From 1c3ad6b9deff9bf7f13075aad77067d083abd967 Mon Sep 17 00:00:00 2001 From: Oleksandr Leshchynskyi Date: Mon, 29 Mar 2021 12:15:48 +0100 Subject: [PATCH 1/2] added additional possible variants of Ukrainian words usage --- dateparser/data/date_translation_data/uk.py | 88 +++++++++++++++++---- 1 file changed, 72 insertions(+), 16 deletions(-) diff --git a/dateparser/data/date_translation_data/uk.py b/dateparser/data/date_translation_data/uk.py index cb67dfa85..f890c714c 100644 --- a/dateparser/data/date_translation_data/uk.py +++ b/dateparser/data/date_translation_data/uk.py @@ -13,6 +13,7 @@ ], "march": [ "бер", + "берез", "березень", "березня" ], @@ -47,6 +48,7 @@ ], "september": [ "вер", + "верес", "вересень", "вересня" ], @@ -59,6 +61,7 @@ "november": [ "лис", "лист", + "листоп", "листопад", "листопада" ], @@ -70,64 +73,88 @@ ], "monday": [ "пн", - "понеділок", - "пон" + "пон", + "понед", + "понеділок" ], "tuesday": [ "вт", - "вівторок", - "вів" + "вів", + "вівторок" ], "wednesday": [ - "середа", - "ср" + "ср", + "сер", + "середа" + ], "thursday": [ - "четвер", "чт", - "чет" + "чет", + "четвер" ], "friday": [ + "пт", "п'ятниця", - "пт" ], "saturday": [ "сб", + "суб", "субота", - "суб" ], "sunday": [ "нд", - "неділя", - "нед" + "нед", + "неділя" ], "am": [ - "дп" + "дп", + "до полудня" ], "pm": [ - "пп" + "пп", + "пополудні", + "пополудні" ], "year": [ "р", "рік", "роки", - "років" + "років", + "року", + "рокові", + "роком", + "році" ], "month": [ "міс", "місяць", + "місяця", + "місяцеві", + "місяцю", + "місяцем", + "місяцю", "місяці", "місяців" ], "week": [ "тиж", "тиждень", + "тижня", + "тижневі", + "тижню", + "тижнем", + "тижню", "тижні", "тижнів" ], "day": [ "д", "день", + "дня", + "дневі", + "дню", + "днем", "дні", "днів" ], @@ -135,6 +162,9 @@ "год", "година", "години", + "годині", + "годиною", + "годино", "годин", "годину", "г" @@ -143,6 +173,9 @@ "хв", "хвилина", "хвилини", + "хвилині", + "хвилиною", + "хвилино", "хвилин", "хвилину" ], @@ -150,6 +183,9 @@ "с", "секунда", "секунди", + "секунді", + "секундою", + "секундо", "секунд", "секунду", "сек" @@ -215,11 +251,13 @@ "\\1 hour ago": [ "(\\d+) год тому", "(\\d+) години тому", + "(\\d+) година тому", "(\\d+) годину тому" ], "\\1 minute ago": [ "(\\d+) хв тому", "(\\d+) хвилини тому", + "(\\d+) хвилина тому", "(\\d+) хвилину тому" ], "\\1 month ago": [ @@ -230,6 +268,7 @@ "\\1 second ago": [ "(\\d+) с тому", "(\\d+) секунди тому", + "(\\d+) секунда тому", "(\\d+) секунду тому" ], "\\1 week ago": [ @@ -310,7 +349,9 @@ "назад" ], "in": [ - "протягом" + "за" + "протягом", + "через" ], "simplifications": [ { @@ -328,14 +369,29 @@ { "кілька секунд": "44 секунди" }, + { + "кілька секунд": "5 секунд" + }, + { + "кілька годин": "4 години" + }, + { + "кілька годин": "5 годин" + }, { "кілька хвилин": "2 хвилини" }, + { + "кілька хвилин": "5 хвилин" + }, { "опів на": "30 хвилин" }, { "за чверть": "15 хвилин" + }, + { + "за чверть до": "15 хвилин" } ] } From 992b766905167f1dddb87fa96f6c8eb9aeb6e039 Mon Sep 17 00:00:00 2001 From: Serhii Abarovskyi Date: Fri, 9 Sep 2022 17:55:50 +0300 Subject: [PATCH 2/2] Update Ukrainian --- dateparser/data/date_translation_data/uk.py | 56 +++++++++++++++++-- .../date_translation_data/uk.yaml | 44 +++++++++++++++ 2 files changed, 94 insertions(+), 6 deletions(-) diff --git a/dateparser/data/date_translation_data/uk.py b/dateparser/data/date_translation_data/uk.py index f4366f943..474755584 100644 --- a/dateparser/data/date_translation_data/uk.py +++ b/dateparser/data/date_translation_data/uk.py @@ -71,22 +71,34 @@ "monday": [ "пн", "понеділок", - "пон" + "пн", + "пон", + "понед", + "понеділок" ], "tuesday": [ "вт", "вівторок", - "вів" + "вт", + "вів", + "вівтор", + "вівторок" ], "wednesday": [ "середа", "ср", + "ср", + "сер", + "серед", + "середа", "середу" ], "thursday": [ "четвер", "чт", - "чет" + "чт", + "чет", + "четвер" ], "friday": [ "п'ятниця", @@ -95,13 +107,19 @@ "saturday": [ "сб", "субота", + "сб", "суб", + "субот", + "субота", "суботу" ], "sunday": [ "нд", "неділя", + "нд", "нед", + "неділ", + "неділя", "неділю" ], "am": [ @@ -111,27 +129,46 @@ "пп" ], "year": [ + "р", + "рік", "р", "рік", "роки", "років", - "року" + "року", + "роком", + "році" ], "month": [ + "міс", + "місяць", + "м", "міс", "місяць", "місяці", - "місяців" + "місяців", + "місяця", + "місяцю", + "місяцям", + "місяцем" ], "week": [ "тиж", "тиждень", + "т", + "тиждень", + "тижня", "тижні", - "тижнів" + "тижнів", + "тижнем" ], "day": [ "д", "день", + "д", + "дн", + "день", + "дня", "дні", "днів", "доба", @@ -141,6 +178,10 @@ "hour": [ "год", "година", + "г", + "год", + "годин", + "година", "години", "годин", "годину", @@ -149,11 +190,14 @@ "minute": [ "хв", "хвилина", + "хв", "хвилини", "хвилин", "хвилину" ], "second": [ + "с", + "секунда", "с", "секунда", "секунди", diff --git a/dateparser_data/supplementary_language_data/date_translation_data/uk.yaml b/dateparser_data/supplementary_language_data/date_translation_data/uk.yaml index 12e208766..ca02dd809 100644 --- a/dateparser_data/supplementary_language_data/date_translation_data/uk.yaml +++ b/dateparser_data/supplementary_language_data/date_translation_data/uk.yaml @@ -3,46 +3,90 @@ skip: ["приблизно", "близько", "о", "об", "і"] sentence_splitter_group : 1 monday: + - пн - пон + - понед + - понеділок tuesday: + - вт - вів + - вівтор + - вівторок wednesday: + - ср + - сер + - серед + - середа - середу thursday: + - чт - чет + - четвер saturday: + - сб - суб + - субот + - субота - суботу sunday: + - нд - нед + - неділ + - неділя - неділю year: + - р + - рік - роки - років - року + - роком + - році month: + - м + - міс + - місяць - місяці - місяців + - місяця + - місяцю + - місяцям + - місяцем week: + - т + - тиждень + - тижня - тижні - тижнів + - тижнем day: + - д + - дн + - день + - дня - дні - днів - доба - доби - діб hour: + - г + - год + - годин + - година - години - годин - годину - г minute: + - хв - хвилини - хвилин - хвилину second: + - с + - секунда - секунди - секунд - секунду