From d052d3ee1700ef049c200252a055c4956df31cea Mon Sep 17 00:00:00 2001 From: Jonah Lawrence Date: Mon, 24 Oct 2022 01:22:41 -0600 Subject: [PATCH] Fix Ukrainian supplemental data to be in the yaml and restored CLDR data (#1090) * Restore uk.json * Update uk.yaml * Add friday translation --- dateparser/data/date_translation_data/uk.py | 108 +++++++----------- .../date_translation_data/uk.json | 78 +++---------- .../date_translation_data/uk.yaml | 45 ++++++++ 3 files changed, 102 insertions(+), 129 deletions(-) diff --git a/dateparser/data/date_translation_data/uk.py b/dateparser/data/date_translation_data/uk.py index 123713706..7438d7748 100644 --- a/dateparser/data/date_translation_data/uk.py +++ b/dateparser/data/date_translation_data/uk.py @@ -13,9 +13,9 @@ ], "march": [ "бер", - "берез", "березень", - "березня" + "березня", + "берез" ], "april": [ "кві", @@ -48,9 +48,9 @@ ], "september": [ "вер", - "верес", "вересень", - "вересня" + "вересня", + "верес" ], "october": [ "жов", @@ -61,9 +61,9 @@ "november": [ "лис", "лист", - "листоп", "листопад", - "листопада" + "листопада", + "листоп" ], "december": [ "гру", @@ -73,8 +73,6 @@ ], "monday": [ "пн", - "пон", - "понед", "понеділок", "пн", "пон", @@ -83,7 +81,6 @@ ], "tuesday": [ "вт", - "вів", "вівторок", "вт", "вів", @@ -91,31 +88,28 @@ "вівторок" ], "wednesday": [ - "ср", - "сер", "середа", "ср", + "ср", "сер", "серед", "середа", "середу" ], "thursday": [ - "чт", - "чет", "четвер", "чт", + "чт", "чет", "четвер" ], "friday": [ + "п'ятниця", "пт", - "пят", - "п'ятниця" + "пят" ], "saturday": [ "сб", - "суб", "субота", "сб", "суб", @@ -125,7 +119,6 @@ ], "sunday": [ "нд", - "нед", "неділя", "нд", "нед", @@ -146,33 +139,20 @@ "year": [ "р", "рік", - "року", - "років", - "роками", - "роках", - "роки", - "рокові", - "роком", - "році", "р", "рік", "роки", "років", "року", "роком", - "році" + "році", + "роках", + "роками", + "рокові" ], "month": [ "міс", "місяць", - "місяця", - "місяців", - "місяцями", - "місяцях", - "місяці", - "місяцеві", - "місяцю", - "місяцем", "м", "міс", "місяць", @@ -181,29 +161,25 @@ "місяця", "місяцю", "місяцям", - "місяцем" + "місяцем", + "місяцеві", + "місяцях", + "місяцями" ], "week": [ "тиж", - "тижня", - "тижневі", - "тижню", - "тижнем", - "тижню", "тиждень", "т", "тиждень", "тижня", "тижні", "тижнів", - "тижнем" + "тижнем", + "тижневі", + "тижню" ], "day": [ "д", - "дня", - "дневі", - "дню", - "днем", "день", "д", "дн", @@ -213,14 +189,14 @@ "днів", "доба", "доби", - "діб" + "діб", + "дневі", + "дню", + "днем" ], "hour": [ "год", "година", - "годині", - "годиною", - "годино", "г", "год", "годин", @@ -228,31 +204,35 @@ "години", "годин", "годину", - "г" + "г", + "годині", + "годиною", + "годино" ], "minute": [ "хв", "хвилина", - "хвилині", - "хвилиною", - "хвилино", "хв", "хвилини", "хвилин", - "хвилину" + "хвилину", + "хвилина", + "хвилині", + "хвилиною", + "хвилино" ], "second": [ "с", "секунда", - "секунді", - "секундою", - "секундо", "с", "секунда", "секунди", "секунд", "секунду", - "сек" + "сек", + "секунді", + "секундою", + "секундо" ], "relative-type": { "0 day ago": [ @@ -318,14 +298,14 @@ "\\1 hour ago": [ "(\\d+) год тому", "(\\d+) години тому", - "(\\d+) година тому", - "(\\d+) годину тому" + "(\\d+) годину тому", + "(\\d+) година тому" ], "\\1 minute ago": [ "(\\d+) хв тому", - "(\\d+) хвилина тому", "(\\d+) хвилини тому", - "(\\d+) хвилину тому" + "(\\d+) хвилину тому", + "(\\d+) хвилина тому" ], "\\1 month ago": [ "(\\d+) міс тому", @@ -334,9 +314,9 @@ ], "\\1 second ago": [ "(\\d+) с тому", - "(\\d+) секунда тому", "(\\d+) секунди тому", - "(\\d+) секунду тому" + "(\\d+) секунду тому", + "(\\d+) секунда тому" ], "\\1 week ago": [ "(\\d+) тиж тому", diff --git a/dateparser_data/cldr_language_data/date_translation_data/uk.json b/dateparser_data/cldr_language_data/date_translation_data/uk.json index 58a865be8..786cb4db0 100644 --- a/dateparser_data/cldr_language_data/date_translation_data/uk.json +++ b/dateparser_data/cldr_language_data/date_translation_data/uk.json @@ -13,7 +13,6 @@ ], "march": [ "бер", - "берез", "березень", "березня" ], @@ -48,7 +47,6 @@ ], "september": [ "вер", - "верес", "вересень", "вересня" ], @@ -61,7 +59,6 @@ "november": [ "лис", "лист", - "листоп", "листопад", "листопада" ], @@ -73,111 +70,65 @@ ], "monday": [ "пн", - "пон", - "понед", "понеділок" ], "tuesday": [ "вт", - "вів", "вівторок" ], "wednesday": [ - "ср", - "сер", - "середа" + "середа", + "ср" ], "thursday": [ - "чт", - "чет", - "четвер" + "четвер", + "чт" ], "friday": [ - "пт", - "пят", - "п'ятниця" + "п'ятниця", + "пт" ], "saturday": [ "сб", - "суб", "субота" ], "sunday": [ "нд", - "нед", "неділя" ], "am": [ - "дп", - "до полудня" + "дп" ], "pm": [ - "пп", - "після полудня", - "пополудні", - "пополудні" + "пп" ], "year": [ "р", - "рік", - "року", - "років", - "роками", - "роках", - "роки", - "рокові", - "роком", - "році" + "рік" ], "month": [ "міс", - "місяць", - "місяця", - "місяців", - "місяцями", - "місяцях", - "місяці", - "місяцеві", - "місяцю", - "місяцем" + "місяць" ], "week": [ "тиж", - "тижня", - "тижневі", - "тижню", - "тижнем", - "тижню", "тиждень" ], "day": [ "д", - "дня", - "дневі", - "дню", - "днем", "день" ], "hour": [ "год", - "година", - "годині", - "годиною", - "годино" + "година" ], "minute": [ "хв", - "хвилина", - "хвилині", - "хвилиною", - "хвилино" + "хвилина" ], "second": [ "с", - "секунда", - "секунді", - "секундою", - "секундо" + "секунда" ], "relative-type": { "0 day ago": [ @@ -236,12 +187,10 @@ "\\1 hour ago": [ "{0} год тому", "{0} години тому", - "(\\d+) година тому", "{0} годину тому" ], "\\1 minute ago": [ "{0} хв тому", - "(\\d+) хвилина тому", "{0} хвилини тому", "{0} хвилину тому" ], @@ -252,7 +201,6 @@ ], "\\1 second ago": [ "{0} с тому", - "(\\d+) секунда тому", "{0} секунди тому", "{0} секунду тому" ], diff --git a/dateparser_data/supplementary_language_data/date_translation_data/uk.yaml b/dateparser_data/supplementary_language_data/date_translation_data/uk.yaml index ca02dd809..37ce27295 100644 --- a/dateparser_data/supplementary_language_data/date_translation_data/uk.yaml +++ b/dateparser_data/supplementary_language_data/date_translation_data/uk.yaml @@ -22,6 +22,8 @@ thursday: - чт - чет - четвер +friday: + - пят saturday: - сб - суб @@ -35,6 +37,13 @@ sunday: - неділя - неділю +march: + - берез +september: + - верес +november: + - листоп + year: - р - рік @@ -43,6 +52,9 @@ year: - року - роком - році + - роках + - роками + - рокові month: - м - міс @@ -53,6 +65,9 @@ month: - місяцю - місяцям - місяцем + - місяцеві + - місяцях + - місяцями week: - т - тиждень @@ -60,6 +75,8 @@ week: - тижні - тижнів - тижнем + - тижневі + - тижню day: - д - дн @@ -70,6 +87,9 @@ day: - доба - доби - діб + - дневі + - дню + - днем hour: - г - год @@ -79,11 +99,18 @@ hour: - годин - годину - г + - годині + - годиною + - годино minute: - хв - хвилини - хвилин - хвилину + - хвилина + - хвилині + - хвилиною + - хвилино second: - с - секунда @@ -91,6 +118,16 @@ second: - секунд - секунду - сек + - секунді + - секундою + - секундо + +am: + - до полудня +pm: + - після полудня + - пополудні + - пополудні ago: - тому @@ -108,6 +145,14 @@ relative-type: in 2 day: - післязавтра +relative-type-regex: + \1 hour ago: + - (\d+) година тому + \1 minute ago: + - (\d+) хвилина тому + \1 second ago: + - (\d+) секунда тому + simplifications: - од(на|ну|ні|ної|нієї|ин|ній): '1' - дв(а|і|оє|ох): '2'