Skip to content

Commit

Permalink
Update data for Ukranian (#1072)
Browse files Browse the repository at this point in the history
Co-authored-by: igor <ihorsam@gmail.com>
Co-authored-by: Serhii Abarovskyi <serhii@zyte.com>
  • Loading branch information
3 people committed Aug 29, 2022
1 parent ffb9a2d commit cbea5e8
Show file tree
Hide file tree
Showing 5 changed files with 147 additions and 12 deletions.
97 changes: 91 additions & 6 deletions dateparser/data/date_translation_data/uk.py
Expand Up @@ -80,7 +80,8 @@
],
"wednesday": [
"середа",
"ср"
"ср",
"середу"
],
"thursday": [
"четвер",
Expand All @@ -94,12 +95,14 @@
"saturday": [
"сб",
"субота",
"суб"
"суб",
"суботу"
],
"sunday": [
"нд",
"неділя",
"нед"
"нед",
"неділю"
],
"am": [
"дп"
Expand All @@ -111,7 +114,8 @@
"р",
"рік",
"роки",
"років"
"років",
"року"
],
"month": [
"міс",
Expand All @@ -129,7 +133,10 @@
"д",
"день",
"дні",
"днів"
"днів",
"доба",
"доби",
"діб"
],
"hour": [
"год",
Expand Down Expand Up @@ -203,6 +210,9 @@
],
"2 day ago": [
"позавчора"
],
"in 2 day": [
"післязавтра"
]
},
"relative-type-regex": {
Expand Down Expand Up @@ -287,6 +297,7 @@
},
"locale_specific": {},
"skip": [
"приблизно",
"близько",
"о",
"об",
Expand All @@ -310,9 +321,83 @@
"назад"
],
"in": [
"протягом"
"протягом",
"через",
"за"
],
"simplifications": [
{
"од(на|ну|ні|ної|нієї|ин|ній)": "1"
},
{
"дв(а|і|оє|ох)": "2"
},
{
"пар[ауі]": "2"
},
{
"три": "3"
},
{
"чотири": "4"
},
{
"п'ять": "5"
},
{
"шість": "6"
},
{
"сім": "7"
},
{
"вісім": "8"
},
{
"дев'ять": "9"
},
{
"десять": "10"
},
{
"одинадцять": "11"
},
{
"дванадцять": "12"
},
{
"п'ятнадцять": "15"
},
{
"двадцять": "20"
},
{
"тридцять": "30"
},
{
"сорок": "40"
},
{
"п'ятдесят": "50"
},
{
"півгодини": "30 хвилин"
},
{
"пів години": "30 хвилин"
},
{
"півроку": "6 місяців"
},
{
"пів року": "6 місяців"
},
{
"півтори години": "90 хвилин"
},
{
"півтора року": "18 місяців"
},
{
"^година": "1 година"
},
Expand Down
@@ -1,21 +1,26 @@
skip: ["близько", "о", "об", "і"]
skip: ["приблизно", "близько", "о", "об", "і"]

sentence_splitter_group : 1

monday:
- пон
tuesday:
- вів
wednesday:
- середу
thursday:
- чет
saturday:
- суб
- суботу
sunday:
- нед
- неділю

year:
- роки
- років
- року
month:
- місяці
- місяців
Expand All @@ -25,6 +30,9 @@ week:
day:
- дні
- днів
- доба
- доби
- діб
hour:
- години
- годин
Expand All @@ -45,14 +53,42 @@ ago:
- назад
in:
- протягом
- через
- за

relative-type:
2 day ago:
- позавчора
1 day ago:
- вчора
in 2 day:
- післязавтра

simplifications:
- од(на|ну|ні|ної|нієї|ин|ній): '1'
- дв(а|і|оє|ох): '2'
- пар[ауі]: '2'
- три: '3'
- чотири: '4'
- п'ять: '5'
- шість: '6'
- сім: '7'
- вісім: '8'
- дев'ять: '9'
- десять: '10'
- одинадцять: '11'
- дванадцять: '12'
- п'ятнадцять: '15'
- двадцять: '20'
- тридцять: '30'
- сорок: '40'
- п'ятдесят: '50'
- півгодини: 30 хвилин
- пів години: 30 хвилин
- півроку: 6 місяців
- пів року: 6 місяців
- півтори години: 90 хвилин
- півтора року: 18 місяців
- ^година: 1 година
- ^годину: 1 годину
- ^хвилину: 1 хвилину
Expand Down
1 change: 0 additions & 1 deletion tests/test_freshness_date_parser.py
Expand Up @@ -1380,7 +1380,6 @@ def test_normalized_relative_dates(self, date_string, ago, period):
param("pas 2 muajsh", in_future={'months': 2}, period='month'),
param("pas 15 ditësh", in_future={'days': 15}, period='day'),
# sr-Cyrl
param("за 3 годину", in_future={'years': 3}, period='year'),
param("за 10 мин 20 сек", in_future={'minutes': 10, 'seconds': 20}, period='day'),
# sr-Latn
param("za 2 god 6 mes", in_future={'years': 2, 'months': 6}, period='month'),
Expand Down
19 changes: 17 additions & 2 deletions tests/test_languages.py
Expand Up @@ -89,6 +89,8 @@ def setUp(self):
param('pl', "29 listopada 2014 o 08:40", "29 november 2014 08:40"),
# Ukrainian
param('uk', "30 листопада 2013 о 04:27", "30 november 2013 04:27"),
param('uk', "28 лютого 2020 року об 11:57", "28 february 2020 year 11:57"),
param('uk', "середу, 28 лютого 2020 року об 11:57", "wednesday 28 february 2020 year 11:57"),
# Belarusian
param('be', "5 снежня 2015 г. у 12:00", "5 december 2015 year. 12:00"),
param('be', "11 верасня 2015 г. у 12:11", "11 september 2015 year. 12:11"),
Expand Down Expand Up @@ -942,6 +944,13 @@ def test_translation(self, shortname, datetime_string, expected_translation):
param('tl', "ngayon", "0 second ago"),
# Ukrainian
param('uk', "позавчора", "2 day ago"),
param('uk', "післязавтра", "in 2 day"),
param('uk', "через 2 дні", "in 2 day"),
param('uk', "через 2 доби", "in 2 day"),
param('uk', "через 5 діб", "in 5 day"),
param('uk', "через п'ять діб", "in 5 day"),
param('uk', "за вісім днів", "in 8 day"),
param('uk', "2 роки", "2 year"),
# Belarusian
param('be', "9 месяцаў", "9 month"),
param('be', "8 тыдняў", "8 week"),
Expand Down Expand Up @@ -1562,6 +1571,8 @@ def test_translation(self, shortname, datetime_string, expected_translation):
param('sr-Cyrl', "пре 5 година", "5 year ago"),
param('sr-Cyrl', "за 52 нед", "in 52 week"),
param('sr-Cyrl', "данас", "0 day ago"),
param('sr-Cyrl', "за 3 годину", "in 3 year"),
# sr-Latn
param('sr-Latn', "za 120 sekundi", "in 120 second"),
param('sr-Latn', "pre 365 dana", "365 day ago"),
Expand Down Expand Up @@ -1604,9 +1615,13 @@ def test_translation(self, shortname, datetime_string, expected_translation):
param('tzm', "assenaṭ", "1 day ago"),
param('tzm', "asekka", "in 1 day"),
# uk
param('uk', "18 хвилину тому", "18 minute ago"),
param('uk', "через 22 року", "in 22 year"),
param('uk', "18 хвилин тому", "18 minute ago"),
param('uk', "через 22 роки", "in 22 year"),
param('uk', "цього тижня", "0 week ago"),
param('uk', "півгодини тому", "30 minute ago"),
param('uk', "пів години тому", "30 minute ago"),
param('uk', "півроку тому", "6 month ago"),
param('uk', "за півтора року", "in 18 month"),
# uz-Cyrl
param('uz-Cyrl', "кейинги ой", "in 1 month"),
param('uz-Cyrl', "30 йил аввал", "30 year ago"),
Expand Down
4 changes: 2 additions & 2 deletions tests/test_search.py
Expand Up @@ -432,8 +432,8 @@ def test_search_date_string(self, shortname, datetime_string):
'інтервенції в Маньчжурію 13 вересня 1931, початок другої японсько-китайської війни 7 '
'липня 1937 року та початок угорсько-української війни 14 березня 1939 року.',
[('13 вересня 1931', datetime.datetime(1931, 9, 13, 0, 0)),
('7 липня 1937', datetime.datetime(1937, 7, 7, 0, 0)),
('14 березня 1939', datetime.datetime(1939, 3, 14, 0, 0))],
('7 липня 1937 року', datetime.datetime(1937, 7, 7, 0, 0)),
('14 березня 1939 року', datetime.datetime(1939, 3, 14, 0, 0))],
settings={'RELATIVE_BASE': datetime.datetime(2000, 1, 1)}),
# Vietnamese
Expand Down

0 comments on commit cbea5e8

Please sign in to comment.