Skip to content

Commit

Permalink
[uk] dictionary update
Browse files Browse the repository at this point in the history
  • Loading branch information
arysin committed Feb 16, 2023
1 parent 9ee85b5 commit b7ec4ff
Show file tree
Hide file tree
Showing 8 changed files with 86 additions and 35 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -12028,9 +12028,9 @@
зосередитися v_oru
зоставатися v_inf:v_oru
зостатися v_inf:v_oru
зраджувати v_zna:v_oru:v_dav
зраджувати v_zna:v_oru
зраджуватися v_oru
зрадити v_zna:v_oru:v_dav
зрадити v_zna:v_oru
зрадитися v_oru
зрадіти v_dav
зрадянізувати v_zna:v_oru:v_dav
Expand Down Expand Up @@ -13007,6 +13007,7 @@
культивувати v_zna:v_oru:v_dav
культивуватися v_oru
купажувати v_zna:v_oru:v_dav
купажуватися v_oru
купати v_zna:v_oru:v_dav
купатися v_oru
купелювати v_zna:v_oru:v_dav
Expand Down Expand Up @@ -15810,6 +15811,7 @@
нерівний v_oru
нерівнозначний v_dav
нерівноцінний v_dav
несвідомий v_rod
несимпатичний v_dav
нескутий v_oru
неславити v_zna:v_oru:v_dav
Expand Down Expand Up @@ -17184,6 +17186,8 @@
окопатися v_oru
окопувати v_zna:v_oru:v_dav
окопуватися v_oru
окрадати v_zna
окрасти v_zna
окреслити v_zna:v_oru:v_dav
окреслитися v_oru
окреслювати v_zna:v_oru:v_dav
Expand Down Expand Up @@ -19190,6 +19194,7 @@
переповнюватися v_oru
переповняти v_zna:v_oru:v_dav
переповнятися v_oru
перепоганити v_zna:v_oru:v_dav
переподарувати v_zna:v_oru:v_dav
переподати v_zna:v_oru:v_dav
перепозиціонувати v_zna:v_oru:v_dav
Expand Down Expand Up @@ -34233,6 +34238,7 @@
щебетати v_oru:v_dav
щедрий v_oru
щедріший v_oru
щедритися v_oru
щедрувати v_oru
щепити v_zna:v_oru:v_dav
щепитися v_oru
Expand Down Expand Up @@ -34520,11 +34526,13 @@
відмазатися v_oru
відмазувати v_zna
відмазуватися v_oru
відхаймарсити v_zna:v_oru
вкурити v_zna
демолювати v_zna:v_oru:v_dav
забабахати v_zna:v_oru:v_dav
забанити v_zna
забембати v_zna:v_oru
заджавелінити v_zna:v_oru
закенселити v_zna:v_oru:v_dav
залабати v_zna:v_oru:v_dav
заникати v_zna:v_oru:v_dav
Expand All @@ -34533,6 +34541,7 @@
лайкнути v_zna
наваяти v_zna:v_oru:v_dav
навігувати v_oru
наволонтерити v_zna:v_rod
намародерити v_zna:v_rod:v_oru:v_dav
повимахуватися v_oru:v_dav
поюзати v_zna:v_oru
Expand All @@ -34543,6 +34552,7 @@
рулити v_oru
скролити v_zna:v_oru
схавати v_zna:v_oru
чорнобаїти v_zna:v_oru
юзати v_zna:v_oru
бути v_oru:v_dav
пробути v_oru
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -3,6 +3,7 @@
# Anything with conditional logic should go into disambiguation.xml

А-БА-БА-ГА-ЛА-МА-ГА а-ба-ба-га-ла-ма-га noun:inanim:f:v_naz:prop:bad
Але Аля noun:anim:f:v_kly:prop:fname
бабій бабіти verb:imperf:impr:s:2
бадьорим бадьорити verb:imperf:pres:p:1:subst
бабів бабіти verb:imperf:past:m
Expand Down Expand Up @@ -523,7 +524,6 @@
Усі Ус noun:anim:m:v_mis:prop:lname
установи установити verb:perf:impr:s:2
утік утік noun:inanim:m:v_.*
ух ухо noun:inanim:p:v_rod:bad
фальшивим фальшивити verb:imperf:pres:p:1:subst
фестивалю фестивалити verb:imperf:pres:s:1
хай хаяти verb:imperf:impr:s:2:bad
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -104,7 +104,7 @@
<!-- правильно: (з)воротний, народний, природний, бездвірний, зворотний, заможний, заробітний, пружний
забу́тній/забутни́й
але дорожній, дочірній, незабутній -->
<token postag_regexp="yes" postag="adj(?!.*:bad).*" regexp="yes">.*(воротн|двірн|дорожн|додатн|забутн|заможн|західн|заробітн|народн|погодн|поздовжн|приватн|природн|пружн|самотн|старожитн|сухопутн|східн)(і[йм]?)</token>
<token postag_regexp="yes" postag="adj(?!.*:bad).*" regexp="yes">.*(воротн|двірн|дорожн|додатн|забутн|заможн|західн|заробітн|народн|погодн|поздовжн|приватн|порожн|природн|пружн|самотн|старожитн|сухопутн|східн)(і[йм]?)</token>
</marker>
</pattern>
<disambig action="remove" postag="adj.*?:bad.*" />
Expand All @@ -123,8 +123,8 @@
<pattern>
<marker>
<and>
<token case_sensitive="yes" inflected="yes" regexp="yes">(росія|путін|рф|москва)(-.+)?</token>
<token case_sensitive="yes" inflected="yes" regexp="yes">(Росія|Путін|Рф|Москва)(-.+)?</token>
<token case_sensitive="yes" inflected="yes" regexp="yes" postag_regexp="yes" postag="noun.*prop.*alt">[а-яіїєґ].*</token>
<token case_sensitive="yes" inflected="yes" regexp="yes" postag_regexp="yes" postag="noun.*prop.*">[А-ЯІЇЄҐ].*</token>
</and>
</marker>
</pattern>
Expand Down Expand Up @@ -335,6 +335,7 @@
<example type="untouched">Рви, ріж, коли!</example>
</rule>

<!--
<rule name="Усі м.в." id="usi_bad">
<antipattern>
<token>усі</token>
Expand All @@ -346,31 +347,38 @@
<token>усі</token>
</marker>
</pattern>
<disambig action="filter" postag="noun:inanim:n:v_mis:bad"/>
<disambig action="filter" postag="noun:inanim:n:v_mis:arch"/>
<example type="ambiguous"
inputform="усі[увесь/adj:p:v_naz:&amp;pron:gen,увесь/adj:p:v_zna:rinanim:&amp;pron:gen,усі/noun:anim:p:v_naz:&amp;pron:gen,ухо/noun:inanim:n:v_mis:bad]"
outputform="усі[ухо/noun:inanim:n:v_mis:bad]"
inputform="усі[увесь/adj:p:v_naz:&amp;pron:gen,увесь/adj:p:v_zna:rinanim:&amp;pron:gen,усі/noun:anim:p:v_naz:&amp;pron:gen,ухо/noun:inanim:n:v_mis:arch]"
outputform="усі[ухо/noun:inanim:n:v_mis:arch]"
>в <marker>усі</marker> почалося запалення</example>
<example type="ambiguous"
inputform="усі[&lt;/S&gt;,увесь/adj:p:v_naz:&amp;pron:gen,увесь/adj:p:v_zna:rinanim:&amp;pron:gen,усі/noun:anim:p:v_naz:&amp;pron:gen,ухо/noun:inanim:n:v_mis:bad]"
outputform="усі[&lt;/S&gt;,ухо/noun:inanim:n:v_mis:bad]"
inputform="усі[&lt;/S&gt;,увесь/adj:p:v_naz:&amp;pron:gen,увесь/adj:p:v_zna:rinanim:&amp;pron:gen,усі/noun:anim:p:v_naz:&amp;pron:gen,ухо/noun:inanim:n:v_mis:arch]"
outputform="усі[&lt;/S&gt;,ухо/noun:inanim:n:v_mis:arch]"
>тихо як в <marker>усі</marker></example>
<example type="untouched">в усі сторони</example>
</rule>
-->

<rule name="Усі прийм." id="usi_non_bad">
<pattern>
<marker>
<token postag_regexp="yes" postag="adj.*">усі</token>
<token postag_regexp="yes" postag="adj.*">усі
<exception postag="SENT_END"/>
<exception scope="next" postag="SENT_END"/>
</token>
</marker>
</pattern>
<disambig action="remove" postag="noun:inanim:n:v_mis:bad"/>
<disambig action="remove" postag="noun:inanim:n:v_mis:arch"/>
<example type="ambiguous"
inputform="усі[увесь/adj:p:v_naz:&amp;pron:gen,увесь/adj:p:v_zna:rinanim:&amp;pron:gen,усі/noun:anim:p:v_naz:&amp;pron:gen,ухо/noun:inanim:n:v_mis:bad]"
inputform="усі[увесь/adj:p:v_naz:&amp;pron:gen,увесь/adj:p:v_zna:rinanim:&amp;pron:gen,усі/noun:anim:p:v_naz:&amp;pron:gen,ухо/noun:inanim:n:v_mis:arch]"
outputform="усі[увесь/adj:p:v_naz:&amp;pron:gen,увесь/adj:p:v_zna:rinanim:&amp;pron:gen,усі/noun:anim:p:v_naz:&amp;pron:gen]"
>в <marker>усі</marker> сторони</example>
<!--
<example type="untouched">в усі почалося запалення</example>
-->
<example type="untouched">тихо як в усі</example>
<example type="untouched">тихо як в усі.</example>
</rule>

<rule name="Єсть - вигук" id="yest_intj_1">
Expand Down Expand Up @@ -1630,6 +1638,20 @@
<example type="untouched">каже йому: га?</example>
</rule>

<rule name="га - вигук" id="HA_INTJ">
<pattern>
<marker>
<token>га</token>
</marker>
<token>?</token>
</pattern>
<disambig action="filter" postag="intj" />
<example type="ambiguous"
inputform="га[га/intj,га/noun:inanim:m:v_dav:nv:abbr,га/noun:inanim:m:v_mis:nv:abbr,га/noun:inanim:m:v_naz:nv:abbr,га/noun:inanim:m:v_oru:nv:abbr,га/noun:inanim:m:v_rod:nv:abbr,га/noun:inanim:m:v_zna:nv:abbr,га/noun:inanim:p:v_dav:nv:abbr,га/noun:inanim:p:v_mis:nv:abbr,га/noun:inanim:p:v_naz:nv:abbr,га/noun:inanim:p:v_oru:nv:abbr,га/noun:inanim:p:v_rod:nv:abbr,га/noun:inanim:p:v_zna:nv:abbr]"
outputform="га[га/intj]">каже йому: <marker>га</marker>?</example>
<example type="untouched">га</example>
</rule>

<rule name="ласка - inanim" id="laska_inanim">
<pattern>
<token>будь</token>
Expand Down Expand Up @@ -3866,22 +3888,6 @@
<example type="untouched">велика ґрата</example>
</rule>

<rule name="І т.д." id="i_t_d">
<pattern>
<token regexp="yes">[ій]</token>
<token>т.</token>
<marker>
<token>д.</token>
</marker>
</pattern>
<disambig action="replace" postag="adv:abbr"></disambig>
<example type="ambiguous"
inputform="д.[&lt;/S&gt;]"
outputform="д.[&lt;/S&gt;,д./adv:abbr]"
>і т.<marker>д.</marker></example>
<example type="untouched">д.м.н.</example>
</rule>

<!-- TODO: забути/забувши взять -->

<rule name="Розмовні форми інфінітиву" id="verb_inf_short_1">
Expand Down Expand Up @@ -4743,6 +4749,25 @@
<example type="untouched">і буду стало тут проживати</example>
</rule>

<rule name="село/місто" id="selo_misto_geo">
<pattern>
<token case_sensitive="yes" regexp="yes">[сС]ело|[мС]істо|[см]\.</token>
<marker>
<token case_sensitive="yes" regexp="yes" postag_regexp="yes" postag="noun:inanim.*prop:geo.*">[А-ЯІЇЄҐ]'?[а-яіїєґ'-]+</token>
</marker>
</pattern>
<disambig action="filter" postag="noun:inanim.*:prop:geo.*"/>
<example type="ambiguous"
inputform="Сосни[Сосна/noun:anim:f:v_rod:prop:lname,Сосна/noun:anim:m:v_rod:prop:lname,Сосни/noun:inanim:p:v_naz:ns:prop:geo,Сосни/noun:inanim:p:v_zna:ns:prop:geo,сосна/noun:inanim:f:v_rod,сосна/noun:inanim:p:v_naz,сосна/noun:inanim:p:v_zna]"
outputform="Сосни[Сосни/noun:inanim:p:v_naz:ns:prop:geo,Сосни/noun:inanim:p:v_zna:ns:prop:geo]">село <marker>Сосни</marker>.
</example>
<example type="ambiguous"
inputform="Сосни[Сосна/noun:anim:f:v_rod:prop:lname,Сосна/noun:anim:m:v_rod:prop:lname,Сосни/noun:inanim:p:v_naz:ns:prop:geo,Сосни/noun:inanim:p:v_zna:ns:prop:geo,сосна/noun:inanim:f:v_rod,сосна/noun:inanim:p:v_naz,сосна/noun:inanim:p:v_zna]"
outputform="Сосни[Сосни/noun:inanim:p:v_naz:ns:prop:geo,Сосни/noun:inanim:p:v_zna:ns:prop:geo]">у м. <marker>Сосни</marker>.
</example>
<example type="untouched">Буки і Сосни</example>
</rule>

<!-- TODO: other просто, but it does not buy much - still have adv and part -->

<!--
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -29,6 +29,7 @@
Точка-У noun:f:nv
Шахід-[0-9]+ noun:m:nv
Шахед-[0-9]+ noun:m:nv
БРДМ-[0-9]+ noun:f:nv

Євро-[0-9]+ noun:n:nv:np:prop
ЄВРО-[0-9]+ noun:n:nv:np:prop
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -171,6 +171,7 @@
башмачник=черевичник|швець
башня=вежа|башта
баю-бай=люлі-люлі
баю-баю=люлі-люлі
бджоловедення=бджільництво
бдіння=чування|пильнування
бедрівки=стегнівки
Expand Down Expand Up @@ -222,6 +223,9 @@
безстержневий=безстрижневий
безстержневість=безстрижневість
безстержньовий=безстрижневий
безстрасний=безпристрасний
безстрасність=безпристрасність
безстрасно=безпристрасно
безступінчастий=безступеневий|безсхідчастий|несхідчастий
безступінчастість=безступеневість|безсхідчастість|несхідчастість
безступінчатий=безступеневий|безсхідчастий|несхідчастий
Expand Down Expand Up @@ -2160,7 +2164,7 @@
книговод=книгознавець
книготоргівельний=книготорговельний
кнут=батіг
княження=князювання|князіння
княження=князювання
кобель=пес|собака|(про люд.) жеребець
коварний=підступний
коварно=підступно
Expand Down Expand Up @@ -2389,6 +2393,7 @@
лизоблюдський=підлабузницький
линька=линяння|блякнення|половіння|линьба|линовище|линовисько
лисіючий=що лисіє|полисілий|лисак|лисун|голомозько|боса голова|голомозий|лисавий
листати=гортати
листопрокатний=листовальцювальний
листопрокатник=листовальцювальник
лихорадка=пропасниця|лихоманка|гарячка|трясця|трясовиця|трясучка|веснуха
Expand Down Expand Up @@ -2523,6 +2528,7 @@
міґруючий=що мігрує|міграційний|мігрувальний|мігрівний|непосидющий|мігрант
міжвузівський=міжвишівський
міжвузловинний=міжвузловий
міжзірковий=міжзоряний
міжобщинний=міжгромадний
мізковий=мозковий
мікрогравірування=мікрогравіювання
Expand Down Expand Up @@ -2733,7 +2739,6 @@
напомповуючий=що напомповує|напомповувальний
напослідок=насамкінець|наостанок
напоумлювати=напоумляти
напочатку=на початку|спочатку|попереду|спершу|перше
направляючий=що спрямовує|напрямний|направний|спрямовувальний|скеровувальний|чоловий
напротив=напроти
напружуючий=що напружує|натягальний
Expand All @@ -2749,6 +2754,7 @@
наростаючий=що наростає|наростальний|зростальний|нарощуваний|нестримний
нарочний=посланець|гінець|навмисний|умисний
наружка=зовнішка
нарушити=порушити
нарядчик=нарядник
насичуючий=що насичує|насичувальний
насищений=насичений|нагодований|багатий (на що)
Expand Down Expand Up @@ -3083,6 +3089,7 @@
обезлюднений=знелюднений
обезлюднення=знелюднення
обезнадієний=позбавлений надії|зневірений
обезпечення=забезпечення
обезпліднений=знепліднений|яловий
обезсилений=знесилений|збезсилений|виснажений|занепалий|охлялий
обезславлений=знеславлений|ославлений
Expand Down Expand Up @@ -3418,7 +3425,7 @@
освіжуючий=що відсвіжує|відсвіжувач|відсвіжний
осевий=осьовий
осилити=подужати|пересилити|перемогти
осилювати=дужати|пересилювати|перемагати
осилювати=пересилювати|перемагати
осиплий=охриплий|хриплий|хрипкий
осифікуючий=осифікувальний
осідаючий=що осідає|осідальний
Expand Down Expand Up @@ -4787,6 +4794,8 @@
розгрузка=розвантаження
розгрузочний=розвантажувальний
розгрузчик=розвантажувач
роздаточна=роздавальня
роздаточний=роздавальний|розподільчий|роздатний
розділюючий=що розділює|відокремлювальний|розподільчий|роздільний|розділювальний|розподільний|розрізнювальний|розділовий|розбратній|роз'єднавчий|межовий|розподілювач
розділяючий=що розділює|відокремлювальний|розподільчий|роздільний|розділювальний|розподільний|розрізнювальний|розділовий|розбратній|роз'єднавчий|межовий|розподілювач
роздор=розбрат|розлад
Expand Down Expand Up @@ -5294,6 +5303,7 @@
страждущий=стражденний
страйкуючий=що страйкує|страйкар|учасник страйку|охоплений страйком
странний=дивний
страсно=пристрасно
стратифікуючий=страфікувальний
страусиний=страусовий
страхаючий=що страхає|що встрашує|що лякає|лячний|застрашливий|настрашливий
Expand Down Expand Up @@ -5749,7 +5759,6 @@
утюжок=праска
утяжка=утягання|утягування
ухід=вихід|відхід|вибуття|догляд|вхід
ухо=вухо
уход=вихід|відхід|вибуття|догляд|вхід
ухолосту=безрезультатно|даремно|марно|ненавантажено
участковий=дільничний|ділянковий|дільничний
Expand Down Expand Up @@ -6006,6 +6015,7 @@
шалфей=шавлія
шарашкін=шарашчин
шарик=кулька|бульбашка|балабушка|галка|галочка|болюс
шариковий=кульковий
шаровидний=кулястий
шароподібний=кулястий
шатер=намет|шатро|таш|таша
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -68,6 +68,7 @@
Білорусія=Білорусь
благоустрій=доброустрій|порядок|добрий лад
блокпостний=блокпостовий
Болдуін=Болдуїн
борщовик=борщівник
братолюбивість=братолюбність
Брауншвейг=Брауншвайг
Expand Down Expand Up @@ -395,6 +396,7 @@
іосифлянський=йосифлянський
іпотекодержатель=іпотекотримач
Істамбул=Стамбул
Істанбул=Стамбул
історико-дослідницький=історико-дослідний|історико-дослідчий
іуда=юда
Іуда=Юда
Expand All @@ -411,6 +413,7 @@
Іудея=Юдея
іудин=юдин
Іудин=Юдин
Йеллен=Єллен
Йенс=Єнс
Йенсен=Єнсен
йорк=йоркширський тер'єр
Expand Down Expand Up @@ -678,6 +681,7 @@
Ортега-і-Гасет=Ортега-і-Гассет
Оскол=Оскіл
ослизнюватися=ослизати
Осло-фьорд=Осло-фіорд
офіціальний=офіційний
офіціальність=офіційність
оцифрований=зацифрований
Expand Down
Loading

0 comments on commit b7ec4ff

Please sign in to comment.