From ff0e219acd732ac02a22da8326b296437bacfc7e Mon Sep 17 00:00:00 2001 From: funderburkjim Date: Fri, 8 Dec 2023 22:16:35 -0500 Subject: [PATCH] #67 --- pwgissues/issue67/change_irregular.txt | 70 +++ pwgissues/issue67/change_regular.txt | 600 +++++++++++++++++++++ pwgissues/issue67/diff_to_changes_dict.py | 71 +++ pwgissues/issue67/digentry.py | 103 ++++ pwgissues/issue67/make_change_regular.py | 278 ++++++++++ pwgissues/issue67/pre_change.txt | 134 +++++ pwgissues/issue67/pre_change_irregular.txt | 13 + pwgissues/issue67/pre_change_regular.txt | 120 +++++ pwgissues/issue67/readme.txt | 135 +++++ pwgissues/issue67/updateByLine.py | 163 ++++++ 10 files changed, 1687 insertions(+) create mode 100644 pwgissues/issue67/change_irregular.txt create mode 100644 pwgissues/issue67/change_regular.txt create mode 100644 pwgissues/issue67/diff_to_changes_dict.py create mode 100644 pwgissues/issue67/digentry.py create mode 100644 pwgissues/issue67/make_change_regular.py create mode 100644 pwgissues/issue67/pre_change.txt create mode 100644 pwgissues/issue67/pre_change_irregular.txt create mode 100644 pwgissues/issue67/pre_change_regular.txt create mode 100644 pwgissues/issue67/readme.txt create mode 100644 pwgissues/issue67/updateByLine.py diff --git a/pwgissues/issue67/change_irregular.txt b/pwgissues/issue67/change_irregular.txt new file mode 100644 index 0000000..23e8a6a --- /dev/null +++ b/pwgissues/issue67/change_irregular.txt @@ -0,0 +1,70 @@ +; 118241-0954upaDAupaDA/ +108730 old
— 2) {%das aufdie-Probe-Stellen%}, = {#DarmAdyEryatparIkzaRam#} +; +108730 new
— 2) {%das auf-die-Probe-Stellen%}, = {#DarmAdyEryatparIkzaRam#} +;--------------------------------------------------- +; 236752-0852grahaRagra/haRa +228492 old
— β) {%das Fangen, Einfangen, Gefangennehmen, inseine%} +; +228492 new
— β) {%das Fangen, Einfangen, Gefangennehmen, in-seine-Gewalt-Bekommen%}: +;--------------------------------------------------- +; 236752-0852grahaRagra/haRa +228494 old {%- Gewalt-Bekommen%}: {#SvA mfgagrahaRe SuciH#} +; +228494 new {#SvA mfgagrahaRe SuciH#} +;--------------------------------------------------- +; 344123-0741devagaRadevagaRa/ +340910 old {#devagaRa/#}¦ ({#deva + gaRa#}) m. {%Götterschaar, - abtheilung%} +; +340910 new {#devagaRa/#}¦ ({#deva + gaRa#}) m. {%Götterschaar, -abtheilung%} +;--------------------------------------------------- +; 361863-0868DarDar +356546 old
— 2) {%vernehmen. horen. erfahren%}: {#madvAkyaM cAvaDArya#} +; +356546 new
— 2) {%vernehmen. hören, erfahren%}: {#madvAkyaM cAvaDArya#} +;--------------------------------------------------- +; 565115-0448maRqapamaRqapa/ +560080 old
— 4) f. {#A#} {%eine hest. Hülsenfrucht%}, = {#nizpAvI#} +; +560080 new
— 4) f. {#A#} {%eine best. Hülsenfrucht%}, = {#nizpAvI#} +;--------------------------------------------------- +; 591155-0662mahAsarjamahAsarja +585218 old {#mahAsarja#}¦ ({#ma° + sarja#}) m. {%Terminalia tomentosa W. u. A.%} und {%Artocar pus integrifolia Lin.%} +; +585218 new {#mahAsarja#}¦ ({#ma° + sarja#}) m. {%Terminalia tomentosa W. u. A.%} und {%Artocarpus integrifolia Lin.%} +;--------------------------------------------------- +; 715435-1326keSaDAraRakeSaDAraRa +676419 old {#keSaDAraRa#}¦ ({#keSa + DA°#}) n. {%das Tragen von Haar%} so v. a. {%nicht abge schnittenes Haar%} +; +676419 new {#keSaDAraRa#}¦ ({#keSa + DA°#}) n. {%das Tragen von Haar%} so v. a. {%nicht abgeschnittenes Haar%} +;--------------------------------------------------- +; 1042377-0590satvansa/tvan +985017 old 4, 13, 2. (wonach unter {#drapsa#} und {#drapsin#} zu andern und drafsha im Zend zu vergleichen ist). Indra +; +985017 new 4, 13, 2. (wonach unter {#drapsa#} und {#drapsin#} zu ändern und drafsha im Zend zu vergleichen ist). Indra +;--------------------------------------------------- +; 1061867-0748saMplavasaMplava +1004292 old MĀRK. P. 114, 20. {#garBa°#} so v. a. {%Fehl geburt%} +; +1004292 new MĀRK. P. 114, 20. {#garBa°#} so v. a. {%Fehlgeburt%} +;--------------------------------------------------- +; 1070497-0830sarvasaMnAhasarvasaMnAha +1014133 old {#sarvasaMnAha#}¦ m. {%das vollständige Gerüstetsein zu Etwas, das mit-Eiferan-Etwas-Gehen%}; = 1. {#sarvAtman#} +; +1014133 new {#sarvasaMnAha#}¦ m. {%das vollständige Gerüstetsein zu Etwas, das mit-Eifer-an-Etwas-Gehen%}; = 1. {#sarvAtman#} +;--------------------------------------------------- +; 1073617-0846saviSezaRasaviSezaRa +1016431 old {#saviSezaRa#}¦ (2. {#sa + vi°#}) adj. {%mit näheren Bestimmungen%} ({%Attributen¤u.s.w.%}) +; +1016431 new {#saviSezaRa#}¦ (2. {#sa + vi°#}) adj. {%mit näheren Bestimmungen%} ({%Attributen u.s.w.%}) +;--------------------------------------------------- +; 1210437-1775pratizWApratizWA +1139724 old
6) {%Vorzūglichkeit%} überh.: {#kAvyabanDasya#} Cit. bei +; +1139724 new
6) {%Vorzüglichkeit%} überh.: {#kAvyabanDasya#} Cit. bei +;--------------------------------------------------- +; 1222347-1809vyaparopaRavyaparopaRa +1146609 old
3) {%das Vernicḥten%}: {#jIvita°#} +; +1146609 new
3) {%das Vernichten%}: {#jIvita°#} +;--------------------------------------------------- diff --git a/pwgissues/issue67/change_regular.txt b/pwgissues/issue67/change_regular.txt new file mode 100644 index 0000000..0f9c3d4 --- /dev/null +++ b/pwgissues/issue67/change_regular.txt @@ -0,0 +1,600 @@ +; 915106-1038vitAnamUlakavitAnamUlaka +; Andropogen -> Andropogon +857024 old {#vitAnamUlaka#}¦ n. {%die Wurzel von Andropogen muricatus%} +; +857024 new {#vitAnamUlaka#}¦ n. {%die Wurzel von Andropogon muricatus%} +; 527885-0094bIjadarSakabIjadarSaka +; Anfung -> Anfang +520709 old {#bIjadarSaka#}¦ ({#bIja + da°#}) m. {%Schauspieldirector (den Keim, den ersten Anfung eines Schauspiels, den Augen der Zuschauer vorführend)%} +; +520709 new {#bIjadarSaka#}¦ ({#bIja + da°#}) m. {%Schauspieldirector (den Keim, den ersten Anfang eines Schauspiels, den Augen der Zuschauer vorführend)%} +; 446834-0673pArAvatapA/rAvata +; Annona -> Anona +444826 old
a) {%die Frucht der Pflanze%} {#lavalI#} ({%Annona reticulata%} nach +; +444826 new
a) {%die Frucht der Pflanze%} {#lavalI#} ({%Anona reticulata%} nach +; 631495-0969advayAnandaadvayAnanda +; Anschauug -> Anschauung +621646 old VEDĀNTAS. 1, 5 (Allah. No. 2) zugleich adj. {%eine Wonne über die monistische Anschauug empfindend.%} +; +621646 new VEDĀNTAS. 1, 5 (Allah. No. 2) zugleich adj. {%eine Wonne über die monistische Anschauung empfindend.%} +; 532045-0124bokaqIbokaqI +; Arggreia -> Argyrea +524269 old {#bokaqI#}¦ f. {%Arggreia speciosa%} oder {%argentea Sweet.%} ({#bastAntrI#}) +; +524269 new {#bokaqI#}¦ f. {%Argyrea speciosa%} oder {%argentea Sweet.%} ({#bastAntrI#}) +; 37621-0281apadaa/pada1 +; Aufenthalsort -> Aufenthaltsort +31870 old
1) {%kein Aufenthalsort%}: {#ka\po\to\lU\kAByA\mapa^da\M tada^stu#} +; +31870 new
1) {%kein Aufenthaltsort%}: {#ka\po\to\lU\kAByA\mapa^da\M tada^stu#} +; 375174-0023nadIkAntanadIkAnta +; Baringtonia -> Barringtonia +372875 old
— c) {%Baringtonia acutangula Gaertn.%} +; +372875 new
— c) {%Barringtonia acutangula Gaertn.%} +; 114311-0928udDAraudDAra/ +; Befreigung -> Befreiung +105417 old
a) {%das Herausziehen, Errettung, Befreigung%} +; +105417 new
a) {%das Herausziehen, Errettung, Befreiung%} +; 1054057-0691samarTasamarTa +; Befähi -> Befähigung +997208 old
a) = {#sAmarTya#} {%Befähi%}- gung u. s. w.: {#sarvezu kAryezu samarTayuktA budDistavAstyeva#} +; +997208 new
a) = {#sAmarTya#} {%Befähigung%}- gung u. s. w.: {#sarvezu kAryezu samarTayuktA budDistavAstyeva#} +; 873296-0629vacasyAvacasyA/ +; Beredtsamkeit -> Beredsamkeit +809766 old NIR. 12, 18. {#viSve^ de\vAso\ aDa\ vfzRyA^ni\ te 'va^rDaya\nsoma^vatyA vaca\syayA^#} {%mit%} Soma {%trunkener Beredtsamkeit%} +; +809766 new NIR. 12, 18. {#viSve^ de\vAso\ aDa\ vfzRyA^ni\ te 'va^rDaya\nsoma^vatyA vaca\syayA^#} {%mit%} Soma {%trunkener Beredsamkeit%} +; 391684-0174niraBiBavaniraBiBava +; Beschäwung -> Beschämung +389773 old {#niraBiBava#}¦ ({#nis + aBi°#}) adj. {%keine Demüthigung —, keine Beschäwung enthaltend%} +; +389773 new {#niraBiBava#}¦ ({#nis + aBi°#}) adj. {%keine Demüthigung —, keine Beschämung enthaltend%} +; 962046-1428vyagravyagra +; Besonnenbeit -> Besonnenheit +903542 old BHĀG. P. 5, 8, 2. {#avyagra#} {%nicht aufgeregt, Besonnenbeit zeigend, ruhig und besonnen zu Werke gehend, sich durch Nichts irre machen lassend%} +; +903542 new BHĀG. P. 5, 8, 2. {#avyagra#} {%nicht aufgeregt, Besonnenheit zeigend, ruhig und besonnen zu Werke gehend, sich durch Nichts irre machen lassend%} +; 209552-0599KapuraKapura +; Betenussbaum -> Betelnussbaum +199186 old
α) {%Betenussbaum%} +; +199186 new
α) {%Betelnussbaum%} +; 1155617-1464svAgatasvAgata +; Bewillkommung -> Bewillkommnung +1095489 old {%Bewillkommung%} +; +1095489 new {%Bewillkommnung%} +; 60321-0448aryamanaryama/n +; Comerad -> Camerad +51589 old
1) {%Busenfreund, Gespiele, Gefährte, Comerad, sodalis%}: {#nArya\maRa\M puzya^ti\ no saKA^yam#} +; +51589 new
1) {%Busenfreund, Gespiele, Gefährte, Camerad, sodalis%}: {#nArya\maRa\M puzya^ti\ no saKA^yam#} +; 928406-1156virukmantviru/kmant +; Donnerkeit -> Donnerkeil +870806 old 1, 127, 3. {%der Blitz%} oder {%Donnerkeit%} +; +870806 new 1, 127, 3. {%der Blitz%} oder {%Donnerkeil%} +; 13571-0099atiBIatiBI +; Donnerkeits -> Donnerkeils +11697 old {#atiBI#}¦ ({#ati + BI#}) m. {%der überaus schreckenerregende Lichtglanz des Donnerkeits, Blitz%} +; +11697 new {#atiBI#}¦ ({#ati + BI#}) m. {%der überaus schreckenerregende Lichtglanz des Donnerkeils, Blitz%} +; 982747-0107SalAkaSalAka +; Durchboren -> Durchbohren +925336 old
— 4) {%ein spitzes Werkzeug zum Durchboren, Spitze des Pfeils, Nadel%} u. s. w. (= {#Salya#} +; +925336 new
— 4) {%ein spitzes Werkzeug zum Durchbohren, Spitze des Pfeils, Nadel%} u. s. w. (= {#Salya#} +; 205802-0571kzetrakze/tra +; Eheman -> Ehemann +195685 old
— 5) {%der fruchtbare Mutterleib; das als Feld gedachte Eheweib, welches der Eheman selbst bestellt oder durch Andere bestellen lässt%}; = {#Baga#} oder {#yoni#} +; +195685 new
— 5) {%der fruchtbare Mutterleib; das als Feld gedachte Eheweib, welches der Ehemann selbst bestellt oder durch Andere bestellen lässt%}; = {#Baga#} oder {#yoni#} +; 558155-0383BogapatiBogapati +; Einkänfte -> Einkünfte +552909 old {#Bogapati#}¦ (2. {#Boga + pa°)#} m. {%Gouverneur einer Stadt%} oder {%Provinz (Herr der Einkänfte)%} +; +552909 new {#Bogapati#}¦ (2. {#Boga + pa°)#} m. {%Gouverneur einer Stadt%} oder {%Provinz (Herr der Einkünfte)%} +; 509744-1158prAsAdaprAsAda +; Eundament -> Fundament +502958 old
— 2) {%ein auf hohem Eundament ruhendes Gebäude, zu dem man vermittelst Treppen hinaufsteigt; Tempel; Palast%} +; +502958 new
— 2) {%ein auf hohem Fundament ruhendes Gebäude, zu dem man vermittelst Treppen hinaufsteigt; Tempel; Palast%} +; 225612-0755guRaguRa/ +; Feid -> Feind +217102 old MED. Die vier sogenannten {#upAya#} oder {%Hülfsmittel den Feid zu bezwingen: Unterhandlung, Bestechung, Zwiespalt, offene Gewalt%} werden +; +217102 new MED. Die vier sogenannten {#upAya#} oder {%Hülfsmittel den Feind zu bezwingen: Unterhandlung, Bestechung, Zwiespalt, offene Gewalt%} werden +; 323993-0565dAdA1 +; Fluchthun -> Fluch thun +321390 old VID. 71. {#SApam#} {%einen Fluchthun, aussprechen%}: {#evaM dattvArjune SApam#} +; +321390 new VID. 71. {#SApam#} {%einen Fluch thun, aussprechen%}: {#evaM dattvArjune SApam#} +; 353593-0804drudru1 +; Fluchtschlagen -> Flucht schlagen +349006 old R. 2, 97, 9. 4, 1, 19 5, 95, 26. — caus. {%zum Laufen bringen, in die Fluchtschlagen%}: {#sEnyam - prAdrAvayadbalI#} +; +349006 new R. 2, 97, 9. 4, 1, 19 5, 95, 26. — caus. {%zum Laufen bringen, in die Flucht schlagen%}: {#sEnyam - prAdrAvayadbalI#} +; 861336-0520lavaRottamalavaRottama +; Flussalz -> Flusssalz +796926 old {#lavaRottama#}¦ n. {%Flussalz%} +; +796926 new {#lavaRottama#}¦ n. {%Flusssalz%} +; 224142-0747giripuragiripura +; Gebirgssladt -> Gebirgsstadt +215822 old {#giripura#}¦ ({#giri + pura#}) n. {%Gebirgssladt%} oder N. pr. einer best. Stadt +; +215822 new {#giripura#}¦ ({#giri + pura#}) n. {%Gebirgsstadt%} oder N. pr. einer best. Stadt +; 144922-0031kaRwakaka/Rwaka +; Gemüthsoffecten -> Gemüthsaffecten +133163 old
— e) {%die stachelartig sich erhebenden Haare am menschlichen Leibe bei heftigen Gemüthsoffecten%} +; +133163 new
— e) {%die stachelartig sich erhebenden Haare am menschlichen Leibe bei heftigen Gemüthsaffecten%} +; 1026317-0444zazWazazWa/ +; Genetiv -> Genitiv +968263 old
— b) (sc. {#viBakti#}) {%der sechste Casus, Genetiv%} +; +968263 new
— b) (sc. {#viBakti#}) {%der sechste Casus, Genitiv%} +; 491474-1019pradAtavyapradAtavya +; Genugthung -> Genugthuung +486304 old Spr. 1514. {#pratipARaH#} {%Genugthung im Spiel%} +; +486304 new Spr. 1514. {#pratipARaH#} {%Genugthuung im Spiel%} +; 654915-1062avaroDanaavaroDana2 +; Ggnaeceum -> Gynaeceum +636127 old
3) pl. {%die Frauen im Ggnaeceum%} +; +636127 new
3) pl. {%die Frauen im Gynaeceum%} +; 1215387-1789mahAvratinmahAvratin +; Grundpfichten -> Grundpflichten +1142541 old
1) {%die fünf Grundpfichten der%} Jaina {%ausübend%} +; +1142541 new
1) {%die fünf Grundpflichten der%} Jaina {%ausübend%} +; 265563-0029janitrajani/tra +; Herkunfl -> Herkunft +260639 old
1) {%Geburtsstätte; Heimath; Herkunfl%}: {#yatrA^ ta A\huH pa^ra\maM ja\nitra^m#} +; +260639 new
1) {%Geburtsstätte; Heimath; Herkunft%}: {#yatrA^ ta A\huH pa^ra\maM ja\nitra^m#} +; 364843-0901DADA1 +; Herzsetzend -> Herz setzend +360542 old HARIV. 12705. {#puravanitAnAM manasi kusumaSarAsanamupadaDAnaH#} {%den Liebesgott in's Herzsetzend%} +; +360542 new HARIV. 12705. {#puravanitAnAM manasi kusumaSarAsanamupadaDAnaH#} {%den Liebesgott in's Herz setzend%} +; 311493-0444trivftparRItrivftparRI +; Hincha -> Hingcha +308240 old {#trivftparRI#}¦ ({#tri° + parRa#}) f. N. einer Pflanze, {%Hincha repens Roxb.%} (vgl. {#hilamocikA#}), +; +308240 new {#trivftparRI#}¦ ({#tri° + parRa#}) f. N. einer Pflanze, {%Hingcha repens Roxb.%} (vgl. {#hilamocikA#}), +; 541485-0210BarawaBarawa/ +; Iöpfer -> Töpfer +533838 old UṆĀDIS. 4, 104. m. {%(Iöpfer%}) +; +533838 new UṆĀDIS. 4, 104. m. {%(Töpfer%}) +; 705015-1287kAryavaSakAryavaSa +; Jederman -> Jedermann +669817 old {#kAryavaSa#}¦ ({#kArya + vaSa#}) m. {%die Macht der Absicht, - des Zweckes%}: {#sarvaH kAryavaSAjjano 'Biramate#} {%Jederman fühlt sich für Etwas zu Etwas hingezogen%} +; +669817 new {#kAryavaSa#}¦ ({#kArya + vaSa#}) m. {%die Macht der Absicht, - des Zweckes%}: {#sarvaH kAryavaSAjjano 'Biramate#} {%Jedermann fühlt sich für Etwas zu Etwas hingezogen%} +; 525345-0076bAliSabAliSa1 +; Kindisch -> kindisch +518447 old P. 5, 1, 124. adj. f. {#A = bAla#} {%jung%}; subst. {%Kind%}; gewöhnlich in der übertr. Bed. {%Kindisch, dumm, einfältig; Thor, Schwachkopf%} +; +518447 new P. 5, 1, 124. adj. f. {#A = bAla#} {%jung%}; subst. {%Kind%}; gewöhnlich in der übertr. Bed. {%kindisch, dumm, einfältig; Thor, Schwachkopf%} +; 352633-0796dravadrava/ +; Rewegung -> Bewegung +347733 old
a) {%Lauf, rasche Rewegung; Flucht%}; = {#gati, vega, pradrAva, vidrava#} +; +347733 new
a) {%Lauf, rasche Bewegung; Flucht%}; = {#gati, vega, pradrAva, vidrava#} +; 292433-0298tApyatApya +; Schwefelktes -> Schwefelkies +290713 old {#tApya#}¦ (von {#tApI) = tApIja#} {%Schwefelktes%} +; +290713 new {#tApya#}¦ (von {#tApI) = tApIja#} {%Schwefelkies%} +; 793035-1623pratyAtmampratyAtmam +; Seelle -> Seele +727641 old {#pratyAtmam#}¦ adv. {%für jede Seelle, in jeder Seele%} +; +727641 new {#pratyAtmam#}¦ adv. {%für jede Seele, in jeder Seele%} +; 437174-0593palyapalya +; Suck -> Sack +435477 old
1) {%ein%} (wohl {%ein bestimmtes Maass fassender) Suck für Getraide%} +; +435477 new
1) {%ein%} (wohl {%ein bestimmtes Maass fassender) Sack für Getraide%} +; 538625-0178BajBaj +; Theii -> Theil +530750 old SUŚR. 1, 6, 2. 106, 13 (act.). {%mit%} ({#saha#}) {%Jmd Etwas theilen, Jmd%} (dat. gen.) {%einen Theii abgeben%}: {#siMhastena saMviBajya#} — {#taM BakzitavAn#} +; +530750 new SUŚR. 1, 6, 2. 106, 13 (act.). {%mit%} ({#saha#}) {%Jmd Etwas theilen, Jmd%} (dat. gen.) {%einen Theil abgeben%}: {#siMhastena saMviBajya#} — {#taM BakzitavAn#} +; 711115-1310kulakakulaka +; Their -> Thier +673651 old
f) {%ein best. zu den Mäusen gerechnetes Their%} +; +673651 new
f) {%ein best. zu den Mäusen gerechnetes Thier%} +; 155852-0142karvarakarvara/2 +; Tieger -> Tiger +145481 old
— b) {%Tieger%} +; +145481 new
— b) {%Tiger%} +; 358933-0843dvIpadvIpa/ +; Tiegerfell -> Tigerfell +353495 old VP. 175 aufgezählt. — Die Bed. {%Tiegerfell%} ( +; +353495 new VP. 175 aufgezählt. — Die Bed. {%Tigerfell%} ( +; 491814-1022pradfptipra/dfpti +; Tolltheit -> Tollheit +486657 old {#pra/dfpti#}¦ (von 1. {#darp#} mit {#pra#}) f. {%Uebermuth, Tolltheit%}: {#nAMho\ marta^M naSate\ na pradf^ptiH#} +; +486657 new {#pra/dfpti#}¦ (von 1. {#darp#} mit {#pra#}) f. {%Uebermuth, Tollheit%}: {#nAMho\ marta^M naSate\ na pradf^ptiH#} +; 852706-0435revantreva/nt +; Traunkenheit -> Trunkenheit +786912 old 13. {#mada\ A so^ma\ manye^ re\vA~ i^va#} {%ich komme in der Traunkenheit mir als reicher Mann vor%} +; +786912 new 13. {#mada\ A so^ma\ manye^ re\vA~ i^va#} {%ich komme in der Trunkenheit mir als reicher Mann vor%} +; 46151-0340aBiBavanaaBiBavana +; Uberwältigen -> Ueberwältigen +38649 old {#aBiBavana#}¦ (wie eben) n. {%das Uberwältigen%}: {#jarayA cABiBavanaM vyADiBiScopapIqanam#} +; +38649 new {#aBiBavana#}¦ (wie eben) n. {%das Ueberwältigen%}: {#jarayA cABiBavanaM vyADiBiScopapIqanam#} +; 634025-0979anarTaanarTa1 +; Unheii -> Unheil +623206 old Spr. 1446 (Conj.). {#°paRqita#} {%sich auf Unheii verstehend%} d. i. {%Unheil zu stiften verstehend%} (oder zu 2. {#anarTa#} +; +623206 new Spr. 1446 (Conj.). {#°paRqita#} {%sich auf Unheil verstehend%} d. i. {%Unheil zu stiften verstehend%} (oder zu 2. {#anarTa#} +; 83411-0625AtmavikrayaAtmavikraya +; Verhauf -> Verkauf +72350 old {#Atmavikraya#}¦ ({#A° + vi°#}) m. {%Verhauf seiner selbst, Verkauf seiner Freiheit%} +; +72350 new {#Atmavikraya#}¦ ({#A° + vi°#}) m. {%Verkauf seiner selbst, Verkauf seiner Freiheit%} +; 99801-0779iNgiNg +; Verhälltniss -> Verhältniss +89644 old
— 2) {%in dasjenige grammatische Verhälltniss bringen, in welchem ein Worttheil%} {#iNgya#} (s. d.) {%heisst%}, +; +89644 new
— 2) {%in dasjenige grammatische Verhältniss bringen, in welchem ein Worttheil%} {#iNgya#} (s. d.) {%heisst%}, +; 664275-1102ADAtarADAtar +; Verleicher -> Verleiher +642056 old {#ADAtar#}¦ (von 1. {#DA#} mit {#A)#} nom. ag. {%Verleicher%} (einer Kunst), {%Lehrer%}: {#pAtraviSeze nyastaM guRAntaraM vrajati SilpamADAtuH#} +; +642056 new {#ADAtar#}¦ (von 1. {#DA#} mit {#A)#} nom. ag. {%Verleiher%} (einer Kunst), {%Lehrer%}: {#pAtraviSeze nyastaM guRAntaraM vrajati SilpamADAtuH#} +; 543875-0230BABA1 +; Verschein -> Vorschein +536173 old R. 1, 4, 30. {#Bede BAti#} (loc. partic.) {%zum Verschein kommen%} +; +536173 new R. 1, 4, 30. {#Bede BAti#} (loc. partic.) {%zum Vorschein kommen%} +; 914056-1030viwaNkaviwaNka +; Vogethaus -> Vogelhaus +856088 old
1) {%Taubenhaus, Vogethaus%} +; +856088 new
1) {%Taubenhaus, Vogelhaus%} +; 606625-0793mIlmIl +; Vorsehein -> Vorschein +600353 old
— {#samud#} {%zum Vorsehein kommen, sich zeigen%}: {#DvAnte samunmIlati#} +; +600353 new
— {#samud#} {%zum Vorschein kommen, sich zeigen%}: {#DvAnte samunmIlati#} +; 1145067-1375sPursPur +; Vorshein -> Vorschein +1084790 old
— 3) {%erscheinen, hervorbrechen, zum Vorshein kommen%} +; +1084790 new
— 3) {%erscheinen, hervorbrechen, zum Vorschein kommen%} +; 834226-0258raTaSAlAraTaSAlA +; Wagenschüppen -> Wagenschuppen +766574 old {#raTaSAlA#}¦ f. {%Wagenschüppen%} +; +766574 new {#raTaSAlA#}¦ f. {%Wagenschuppen%} +; 120541-0971upavanaupavana +; Waldchen -> Wäldchen +110716 old {#upavana#}¦ ({#upa + vana#}) n. {%Waldchen, Hain%}; nach den Lexicographen {%ein angepflanzter Wald%} +; +110716 new {#upavana#}¦ ({#upa + vana#}) n. {%Wäldchen, Hain%}; nach den Lexicographen {%ein angepflanzter Wald%} +; 68651-0506avyayIBAvaavyayIBAva +; Weehsel -> Wechsel +58739 old {#avyayIBAva#}¦ (von {#avyaya + BU#}) m. {%eine adverbiale Zusammensetzung, die keinem Weehsel der Flexion mehr unterworfen ist%}, +; +58739 new {#avyayIBAva#}¦ (von {#avyaya + BU#}) m. {%eine adverbiale Zusammensetzung, die keinem Wechsel der Flexion mehr unterworfen ist%}, +; 483224-0958pratipakzitapratipakzita +; Widersprueh -> Widerspruch +479234 old {#pratipakzita#}¦ (wie eben) adj. {%einen Widersprueh enthaltend%} +; +479234 new {#pratipakzita#}¦ (wie eben) adj. {%einen Widerspruch enthaltend%} +; 459294-0773punaHsaMgamapunaHsaMgama +; Wiedderzusammenkommen -> Wiederzusammenkommen +457056 old {#punaHsaMgama#}¦ ({#punar + saM°#}) m. {%das Wiedderzusammenkommen%} +; +457056 new {#punaHsaMgama#}¦ ({#punar + saM°#}) m. {%das Wiederzusammenkommen%} +; 483474-0961pratipAdanapratipAdana +; Wiederzukommtenlassen -> Wiederzukommenlassen +479539 old KULL. zu M. 8, 214. {%das Wiederzukommtenlassen, Wiedergeben%}: {#indradyumnasya svargasya pra°#} +; +479539 new KULL. zu M. 8, 214. {%das Wiederzukommenlassen, Wiedergeben%}: {#indradyumnasya svargasya pra°#} +; 561595-0420makkallamakkalla +; Wochnerinnen -> Wöchnerinnen +556785 old {#makkalla#}¦ m. {%ein gefährlicher Unterleibsabscess bei Wochnerinnen%} +; +556785 new {#makkalla#}¦ m. {%ein gefährlicher Unterleibsabscess bei Wöchnerinnen%} +; 474094-0884pozapo/za +; Wohlfart -> Wohlfahrt +470566 old AV. 9, 4, 2. {#sahasrapoza/#} und {#sahasrApoza/#} {%tausendfältiges Gedeihen, - Wohlfart%} +; +470566 new AV. 9, 4, 2. {#sahasrapoza/#} und {#sahasrApoza/#} {%tausendfältiges Gedeihen, - Wohlfahrt%} +; 980497-0091SaraRaSaraRa/2 +; Wöhnung -> Wohnung +923263 old BHĀG. P. 2, 8, 6. {#devAnAm#} {%Wöhnung%} +; +923263 new BHĀG. P. 2, 8, 6. {#devAnAm#} {%Wohnung%} +; 978027-0066SabdakalpadruSabdakalpadru +; Wöterbuchs -> Wörterbuch +920301 old {#Sabdakalpadru#}¦ m. Titel des {%Wöterbuchs%} von Keśava +; +920301 new {#Sabdakalpadru#}¦ m. Titel des {%Wörterbuch%} von Keśava +; 814316-0051yaTepsitayaTepsita +; Wünsehen -> Wünschen +743226 old {#yaTepsita#}¦ ({#yaTA + I°#}) adj. {%den Wünsehen entsprechend, gewünscht%}: {#kAmAn#} +; +743226 new {#yaTepsita#}¦ ({#yaTA + I°#}) adj. {%den Wünschen entsprechend, gewünscht%}: {#kAmAn#} +; 991427-0164SAsSAs1 +; Zuscht -> Zucht +932826 old
— 2) {%in Zuscht —, im Zaum halten%}: {#daRqaH SAsti prajAH sarvAH#} +; +932826 new
— 2) {%in Zucht —, im Zaum halten%}: {#daRqaH SAsti prajAH sarvAH#} +; 497814-1071pravartanapravartana +; Zustromen -> Zuströmen +492515 old VARĀH. BṚH. S. 49, 5. {%das Zustromen%}: {#toya°#} +; +492515 new VARĀH. BṚH. S. 49, 5. {%das Zuströmen%}: {#toya°#} +; 356833-0831dvijihvadvi/jihva +; Zweizungigkeit -> Zweizüngigkeit +351843 old ŚABDAR. im ŚKDR. Davon {#°tA#} f. {%Zweizungigkeit%} (eig.) +; +351843 new ŚABDAR. im ŚKDR. Davon {#°tA#} f. {%Zweizüngigkeit%} (eig.) +; 1134257-1235skandskand +; abtropfeln -> abtröpfeln +1069189 old
— {#sam#} {%abtropfeln, abspringen%}: {#ApaH#} +; +1069189 new
— {#sam#} {%abtröpfeln, abspringen%}: {#ApaH#} +; 1038437-0556saYjsaYj +; anhangend -> anhängend +981158 old
a) {%angehängt; anhangend, hängend an%}: {#(rAjYA) avasaktaH pituste 'dya mftaH skanDe BujaMgamaH#} +; +981158 new
a) {%angehängt; anhängend, hängend an%}: {#(rAjYA) avasaktaH pituste 'dya mftaH skanDe BujaMgamaH#} +; 520795-0044bahirDAbahirDA/ +; ansserhalb -> ausserhalb +514492 old {#bahirDA/#}¦ (von {#bahis)#} adv. praep. (mit abl.) {%draussen, auswärts. ansserhalb, hinaus aus%}: {#i\dama\haM ta\ptaM vArva^hi\rDA ya\jYAnniH sf^jAmi#} +; +514492 new {#bahirDA/#}¦ (von {#bahis)#} adv. praep. (mit abl.) {%draussen, auswärts. ausserhalb, hinaus aus%}: {#i\dama\haM ta\ptaM vArva^hi\rDA ya\jYAnniH sf^jAmi#} +; 242612-0905cakcak +; aprés -> après +234741 old
— {#ud#} {%aufblicken, sehen%}: {#yaM cekitAnamanu cittaya uccakanti#} {%il voit, et aprés lui voient les organes de la connaissance%} +; +234741 new
— {#ud#} {%aufblicken, sehen%}: {#yaM cekitAnamanu cittaya uccakanti#} {%il voit, et après lui voient les organes de la connaissance%} +; 393674-0187nirUhanirUha2 +; ascertainement -> ascertainment +391295 old MED. {%logick, disputation; a complete sentence, one having no ellipsis; certainty, ascertainement%} +; +391295 new MED. {%logick, disputation; a complete sentence, one having no ellipsis; certainty, ascertainment%} +; 190972-0430kevalinkevalin +; ascéte -> ascète +179639 old BHĀG. P. 4, 25, 39. 6, 5, 40. BURNOUF : {%ascéte contemplatif%} und {%sage.%} +; +179639 new BHĀG. P. 4, 25, 39. 6, 5, 40. BURNOUF : {%ascète contemplatif%} und {%sage.%} +; 172362-0285kimkim +; aufkeine -> auf keine +162253 old
— θ) mit {#ca na (cana)#} {%auch nicht%} (verstärkend) {%irgendwie, aufkeine Weise%}: {#na hi SakzyAmi kiM ca na . parityaktumahaM banDuM svayaM jIvannfSaMsavat ..#} +; +162253 new
— θ) mit {#ca na (cana)#} {%auch nicht%} (verstärkend) {%irgendwie, auf keine Weise%}: {#na hi SakzyAmi kiM ca na . parityaktumahaM banDuM svayaM jIvannfSaMsavat ..#} +; 242612-0905cakcak +; befriedrigt -> befriedigt +234710 old {#cak#}¦, {#ca/kati#} und {#ca/kate#} {%befriedrigt sein; widerstehen; leuchten%} +; +234710 new {#cak#}¦, {#ca/kati#} und {#ca/kate#} {%befriedigt sein; widerstehen; leuchten%} +; 181812-0361kulyakulya1 +; condolance -> condolence +171233 old MED. y. 14. Als n. {%friendly inquiry after family affairs or domestic accidents, condolance, congratulation, etc.%} +; +171233 new MED. y. 14. Als n. {%friendly inquiry after family affairs or domestic accidents, condolence, congratulation, etc.%} +; 262632-1096CinnaruhaCinnaruha +; cordifoliuss -> cordifolius +257012 old
a) {%Cocculus cordifoliuss DC.%} +; +257012 new
a) {%Cocculus cordifolius DC.%} +; 295513-0323tiktaBadrakatiktaBadraka +; dioica -> dioeca +293750 old {#tiktaBadraka#}¦ ({#tikta + Ba°#}) m. {%Trichosanthes dioica Roxb.%} ({#pawola#}) +; +293750 new {#tiktaBadraka#}¦ ({#tikta + Ba°#}) m. {%Trichosanthes dioeca Roxb.%} ({#pawola#}) +; 309933-0434trinetratrinetra +; dretäugig -> dreiäugig +306933 old
1) {%dretäugig%}, Beiw. und Bein. Rudra-Śiva's +; +306933 new
1) {%dreiäugig%}, Beiw. und Bein. Rudra-Śiva's +; 818156-0097yAyA1 +; durchwändern -> durchwandern +749339 old
— {#pari#} {%umherwandeln, umwandeln, umfahren, durchwändern; herbeikommen%}: {#yABi\H sUrya^M pariyA\TaH pa^rA\vati^#} +; +749339 new
— {#pari#} {%umherwandeln, umwandeln, umfahren, durchwandern; herbeikommen%}: {#yABi\H sUrya^M pariyA\TaH pa^rA\vati^#} +; 1035057-0524saMkocinsaMkocin +; einziekend -> einziehend +977301 old
— 2) {%zusammenziehend, einziekend%}; s. {#gAtra°#} . +; +977301 new
— 2) {%zusammenziehend, einziehend%}; s. {#gAtra°#} . +; 186262-0395kftaBAvakftaBAva +; entchlossen -> entschlossen +175442 old {#kftaBAva#}¦ ({#kfta + BAva#}) adj. {%der seinen Sinn auf Etwas%} (loc.) {%gerichtet hat, fest entchlossen%}: {#tO parasparamaByetya sarvagAtrezu DanvinO . GorErvivyaDaturvAREH kftaBAvAvuBO jaye ..#} +; +175442 new {#kftaBAva#}¦ ({#kfta + BAva#}) adj. {%der seinen Sinn auf Etwas%} (loc.) {%gerichtet hat, fest entschlossen%}: {#tO parasparamaByetya sarvagAtrezu DanvinO . GorErvivyaDaturvAREH kftaBAvAvuBO jaye ..#} +; 536485-0155brAhmaRabruvabrAhmaRabruva +; enterhrender -> entehrender +527890 old {#brAhmaRabruva#}¦ ({#brA° + bruva#}) adj. subst. {%sich Brahmane nennend, bloss den Namen eines Brahmanen tragend, ein seinen Stand enterhrender Brahmane%} +; +527890 new {#brAhmaRabruva#}¦ ({#brA° + bruva#}) adj. subst. {%sich Brahmane nennend, bloss den Namen eines Brahmanen tragend, ein seinen Stand entehrender Brahmane%} +; 1064107-0769sarsar +; entstandt -> entsandt +1007428 old
— c) {%entstandt%}: {#bARavadvisftA#} (= {#aparAvartinaH#} +; +1007428 new
— c) {%entsandt%}: {#bARavadvisftA#} (= {#aparAvartinaH#} +; 1018587-0389SrutitasSrutitas +; geoflenbarten -> geoffenbarten +961253 old {#Srutitas#}¦ (von 1. {#Sruti#}) adv. {%auf dem Wege der geoflenbarten Lehre%} (Gegens. {#tarkatas#}) +; +961253 new {#Srutitas#}¦ (von 1. {#Sruti#}) adv. {%auf dem Wege der geoffenbarten Lehre%} (Gegens. {#tarkatas#}) +; 139581-1132OdumbaraO/dumbara +; herrühend -> herrührend +128177 old
1) adj. f. {#I#} {%vom%} Udumbara-{%Baum herrühend, aus dessen Holze gemacht%} gaṇa {#rajatAdi#} zu +; +128177 new
1) adj. f. {#I#} {%vom%} Udumbara-{%Baum herrührend, aus dessen Holze gemacht%} gaṇa {#rajatAdi#} zu +; 965156-1466vyAGranaKavyAGranaKa +; herrühende -> herrührende +907564 old
1) n. {%eine von Fingernägeln herrühende Wunde von bestimmter Form%} +; +907564 new
1) n. {%eine von Fingernägeln herrührende Wunde von bestimmter Form%} +; 866356-0574loklok +; hinaufblücken -> hinaufblicken +803172 old
— {#ud#} caus. {%hinaufblücken zu%}: {#BagavantamaBimuKamullokayamAnAH#} +; +803172 new
— {#ud#} caus. {%hinaufblicken zu%}: {#BagavantamaBimuKamullokayamAnAH#} +; 33111-0248antargataantargata +; hineigegangen -> hineingegangen +28104 old
1) {%hineigegangen%} ({#maDyaprApta#}) +; +28104 new
1) {%hineingegangen%} ({#maDyaprApta#}) +; 1198277-1740gOmayagOmaya +; hommend -> kommend +1132856 old {#gOmaya#}¦ (von {#gomaya#}) adj. {%von Kuhmist hommend%}: {#Basman#} +; +1132856 new {#gOmaya#}¦ (von {#gomaya#}) adj. {%von Kuhmist kommend%}: {#Basman#} +; 411554-0341papa2 +; hülend -> hütend +408430 old 2. {#pa#}¦ (von {#pA, pAti#}) am Ende eines comp. {%hülend, beschützend%}: {#madrapa#} s. v. a. {#madreSa#} +; +408430 new 2. {#pa#}¦ (von {#pA, pAti#}) am Ende eines comp. {%hütend, beschützend%}: {#madrapa#} s. v. a. {#madreSa#} +; 264833-0016janjan +; lebenfähig -> lebensfähig +259661 old AV. 6, 3, 1 (wo viell. richtiger {#pari^ jA\taH#} betont würde) und {#aparijAta#} {%nicht fertig, nicht lebenfähig geboren%} oder {%todtgeboren%} +; +259661 new AV. 6, 3, 1 (wo viell. richtiger {#pari^ jA\taH#} betont würde) und {#aparijAta#} {%nicht fertig, nicht lebensfähig geboren%} oder {%todtgeboren%} +; 104701-0835IkzIkz +; nehment -> nehmet +95155 old KUMĀRAS. 1, 17. {#nAvekzaDve#} (so ist wohl zu lesen) {#parasparam#} {%ihr nehment nicht Einer auf den Andern Rücksicht%} +; +95155 new KUMĀRAS. 1, 17. {#nAvekzaDve#} (so ist wohl zu lesen) {#parasparam#} {%ihr nehmet nicht Einer auf den Andern Rücksicht%} +; 380114-0074navazawkanavazawka +; sachs -> sechs +378371 old {#navazawka#}¦ ({#navan + za°#}) adj. {%aus neun Mal sachs (Schnüren) bestehend%}: {#raSmikalApa#} +; +378371 new {#navazawka#}¦ ({#navan + za°#}) adj. {%aus neun Mal sechs (Schnüren) bestehend%}: {#raSmikalApa#} +; 867876-0588locakalocaka +; schalffe -> schlaffe +804522 old
— i) {%schalffe Haut%} +; +804522 new
— i) {%schlaffe Haut%} +; 978847-0070SabdABivahaSabdABivaha +; schalleitend -> schallleitend +920857 old {#SabdABivaha#}¦ adj. {%lautzuführend, schalleitend%}: {#sirA#} {%Gehörgang%} +; +920857 new {#SabdABivaha#}¦ adj. {%lautzuführend, schallleitend%}: {#sirA#} {%Gehörgang%} +; 220482-0709galgal1 +; schmeizend -> schmelzend +211631 old
— 3) {%verrinnen%} so v. a. {%schwinden, weichen%}: {#viyogAgnivigalajjIvito#} (auch {%schmeizend%}) {#'Bavat#} +; +211631 new
— 3) {%verrinnen%} so v. a. {%schwinden, weichen%}: {#viyogAgnivigalajjIvito#} (auch {%schmelzend%}) {#'Bavat#} +; 230932-0797gotIrTakagotIrTaka +; seittlicher -> seitlicher +222039 old {#gotIrTaka#}¦ (von {#gotIrTa#}) adj. so heisst ein {%seittlicher Schnitt%} ({#Ceda#}), der bei einer Mastdarmfistel angewandt wird, +; +222039 new {#gotIrTaka#}¦ (von {#gotIrTa#}) adj. so heisst ein {%seitlicher Schnitt%} ({#Ceda#}), der bei einer Mastdarmfistel angewandt wird, +; 115061-0932udrekaudreka +; sempercirens -> sempervirens +106046 old
— 2) f. {#°kA#} N. einer Pflanze, {%Melia sempercirens Sw.%} ({#mahAnimba#}), +; +106046 new
— 2) f. {#°kA#} N. einer Pflanze, {%Melia sempervirens Sw.%} ({#mahAnimba#}), +; 1143577-1358sparSsparS +; spühlen -> spülen +1082753 old
— 2) {#apaH, udakam, jalam#} u. s. w. {%bestimmte Theile des Körpers mit Wasser in Berührung bringen, eine Waschung vornehmen, sich den Mund spühlen u.s.w.%} +; +1082753 new
— 2) {#apaH, udakam, jalam#} u. s. w. {%bestimmte Theile des Körpers mit Wasser in Berührung bringen, eine Waschung vornehmen, sich den Mund spülen u.s.w.%} +; 526745-0085bindubindu/ +; unbedentender -> unbedeutender +519691 old
— 3) in der Dramatik {%ein scheinbar unbedentender Zwischenfall, der wie ein Oeltropfen im Wasser einen grossen Umfang gewinnt%}, +; +519691 new
— 3) in der Dramatik {%ein scheinbar unbedeutender Zwischenfall, der wie ein Oeltropfen im Wasser einen grossen Umfang gewinnt%}, +; 55081-0398ayuvaayuva +; unerschütter -> unerschüttert +45809 old {#ayuva#}¦ (3. {#a + yuva#}) adj. {%ungestört, unerschütter%}: {#ayuvamAryasya rAzwraM Bavati#} +; +45809 new {#ayuva#}¦ (3. {#a + yuva#}) adj. {%ungestört, unerschüttert%}: {#ayuvamAryasya rAzwraM Bavati#} +; 785175-1597pAriRAmikapAriRAmika +; unterworjen -> unterworfen +722885 old {#pAriRAmika#}¦ (von {#pariRAma)#} adj. {%der Entwickelung unterworjen%}: {#BAva#} bei den Jaina so v. a. {%natürliche Anlage%} +; +722885 new {#pAriRAmika#}¦ (von {#pariRAma)#} adj. {%der Entwickelung unterworfen%}: {#BAva#} bei den Jaina so v. a. {%natürliche Anlage%} +; 876026-0647vatsanABavatsanABa +; vegetablisches -> vegetabilisches +812148 old
— 2) m. {%ein best. vegetablisches Gift%} +; +812148 new
— 2) m. {%ein best. vegetabilisches Gift%} +; 1042477-0591sadsad +; verciehen -> verliehen +985803 old
— c) {%verciehen, geschenkt%}: {#upasannArTa#} +; +985803 new
— c) {%verliehen, geschenkt%}: {#upasannArTa#} +; 1151647-1443svarakzayasvarakzaya +; verlust -> Verlust +1092488 old {#svarakzaya#}¦ m. {%verlust der Stimme%} +; +1092488 new {#svarakzaya#}¦ m. {%Verlust der Stimme%} +; 815266-0063yamyam +; vorstreken -> vorstrecken +745398 old
1) {%strecken, vorstreken%}: {#praya^tA f\zwaya^H#} +; +745398 new
1) {%strecken, vorstrecken%}: {#praya^tA f\zwaya^H#} +; 531515-0121bfhannOkAbfhannOkA +; vortheilthaften -> vortheilhaften +523892 old {#bfhannOkA#}¦ ({#bfhant + nOkA#}) f. Bez. {%einer best. vortheilthaften Stellung im Spiele%} Caturaṅga +; +523892 new {#bfhannOkA#}¦ ({#bfhant + nOkA#}) f. Bez. {%einer best. vortheilhaften Stellung im Spiele%} Caturaṅga +; 1028037-0462saMlakzyasaMlakzya +; wahrnembar -> wahrnehmbar +970052 old {#saMlakzya#}¦ (von {#lakzay#} mit {#sam#}) adj. {%wahrnembar, sichtbar%} +; +970052 new {#saMlakzya#}¦ (von {#lakzay#} mit {#sam#}) adj. {%wahrnehmbar, sichtbar%} +; 1028037-0462saMlakzyasaMlakzya +; wahrnembarer -> wahrnehmbarer +970055 old 338, 13. {#°krama#} und {#asaMlakzyakrama#} {%ein wahrnembarer%} und {%ein nicht wahrnehmbarer Vorgang%} +; +970055 new 338, 13. {#°krama#} und {#asaMlakzyakrama#} {%ein wahrnehmbarer%} und {%ein nicht wahrnehmbarer Vorgang%} +; 141992-0010kakzaka/kza +; wight -> weight +130485 old
— 23) f. {%the jewellers wight, the Retti%} ({#raktikA#}). +; +130485 new
— 23) f. {%the jewellers weight, the Retti%} ({#raktikA#}). +; 529565-0110buButsubuButsu +; wänschend -> wünschend +522444 old {#buButsu#}¦ (wie eben) adj. {%zu kennen wänschend%}: {#samyagjYAna°#} +; +522444 new {#buButsu#}¦ (wie eben) adj. {%zu kennen wünschend%}: {#samyagjYAna°#} +; 617025-0885mfdAhvayAmfdAhvayA +; wöhlriechende -> wohlriechend +610845 old {#mfdAhvayA#}¦ ({#mfd + Ahvaya#}) f. {%eine wöhlriechende Erdart%} +; +610845 new {#mfdAhvayA#}¦ ({#mfd + Ahvaya#}) f. {%eine wohlriechend Erdart%} +; 481154-0943pratAmrapratAmra +; überausroth -> überaus roth +477440 old {#pratAmra#}¦ (1. {#pra + tAmra#}) adj. {%überausroth%}: {#cintAjAgaraRapratAmranayana#} +; +477440 new {#pratAmra#}¦ (1. {#pra + tAmra#}) adj. {%überaus roth%}: {#cintAjAgaraRapratAmranayana#} +; 818156-0097yAyA1 +; überfähren -> überfáhren +749232 old
1) {%überfähren%} (mit einem Wagen): {#a\mi\tra\yanta^M sarvara\TA ni yA^hi#} +; +749232 new
1) {%überfáhren%} (mit einem Wagen): {#a\mi\tra\yanta^M sarvara\TA ni yA^hi#} +; 390994-0169niyayinniyayi/n +; überfährend -> überfáhrend +389150 old {#niyayi/n#}¦ (von {#yA#} mit {#ni#}) adj. {%überfährend%}: {#raTa#} +; +389150 new {#niyayi/n#}¦ (von {#yA#} mit {#ni#}) adj. {%überfáhrend%}: {#raTa#} +; 197642-0477kramkram +; überéten -> übertreten +186165 old
— {#samud#} {%überéten, nicht beachten%}: {#Darmam#} (so verbinden wir) +; +186165 new
— {#samud#} {%übertreten, nicht beachten%}: {#Darmam#} (so verbinden wir) diff --git a/pwgissues/issue67/diff_to_changes_dict.py b/pwgissues/issue67/diff_to_changes_dict.py new file mode 100644 index 0000000..a28a92d --- /dev/null +++ b/pwgissues/issue67/diff_to_changes_dict.py @@ -0,0 +1,71 @@ +# coding=utf-8 +""" diff_to_changes_dict.py + Generate change transactions from an 'old' and 'new' file + The two files should have same number of lines + ASSUME input file is a dictionary as in csl-orig/v02, e.g. mw.txt. + This structure identifies the metaline for each change; + and this is the only difference from diff_to_changes.py, + which ignores this structure, and is thus available for + generating changes for any two text files with same number of lines. + python diff_to_changes_dict.py old.txt new.txt changes.txt + Now: + python updateByLine.py old.txt changes.txt new1.txt + then new1.txt is same as new.txt. +""" +from __future__ import print_function +import sys, re,codecs + +def read_lines(filein): + with codecs.open(filein,encoding='utf-8',mode='r') as f: + lines = [x.rstrip('\r\n') for x in f] + return lines + +class Change(object): + def __init__(self,iline,line1,line2,metaline1): + self.iline = iline + self.line1 = line1 + self.line2 = line2 + self.lnum = iline+1 + self.metaline1 = metaline1 + a = [] + a.append('; %s' %metaline1) + a.append('%s old %s' %(self.lnum,self.line1)) + a.append(';') + a.append('%s new %s' %(self.lnum,self.line2)) + a.append(';---------------------------------------------------') + self.changeout = a + +def write_changes(fileout,changes): + outarr = [] + for change in changes: + for x in change.changeout: + outarr.append(x) + with codecs.open(fileout,"w","utf-8") as f: + for out in outarr: + f.write(out+'\n') + print(len(changes),"changes written to",fileout) + +if __name__=="__main__": + filein1 = sys.argv[1] # old.txt + filein2 = sys.argv[2] # new.txt + fileout = sys.argv[3] # changes.txt + lines1 = read_lines(filein1) + lines2 = read_lines(filein2) + n = len(lines1) + if n != len(lines2): + print('ERROR: files have different number of lines') + exit(1) + changes = [] + metaline1 = None + metaline2 = None + for iline,line1 in enumerate(lines1): + line2 = lines2[iline] + if line1.startswith(''): + metaline1 = line1 + + if line1 == line2: + continue + changes.append(Change(iline,line1,line2,metaline1)) + # + write_changes(fileout,changes) + diff --git a/pwgissues/issue67/digentry.py b/pwgissues/issue67/digentry.py new file mode 100644 index 0000000..9fbe709 --- /dev/null +++ b/pwgissues/issue67/digentry.py @@ -0,0 +1,103 @@ +#-*- coding:utf-8 -*- +"""digentry.py + Module to read a digitization + and generate a list of Entry objects + Adapted for temp_pwkvn_22.txt +""" +from __future__ import print_function +import sys,re,codecs + +class Entry(object): + Ldict = {} + def __init__(self,lines,linenum1,linenum2): + # linenum1,2 are int + self.metaline = lines[0] + self.lend = lines[-1] # the line + self.datalines = lines[1:-1] # the non-meta lines + # parse the meta line into a dictionary + self.metad = parseheadline(self.metaline) + self.linenum1 = linenum1 + self.linenum2 = linenum2 + L = self.metad['L'] + if L in self.Ldict: + print("Entry init error: duplicate L",L,linenum1) + exit(1) + self.Ldict[L] = self + self.lsarr = [] + +def init(filein): + # slurp lines + with codecs.open(filein,encoding='utf-8',mode='r') as f: + lines = [line.rstrip('\r\n') for line in f] + recs=[] # list of Entry objects + inentry = False + idx1 = None + idx2 = None + for idx,line in enumerate(lines): + if inentry: + if line.startswith(''): + idx2 = idx + entrylines = lines[idx1:idx2+1] + linenum1 = idx1 + 1 + linenum2 = idx2 + 1 + entry = Entry(entrylines,linenum1,linenum2) + recs.append(entry) + # prepare for next entry + idx1 = None + idx2 = None + inentry = False + elif line.startswith(''): # error + print('init_entries Error 1. Not expecting ') + print("line # ",idx+1) + print(line.encode('utf-8')) + exit(1) + else: + # keep looking for + continue + else: + # inentry = False. Looking for '' + if line.startswith(''): + idx1 = idx + inentry = True + elif line.startswith(''): # error + print('init_entries Error 2. Not expecting ') + print("line # ",idx+1) + print(line.encode('utf-8')) + exit(1) + else: + # keep looking for + continue + # when all lines are read, we should have inentry = False + if inentry: + print('digentry.init Error 3. for file',filein) + print('Last entry not closed. Open entry starts at line',idx1+1) + exit(1) + + print(len(lines),"lines read from",filein) + print(len(recs),"entries found") + return recs + +def parseheadline(headline): + """ + function to parse a 'metaline' and return a dictionary. + Example: + headline = 16850292-3visargavisarga1 + returns dictionary + {'L': '16850', + 'pc': '292-3', + 'k1': 'visarga', + 'k2': 'visarga', + 'h': '1', + 'e': ''} + """ + headline = headline.strip() + splits = re.split('[<]([^>]*)[>]([^<]*)',headline) + result = {} + for i in range(len(splits)): + if i % 3 == 1: + result[splits[i]] = splits[i+1] + return result + +if __name__=="__main__": + filein = sys.argv[1] # xxx.txt (path to digitization of xxx) + entries = init(filein) diff --git a/pwgissues/issue67/make_change_regular.py b/pwgissues/issue67/make_change_regular.py new file mode 100644 index 0000000..3e255ba --- /dev/null +++ b/pwgissues/issue67/make_change_regular.py @@ -0,0 +1,278 @@ +# coding=utf-8 +""" make_change_regular.py adapted for pwg +""" +from __future__ import print_function +import sys, re,codecs +import digentry + +def read_lines(filein): + with codecs.open(filein,encoding='utf-8',mode='r') as f: + lines = [x.rstrip('\r\n') for x in f] + return lines + +#word_regex_raw = '[A-Za-z0-9äöüÄÖÜ]+' +#word_regex = re.compile(word_regex_raw) + +def exclude_words(words): + ans = [] + for word in words: + if len(word) == 1: + continue + if re.search(r'^[0-9]+$',word): + continue + ans.append(word) + return ans + +def get_words_line(line0,iline=None): + # return array of words + # various filters + line = line0 + # line = re.sub(r'{%.*?%}', ' ',line) + line = re.sub(r'{#.*?#}', ' ',line) + line = re.sub(r'<([^ ]*?)(.*?)>.*?',' ',line) + line = re.sub(r'¦',' ',line) + line = re.sub(r'',' ',line) + line = line.strip() + words0 = re.findall(word_regex,line) + words = exclude_words(words0) + dbg = False + if dbg: + print('line0: ',line0) + print('line : "%s"' % line) + print('words:',', '.join(words)) + print() + return words + +def get_words(entries): + # create entry.dataline_words array + dbg = False + for ientry,e in enumerate(entries): + e.dataline_words = [] + for iline,line in enumerate(e.datalines): + words_line = get_words_line(line) + e.dataline_words.append(words_line) + + print("exit get_words") + +def write_outrecs(fileout,outrecs): + with codecs.open(fileout,"w","utf-8") as f: + for outarr in outrecs: + for out in outarr: + f.write(out+'\n') + print(len(outrecs),"cases written to",fileout) + +def write_recs(fileout,recs): + outrecs = [] + for irec,rec in enumerate(recs): + if rec.lnum == None: + print('write_recs problem:',rec.linein) + outarr = [] + outarr.append('; %s' %rec.metaline) + outarr.append('; %s -> %s' %(rec.oldword,rec.newword)) + outarr.append('%s old %s' % (rec.lnum,rec.line)) + outarr.append(';') + outarr.append('%s new %s' % (rec.lnum,rec.newline)) + outrecs.append(outarr) + write_outrecs(fileout,outrecs) + +def write_outrecs(fileout,outrecs): + with codecs.open(fileout,"w","utf-8") as f: + for outarr in outrecs: + for out in outarr: + f.write(out+'\n') + print(len(outrecs),"cases written to",fileout) + +def write_outarr(fileout,outarr): + with codecs.open(fileout,"w","utf-8") as f: + for out in outarr: + f.write(out+'\n') + print(len(outarr),"cases written to",fileout) + +def get_freq(entries): + d = {} + for ientry,entry in enumerate(entries): + for iline,words_line in enumerate(entry.dataline_words): + for w in words_line: + if w not in d: + d[w] = 0 + d[w] = d[w] + 1 + return d + +def write_freq(fileout,entries): + freqsd = get_freq(entries) + uwords = freqsd.keys() # unique words + uwords1 = sorted(uwords, key = lambda w: w.lower()) + outarr = [] + for w in uwords1: + count = freqsd[w] + out = '%s %s' % (w,count) + outarr.append(out) + write_outarr(fileout,outarr) + +class Change: + def __init__(self,line): + # a -> b + self.linein = line + parts = line.split('->') + if len(parts) != 2: + print ('Change Parse Error 1',line) + exit(1) + self.oldword = parts[0].strip() + self.newword = parts[1].strip() + # some other fields needed + self.metaline = None + self.lnum = None + self.line = None + self.newline = None + +def init_change_regular(filein): + lines = read_lines(filein) + recs = [Change(line) for line in lines] + print(len(recs),"records read from",filein) + return recs + +#regexsplitraw = r'(<(?P[^ >]+).*?>.*?)|({%.*?%})|({#.*?#})|()|(¦)|([A-Za-z0-9äöüÄÖÜ]+)' +regexsplitraw = r'(<(?P[^ >]+).*?>.*?)||({#.*?#})|()|(¦)|([A-Za-z0-9äöüÄÖÜáéèÁÉÈ]+)' + +regexsplit = re.compile(regexsplitraw) + +word_regex_raw = '[A-Za-z0-9äöüÄÖÜáéèÁÉÈ]+' +word_regex = re.compile(word_regex_raw) +tagnames = {'ab','lex','ls','hom','lang','gk','mong','arab','rus','is','bot','zoo','iw'} +def get_newline(line,drec): + dbg = False + if dbg: print(line) + parts = re.split(regexsplit,line) + # if dbg: print(parts) + newparts = [] + chgrecs = [] + for part in parts: + if part == None: + pass + elif part == '': + pass + elif part == '¦': + newparts.append(part) + elif part.startswith(('{','<',' ')): + newparts.append(part) + elif part in tagnames: + #newparts.append(part) + pass # a weakness since no non-capturing named groups + elif re.search(word_regex,part): + #print('word:',part) + if part in drec: + rec = drec[part] + newpart = rec.newword + newparts.append(newpart) + chgrecs.append(rec) + else: + newparts.append(part) + else: + #print('other part="%s"' % part) + newparts.append(part) + if chgrecs != []: + newline = ''.join(newparts) + else: + newline = line + return newline,chgrecs +def update_recs(entries,recs): + drec = {} + for rec in recs: + w = rec.oldword + if w in drec: + print('update_recs error 1',rec.linein) + exit(1) + drec[w] = rec + # + for ientry,e in enumerate(entries): + for iline,line in enumerate(e.datalines): + newline,chgrecs = get_newline(line,drec) + if newline == line: + continue + if len(chgrecs) != 1: + print('PROBLEM: chgrecs has length',len(chgrecs)) + #print(' line=',line) + #print() + #print('newline=',newline) + for rec in chgrecs: + print(rec.line) + continue + if False: + print(' line=',line) + print() + print('newline=',newline) + print(chgrecs) + rec = chgrecs[0] + rec.metaline = e.metaline + rec.lnum = e.linenum1 + iline + 1 + rec.line = line + rec.newline = newline +def test(): + import re + example = "1. {#a#}¦ Pron. der 3ten Person" + pattern = r'(<[^>]+>)|(\{#\w+#\})|(¦)' + print(pattern) + result = re.split(pattern, example) + # Remove empty strings from the result + result = [s for s in result if s] + print('test :',result) + #exit() +""" +r'(<[^>]+>)|(\{#\w+#\})|(¦)' instead of +r'(<[^>]+>)|(\{#\w+#\})|( [.] *)' +""" +def test1(): + import re + example = "1. {#a#}¦ Pron. der 3ten Person" + #pattern = r'(<[^>]+>)|(\{#\w+#\})|(¦)' + pattern = r'(<[^>]+>)|(\{#\w+#\})|( [.] *)' + print(pattern) + result = re.split(pattern, example) + # Remove empty strings from the result + result = [s for s in result if s] + print('test1:',result) + exit() + +def test2(): + import re + example = '1. {#a#}¦ Pron. der 3ten Person' + print(example) + print() + pattern = r'(<(?P[^ >]+)[^>]+>.*?)|(\{#\w+#\})|(¦)|( +)' + pattern = r'(<(?P[^>]+)[^>]+>.*?)' + pattern = r'(<.*?>)' + pattern = r'(<(?P[^ >]+).*?>.*?)' + pattern = r'(<(?P[^ >]+).*?>.*?)|({%.*?%})|({#.*?#})|()|(¦)|([A-Za-z0-9äöüÄÖÜ]+)' + print(pattern) + result = re.split(pattern, example) + print('result=',result) + # Remove empty strings from the result + result = [s for s in result if s] + for r in result: + print(r) + exit() + + +if __name__=="__main__": + #test2() + #test() + #test1() + #exit(1) + filein = sys.argv[1] # pre_change1_regular + filein1 = sys.argv[2] # xxx.txt cdsl + fileout = sys.argv[3] # change_word_regular.txt change transactions + recs = init_change_regular(filein) + entries = digentry.init(filein1) + + update_recs(entries,recs) + write_recs(fileout,recs) + #get_words(entries) # entry.dataline_words + # now we have to correlate the lists of entry.dataline_words + # with recs + # This logic requires that we are changing words which only appear once + + exit(1) + write_words(fileout,entries) + write_freq(fileout1,entries) + + diff --git a/pwgissues/issue67/pre_change.txt b/pwgissues/issue67/pre_change.txt new file mode 100644 index 0000000..2e842c0 --- /dev/null +++ b/pwgissues/issue67/pre_change.txt @@ -0,0 +1,134 @@ +Andropogen -> Andropogon +Anfung -> Anfang +Annona -> Anona +Anschauug -> Anschauung +Arggreia -> Argyrea +Artocar pus -> Artocarpus +Attributen¤u.s.w -> Attributen u.s.w. +Aufenthalsort -> Aufenthaltsort +Baringtonia -> Barringtonia +Befreigung -> Befreiung +Befähi -> Befähigung +Beredtsamkeit -> Beredsamkeit +Beschäwung -> Beschämung +Besonnenbeit -> Besonnenheit +Betenussbaum -> Betelnussbaum +Bewillkommung -> Bewillkommnung +Comerad -> Camerad +Donnerkeit -> Donnerkeil +Donnerkeits -> Donnerkeils +Durchboren -> Durchbohren ;; print error +Eheman -> Ehemann ;; print error +Einkänfte -> Einkünfte +Eundament -> Fundament +Fehl geburt -> Fehlgeburt +Feid -> Feind +Fluchthun -> Fluch thun +Fluchtschlagen -> Flucht schlagen +Flussalz -> Flusssalz +Gebirgssladt -> Gebirgsstadt +Gemüthsoffecten -> Gemüthsaffecten +Genetiv -> Genitiv +Genugthung -> Genugthuung +Ggnaeceum -> Gynaeceum +Grundpfichten -> Grundpflichten +Herkunfl -> Herkunft +Herzsetzend -> Herz setzend +Hincha -> Hingcha +Iöpfer -> Töpfer +Jederman -> Jedermann +Kindisch -> kindisch +Rewegung -> Bewegung +Schwefelktes -> Schwefelkies +Seelle -> Seele +Suck -> Sack +Theii -> Theil +Their -> Thier +Tieger -> Tiger +Tiegerfell -> Tigerfell +Tolltheit -> Tollheit +Traunkenheit -> Trunkenheit +Uberwältigen -> Ueberwältigen +Unheii -> Unheil +Verhauf -> Verkauf +Verhälltniss -> Verhältniss +Verleicher -> Verleiher +Vernic?ten -> Vernichten [h statt unicode U+1E25] ;; +Verschein -> Vorschein +Vogethaus -> Vogelhaus +Vorsehein -> Vorschein +Vorshein -> Vorschein +Vorzuglichkeit -> Vorzüglichkeit +Wagenschüppen -> Wagenschuppen +Waldchen -> Wäldchen +Weehsel -> Wechsel +Widersprueh -> Widerspruch +Wiedderzusammenkommen -> Wiederzusammenkommen +Wiederzukommtenlassen -> Wiederzukommenlassen +Wochnerinnen -> Wöchnerinnen +Wohlfart -> Wohlfahrt +Wöhnung -> Wohnung +Wöterbuchs -> Wörterbuch +Wünsehen -> Wünschen +Zuscht -> Zucht +Zustromen -> Zuströmen +Zweizungigkeit -> Zweizüngigkeit +abge schnittenes -> abgeschnittenes +- abtheilung -> -abtheilung +abtropfeln -> abtröpfeln +zu andern und -> zu ändern und +anhangend -> anhängend +ansserhalb -> ausserhalb +aprés -> après +ascertainement -> ascertainment +ascéte -> ascète +aufdie-Probe-Stellen -> das auf-die-Probe-Stellen +aufkeine -> auf keine +befriedrigt -> befriedigt +condolance -> condolence [misprint] +cordifoliuss -> cordifolius +dioica -> dioeca +dretäugig -> dreiäugig +durchwändern -> durchwandern +einziekend -> einziehend +entchlossen -> entschlossen +enterhrender -> entehrender +entstandt -> entsandt +geoflenbarten -> geoffenbarten +herrühend -> herrührend +herrühende -> herrührende +hest. -> best. +hinaufblücken -> hinaufblicken +hineigegangen -> hineingegangen +hommend -> kommend +horen. -> hören, +hülend -> hütend +inseine-Gewalt-bekommen -> in-seine-Gewalt-Bekommen +lebenfähig -> lebensfähig +mit-Eiferan-Etwas-Gehen -> mit-Eifer-an-Etwas-Gehen +nehment -> nehmet +sachs -> sechs +schalffe -> schlaffe +schalleitend -> schallleitend +schmeizend -> schmelzend +abge schnittenes -> abgeschnittenes +seittlicher -> seitlicher +sempercirens -> sempervirens +spühlen -> spülen +unbedentender -> unbedeutender +unerschütter -> unerschüttert +unterworjen -> unterworfen +vegetablisches -> vegetabilisches +verciehen -> verliehen +verlust -> Verlust +vorstreken -> vorstrecken +vortheilthaften -> vortheilhaften +wahrnembar -> wahrnehmbar ;;misprint corrected +wahrnembarer -> wahrnehmbarer ;;misprint corrected +wight -> weight ;; misprint corrected +wänschend -> wünschend +wöhlriechende -> wohlriechend +überausroth -> überaus roth +überfähren -> überfáhren +überfährend -> überfáhrend +überéten -> übertreten diff --git a/pwgissues/issue67/pre_change_irregular.txt b/pwgissues/issue67/pre_change_irregular.txt new file mode 100644 index 0000000..cb73efc --- /dev/null +++ b/pwgissues/issue67/pre_change_irregular.txt @@ -0,0 +1,13 @@ + Attributen¤u.s.w -> Attributen u.s.w. + Vernic?ten -> Vernichten [h statt unicode U+1E25] ;; ḥ + - abtheilung -> -abtheilung ;; Jim Why? + zu andern und -> zu ändern und + aufdie-Probe-Stellen -> das auf-die-Probe-Stellen + hest. -> best. + horen. -> hören, + inseine-Gewalt-bekommen -> in-seine-Gewalt-Bekommen + mit-Eiferan-Etwas-Gehen -> mit-Eifer-an-Etwas-Gehen + abge schnittenes -> abgeschnittenes + Artocar pus -> Artocarpus + Fehl geburt -> Fehlgeburt + Vorzuglichkeit -> Vorzüglichkeit diff --git a/pwgissues/issue67/pre_change_regular.txt b/pwgissues/issue67/pre_change_regular.txt new file mode 100644 index 0000000..dff47be --- /dev/null +++ b/pwgissues/issue67/pre_change_regular.txt @@ -0,0 +1,120 @@ +Andropogen -> Andropogon +Anfung -> Anfang +Annona -> Anona +Anschauug -> Anschauung +Arggreia -> Argyrea +Aufenthalsort -> Aufenthaltsort +Baringtonia -> Barringtonia +Befreigung -> Befreiung +Befähi -> Befähigung +Beredtsamkeit -> Beredsamkeit +Beschäwung -> Beschämung +Besonnenbeit -> Besonnenheit +Betenussbaum -> Betelnussbaum +Bewillkommung -> Bewillkommnung +Comerad -> Camerad +Donnerkeit -> Donnerkeil +Donnerkeits -> Donnerkeils +Durchboren -> Durchbohren +Eheman -> Ehemann +Einkänfte -> Einkünfte +Eundament -> Fundament +Feid -> Feind +Fluchthun -> Fluch thun +Fluchtschlagen -> Flucht schlagen +Flussalz -> Flusssalz +Gebirgssladt -> Gebirgsstadt +Gemüthsoffecten -> Gemüthsaffecten +Genetiv -> Genitiv +Genugthung -> Genugthuung +Ggnaeceum -> Gynaeceum +Grundpfichten -> Grundpflichten +Herkunfl -> Herkunft +Herzsetzend -> Herz setzend +Hincha -> Hingcha +Iöpfer -> Töpfer +Jederman -> Jedermann +Kindisch -> kindisch +Rewegung -> Bewegung +Schwefelktes -> Schwefelkies +Seelle -> Seele +Suck -> Sack +Theii -> Theil +Their -> Thier +Tieger -> Tiger +Tiegerfell -> Tigerfell +Tolltheit -> Tollheit +Traunkenheit -> Trunkenheit +Uberwältigen -> Ueberwältigen +Unheii -> Unheil +Verhauf -> Verkauf +Verhälltniss -> Verhältniss +Verleicher -> Verleiher +Verschein -> Vorschein +Vogethaus -> Vogelhaus +Vorsehein -> Vorschein +Vorshein -> Vorschein +Wagenschüppen -> Wagenschuppen +Waldchen -> Wäldchen +Weehsel -> Wechsel +Widersprueh -> Widerspruch +Wiedderzusammenkommen -> Wiederzusammenkommen +Wiederzukommtenlassen -> Wiederzukommenlassen +Wochnerinnen -> Wöchnerinnen +Wohlfart -> Wohlfahrt +Wöhnung -> Wohnung +Wöterbuchs -> Wörterbuch +Wünsehen -> Wünschen +Zuscht -> Zucht +Zustromen -> Zuströmen +Zweizungigkeit -> Zweizüngigkeit +abtropfeln -> abtröpfeln +anhangend -> anhängend +ansserhalb -> ausserhalb +aprés -> après +ascertainement -> ascertainment +ascéte -> ascète +aufkeine -> auf keine +befriedrigt -> befriedigt +condolance -> condolence +cordifoliuss -> cordifolius +dioica -> dioeca +dretäugig -> dreiäugig +durchwändern -> durchwandern +einziekend -> einziehend +entchlossen -> entschlossen +enterhrender -> entehrender +entstandt -> entsandt +geoflenbarten -> geoffenbarten +herrühend -> herrührend +herrühende -> herrührende +hinaufblücken -> hinaufblicken +hineigegangen -> hineingegangen +hommend -> kommend +hülend -> hütend +lebenfähig -> lebensfähig +nehment -> nehmet +sachs -> sechs +schalffe -> schlaffe +schalleitend -> schallleitend +schmeizend -> schmelzend +seittlicher -> seitlicher +sempercirens -> sempervirens +spühlen -> spülen +unbedentender -> unbedeutender +unerschütter -> unerschüttert +unterworjen -> unterworfen +vegetablisches -> vegetabilisches +verciehen -> verliehen +verlust -> Verlust +vorstreken -> vorstrecken +vortheilthaften -> vortheilhaften +wahrnembar -> wahrnehmbar +wahrnembarer -> wahrnehmbarer +wight -> weight +wänschend -> wünschend +wöhlriechende -> wohlriechend +überausroth -> überaus roth +überfähren -> überfáhren +überfährend -> überfáhrend +überéten -> übertreten diff --git a/pwgissues/issue67/readme.txt b/pwgissues/issue67/readme.txt new file mode 100644 index 0000000..f7b66a8 --- /dev/null +++ b/pwgissues/issue67/readme.txt @@ -0,0 +1,135 @@ + +PWG/pwgissues/issue67 +German word corrections provided by Thomas. + pre_change.txt 134 +Separate into 'regular' and 'irregular' + pre_change_regular.txt 120 + pre_change_irregular.txt 14 (for manual corrections) +cd /c/xampp/htdocs/sanskrit-lexicon/PWG/pwgissues/issue67 + +Start with pwg.txt +at commit 6678da906d50216059cfa2728cd8ec581e0da97d of csl-orig: + +cp /c/xampp/htdocs/cologne/csl-orig/v02/pwg/pwg.txt temp_pwg_0.txt + + +Try borrow code from + /c/xampp/htdocs/sanskrit-lexicon/PWK/pwkissues/issue101 + +cp /c/xampp/htdocs/sanskrit-lexicon/PWK/pwkissues/issue101/german1/make_change_regular.py . +cp /c/xampp/htdocs/sanskrit-lexicon/PWK/pwkissues/issue101/german1/digentry.py . + +# programmatic changes for regular +python make_change_regular.py pre_change_regular.txt temp_pwg_0.txt change_regular.txt +120 records read from pre_change_regular.txt +1149413 lines read from temp_pwg_0.txt +122736 entries found +120 cases written to change_regular.txt + +# Apply the regular changes +python updateByLine.py temp_pwg_0.txt change_regular.txt temp_pwg_1.txt +1149413 records written to temp_pwg_1.txt +120 change transactions from change_regular.txt + +# make the 'irregular' changes +cp temp_pwg_1.txt temp_pwg_2.txt + +# manual changes to temp_pwg_2.txt from pre_change_irregular.txt + +# generate changes +python python diff_to_changes_dict.py temp_pwg_1.txt temp_pwg_2.txt change_irregular.txt +14 changes written to change_irregular.txt + +# print changes +----- +982747-0107SalAka +Durchboren -> Durchbohren ;; print error +----- +205802-0571kzetra +Eheman -> Ehemann ;; print error +----- +181812-0361kulya +condolance -> condolence [misprint] +----- +1028037-0462saMlakzya +wahrnembar -> wahrnehmbar ;;misprint corrected +----- +1028037-0462saMlakzya +wahrnembarer -> wahrnehmbarer ;;misprint corrected +----- +141992-0010kakza +wight -> weight ;; misprint corrected + +===================================================================== + +# do local install +cp temp_pwg_2.txt /c/xampp/htdocs/cologne/csl-orig/v02/pwg/pwg.txt + +# check local installation +cd /c/xampp/htdocs/cologne/csl-pywork/v02 +sh generate_dict.sh pwg ../../pwg +sh xmlchk_xampp.sh pwg +# ok +cd /c/xampp/htdocs/sanskrit-lexicon/PWG/pwgissues/issue67/ + +# push repositories to GitHub +----- csl-orig +cd /c/xampp/htdocs/cologne/csl-orig +git pull # check for other revisions. +git status # v02/pwg/pwg.txt +git add . +git commit -m "PWG: German word corrections + Ref: https://github.com/sanskrit-lexicon/PWG/issues/67" +# 134 lines changed +git push + +-------------------------------------------- +# update cologne displays +# login to cologne +---- csl-orig +git pull +#161 lines changed + +---- csl-pywork +cd v02 +git pull # no change +sh generate_dict.sh pwg ../../PWGScan/2020/ + + +****************************************************** +prepare temp_pwg_2_hk.txt for Thomas +------------------------------------------- +12-08-2023 +Regenerate temp_pwg_2_hk.txt from temp_pwg_2.txt +(refer c:/xampp/htdocs/sanskrit-lexicon/PWK/pwkissues/issue95/pwtranscode/) + +cp temp_pwg_2.txt /c/xampp/htdocs/sanskrit-lexicon/PWK/pwkissues/issue95/pwtranscode/temphk/temp_pwg_2.txt +cd /c/xampp/htdocs/sanskrit-lexicon/PWK/pwkissues/issue95/pwtranscode/ + +python pw_transcode.py slp1 hk temphk/temp_pwg_2.txt temphk/temp_pwg_2_hk.txt +# check invertibility +python pw_transcode.py hk slp1 temphk/temp_pwg_2_hk.txt temphk/temp_pwg_2_hk_slp1.txt +diff temphk/temp_pwg_2.txt temphk/temp_pwg_2_hk_slp1.txt | wc -l +# 92 - known differences +# mv temp_pwg_2_hk.txt back to german1 directory +mv temphk/temp_pwg_2_hk.txt /c/xampp/htdocs/sanskrit-lexicon/PWG/pwgissues/issue67/ +# remove unneeded +rm temphk/temp_pwg_2.txt +rm temphk/temp_pwg_2_hk_slp1.txt + +# return to this german1 directory +cd /c/xampp/htdocs/sanskrit-lexicon/PWG/pwgissues/issue67 + +zip temp_pwg_2_hk.zip temp_pwg_2_hk.txt change_regular.txt change_irregular.txt +Send temp_pw_2_hk.zip to thomas + +----------------------------------------------------- +-------------------------------------------- +# sync this repository to Github +cd /c/xampp/htdocs/sanskrit-lexicon/PWG/pwgissues/issue67 + +git add . +git commit -m "#67" +git push + +make comment in https://github.com/sanskrit-lexicon/PWG/issues/67 diff --git a/pwgissues/issue67/updateByLine.py b/pwgissues/issue67/updateByLine.py new file mode 100644 index 0000000..927e3f1 --- /dev/null +++ b/pwgissues/issue67/updateByLine.py @@ -0,0 +1,163 @@ +"""updateByLine.py Begun Apr 10, 2014 + This program is intended to be rather general. + The 'changein' file consists of a sequence of line pairs: + nn old old-text + nn new new-text + nn is the line number (starting at 1) in the input vcp file. + 'old' and 'new' are fixed. + old-text should be identical to the text of line nn in input vcp file. + new-text is the replacement for line nn, written to the output vcp file. + 'changein' file should be utf-8 encoded. + Nov 16, 2014 comment line + May 30, 2017. Allow for 'ins' (insert) and 'del' (delete) in addition to 'new' + 1234 old xyz + 1234 ins uvw + 1234 old xyz + 1234 del + NOTE: This introduces complications regarding line numbers. + The interpretation is that + (a) the line number (1234) represents the line number in the INPUT file + (b) For 'ins', the inserted line ('uvw') is inserted AFTER this line + (c) For 'del', the text part is ignored (should typically be blank, + and there should be a space character after 'del': '1234 del ' + Nov 27, 2018. Changed print X to print(X), for python3 compatibility. +""" +# +from __future__ import print_function +import re,sys +import codecs +class Change(object): + def __init__(self,n,oldline,newline): + self.n = n + m = re.search(r'^([0-9]+) old (.*)$',oldline) + m1 = re.search(r'^([0-9]+) (new|ins|del) (.*)$',newline) + if (not m) or (not m1): + print('Change error(1) @ line %s:' % n) + out= 'oldline=%s' % oldline + print(out.encode('utf-8')) + out= 'newline=%s' % newline + print(out.encode('utf-8')) + exit(1) + self.chgcode = m1.group(2) + nold = m.group(1) + m = re.search(r'^([0-9]+) old (.*)$',oldline) + oldtext = m.group(2) + nnew = m1.group(1) + newtext = m1.group(3) + if nold != nnew: + print('Change error(2) @ line %s:' % n) + print('nold(%s) != nnew(%s)' % (nold,nnew)) + out= 'oldline=%s' % oldline + print(out.encode('utf-8')) + out= 'newline=%s' % newline + print(out.encode('utf-8')) + exit(1) + if (not m) or (not m1): + print('Change error(2) @ line %s:' % n) + out= 'oldline=%s' % oldline + print(out.encode('utf-8')) + out= 'newline=%s' % newline + print(out.encode('utf-8')) + exit(1) + self.lnumstr = nold # same as nnew + self.oldtext = oldtext + self.newtext = newtext + +def init_changein(changein ): + changes = [] # ret + f = codecs.open(changein,encoding='utf-8',mode='r') + n = 0 + sep='XXXX' + for line in f: + line = line.rstrip('\r\n') + if line.startswith(';'): # skip comment line + continue + n = n + 1 + if (n % 2) == 1: + oldline = line + else: + newline = line + chgrec = Change(n-1,oldline,newline) + changes.append(chgrec) + f.close() + if (n % 2) != 0: + print("ERROR init_changein: Expected EVEN number of lines in",changein) + exit(1) + return changes +def update(filein,changein,fileout): + # determine change structure from changein file + changes = init_changein(changein) + # initialize input records + with codecs.open(filein,encoding='utf-8',mode='r') as f: + # recs is a list of lines, to accomodate 'ins' and 'del' + recs = [[line.rstrip('\n\r')] for line in f] + print(len(recs),"lines read from",filein) + # process change records + # counter for each type ('new','ins','del') of change record + counter = {} + for change in changes: + lnum = int(change.lnumstr) + irec = lnum - 1 # since lnum assumed to start at 1 + try: + oldrec = recs[irec] + except: + print("lnum error: ",change.lnumstr) + exit(1) + # oldrec is a list of lines, typically with just 1 line. + # We assume there is always at least 1 element in this tuple, and + # that it's text matches the 'oldtext' of the change + if len(oldrec)==0: + print("update ERROR #1. record has been deleted for linenum=",lnum) + exit(1) + oldtext = oldrec[0] + if oldtext != change.oldtext: + print("CHANGE ERROR #2: Old mismatch line %s of %s" %(change.n,changein)) + print("Change record lnum =",lnum) + out = "Change old text:\n%s" % change.oldtext + print(out.encode('utf-8')) + out = "Change old input:\n%s" % oldtext + print(out.encode('utf-8')) + out = "line from %s:" % filein + print(out.encode('utf-8')) + exit(1) + code = change.chgcode + # update counter + if code not in counter: + counter[code] = 0 + counter[code] = counter[code] + 1 + if code == 'new': + # a simple change. Make this to the last in list of oldrecs + oldrec.pop() # remove last record + oldrec.append(change.newtext) # insert new text at end + recs[irec] = oldrec + elif code == 'ins': + # insert new text onto end of oldrec + oldrec.append(change.newtext) + recs[irec] = oldrec + elif code == 'del': + # remove text from end + oldrec.pop() # remove last record + recs[irec] = oldrec + # write all records to fileout + fout = codecs.open(fileout,'w','utf-8') + nout = 0 + for rec in recs: + # rec is a list of strings, possibly empty + for text in rec: + fout.write("%s\n" % text) + nout = nout + 1 + fout.close() + # write summary of changes performed + print(nout,"records written to",fileout) + print("%s change transactions from %s" % (len(changes),changein)) + # summary of types of changes transacted + codes = counter.keys() + outarr = ["%s of type %s"%(counter[key],key) for key in codes] + out = ', '.join(outarr) + print(out) +if __name__=="__main__": + filein = sys.argv[1] + changein = sys.argv[2] + fileout = sys.argv[3] + update(filein,changein,fileout) +