{"id":9990,"date":"2022-06-26T12:00:45","date_gmt":"2022-06-26T12:00:45","guid":{"rendered":"https:\/\/www.orynycz.com\/bez-kategorii\/powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai-wspiera-nowych-uzytkownikow-w-rewitalizacji-jezyka-lemkoego\/"},"modified":"2026-02-20T06:35:46","modified_gmt":"2026-02-20T06:35:46","slug":"2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai","status":"publish","type":"post","link":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/","title":{"rendered":"Powiedz to dobrze: Neuronowe t\u0142umaczenie maszynowe AI pozwala nowym m\u00f3wcom o\u017cywi\u0107 j\u0119zyk \u0142emkowski (2022)"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\" id=\"h-abstract\">Streszczenie<\/h2>\n\n<p class=\"wp-block-paragraph\">Neuronowe t\u0142umaczenie maszynowe wspierane sztuczn\u0105 inteligencj\u0105 mo\u017ce wkr\u00f3tce rewitalizowa\u0107 zagro\u017cone j\u0119zyki, umo\u017cliwiaj\u0105c nowym u\u017cytkownikom komunikacj\u0119 w czasie rzeczywistym przy u\u017cyciu zda\u0144 mierzalnie bli\u017cszych normie literackiej ni\u017c te u\u017cywane przez rodzimych u\u017cytkownik\u00f3w, i to od pierwszego dnia ich podr\u00f3\u017cy odzyskiwania j\u0119zyka. Podczas gdy Dolina Krzemowa inwestuje ogromne zasoby w technologi\u0119 t\u0142umaczenia neuronowego zdoln\u0105 do nadludzkiej szybko\u015bci i dok\u0142adno\u015bci dla najcz\u0119\u015bciej u\u017cywanych j\u0119zyk\u00f3w \u015bwiata, 98% zosta\u0142o pomini\u0119tych z powodu braku korpus\u00f3w: modele neuronowego t\u0142umaczenia maszynowego ucz\u0105 si\u0119 na milionach s\u0142\u00f3w tekstu dwuj\u0119zycznego, kt\u00f3ry po prostu nie istnieje dla wi\u0119kszo\u015bci j\u0119zyk\u00f3w i kosztuje ponad sto tysi\u0119cy dolar\u00f3w ameryka\u0144skich na j\u0119zyk, aby go zgromadzi\u0107.<\/p>\n\n<p class=\"wp-block-paragraph\">Dla j\u0119zyk\u00f3w o ograniczonych zasobach istnieje bardziej pomys\u0142owe podej\u015bcie, je\u015bli nie bardziej efektywne: transfer uczenia si\u0119, kt\u00f3ry umo\u017cliwia j\u0119zykom o mniejszych zasobach korzystanie z osi\u0105gni\u0119\u0107 j\u0119zyk\u00f3w o wi\u0119kszych zasobach. W tym eksperymencie neuronowa us\u0142uga t\u0142umaczenia Google z angielskiego na polski zosta\u0142a po\u0142\u0105czona z moim klasycznym silnikiem opartym na regu\u0142ach, aby t\u0142umaczy\u0107 z angielskiego na zagro\u017cony, niskorezursowy, wschodnios\u0142owia\u0144ski j\u0119zyk \u0142emkowski. System osi\u0105gn\u0105\u0142 wynik jako\u015bci BLEU (bilingual evaluation understudy) 6,28, kilkakrotnie lepszy ni\u017c us\u0142ugi Google Translate dla t\u0142umaczenia z angielskiego na standardowy ukrai\u0144ski (BLEU 2,17), rosyjski (BLEU 1,10) i polski (BLEU 1,70). Ostatecznie, owoc tego eksperymentu, pierwsza na \u015bwiecie us\u0142uga t\u0142umaczenia z angielskiego na \u0142emkowski, zosta\u0142a udost\u0119pniona pod adresem internetowym <code>www.LemkoTran.com<\/code>, aby umo\u017cliwi\u0107 nowym m\u00f3wcom rewitalizacj\u0119 ich j\u0119zyka.<\/p>\n\n<p class=\"wp-block-paragraph\">Nowi u\u017cytkownicy j\u0119zyka s\u0105 kluczem do rewitalizacji j\u0119zyka, a mo\u017cliwo\u015b\u0107 &#8222;poprawnego m\u00f3wienia\u201e w j\u0119zyku \u0142emkowskim jest teraz w zasi\u0119gu ich r\u0119ki.<\/p>\n\n<p class=\"wp-block-paragraph\"><strong>S\u0142owa kluczowe:<\/strong> Sztuczna inteligencja skoncentrowana na cz\u0142owieku, Rewitalizacja j\u0119zyka, \u0141emkowski.<\/p>\n\n<div class=\"wp-block-file aligncenter\"><a id=\"wp-block-file--media-276bf8bd-1f68-4249-80c2-db9258ee7ce0\" href=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/OrynyczP_2022_HCI_preprint.pdf\">Pobierz PDF<\/a><a href=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/OrynyczP_2022_HCI_preprint.pdf\" class=\"wp-block-file__button wp-element-button\" download=\"\" aria-describedby=\"wp-block-file--media-276bf8bd-1f68-4249-80c2-db9258ee7ce0\">Pobierz<\/a><\/div>\n\n<p class=\"alert is-style-text-annotation is-style-text-annotation--1 wp-block-paragraph\">Prosz\u0119 cytowa\u0107 jako: Orynycz, P. (2022). Powiedz to dobrze: Neuronowe t\u0142umaczenie maszynowe AI umo\u017cliwia nowym u\u017cytkownikom rewitalizacj\u0119 j\u0119zyka \u0142emkowskiego. W: Degen, H., Ntoa, S. (red.) Artificial Intelligence in HCI. HCII 2022. Lecture Notes in Computer Science, t. 13336. Springer, Cham. <a href=\"https:\/\/doi.org\/10.1007\/978-3-031-05643-7_37\" rel=\"nofollow\">https:\/\/doi.org\/10.1007\/978-3-031-05643-7_37<\/a><\/p>\n\n<p class=\"is-style-text-annotation has-text-color has-background has-link-color wp-elements-58cd1070d80e8fe2d9d8f195e9f7be54 is-style-text-annotation--2 wp-block-paragraph\" style=\"color:#0f5132;background-color:#d1e7dd\">\u2705 Ta wersja publikacji zosta\u0142a zaakceptowana do publikacji po recenzji, ale nie jest wersj\u0105 ostateczn\u0105 i nie odzwierciedla poprawek wprowadzonych po akceptacji ani \u017cadnych korekt. Wersja ostateczna jest dost\u0119pna online pod adresem   <a href=\"https:\/\/doi.org\/10.1007\/978-3-031-35894-4_10\"><\/a><a href=\"https:\/\/doi.org\/10.1007\/978-3-031-05643-7_37\" rel=\"nofollow\">https:\/\/doi.org\/10.1007\/978-3-031-05643-7_37<\/a>. Korzystanie z tej zaakceptowanej wersji podlega warunkom u\u017cytkowania zaakceptowanego manuskryptu wydawcy: <a href=\"https:\/\/www.springernature.com\/gp\/open-research\/policies\/accepted-manuscript-terms\" rel=\"nofollow\">https:\/\/www.springernature.com\/gp\/open-research\/policies\/accepted-manuscript-terms<\/a>.<\/p>\n\n<div class=\"wp-block-yoast-seo-table-of-contents yoast-table-of-contents\"><h2>Spis tre\u015bci<\/h2><ul><li><a href=\"#h-abstract\" data-level=\"2\">Streszczenie<\/a><\/li><li><a href=\"#h-1-introduction\" data-level=\"2\">1 Wprowadzenie<\/a><ul><li><a href=\"#h-1-1-problems\" data-level=\"3\">1.1. Problemy<\/a><\/li><li><a href=\"#h-1-2-work-so-far\" data-level=\"3\">1.2 Dotychczasowe prace<\/a><\/li><li><a href=\"#h-1-3-system-under-study\" data-level=\"3\">1.3 Badany system<\/a><\/li><li><a href=\"#h-1-4-hypothesis\" data-level=\"3\">1.4 Hipoteza<\/a><\/li><li><a href=\"#h-1-5-predictions\" data-level=\"3\">1.5 Przewidywania<\/a><\/li><li><a href=\"#h-1-6-methods-and-justification\" data-level=\"3\">1.6 Metody i uzasadnienie<\/a><\/li><li><a href=\"#h-1-7-principal-results\" data-level=\"3\">1.7 G\u0142\u00f3wne wyniki<\/a><\/li><\/ul><\/li><li><a href=\"#h-2-materials-and-methods\" data-level=\"2\">2 Materia\u0142y i metody<\/a><ul><li><a href=\"#h-2-1-setup\" data-level=\"3\">2.1 Konfiguracja<\/a><\/li><\/ul><\/li><li><a href=\"#h-3-results\" data-level=\"2\">3 Wyniki<\/a><ul><li><a href=\"#h-3-1-results-by-machine-translation-service\" data-level=\"3\">3.1 Wyniki wed\u0142ug us\u0142ugi t\u0142umaczenia maszynowego<\/a><\/li><\/ul><\/li><li><a href=\"#h-4-discussion\" data-level=\"2\">4 Dyskusja<\/a><\/li><li><a href=\"#h-references\" data-level=\"2\">Referencje<\/a><\/li><\/ul><\/div>\n\n<h2 class=\"wp-block-heading\" id=\"h-1-introduction\">1 Wprowadzenie<\/h2>\n\n<h3 class=\"wp-block-heading\" id=\"h-1-1-problems\">1.1. Problemy<\/h3>\n\n<p class=\"wp-block-paragraph\">Celem tego eksperymentu jest przyczynienie si\u0119 na poziomie lokalnym do globalnego wyzwania, jakim jest zanik j\u0119zyk\u00f3w, kt\u00f3ry mo\u017ce nast\u0119powa\u0107 w tempie jednego dziennie, przy czym szanse na przetrwanie ma zaledwie jeden na dziesi\u0119\u0107 j\u0119zyk\u00f3w <a id=\"cite-1\" href=\"#ref-1\">[1, s. 1329]<\/a>. W momencie publikacji, SIL International&#8217;s <em>Ethnologue<\/em> u\u017cywa Rozszerzonej Skali Mi\u0119dzypokoleniowego Zak\u0142\u00f3cenia Transmisji Lewisa i Simonsa z 2010 roku, aby oszacowa\u0107, \u017ce 3018 j\u0119zyk\u00f3w jest zagro\u017conych <a id=\"cite-2\" href=\"#ref-2\">[2]<\/a>, co stanowi 43% z 7001 indywidualnych \u017cywych j\u0119zyk\u00f3w zliczonych w momencie publikacji w standardzie ISO 639-3 Mi\u0119dzynarodowej Organizacji Normalizacyjnej <a id=\"cite-3\" href=\"#ref-3\">[3]<\/a>. Tymczasem Google Translate obs\u0142uguje tylko 108 j\u0119zyk\u00f3w <a id=\"cite-4\" href=\"#ref-4\">[4]<\/a>, a Facebook 112 <a href=\"#ref-5\" id=\"cite-5\">[5]<\/a>, co jest pocz\u0105tkiem. Niemniej jednak, jeden j\u0119zyk jest teraz mniej niedostatecznie obs\u0142ugiwany, poniewa\u017c owoc tego eksperymentu zosta\u0142 wdro\u017cony na serwerze internetowym jako publiczna us\u0142uga t\u0142umaczeniowa.<\/p>\n\n<p class=\"wp-block-paragraph\">Nowe technologie sztucznej inteligencji kusz\u0105 obietnic\u0105 pomocy, kt\u00f3ra natychmiast kompensuje utrat\u0119 j\u0119zyka poprzez interakcj\u0119 cz\u0142owiek-komputer. W moim poprzednim eksperymencie silniki neuronowe nowej generacji osi\u0105gn\u0119\u0142y wy\u017csze wyniki jako\u015bci t\u0142umaczenia z rosyjskiego i polskiego na angielski ni\u017c kontrola ludzka <a href=\"#ref-6\" id=\"cite-6-0\">[6, s. 9]<\/a>. Tymczasem Facebook i Google<sup>1<\/sup> zainwestowa\u0142y ogromne zasoby w dostarczanie lepszych ni\u017c ludzkie automatycznych system\u00f3w t\u0142umaczeniowych bez koszt\u00f3w dla konsumenta.  <\/p>\n\n<p class=\"has-small-font-size wp-block-paragraph\"><sup>1<\/sup> Ujawnienie: pracuj\u0119 jako p\u0142atny lingwista rosyjski, polski i ukrai\u0144ski oraz specjalista kontroli jako\u015bci t\u0142umacze\u0144 dla projektu Google Translate; siedziba g\u0142\u00f3wna znajduje si\u0119 w San Francisco.<\/p>\n\n<p class=\"wp-block-paragraph\">Nadludzka sztuczna inteligencja nie jest tania: trenowanie neuronowych modeli j\u0119zykowych wymaga dwuj\u0119zycznych korpus\u00f3w z liczb\u0105 s\u0142\u00f3w w setkach tysi\u0119cy, a idealnie w milionach, kt\u00f3rych przet\u0142umaczenie kosztowa\u0142oby setki tysi\u0119cy dolar\u00f3w, sumy przekraczaj\u0105ce mo\u017cliwo\u015bci wi\u0119kszo\u015bci spo\u0142eczno\u015bci j\u0119zyk\u00f3w o niskich zasobach. Na szcz\u0119\u015bcie ten eksperyment pokazuje, \u017ce istniej\u0105 bardziej zaradne i skuteczne sposoby odpowiedzi na wyzwanie tworzenia pomocy t\u0142umaczeniowych do rewitalizacji zagro\u017conych j\u0119zyk\u00f3w w \u015brodowiskach o niskich zasobach. <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-1-2-work-so-far\">1.2 Dotychczasowe prace<\/h3>\n\n<p class=\"wp-block-paragraph\">Zbudowa\u0142em pierwszy na \u015bwiecie system t\u0142umaczenia maszynowego z j\u0119zyka \u0142emkowskiego na angielski i udost\u0119pni\u0142em go publicznie. Jego obiektywne wyniki jako\u015bci t\u0142umaczenia ulega\u0142y poprawie: silnik osi\u0105gn\u0105\u0142 wynik BLEU (bilingual evaluation understudy) 14,57 latem 2021 roku, co zosta\u0142o zaprezentowane profesjonalistom na konferencji Interservice\/Industry Training, Simulation and Education Conference Narodowego Stowarzyszenia Przemys\u0142u Obronnego i opublikowane w jej materia\u0142ach <a href=\"#ref-6\" id=\"cite-6\">[6]<\/a>. Dla por\u00f3wnania, jako t\u0142umacz-cz\u0142owiek pracuj\u0105cy w warunkach polowych, odci\u0119ty od \u015bwiata zewn\u0119trznego, uzyska\u0142em wynik BLEU 28,66. Jesieni\u0105 2021 roku silnik osi\u0105gn\u0105\u0142 wynik BLEU 15,74, co zosta\u0142o przedstawione j\u0119zykoznawcom, naukowcom i szerszej spo\u0142eczno\u015bci podczas wydarzenia prezentacyjnego zorganizowanego przez Uniwersytet w Pittsburghu.<sup>2<\/sup>   <\/p>\n\n<p class=\"has-small-font-size wp-block-paragraph\"><sup>2<\/sup> Ujawnienie: wydarzenie by\u0142o sponsorowane przez Carpatho-Rusyn Society (Pensylwania), a Uniwersytet w Pittsburghu zap\u0142aci\u0142 mi za prezentacj\u0119.<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-1-3-system-under-study\">1.3 Badany system<\/h3>\n\n<p class=\"wp-block-paragraph\">\u0141emkowski jest zdecydowanie do powa\u017cnie zagro\u017conego [<a href=\"#ref-6\">6, s. 3<\/a>, <a id=\"cite-7\" href=\"#ref-7\">7, ss. 177-178<\/a>], niskozasobowym <a id=\"cite-8\" href=\"#ref-8\">[8]<\/a>, oficjalnie uznanym j\u0119zykiem mniejszo\u015bciowym <a id=\"cite-9\" href=\"#ref-9\">[9]<\/a>, przypuszczalnie rdzennym dla transgranicznych wy\u017cyn na po\u0142udnie od obszar\u00f3w metropolitalnych Krakowa, Tarnowa i Rzeszowa; historyczne izoglosy demarkacyjne b\u0119d\u0105, miejmy nadziej\u0119, tematem przysz\u0142ego artyku\u0142u. Polski urz\u0105d statystyczny w 2011 roku odnotowa\u0142 6279 mieszka\u0144c\u00f3w, dla kt\u00f3rych j\u0119zyk \u0142emkowski by\u0142 j\u0119zykiem \u201ezwykle u\u017cywanym w domu\u201d (nawet je\u015bli dodatkowo u\u017cywali j\u0119zyka polskiego) [<a id=\"cite-10\" href=\"#ref-10\">10, str. 3<\/a>], co stanowi wzrost o 12% w por\u00f3wnaniu z 5605 osobami, dla kt\u00f3rych j\u0119zyk \u0142emkowski by\u0142 \u201ej\u0119zykiem najcz\u0119\u015bciej u\u017cywanym w domu\u201d w 2002 roku [<a id=\"cite-11\" href=\"#ref-11\">11, str. 6<\/a>, <a href=\"#ref-12\" id=\"cite-12\">12, str. 7<\/a>]. W momencie publikacji trwa opracowywanie wynik\u00f3w nowego spisu.<\/p>\n\n<p class=\"wp-block-paragraph\">\u0141emkowski mo\u017cna sklasyfikowa\u0107 jako j\u0119zyk wschodnios\u0142owia\u0144ski, poniewa\u017c spe\u0142nia zwyczajowe kryteria cech strukturalnych genetycznych, z kt\u00f3rych najwa\u017cniejsz\u0105 jest pe\u0142nog\u0142os [<a id=\"cite-13\" href=\"#ref-13\">13, s. 20<\/a>], zgodnie z kt\u00f3rym zak\u0142ada si\u0119, \u017ce samog\u0142oska powsta\u0142a w pras\u0142owia\u0144skich sekwencjach sp\u00f3\u0142g\u0142oski  <em><code>C<\/code><\/em>  po kt\u00f3rej nast\u0119puje samog\u0142oska \u015brednia lub niska  <code>V<\/code>  (<code>*e<\/code>, lub  <code>*o<\/code>, z kt\u00f3r\u0105  <code>*a<\/code>  si\u0119 po\u0142\u0105czy\u0142a <a id=\"cite-14\" href=\"#ref-14\">[14, s. 366]<\/a>), po kt\u00f3rej nast\u0119puje p\u0142ynna R (to jest   <code>*l<\/code>  lub  <code>*r<\/code>), po kt\u00f3rej nast\u0119puje kolejna sp\u00f3\u0142g\u0142oska  <em><code>C<\/code><\/em>, to znaczy <code>CVRC &gt; CVRVC<\/code>. Dla ilustracji, por\u00f3wnajmy staroangielskie s\u0142owo oznaczaj\u0105ce &#8222;topi\u0107 si\u0119\u201e, <g id=\"gid_1\">meltan<\/g> (<x id=\"gid_2\"><\/x>) <g id=\"gid_3\">[15, s. 718]<\/g> z jego domniemanym \u0142emkowskim odpowiednikiem <g id=\"gid_4\">mo\u0142\u00f3dyj<\/g> [<g id=\"gid_5\">16, s. 92<\/g>, <g id=\"gid_6\">17, s. 150<\/g>] (<x id=\"gid_7\"><\/x>), oznaczaj\u0105cym &#8222;m\u0142ody\u201e. Inne wschodnios\u0142owia\u0144skie odpowiedniki obejmuj\u0105 ukrai\u0144skie <em>mo\u0142od\u00fdj<\/em> i rosyjskie <em>mo\u0142od\u00f3j<\/em> <a id=\"cite-17-1\" href=\"#ref-17\">[17]<\/a>, oba wykazuj\u0105ce samog\u0142osk\u0119 po sp\u00f3\u0142g\u0142osce p\u0142ynnej (<code>CVRVC<\/code>).   Tymczasem j\u0119zyki zachodnios\u0142owia\u0144skie nie maj\u0105 samog\u0142oski przed p\u0142ynn\u0105; por\u00f3wnaj polskie <em>m\u0142ody<\/em> i s\u0142owackie <em>mlad\u00fd<\/em> (oba <code>CRVC<\/code>) <a id=\"cite-17-2\" href=\"#ref-17\">[17]<\/a>. Ponadto pokrewie\u0144stwo postulowano dla innych s\u0142\u00f3w t\u0142umaczonych jako \u201e\u0142agodny\u201d, w tym sanskryckie <em>m\u1e5bd\u00fa<\/em> (<code>CRC<\/code>) <a id=\"cite-18\" href=\"#ref-18\">[18, str. 830]<\/a> i \u0142aci\u0144skie <em>mollis<\/em> (<code>CVRC<\/code> je\u015bli od *<em>moldvis<\/em>) [<a id=\"cite-15-1\" href=\"#ref-15\">15<\/a>, <a id=\"cite-17-3\" href=\"#ref-17\">17<\/a>, <a href=\"#ref-19\" id=\"cite-19\">19, str. 323<\/a>].<\/p>\n\n<p class=\"wp-block-paragraph\">W tym eksperymencie nie oceniano, jak dobrze \u0142emkowski spe\u0142nia zwyczajowe, wsp\u00f3\u0142czesne ukrai\u0144skie kryteria cech strukturalnych genetycznych. Jednak\u017ce podobie\u0144stwo mi\u0119dzy \u0142emkowskim a standardowym ukrai\u0144skim zosta\u0142o po raz pierwszy, o ile mi wiadomo, skwantyfikowane w druku. Poni\u017cej, m\u00f3j silnik \u0142emkowski uzyska\u0142 wynik BLEU 6,28, prawie trzykrotnie wy\u017cszy ni\u017c wynik ukrai\u0144skiego Google Translate wynosz\u0105cy BLEU 2,17. Mo\u017cna przeprowadzi\u0107 dalsze eksperymenty w celu kwantyfikacji podobie\u0144stwa mi\u0119dzy \u0142emkowskim, standardowym ukrai\u0144skim, polskim i rusi\u0144skim skodyfikowanym na S\u0142owacji, a tak\u017ce \u015bwie\u017ce spojrzenie na klasyfikacj\u0119 typologiczn\u0105 \u0142emkowskiego.   <\/p>\n\n<p class=\"wp-block-paragraph\">Ilo\u015b\u0107 i jako\u015b\u0107 zasob\u00f3w ulegaj\u0105 poprawie, podobnie jak pomys\u0142owo\u015b\u0107 wspierana przez technologi\u0119. Wszystkie znane korpusy dwuj\u0119zyczne, obejmuj\u0105ce mniej ni\u017c siedemdziesi\u0105t tysi\u0119cy s\u0142\u00f3w \u0142emkowskich, zosta\u0142y zgromadzone na potrzeby tego eksperymentu. Oczyszczam dwuj\u0119zyczny korpus transkrypcji wywiad\u00f3w przeprowadzonych z rodzimymi u\u017cytkownikami w Polsce i moich t\u0142umacze\u0144 na j\u0119zyk angielski, kt\u00f3re klient ze Stan\u00f3w Zjednoczonych zleci\u0142 mi wykona\u0107 i pozwoli\u0142 wykorzysta\u0107. Kompiluj\u0119 r\u00f3wnie\u017c korpusy jednoj\u0119zyczne, kt\u00f3re w momencie publikacji licz\u0105 534 512 s\u0142\u00f3w.   <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-1-4-hypothesis\">1.4 Hipoteza<\/h3>\n\n<p class=\"wp-block-paragraph\">Na podstawie mojego subiektywnego wra\u017cenia jako profesjonalnego t\u0142umacza, \u017ce rodzimi u\u017cytkownicy j\u0119zyka \u0142emkowskiego, z kt\u00f3rymi przeprowadzono wywiady w Polsce, cz\u0119\u015bciej u\u017cywali s\u0142\u00f3w z oczywistymi polskimi odpowiednikami ni\u017c standardowymi ukrai\u0144skimi, postawi\u0142em hipotez\u0119, \u017ce przy innych r\u00f3wnych warunkach, maszyn\u0119 mo\u017cna skonfigurowa\u0107 do t\u0142umaczenia na \u0142emkowski z angielskiego i osi\u0105gn\u0105\u0107 obiektywne wyniki jako\u015bci BLEU wy\u017csze ni\u017c us\u0142ugi ukrai\u0144skie i rosyjskie Google Translate.<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-1-5-predictions\">1.5 Przewidywania<\/h3>\n\n<p class=\"wp-block-paragraph\"><strong>System t\u0142umaczenia \u0142emkowskiego.<\/strong> Przewidzia\u0142em, \u017ce wspomniany system t\u0142umaczenia osi\u0105gnie wynik BLEU 15 w t\u0142umaczeniu na \u0142emkowski z angielskiego w por\u00f3wnaniu z korpusem dwuj\u0119zycznym.<\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Google Translate.<\/strong><\/p>\n\n<p class=\"wp-block-paragraph\"><em>Us\u0142uga z angielskiego na ukrai\u0144ski<\/em>. Przewidywa\u0142em, \u017ce us\u0142uga Google Translate z angielskiego na ukrai\u0144ski osi\u0105gnie wynik BLEU 10 wzgl\u0119dem korpusu dwuj\u0119zycznego. <\/p>\n\n<p class=\"wp-block-paragraph\"><em>Us\u0142uga z angielskiego na rosyjski<\/em>. Przewidywa\u0142em, \u017ce us\u0142uga Google Translate z angielskiego na rosyjski osi\u0105gnie wynik BLEU 1 wzgl\u0119dem korpusu dwuj\u0119zycznego. <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-1-6-methods-and-justification\">1.6 Metody i uzasadnienie<\/h3>\n\n<p class=\"wp-block-paragraph\">W celu przyspieszenia, oszcz\u0119dno\u015bci zasob\u00f3w i zwi\u0119kszenia odporno\u015bci, laptop uznany za przestarza\u0142y przez mojego pracodawc\u0119 zosta\u0142 skonfigurowany do t\u0142umaczenia na \u0142emkowski i wykonywania po\u0142\u0105cze\u0144 z us\u0142ug\u0105 Google Translate na platformie Google Cloud, a tak\u017ce do oceny wspomnianych t\u0142umacze\u0144 przy u\u017cyciu standardowej w bran\u017cy miary BLEU.<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-1-7-principal-results\">1.7 G\u0142\u00f3wne wyniki<\/h3>\n\n<p class=\"wp-block-paragraph\">System t\u0142umaczenia z angielskiego na \u0142emkowski osi\u0105gn\u0105\u0142 \u0142\u0105czny wynik BLEU <code>6.28431824990417<\/code>. Tymczasem us\u0142uga ukrai\u0144ska Google Translate uzyska\u0142a wynik BLEU <code>2.16830846776652<\/code>, us\u0142uga rosyjska BLEU <code>1.10424105952048<\/code>, a kontrolny polski transliterowany na alfabet cyrylicki BLEU <code>1.70036447680114<\/code>. <\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-2-materials-and-methods\">2 Materia\u0142y i metody<\/h2>\n\n<p class=\"wp-block-paragraph\">Powy\u017csza hipoteza zosta\u0142a przetestowana przez obliczenie wynik\u00f3w jako\u015bci BLEU dla ka\u017cdego systemu t\u0142umaczeniowego skonfigurowanego w spos\u00f3b szczeg\u00f3\u0142owo opisany poni\u017cej.<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-2-1-setup\">2.1 Konfiguracja<\/h3>\n\n<p class=\"wp-block-paragraph\"><strong>Sprz\u0119t.<\/strong>  Eksperyment zosta\u0142 przeprowadzony na laptopie HP Elitebook 850 G2 z procesorem Core i7-5600U 2,6 GHz i 16 gigabajtami pami\u0119ci o dost\u0119pie swobodnym. Zosta\u0142 odrzucony przez mojego pracodawc\u0119 jako przestarza\u0142y i wystawiony na sprzeda\u017c za 450 USD w momencie publikacji. <\/p>\n\n<p class=\"wp-block-paragraph\"><em>Konfiguracja<\/em>. W menu podstawowego systemu wej\u015bcia\/wyj\u015bcia (BIOS) urz\u0105dzenie zosta\u0142o skonfigurowane w celu w\u0142\u0105czenia technologii wirtualizacji (VTx). <\/p>\n\n<p class=\"wp-block-paragraph\"><strong>System operacyjny.<\/strong>  Windows 10 Professional 64 bit zosta\u0142 zainstalowany na go\u0142ym metalu. Upewniono si\u0119, \u017ce funkcje Windows <code>Virtual Machine Platform<\/code> i <code>Windows Subsystem for Linux<\/code> by\u0142y w\u0142\u0105czone. Nast\u0119pnie zainstalowano <code>WSL2 Linux kernel update for x64 <\/code>machines (wsl_update_x64.msi) dost\u0119pne od Microsoft pod adresem <code><a href=\"https:\/\/aka.ms\/wsl2kernel\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/aka.ms\/wsl2kernel<\/a><\/code>.  <\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Oprogramowanie.<\/strong> Instalator Docker Desktop dla Windows w wersji 4.4.3 (73365) zosta\u0142 pobrany z <code><a href=\"https:\/\/www.docker.com\/get-started\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/www.docker.com\/get-started<\/a><\/code> i uruchomiony z opcj\u0105 <code>Install required Windows components for WSL 2 selected<\/code>.<\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Pakiety.<\/strong>  Eksperyment zale\u017ca\u0142 od poni\u017cszych pakiet\u00f3w z Python Package Index.<\/p>\n\n<p class=\"wp-block-paragraph\"><strong>SacreBLEU.<\/strong>  Wersja 2.0.0 zosta\u0142a zainstalowana przy u\u017cyciu pakietu Python udokumentowanego pod nast\u0119puj\u0105cym uniwersalnym lokalizatorem zasob\u00f3w (URL):<br\/><code><a href=\"https:\/\/pypi.org\/project\/sacrebleu\/2.0.0\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/pypi.org\/project\/sacrebleu\/2.0.0\/<\/a><\/code><\/p>\n\n<p class=\"wp-block-paragraph\"><em>Biblioteka klienta Google Cloud Translation API<\/em>. Wersja 2.0.1 zosta\u0142a zainstalowana przy u\u017cyciu pakietu Python udokumentowanego pod uniwersalnym lokalizatorem zasob\u00f3w (URL)   <code><a href=\"https:\/\/pypi.org\/project\/google-cloud-translate\/2.0.1\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/pypi.org\/project\/google-cloud-translate\/2.0.1\/<\/a><\/code><\/p>\n\n<p class=\"wp-block-paragraph\">Powy\u017csze zale\u017cno\u015bci zosta\u0142y okre\u015blone w pliku wymaga\u0144 w nast\u0119puj\u0105cy spos\u00f3b:<br\/><code>google-cloud-translate==2.0.1<\/code><br\/><code>sacrebleu==2.0.0<\/code>\n<\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Kontener.<\/strong><\/p>\n\n<p class=\"wp-block-paragraph\"><em>Budowa<\/em>. Eksperyment zosta\u0142 uruchomiony w kontenerze Docker z najnowsz\u0105 wersj\u0105 j\u0119zyka programowania Python, kt\u00f3r\u0105 w tym czasie by\u0142a wersja 3.10.2, dzia\u0142aj\u0105c\u0105 na systemie operacyjnym Debian Bullseye 11 Linux architektury AMD64, o skr\u00f3conym skr\u00f3cie Secure Hash Algorithm 2 <code>bcb158d5ddb6<\/code>, dost\u0119pnym za pomoc\u0105 nast\u0119puj\u0105cego polecenia: <br\/><code>docker pull python@sha256:bcb158d5ddb636fa3aa567c987e7fcf61113307820d466813527ca90d60fedc7<\/code><\/p>\n\n<p class=\"wp-block-paragraph\"><em>\u015arodowisko uruchomieniowe<\/em>. Kontener zosta\u0142 skonfigurowany do zapisywania surowych plik\u00f3w danych eksperymentalnych do lokalnego woluminu bind mounted. <\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Ocena jako\u015bci t\u0142umaczenia.<\/strong><br\/>Wyniki jako\u015bci t\u0142umaczenia zosta\u0142y obliczone zgodnie z metryk\u0105 BLEU przy u\u017cyciu wersji 2.0.0 narz\u0119dzia <em>SacreBLEU<\/em> wynalezionego przez Posta <a href=\"#ref-20\" id=\"cite-20\">[20]<\/a>.<\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Wra\u017cliwo\u015b\u0107 na wielko\u015b\u0107 liter.<\/strong>  Ocena zosta\u0142a przeprowadzona w spos\u00f3b wra\u017cliwy na wielko\u015b\u0107 liter.<\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Tokenizacja.<\/strong> Segmenty zosta\u0142y tokenizowane przy u\u017cyciu wersji 13a standardowej procedury tokenizacji wewn\u0119trznej skryptu metrycznego Workshop on Statistical Machine Translation.<\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Metoda wyg\u0142adzania.<\/strong> Zastosowano domy\u015blnie technik\u0119 wyg\u0142adzania opracowan\u0105 w National Institute of Standards and Technology przez pracownik\u00f3w Rz\u0105du Federalnego Stan\u00f3w Zjednoczonych dla ich zestawu narz\u0119dzi BLEU Multimodal Information Group, b\u0119d\u0105c\u0105 trzeci\u0105 technik\u0105 opisan\u0105 przez Chen i Cherry <a href=\"#ref-21\" id=\"cite-21\">[21, s. 363]<\/a>.<\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Sygnatura<\/strong>. Powy\u017csze ustawienia wygenerowa\u0142y nast\u0119puj\u0105c\u0105 sygnatur\u0119:<br\/>n <code>refs:1|case:mixed|eff:no|tok:13a|smooth:exp|version:2.0.0<\/code><\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Kalibracja<\/strong>. Skonfigurowana jak powy\u017cej, maszyna produkuje nast\u0119puj\u0105ce wyniki: <\/p>\n\n<div>\n<em>Segment 1031.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>Everything was there.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0412\u0448\u044b\u0442\u043a\u043e \u0442\u0430\u043c \u0431\u044b\u043b\u043e.<\/code><\/td><td><code>V\u0161\u0177tko tam b\u0177lo.<\/code><\/td><\/tr><tr><td><code>Lemkotran.com<\/code> hipoteza i transliteracja<\/td><td><code>\u0412\u0448\u044b\u0442\u043a\u043e \u0442\u0430\u043c \u0431\u044b\u043b\u043e.<\/code><\/td><td><code>V\u0161\u0177tko tam b\u0177lo.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 100.00 100.0\/100.0\/100.0\/100.0 (BP = 1.000 ratio = 1.000 hyp_len = 4 ref_len = 4)<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<p class=\"wp-block-paragraph\"><em>Wyja\u015bnienie<\/em>. Segment hipotezy by\u0142 identyczny z segmentem odniesienia i maszyna osi\u0105gn\u0119\u0142a doskona\u0142y wynik BLEU 100. <\/p>\n\n<div>\n<em>Segment 179.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>I don't remember what year.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u041d\u0435 \u043f\u0430\u043c\u044f\u0442\u0430\u043c \u0432 \u043a\u043e\u0442\u0440\u044b\u043c \u0440\u043e\u0446\u0456.<\/code><\/td><td><code>Ne pamjatam v kotr\u0177m roci.<\/code><\/td><\/tr><tr><td><code>Lemkotran.com<\/code> hipoteza i transliteracja<\/td><td><code>\u041d\u0456 \u043f\u0430\u043c\u044f\u0442\u0430\u043c, \u0432 \u043a\u043e\u0442\u0440\u044b\u043c \u0440\u043e\u0446\u0456.<\/code><\/td><td><code>Ni pamjatam, v kotr\u0177m roci.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 43.47 71.4\/50.0\/40.0\/25.0 (BP = 1.000 ratio = 1.167 hyp_len = 7 ref_len = 6)<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<p class=\"wp-block-paragraph\"><em>Wyja\u015bnienie<\/em>. Hipoteza r\u00f3\u017cni\u0142a si\u0119 od odniesienia o dwa znaki. Maszyna b\u0142\u0119dnie przet\u0142umaczy\u0142a cz\u0105stk\u0119 neguj\u0105c\u0105 czasownik, u\u017cywaj\u0105c s\u0142owa oznaczaj\u0105cego \u201enie\u201d (<em>ni<\/em>) zamiast oczekiwanego s\u0142owa \u201enie\u201d (<em>ne<\/em>). To zosta\u0142o ju\u017c w du\u017cej mierze naprawione. Maszyna r\u00f3wnie\u017c doda\u0142a przecinek po <g id=\"gid_3\">pamjatam<\/g>, co oznacza \u201epami\u0119tam\u201d. To obni\u017cy\u0142o wynik z tego, co by\u0142oby doskona\u0142ym wynikiem 100, do 43,47.     <\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Kontrola<\/strong>. Poniewa\u017c korpus opiera si\u0119 na wywiadach przeprowadzonych w Polsce, jako kontrol\u0119 wykorzystano t\u0142umaczenia na j\u0119zyk polski. Zosta\u0142y one transliterowane na alfabet cyrylicki poprzez odwr\u00f3cenie zasad transliteracji nazwisk \u0142emkowskich ustanowionych przez Ministerstwo Spraw Wewn\u0119trznych i Administracji Polski <a id=\"cite-22\" href=\"#ref-22\">[22, s. 6564]<\/a>. Polskie samog\u0142oski nosowe zosta\u0142y roz\u0142o\u017cone na samog\u0142osk\u0119 plus zwarcie nosowe, z wyj\u0105tkiem pozycji przed aproksymantami, gdzie zosta\u0142y bezpo\u015brednio odnazalizowane. W wyg\u0142osie przednia samog\u0142oska nosowa \/\u0119\/ zosta\u0142a po prostu odnazalizowana, a tylna \/\u0105\/ zosta\u0142a transliterowana tak, jakby by\u0142a nast\u0119powana przez zwarcie z\u0119bowe.    <\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-3-results\">3 Wyniki<\/h2>\n\n<p class=\"wp-block-paragraph\">Silnik dost\u0119pny publicznie pod adresem <code>www.LemkoTran.com<\/code> zaj\u0105\u0142 pierwsze miejsce z \u0142\u0105cznym wynikiem jako\u015bci t\u0142umaczenia BLEU 6,28, prawie trzy razy wy\u017cszym ni\u017c drugi w kolejno\u015bci Google Translate z us\u0142ug\u0105 angielsko-ukrai\u0144sk\u0105 (BLEU 2,17). Nast\u0119pna by\u0142a jego us\u0142uga angielsko-polska (BLEU 1,70), z us\u0142ug\u0105 angielsko-rosyjsk\u0105 na ostatnim miejscu (BLEU 1,10). <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"716\" src=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2022\/02\/chart-1024x716.png\" alt=\"\" class=\"wp-image-2157\" srcset=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2022\/02\/chart-1024x716.png 1024w, https:\/\/www.orynycz.com\/wp-content\/uploads\/2022\/02\/chart-300x210.png 300w, https:\/\/www.orynycz.com\/wp-content\/uploads\/2022\/02\/chart-768x537.png 768w, https:\/\/www.orynycz.com\/wp-content\/uploads\/2022\/02\/chart.png 1338w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><strong>Tabela 1<\/strong>. Jako\u015b\u0107 t\u0142umaczenia z angielskiego na \u0142emkowski: LemkoTran.com versus Google Translate<\/figcaption><\/figure>\n\n<h3 class=\"wp-block-heading\" id=\"h-3-1-results-by-machine-translation-service\">3.1 Wyniki wed\u0142ug us\u0142ugi t\u0142umaczenia maszynowego<\/h3>\n\n<p class=\"wp-block-paragraph\"><strong>Kontrola.<\/strong> Po transliteracji na alfabet cyrylicki, t\u0142umaczenia Google Translate na standardowy j\u0119zyk polski osi\u0105gn\u0119\u0142y wynik BLEU na poziomie korpusu 1,70. Pr\u00f3bki jego wydajno\u015bci s\u0105 nast\u0119puj\u0105ce: <\/p>\n\n<div>\n<em>Segment 2174.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>We had still been in Izby, right.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0422\u043e \u043c\u044b \u0456\u0449\u044b \u0431\u044b\u043b\u0438 \u0432 \u0406\u0437\u0431\u0430\u0445, \u0442\u0430\u043a.<\/code><\/td><td><code>To m\u0177 i\u0161\u010d\u0177 b\u0177ly v Izbach, tak.<\/code><\/td><\/tr><tr><td>Hipoteza polska i transliteracja<\/td><td><code>\u0411\u0438\u043b\u0456\u0441\u044c\u043c\u0438 \u0454\u0449\u0435 \u0432 \u0406\u0437\u0431\u0430\u0445, \u0442\u0430\u043a.<\/code><\/td><td><code>Byli\u015bmy jeszcze w Izbach, tak.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 46.20<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<div>\n<em>Segment 854.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>And that's what it's all about.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0406 \u043e \u0442\u043e \u0445\u043e\u0434\u0438\u0442.<\/code><\/td><td><code>I o to chodyt.<\/code><\/td><\/tr><tr><td>Hipoteza polska i transliteracja<\/td><td><code>\u0406 \u043e \u0442\u043e \u0432\u043b\u0430\u0441\u044c\u043d\u0454 \u0445\u043e\u0434\u0437\u0456.<\/code><\/td><td><code>I o to w\u0142a\u015bnie chodzi.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 32.47<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<div>\n<em>Segment 217.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>And that's what it's all about.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0422\u0430\u043a \u043c\u0456 \u043f\u043e\u0432\u0456\u043b.<\/code><\/td><td><code>Tak mi povil.<\/code><\/td><\/tr><tr><td>Hipoteza polska i transliteracja<\/td><td><code>\u0422\u0430\u043a \u043c\u0456 \u043f\u043e\u0432\u0454\u0434\u0437\u044f\u043b.<\/code><\/td><td><code>Tak mi powiedzia\u0142.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 35.36<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<p class=\"wp-block-paragraph\"><strong>Hybrydowy silnik angielsko-\u0142emkowski<\/strong>. Silnik dost\u0119pny bezp\u0142atnie publicznie pod adresem URL <code>www.LemkoTran.com<\/code> osi\u0105gn\u0105\u0142 wynik BLEU na poziomie korpusu 6,28. <\/p>\n\n<div>\n<em>Segment 1031.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>Everything was there.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0412\u0448\u044b\u0442\u043a\u043e \u0442\u0430\u043c \u0431\u044b\u043b\u043e.<\/code><\/td><td><code>V\u0161\u0177tko tam b\u0177lo.<\/code><\/td><\/tr><tr><td><code>Lemkotran.com<\/code> hipoteza i transliteracja<\/td><td><code>\u0412\u0448\u044b\u0442\u043a\u043e \u0442\u0430\u043c \u0431\u044b\u043b\u043e.<\/code><\/td><td><code>V\u0161\u0177tko tam b\u0177lo.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 100.00<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<div>\n<em>Segment 1445.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>But that officer took that medal and said,<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0410\u043b\u0435 \u0442\u043e\u0442 \u043e\u0444\u0456\u0446\u0435\u0440 \u0432\u0437\u044f\u043b \u0442\u043e\u0442 \u043c\u0435\u0434\u0430\u043b\u044c \u0456 \u043f\u043e\u0432\u0456\u0434\u0430\u0442:<\/code><\/td><td><code>Ale tot oficer vzial tot medal' i povidat:<\/code><\/td><\/tr><tr><td><code>Lemkotran.com<\/code> hipoteza i transliteracja<\/td><td><code>\u0410\u043b\u0435 \u0442\u043e\u0442 \u043e\u0444\u0456\u0446\u0435\u0440 \u0432\u0437\u044f\u043b \u0442\u043e\u0442 \u043c\u0435\u0434\u0430\u043b\u044c \u0456 \u043f\u043e\u0432\u0456\u043b:<\/code><\/td><td><code>Ale tot oficer vzial tot medal' i povil:<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 75.06<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<div>\n<em>Segment 217.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>That's what he said to me.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0422\u0430\u043a \u043c\u0456 \u043f\u043e\u0432\u0456\u043b.<\/code><\/td><td><code>Tak mi povil.<\/code><\/td><\/tr><tr><td><code>Lemkotran.com<\/code> hipoteza i transliteracja<\/td><td><code>\u0422\u0430\u043a \u043c\u0456 \u043f\u043e\u0432\u0456\u043b.<\/code><\/td><td><code>Tak mi povil.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 100.00<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<p class=\"wp-block-paragraph\"><strong>Ukrai\u0144ski<\/strong>. T\u0142umaczenia Google Translate na standardowy j\u0119zyk ukrai\u0144ski osi\u0105gn\u0119\u0142y wynik BLEU na poziomie korpusu 2,35. <\/p>\n\n<div>\n<em>Segment 2419.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>Where and when?<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0414\u0435 \u0456 \u043a\u043e\u043b\u0438?<\/code><\/td><td><code>De i koly?<\/code><\/td><\/tr><tr><td>Hipoteza ukrai\u0144ska i transliteracja<\/td><td><code>\u0414\u0435 \u0456 \u043a\u043e\u043b\u0438?<\/code><\/td><td><code>De i koly?<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 100.00<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<div>\n<em>Segment 1096.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>We were there for three months.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0422\u0430\u043c \u0437\u043c\u0435 \u0431\u044b\u043b\u0438 \u0442\u0440\u0438 \u043c\u0456\u0441\u044f\u0446\u0456.<\/code><\/td><td><code>Tam zme b\u0177ly try misiaci.<\/code><\/td><\/tr><tr><td>Hipoteza ukrai\u0144ska i transliteracja<\/td><td><code>\u041c\u0438 \u0431\u0443\u043b\u0438 \u0442\u0430\u043c \u0442\u0440\u0438 \u043c\u0456\u0441\u044f\u0446\u0456.<\/code><\/td><td><code>My buly tam try misjaci.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 30.21<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<div>\n<em>Segment 2513.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>Well, here to the west.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u041d\u043e \u0442\u043e \u0442\u0443 \u043d\u0430 \u0437\u0430\u0445\u0456\u0434.<\/code><\/td><td><code>No to tu na zachid.<\/code><\/td><\/tr><tr><td>Hipoteza ukrai\u0144ska i transliteracja<\/td><td><code>\u041d\u0443, \u0442\u0443\u0442 \u043d\u0430 \u0437\u0430\u0445\u0456\u0434.<\/code><\/td><td><code>Nu, tut na zachid.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 30.21<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<p class=\"wp-block-paragraph\"><strong>Rosyjski<\/strong>. Us\u0142uga Google Translate z angielskiego na rosyjski osi\u0105gn\u0119\u0142a wynik BLEU na poziomie korpusu 1,10. <\/p>\n\n<div>\n<em>Segment 432.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>Nobody knew.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u041d\u0438\u0445\u0442\u043e \u043d\u0435 \u0437\u043d\u0430\u043b.<\/code><\/td><td><code>Nychto ne znal.<\/code><\/td><\/tr><tr><td>Hipoteza rosyjska i transliteracja<\/td><td><code>\u041d\u0438\u043a\u0442\u043e \u043d\u0435 \u0437\u043d\u0430\u043b.<\/code><\/td><td><code>Nikto ne znal.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 59.46<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<div>\n<em>Segment 2751.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>What did they expel us for?<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0417\u0430 \u0448\u0442\u043e \u043d\u0430\u0441 \u0432\u044b\u0433\u043d\u0430\u043b\u0438?<\/code><\/td><td><code>Za \u0161to nas v\u0177hnaly?<\/code><\/td><\/tr><tr><td>Hipoteza rosyjska i transliteracja<\/td><td><code>\u0417\u0430 \u0447\u0442\u043e \u043d\u0430\u0441 \u0432\u044b\u0433\u043d\u0430\u043b\u0438?<\/code><\/td><td><code>Za \u010dto nas vygnali?<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 42.73<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<div>\n<em>Segment 2164.<\/em><figure class=\"wp-block-table is-style-stripes\"><table><tbody><tr><td>\u0179r\u00f3d\u0142o angielskie<\/td><td colspan=\"2\"><code>Brother went off to war.<\/code><\/td><\/tr><tr><td>Odniesienie i transliteracja \u0142emkowska<\/td><td><code>\u0411\u0440\u0430\u0442 \u043f\u0456\u0448\u043e\u043b \u043d\u0430 \u0432\u043e\u0439\u043d\u0443.<\/code><\/td><td><code>Brat pi\u0161ol na vojnu.<\/code><\/td><\/tr><tr><td>Hipoteza rosyjska i transliteracja<\/td><td><code>\u0411\u0440\u0430\u0442 \u0443\u0448\u0435\u043b \u043d\u0430 \u0432\u043e\u0439\u043d\u0443.<\/code><\/td><td><code>Brat u\u0161el na vojnu.<\/code><\/td><\/tr><tr><td>Wynik<\/td><td colspan=\"2\"><code>BLEU = 42.73<\/code><\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div>\n\n<h2 class=\"wp-block-heading\" id=\"h-4-discussion\">4 Dyskusja<\/h2>\n\n<p class=\"wp-block-paragraph\">Wynik BLEU 6,28 na poziomie korpusu dla systemu t\u0142umaczenia \u0142emkowskiego wskazuje, \u017ce cho\u0107 jest jeszcze wiele do zrobienia, sprawy id\u0105 w dobrym kierunku. Wynik BLEU 1,10 dla standardowego rosyjskiego wskazuje, \u017ce \u0142emkowski jest mniej podobny do rosyjskiego ni\u017c do polskiego (BLEU 1,70). By\u0107 mo\u017ce u\u017cycie przedrewolucyjnej ortografii mog\u0142oby poprawi\u0107 wynik rosyjskiego, ale by\u0142by to kosztowny eksperyment z niewielk\u0105 oczywist\u0105 korzy\u015bci\u0105.  <\/p>\n\n<p class=\"wp-block-paragraph\">Transliterowany wynik podobie\u0144stwa kontrolnego standardowego polskiego BLEU 1,70 wskazuje na mniejsz\u0105 interferencj\u0119 j\u0119zyka dominuj\u0105cego w Polsce ni\u017c mo\u017cna by oczekiwa\u0107. Interesuj\u0105ce by\u0142oby przeprojektowanie eksperymentu, w kt\u00f3rym zastosowano by kilka obliczeniowo niedrogich i oczywistych korespondencji d\u017awi\u0119kowych (na przyk\u0142ad denazalizacja *\u0119 do \/ja\/ i *\u01eb do \/u\/, retrakcja *i do \/y\/ oraz zmiana *g na \/h\/ <a href=\"#ref-23\" id=\"cite-23\">[23]<\/a>) do polskiego, aby sprawdzi\u0107, czy uzyska\u0142by wtedy wy\u017cszy wynik ni\u017c standardowy ukrai\u0144ski. <\/p>\n\n<p class=\"wp-block-paragraph\">Podsumowuj\u0105c, \u0142emkowski zosta\u0142 zsyntetyzowany w laboratorium, a mo\u017cliwo\u015b\u0107 jego tworzenia zosta\u0142a oddana w r\u0119ce zar\u00f3wno nowych, jak i rodzimych u\u017cytkownik\u00f3w. Po gruntownym przegl\u0105dzie silnika i rozbudowie s\u0142ownika, kolejnym krokiem jest obiektywny pomiar, a je\u015bli to mo\u017cliwe, subiektywna ocena przez u\u017cytkownik\u00f3w jako\u015bci syntetycznego \u0142emkowskiego w por\u00f3wnaniu z tym tworzonym przez rodzimych u\u017cytkownik\u00f3w. Dzie\u0144, w kt\u00f3rym nowi u\u017cytkownicy j\u0119zyk\u00f3w niskorezursowych b\u0119d\u0105 mogli korzysta\u0107 z t\u0142umaczenia maszynowego, aby zacz\u0105\u0107 komunikowa\u0107 si\u0119 w swoim j\u0119zyku z dnia na dzie\u0144, jest bli\u017cej, podobnie jak dzie\u0144, w kt\u00f3rym j\u0119zyk \u0142emkowski do\u0142\u0105czy do grona tych wcze\u015bniej zagro\u017conych, ale teraz rewitalizowanych.  <\/p>\n\n<p class=\"wp-block-paragraph\"><strong>Podzi\u0119kowania.<\/strong> Chcia\u0142bym podzi\u0119kowa\u0107 mojemu koledze Ming Qian z Peraton Labs za zainspirowanie mnie do przeprowadzenia tego eksperymentu oraz Brian Stensrud z Soar Technology, Inc. za przedstawienie nas sobie, a tak\u017ce za jego zach\u0119t\u0119.<\/p>\n\n<p class=\"wp-block-paragraph\">Chcia\u0142bym r\u00f3wnie\u017c podzi\u0119kowa\u0107 mojej przyjaci\u00f3\u0142ce Corinna Caudill za jej zach\u0119t\u0119 i osobiste zainteresowanie projektem, a tak\u017ce za przedstawienie mnie Prezydent Carpatho-Rusyn Society Maryann Sivak z University of Pittsburgh, kt\u00f3rej chcia\u0142bym podzi\u0119kowa\u0107 za mo\u017cliwo\u015b\u0107 zaprezentowania mojej pracy.<\/p>\n\n<p class=\"wp-block-paragraph\">Chcia\u0142bym r\u00f3wnie\u017c podzi\u0119kowa\u0107 Marii Silvestri z Fundacji Johna i Helen Timo za przeprowadzenie wywiad\u00f3w z rodzimymi u\u017cytkownikami j\u0119zyka \u0142emkowskiego i przekazanie transkrypt\u00f3w oraz moich t\u0142umacze\u0144 na potrzeby bada\u0144 i rozwoju.<\/p>\n\n<p class=\"wp-block-paragraph\">Chcia\u0142bym podzi\u0119kowa\u0107 Achim Rabus z University of Freiburg i Yves Scherrer z University of Helsinki za ich zainteresowanie projektem i pomys\u0142y.<\/p>\n\n<p class=\"wp-block-paragraph\">Chcia\u0142bym r\u00f3wnie\u017c podzi\u0119kowa\u0107 Myhal&#8217; L\u0177\u017ee\u010dko z blogu technologii j\u0119zyk\u00f3w mniejszo\u015bciowych InterFyisa za jego wczesne zainteresowanie projektem i dzia\u0142ania spo\u0142eczne.<\/p>\n\n<p class=\"wp-block-paragraph\">Chcia\u0142bym r\u00f3wnie\u017c podzi\u0119kowa\u0107 wsp\u00f3\u0142synowi Zahoczewie Marko \u0141yszyk za jego zainteresowanie projektem i dzia\u0142ania spo\u0142eczne.<\/p>\n\n<p class=\"wp-block-paragraph\">Na koniec chcia\u0142bym podzi\u0119kowa\u0107 mojemu wsp\u00f3\u0142autorowi i koledze z Antech Systems Inc. Tom Dobry za jego zach\u0119t\u0119 i wskaz\u00f3wki.<\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-references\">Referencje<\/h2>\n\n<p class=\"wp-block-paragraph\" id=\"ref-1\">1. <a href=\"#cite-1\">^<\/a> Graddol, D.: The future of language. Science, 303(5662), 1329-1331 (2004). <a href=\"https:\/\/doi.org\/10.1126\/science.1096546\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/doi.org\/10.1126\/science.1096546<\/a><\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-2\">2. <a href=\"#cite-2\">^<\/a> Eberhard, D. M., Simons, G. F., &amp; Fennig, C. D.: Ethnologue: Languages of the World, SIL International. Twenty-fourth edition. SIL International, Dallas (2021). Wersja online: How many languages are endangered?, <a href=\"https:\/\/www.ethnologue.com\/guides\/how-many-languages-endangered\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/www.ethnologue.com\/guides\/how-many-languages-endangered<\/a>, ostatni dost\u0119p 2022\/02\/11.<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-3\">3. <a href=\"#cite-3\">^<\/a> ISO 639 Code Tables, <a href=\"https:\/\/iso639-3.sil.org\/code_tables\/639\/data\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/iso639-3.sil.org\/code_tables\/639\/data<\/a>, ostatni dost\u0119p 2022\/02\/11.<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-4\">4. <a href=\"#cite-4\">^<\/a> Language support, <a href=\"https:\/\/cloud.google.com\/translate\/docs\/languages\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/cloud.google.com\/translate\/docs\/languages<\/a>, ostatni dost\u0119p 2022\/02\/11.<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-5\">5. <a href=\"#cite-5\">^<\/a> Select language, <a href=\"https:\/\/m.facebook.com\/language.php\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/m.facebook.com\/language.php<\/a>, ostatni dost\u0119p 2022\/02\/11.<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-6\">6. <a href=\"#cite-6-0\">^<\/a> <a href=\"#cite-6\">^<\/a> Orynycz, P., Dobry, T., Jackson, A., &amp; Litzenberg, K.: Yes I Speak\u2026 AI Neural Machine Translation in Multi-Lingual Training. W: Proceedings of the Interservice\/Industry Training, Simulation, and Education Conference (I\/ITSEC) 2021, Paper no. 21176. National Training and Simulation Association, Orlando (2021). <a href=\"https:\/\/www.xcdsystem.com\/iitsec\/proceedings\/index.cfm?Year=2021&amp;AbID=96953&amp;CID=862\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/www.xcdsystem.com\/iitsec\/proceedings\/index.cfm?Year=2021&amp;AbID=96953&amp;CID=862<\/a><\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-7\">7. <a href=\"#cite-7\">^<\/a> Du\u0107-Fajfer, O.: <em>Literatura a proces rozwoju i rewitalizacja to\u017csamo\u015bci j\u0119zykowej na przyk\u0142adzie literatury \u0142emkowskiej<\/em>. W: Olko, J., Wicherkiewicz, T., Borges, R. (red.), Integral Strategies for Language Revitalization, ss. 175\u2013200. Wydanie pierwsze. Wydzia\u0142 \u201eArtes Liberales\u201d, Uniwersytet Warszawski, Warszawa (2016).<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-8\">8. <a href=\"#cite-8\">^<\/a> Scherrer, Y., Rabus, A.: Neural morphosyntactic tagging for Rusyn. W: Mitkov, R., Tait, J., Boguraev, B. (red.), Natural Language Engineering, 25(5), 633\u2013650. Cambridge University Press, Cambridge (2019). <a href=\"https:\/\/doi.org\/10.1017\/S1351324919000287\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/doi.org\/10.1017\/S1351324919000287<\/a><\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-9\">9. <a href=\"#cite-9\">^<\/a> Reservations and Declarations for Treaty No.148 &#8211; European Charter for Regional or Minority Languages (ETS No. 148), <a href=\"https:\/\/www.coe.int\/en\/web\/conventions\/full-list?module=declarations-by-treaty&amp;numSte=148&amp;codeNature=1&amp;codePays=POL,%20last%20accessed%202022\/02\/11\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/www.coe.int\/en\/web\/conventions\/full-list?module=declarations-by-treaty&amp;numSte=148&amp;codeNature=1&amp;codePays=POL, ostatni dost\u0119p 2022\/02\/11<\/a>.<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-10\">10. <a href=\"#cite-10\">^<\/a> <em>Formularz indywidualny<\/em>, <a href=\"https:\/\/stat.gov.pl\/download\/gfx\/portalinformacyjny\/pl\/defaultstronaopisowa\/5781\/1\/1\/nsp_2011_badanie__pelne_wykaz_pytan.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/stat.gov.pl\/download\/gfx\/portalinformacyjny\/pl\/defaultstronaopisowa\/5781\/1\/1\/nsp_2011_badanie__pelne_wykaz_pytan.pdf<\/a>, ostatni dost\u0119p 2022\/02\/11.<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-11\">11. <a href=\"#cite-11\">^<\/a> <em>Narodowy Spis Powszechny Ludno\u015bci i Mieszka\u0144 2002 r. z 20 maja (formularz A)<\/em> <a href=\"https:\/\/stat.gov.pl\/gfx\/portalinformacyjny\/userfiles\/_public\/spisy_powszechne\/nsp2002-form-a.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/stat.gov.pl\/gfx\/portalinformacyjny\/userfiles\/_public\/spisy_powszechne\/nsp2002-form-a.pdf<\/a>, ostatni dost\u0119p 2022\/02\/11.<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-12\">12. <a href=\"#cite-12\">^<\/a> <em>IV Raport dotycz\u0105cy sytuacji mniejszo\u015bci narodowych i etnicznych oraz j\u0119zyka regionalnego w Rzeczypospolitej Polskiej \u2013 2013<\/em>, <a href=\"http:\/\/mniejszosci.narodowe.mswia.gov.pl\/download\/86\/14637\/TekstIVRaportu.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">http:\/\/mniejszosci.narodowe.mswia.gov.pl\/download\/86\/14637\/TekstIVRaportu.pdf<\/a>, ostatni dost\u0119p 2022\/02\/11.<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-13\">13. <a href=\"#cite-13\">^<\/a> Va\u0148ko, J.: The Language of Slovakia&#8217;s Rusyns. East European Monographs, New York (2000).<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-14\">14. <a href=\"#cite-14\">^<\/a> Forston, B., IV: Indo-European Language and Culture. Blackwell Publishing, Oxford (2004).<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-15\">15. <a href=\"#cite-15-0\">^<\/a> <a href=\"#cite-15-1\">^<\/a> Pokorny, J.: <em>Indogermanisches etymologisches W\u00f6rterbuch<\/em>, Bern, 1959.<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-16\">16. <a href=\"#cite-16\">^<\/a> Horoszczak, J.: <em>S\u0142ownik \u0142emkowsko-polski, polsko-\u0142emkowski<\/em>. Rutenika, Warszawa (2004).<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-17\">17. <a href=\"#cite-17-0\">^<\/a> <a href=\"#cite-17-1\">^<\/a> <a href=\"#cite-17-2\">^<\/a> <a href=\"#cite-17-3\">^<\/a> Vasmer, M. <em>Russisches etymologisches W\u00f6rterbuch<\/em>. <em>Zweiter Band<\/em>. Carl Winter, Universit\u00e4tsverlag, Heidelberg (1955).<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-18\">18. <a href=\"#cite-18\">^<\/a> Monier-Williams, M.: A Sanskrit-English Dictionary Etymologically and Philologically Arranged with Special Reference to Cognate Indo-European Languages, The Clarendon Press, Oxford (1899).<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-19\">19. <a href=\"#cite-19\">^<\/a> Derksen, R.: Etymological Dictionary of the Slavic Inherited Lexicon. W: Lubotsky, A. (red.) Leiden Indo-European Etymological Dictionary Series, t. 4, Koninklijke Brill, Leiden (2008).<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-20\">20. <a href=\"#cite-20\">^<\/a> Post, M.: A Call for Clarity in Reporting BLEU Scores. W: Proceedings of the Third Conference on Machine Translation (WMT), t. 1, str. 186\u2013191. Association for Computational Linguistics, Bruksela (2018). <a href=\"https:\/\/aclanthology.org\/W18-63\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/aclanthology.org\/W18-63<\/a><\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-21\">21. <a href=\"#cite-21\">^<\/a> Chen B., Cherry, C.: A Systematic Comparison of Smoothing Techniques for Sentence-Level BLEU. W: Proceedings of the Ninth Workshop on Statistical Machine Translation, str. 362\u2013367. Association for Computational Linguistics, Baltimore (2014). <a href=\"http:\/\/dx.doi.org\/10.3115\/v1\/W14-33\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">http:\/\/dx.doi.org\/10.3115\/v1\/W14-33<\/a><\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-22\">22. <a href=\"#cite-22\">^<\/a> Ministerstwo Spraw Wewn\u0119trznych i Administracji: <em>Rozporz\u0105dzenie Ministra Spraw Wewn\u0119trznych i Administracji z dnia 30 maja 2005 r. w sprawie sposobu transliteracji imion i nazwisk os\u00f3b nale\u017c\u0105cych do mniejszo\u015bci narodowych i etnicznych zapisanych w alfabecie innym ni\u017c alfabet \u0142aci\u0144ski<\/em>. W: Dziennik Ustaw Nr 102, ss. 6560\u20136573. Rz\u0105dowe Centrum Legislacji, Warszawa (2005).<\/p>\n\n<p class=\"wp-block-paragraph\" id=\"ref-23\">23. <a href=\"#cite-23\">^<\/a> Shevelov, G.: On the Chronology of H and the New G in Ukrainian. W: Harvard Ukrainian Studies, t. 1, nr 2, str. 137\u2013152. Harvard Ukrainian Research Institute, Cambridge (1977). <a href=\"https:\/\/www.jstor.org\/stable\/40999942\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/www.jstor.org\/stable\/40999942<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Streszczenie Neuronowe t\u0142umaczenie maszynowe wspierane sztuczn\u0105 inteligencj\u0105 mo\u017ce wkr\u00f3tce rewitalizowa\u0107 zagro\u017cone j\u0119zyki, umo\u017cliwiaj\u0105c nowym u\u017cytkownikom komunikacj\u0119 w czasie rzeczywistym przy u\u017cyciu zda\u0144 mierzalnie bli\u017cszych normie literackiej ni\u017c te u\u017cywane przez rodzimych u\u017cytkownik\u00f3w, i to od pierwszego dnia ich podr\u00f3\u017cy odzyskiwania j\u0119zyka. Podczas gdy Dolina Krzemowa inwestuje ogromne zasoby w technologi\u0119 t\u0142umaczenia neuronowego zdoln\u0105 do nadludzkiej [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":10597,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[165],"tags":[166,167,168],"class_list":["post-9990","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-prace","tag-lemko","tag-neuronowe-tlumaczenie-maszynowe","tag-rewitalizacja-jezykowa"],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v27.3 (Yoast SEO v27.7) - https:\/\/yoast.com\/product\/yoast-seo-premium-wordpress\/ -->\n<title>Powiedz to dobrze: T\u0142umaczenie maszynowe AI z wykorzystaniem sieci neuronowych dla j\u0119zyka \u0142emkowskiego<\/title>\n<meta name=\"description\" content=\"Artyku\u0142 o tym, jak zbudowa\u0142em translator, aby pom\u00f3c nowym u\u017cytkownikom w rewitalizacji j\u0119zyka \u0142emkowskiego\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/\" \/>\n<meta property=\"og:locale\" content=\"pl_PL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Powiedz to dobrze: T\u0142umaczenie maszynowe AI z wykorzystaniem sieci neuronowych dla j\u0119zyka \u0142emkowskiego\" \/>\n<meta property=\"og:description\" content=\"Artyku\u0142 o tym, jak zbudowa\u0142em translator, aby pom\u00f3c nowym u\u017cytkownikom w rewitalizacji j\u0119zyka \u0142emkowskiego\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/\" \/>\n<meta property=\"og:site_name\" content=\"Petro Orynycz\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/orynycz\" \/>\n<meta property=\"article:author\" content=\"https:\/\/www.facebook.com\/orynycz\" \/>\n<meta property=\"article:published_time\" content=\"2022-06-26T12:00:45+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2026-02-20T06:35:46+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2022-say-fi-pl-v00.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1200\" \/>\n\t<meta property=\"og:image:height\" content=\"628\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Admin\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:title\" content=\"Powiedz to dobrze: T\u0142umaczenie maszynowe AI z wykorzystaniem sieci neuronowych dla j\u0119zyka \u0142emkowskiego\" \/>\n<meta name=\"twitter:description\" content=\"Artyku\u0142 o tym, jak zbudowa\u0142em translator, aby pom\u00f3c nowym u\u017cytkownikom w rewitalizacji j\u0119zyka \u0142emkowskiego.\" \/>\n<meta name=\"twitter:image\" content=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2022\/02\/featured-1-1024x537.jpg\" \/>\n<meta name=\"twitter:creator\" content=\"@OrynyczP\" \/>\n<meta name=\"twitter:label1\" content=\"Napisane przez\" \/>\n\t<meta name=\"twitter:data1\" content=\"Admin\" \/>\n\t<meta name=\"twitter:label2\" content=\"Szacowany czas czytania\" \/>\n\t<meta name=\"twitter:data2\" content=\"14 minut\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/\"},\"author\":{\"name\":\"Admin\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/person\\\/81acf6b0d8344b8d8832f55a0e4a9f63\"},\"headline\":\"Powiedz to dobrze: Neuronowe t\u0142umaczenie maszynowe AI pozwala nowym m\u00f3wcom o\u017cywi\u0107 j\u0119zyk \u0142emkowski (2022)\",\"datePublished\":\"2022-06-26T12:00:45+00:00\",\"dateModified\":\"2026-02-20T06:35:46+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/\"},\"wordCount\":3722,\"commentCount\":0,\"publisher\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/2022-say-fi-pl-v00.jpg\",\"keywords\":[\"\u0142emkowski\",\"neuronowe t\u0142umaczenie maszynowe (NMT)\",\"rewitalizacja j\u0119zykowa\"],\"articleSection\":[\"Recenzowane artyku\u0142y naukowe\"],\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/#respond\"]}],\"copyrightYear\":\"2022\",\"copyrightHolder\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\"},\"accessibilityFeature\":[\"tableOfContents\"]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/\",\"name\":\"Powiedz to dobrze: T\u0142umaczenie maszynowe AI z wykorzystaniem sieci neuronowych dla j\u0119zyka \u0142emkowskiego\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/2022-say-fi-pl-v00.jpg\",\"datePublished\":\"2022-06-26T12:00:45+00:00\",\"dateModified\":\"2026-02-20T06:35:46+00:00\",\"description\":\"Artyku\u0142 o tym, jak zbudowa\u0142em translator, aby pom\u00f3c nowym u\u017cytkownikom w rewitalizacji j\u0119zyka \u0142emkowskiego\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/#breadcrumb\"},\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/#primaryimage\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/2022-say-fi-pl-v00.jpg\",\"contentUrl\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/2022-say-fi-pl-v00.jpg\",\"width\":1200,\"height\":628,\"caption\":\"Powiedz to dobrze po \u0142emkowsku dzi\u0119ki t\u0142umaczeniu neuronowemu opartemu na sztucznej inteligencji.\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Strona g\u0142\u00f3wna\",\"item\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Nauka\",\"item\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/moc\\\/nauka\\\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Recenzowane artyku\u0142y naukowe\",\"item\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/moc\\\/nauka\\\/prace\\\/\"},{\"@type\":\"ListItem\",\"position\":4,\"name\":\"Powiedz to dobrze: Neuronowe t\u0142umaczenie maszynowe AI pozwala nowym m\u00f3wcom o\u017cywi\u0107 j\u0119zyk \u0142emkowski (2022)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#website\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/\",\"name\":\"Orynycz.com\",\"description\":\"Naukowiec. In\u017cynier AI. Lingwista.\",\"publisher\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\"},\"alternateName\":\"\u041e\u0440\u0438\u043d\u0438\u0447.com\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pl-PL\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\",\"name\":\"orynycz.com\",\"alternateName\":\"\u041e\u0440\u0438\u043d\u0438\u0447.com\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/logo-1.jpg\",\"contentUrl\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/logo-1.jpg\",\"width\":512,\"height\":512,\"caption\":\"orynycz.com\"},\"image\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/orynycz\"],\"publishingPrinciples\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"ownershipFundingInfo\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"actionableFeedbackPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"correctionsPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"ethicsPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"diversityPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"diversityStaffingReport\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/person\\\/81acf6b0d8344b8d8832f55a0e4a9f63\",\"name\":\"Admin\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p\",\"caption\":\"Admin\"},\"description\":\"I am a scientist (ORCID iD 0000-0003-3094-9156), software engineer, computational linguist, localization and natural language engineer, Slavist, and Silicon Valley consultant. His research currently focuses on artificial intelligence (AI), neural machine translation (NMT), and hybrid systems to revitalize endangered, indigenous languages like Lemko. He received his degree in Russian at the Institute of East Slavic Philology of Jagiellonian University in Cracow, Poland, where he worked for Google amid its 2016 neural machine translation artificial intelligence breakthrough. His engines were recently mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25, Issue 5, page 634). Mr. Orynycz also has two decades of transatlantic experience as a linguist specializing in Russian, Polish, Ukrainian, Rusyn and Lemko for top language service providers, national defense, heavy industry, Raytheon, Amazon, Siemens, Mercedes-Benz, Daimler, investigators, philanthropists, and scientists.\",\"sameAs\":[\"https:\\\/\\\/www.orynycz.com\",\"https:\\\/\\\/www.facebook.com\\\/orynycz\",\"https:\\\/\\\/www.linkedin.com\\\/in\\\/orynycz\\\/\",\"https:\\\/\\\/x.com\\\/OrynyczP\",\"https:\\\/\\\/www.youtube.com\\\/channel\\\/UCOBzL010xr3XfzJcEZbaZyQ\"],\"gender\":\"male\",\"award\":[\"Engines mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25\",\"Issue 5\",\"page 634)\"],\"knowsAbout\":[\"Natural Language Processing\",\"Machine Translation\"],\"knowsLanguage\":[\"Ukrainian\",\"Lemko\",\"English\",\"Polish\",\"Russian\",\"Hungarian\"],\"jobTitle\":\"scientist\",\"worksFor\":\"Orynycz.com\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"Powiedz to dobrze: T\u0142umaczenie maszynowe AI z wykorzystaniem sieci neuronowych dla j\u0119zyka \u0142emkowskiego","description":"Artyku\u0142 o tym, jak zbudowa\u0142em translator, aby pom\u00f3c nowym u\u017cytkownikom w rewitalizacji j\u0119zyka \u0142emkowskiego","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/","og_locale":"pl_PL","og_type":"article","og_title":"Powiedz to dobrze: T\u0142umaczenie maszynowe AI z wykorzystaniem sieci neuronowych dla j\u0119zyka \u0142emkowskiego","og_description":"Artyku\u0142 o tym, jak zbudowa\u0142em translator, aby pom\u00f3c nowym u\u017cytkownikom w rewitalizacji j\u0119zyka \u0142emkowskiego","og_url":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/","og_site_name":"Petro Orynycz","article_publisher":"https:\/\/www.facebook.com\/orynycz","article_author":"https:\/\/www.facebook.com\/orynycz","article_published_time":"2022-06-26T12:00:45+00:00","article_modified_time":"2026-02-20T06:35:46+00:00","og_image":[{"width":1200,"height":628,"url":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2022-say-fi-pl-v00.jpg","type":"image\/jpeg"}],"author":"Admin","twitter_card":"summary_large_image","twitter_title":"Powiedz to dobrze: T\u0142umaczenie maszynowe AI z wykorzystaniem sieci neuronowych dla j\u0119zyka \u0142emkowskiego","twitter_description":"Artyku\u0142 o tym, jak zbudowa\u0142em translator, aby pom\u00f3c nowym u\u017cytkownikom w rewitalizacji j\u0119zyka \u0142emkowskiego.","twitter_image":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2022\/02\/featured-1-1024x537.jpg","twitter_creator":"@OrynyczP","twitter_misc":{"Napisane przez":"Admin","Szacowany czas czytania":"14 minut"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/#article","isPartOf":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/"},"author":{"name":"Admin","@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/person\/81acf6b0d8344b8d8832f55a0e4a9f63"},"headline":"Powiedz to dobrze: Neuronowe t\u0142umaczenie maszynowe AI pozwala nowym m\u00f3wcom o\u017cywi\u0107 j\u0119zyk \u0142emkowski (2022)","datePublished":"2022-06-26T12:00:45+00:00","dateModified":"2026-02-20T06:35:46+00:00","mainEntityOfPage":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/"},"wordCount":3722,"commentCount":0,"publisher":{"@id":"https:\/\/www.orynycz.com\/#organization"},"image":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/#primaryimage"},"thumbnailUrl":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2022-say-fi-pl-v00.jpg","keywords":["\u0142emkowski","neuronowe t\u0142umaczenie maszynowe (NMT)","rewitalizacja j\u0119zykowa"],"articleSection":["Recenzowane artyku\u0142y naukowe"],"inLanguage":"pl-PL","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/#respond"]}],"copyrightYear":"2022","copyrightHolder":{"@id":"https:\/\/www.orynycz.com\/#organization"},"accessibilityFeature":["tableOfContents"]},{"@type":"WebPage","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/","url":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/","name":"Powiedz to dobrze: T\u0142umaczenie maszynowe AI z wykorzystaniem sieci neuronowych dla j\u0119zyka \u0142emkowskiego","isPartOf":{"@id":"https:\/\/www.orynycz.com\/pl\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/#primaryimage"},"image":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/#primaryimage"},"thumbnailUrl":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2022-say-fi-pl-v00.jpg","datePublished":"2022-06-26T12:00:45+00:00","dateModified":"2026-02-20T06:35:46+00:00","description":"Artyku\u0142 o tym, jak zbudowa\u0142em translator, aby pom\u00f3c nowym u\u017cytkownikom w rewitalizacji j\u0119zyka \u0142emkowskiego","breadcrumb":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/#breadcrumb"},"inLanguage":"pl-PL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/"]}]},{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/#primaryimage","url":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2022-say-fi-pl-v00.jpg","contentUrl":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2022-say-fi-pl-v00.jpg","width":1200,"height":628,"caption":"Powiedz to dobrze po \u0142emkowsku dzi\u0119ki t\u0142umaczeniu neuronowemu opartemu na sztucznej inteligencji."},{"@type":"BreadcrumbList","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2022-powiedz-to-dobrze-neuronowe-tlumaczenie-maszynowe-ai\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Strona g\u0142\u00f3wna","item":"https:\/\/www.orynycz.com\/pl\/"},{"@type":"ListItem","position":2,"name":"Nauka","item":"https:\/\/www.orynycz.com\/pl\/moc\/nauka\/"},{"@type":"ListItem","position":3,"name":"Recenzowane artyku\u0142y naukowe","item":"https:\/\/www.orynycz.com\/pl\/moc\/nauka\/prace\/"},{"@type":"ListItem","position":4,"name":"Powiedz to dobrze: Neuronowe t\u0142umaczenie maszynowe AI pozwala nowym m\u00f3wcom o\u017cywi\u0107 j\u0119zyk \u0142emkowski (2022)"}]},{"@type":"WebSite","@id":"https:\/\/www.orynycz.com\/pl\/#website","url":"https:\/\/www.orynycz.com\/pl\/","name":"Orynycz.com","description":"Naukowiec. In\u017cynier AI. Lingwista.","publisher":{"@id":"https:\/\/www.orynycz.com\/#organization"},"alternateName":"\u041e\u0440\u0438\u043d\u0438\u0447.com","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.orynycz.com\/pl\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pl-PL"},{"@type":"Organization","@id":"https:\/\/www.orynycz.com\/#organization","name":"orynycz.com","alternateName":"\u041e\u0440\u0438\u043d\u0438\u0447.com","url":"https:\/\/www.orynycz.com\/pl\/","logo":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/logo\/image\/","url":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/logo-1.jpg","contentUrl":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/logo-1.jpg","width":512,"height":512,"caption":"orynycz.com"},"image":{"@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/orynycz"],"publishingPrinciples":"https:\/\/www.orynycz.com\/pl\/polityka\/","ownershipFundingInfo":"https:\/\/www.orynycz.com\/pl\/polityka\/","actionableFeedbackPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","correctionsPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","ethicsPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","diversityPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","diversityStaffingReport":"https:\/\/www.orynycz.com\/pl\/polityka\/"},{"@type":"Person","@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/person\/81acf6b0d8344b8d8832f55a0e4a9f63","name":"Admin","image":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/secure.gravatar.com\/avatar\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p","url":"https:\/\/secure.gravatar.com\/avatar\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p","caption":"Admin"},"description":"I am a scientist (ORCID iD 0000-0003-3094-9156), software engineer, computational linguist, localization and natural language engineer, Slavist, and Silicon Valley consultant. His research currently focuses on artificial intelligence (AI), neural machine translation (NMT), and hybrid systems to revitalize endangered, indigenous languages like Lemko. He received his degree in Russian at the Institute of East Slavic Philology of Jagiellonian University in Cracow, Poland, where he worked for Google amid its 2016 neural machine translation artificial intelligence breakthrough. His engines were recently mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25, Issue 5, page 634). Mr. Orynycz also has two decades of transatlantic experience as a linguist specializing in Russian, Polish, Ukrainian, Rusyn and Lemko for top language service providers, national defense, heavy industry, Raytheon, Amazon, Siemens, Mercedes-Benz, Daimler, investigators, philanthropists, and scientists.","sameAs":["https:\/\/www.orynycz.com","https:\/\/www.facebook.com\/orynycz","https:\/\/www.linkedin.com\/in\/orynycz\/","https:\/\/x.com\/OrynyczP","https:\/\/www.youtube.com\/channel\/UCOBzL010xr3XfzJcEZbaZyQ"],"gender":"male","award":["Engines mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25","Issue 5","page 634)"],"knowsAbout":["Natural Language Processing","Machine Translation"],"knowsLanguage":["Ukrainian","Lemko","English","Polish","Russian","Hungarian"],"jobTitle":"scientist","worksFor":"Orynycz.com"}]}},"_links":{"self":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts\/9990","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/comments?post=9990"}],"version-history":[{"count":6,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts\/9990\/revisions"}],"predecessor-version":[{"id":10613,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts\/9990\/revisions\/10613"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/media\/10597"}],"wp:attachment":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/media?parent=9990"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/categories?post=9990"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/tags?post=9990"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}