{"id":9697,"date":"2023-07-09T01:00:00","date_gmt":"2023-07-09T01:00:00","guid":{"rendered":"https:\/\/www.orynycz.com\/bez-kategorii\/bleu-skies-dla-rewitalizacji-zagrozonych-jezykow-dokladnosc-tlumaczenia-lemkoej-rusi-i-ukrainskiej-neuronowej-sztucznej-inteligencji-gwaltownie-rosnie\/"},"modified":"2025-12-10T07:07:34","modified_gmt":"2025-12-10T07:07:34","slug":"2023-bleukitne-niebo-lemko-translator-neuronowy","status":"publish","type":"post","link":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/","title":{"rendered":"BLEUkitne niebo dla rewitalizacji j\u0119zyk\u00f3w zagro\u017conych: Dok\u0142adno\u015b\u0107 t\u0142umaczenia neuronowej sztucznej inteligencji dla j\u0119zyka \u0142emkowskiego i ukrai\u0144skiego osi\u0105ga nowe wy\u017cyny (2023)"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\" id=\"h-abstract\">Streszczenie<\/h2>\n\n<p class=\"wp-block-paragraph\">Przyspieszaj\u0105ca globalna utrata j\u0119zyk\u00f3w, zwi\u0105zana z podwy\u017cszonym wyst\u0119powaniem u\u017cywania substancji niedozwolonych, cukrzycy typu 2, picia alkoholu w nadmiarze i napa\u015bci, a tak\u017ce sze\u015bciokrotnie wy\u017cszymi wska\u017anikami samob\u00f3jstw w\u015br\u00f3d m\u0142odzie\u017cy, stanowi narastaj\u0105ce wyzwanie dla spo\u0142eczno\u015bci mniejszo\u015bciowych, rdzennych, uchod\u017aczych, skolonizowanych i imigranckich. W \u015brodowiskach, gdzie przekaz mi\u0119dzypokoleniowy jest cz\u0119sto zak\u0142\u00f3cany, systemy neuronowego t\u0142umaczenia maszynowego sztucznej inteligencji maj\u0105 potencja\u0142 do rewitalizacji j\u0119zyk\u00f3w dziedzictwa i wzmocnienia nowych u\u017cytkownik\u00f3w poprzez umo\u017cliwienie im zrozumienia i bycia zrozumianymi za pomoc\u0105 natychmiastowego t\u0142umaczenia. Jednak rozwi\u0105zania sztucznej inteligencji stwarzaj\u0105 problemy, takie jak prohibicyjne koszty i problemy z jako\u015bci\u0105 wynik\u00f3w. Rozwi\u0105zaniem jest po\u0142\u0105czenie silnik\u00f3w neuronowych z klasycznymi, opartymi na regu\u0142ach, kt\u00f3re umo\u017cliwiaj\u0105 in\u017cynierom usuwanie zapo\u017cycze\u0144 i neutralizowanie interferencji z j\u0119zyk\u00f3w dominuj\u0105cych. Ta praca opisuje przebudow\u0119 silnika wdro\u017conego na LemkoTran.com w celu umo\u017cliwienia t\u0142umaczenia na j\u0119zyk \u0142emkowski i z niego, b\u0119d\u0105cy powa\u017cnie zagro\u017conym, mniejszo\u015bciowym dialektem ukrai\u0144skiej klasyfikacji genetycznej, rdzennym dla pogranicza mi\u0119dzy Polsk\u0105 a S\u0142owacj\u0105 (gdzie jest r\u00f3wnie\u017c okre\u015blany jako rusi\u0144ski). Modu\u0142y t\u0142umaczenia oparte na s\u0142ownikach zosta\u0142y wyposa\u017cone w morfologicznie i syntaktycznie poinformowane generatory rzeczownik\u00f3w, czasownik\u00f3w i przymiotnik\u00f3w zasilane przez 877 lemat\u00f3w wraz z 708 wpisami s\u0142ownikowymi, a ca\u0142y system zosta\u0142 wzmocniony przez 9 518 automatycznych, odnosz\u0105cych si\u0119 do kodyfikacji, obowi\u0105zkowych test\u00f3w kontroli jako\u015bci. Owocem tej pracy jest 23% poprawa od ostatniej publikacji w jako\u015bci t\u0142umaczenia na j\u0119zyk angielski i 35% wzrost jako\u015bci t\u0142umaczenia z j\u0119zyka angielskiego na \u0142emkowski, zapewniaj\u0105c t\u0142umaczenia, kt\u00f3re przewy\u017cszaj\u0105 ka\u017cd\u0105 us\u0142ug\u0119 Google Translate wed\u0142ug ka\u017cdej metryki i uzyskuj\u0105 wynik o 396% wy\u017cszy ni\u017c us\u0142uga ukrai\u0144ska Google przy t\u0142umaczeniu na j\u0119zyk \u0142emkowski.      <\/p>\n\n<div class=\"wp-block-file aligncenter downloadable\"><a id=\"wp-block-file--media-c89f055c-7e3d-46f7-8c37-12bf5c1a6f8e\" href=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/Orynycz_2023_HCI_preprint.pdf\">Pobierz PDF<\/a><a href=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/Orynycz_2023_HCI_preprint.pdf\" class=\"wp-block-file__button wp-element-button\" download=\"\" aria-describedby=\"wp-block-file--media-c89f055c-7e3d-46f7-8c37-12bf5c1a6f8e\">Pobierz<\/a><\/div>\n    <section class=\"petro-citation\" aria-labelledby=\"petro-citation-heading-2023-bleu\">\n        <h3 id=\"petro-citation-heading-2023-bleu\">\n            Prosz\u0119 cytowa\u0107:        <\/h3>\n\n        <p class=\"petro-citation__text\">\n            <cite id=\"petro-cite-2023-bleu\" class=\"p-name\">\n                Orynycz, P. (2023). BLEU Skies for Endangered Language Revitalization: Lemko Rusyn and Ukrainian Neural AI Translation Accuracy Soars. W: Degen, H., Ntoa, S. (red.), Artificial Intelligence in HCI. HCII 2023. Lecture Notes in Computer Science, t. 14051. Cham: Springer. https:\/\/doi.org\/10.1007\/978-3-031-35894-4_10            <\/cite>\n\n                            <span class=\"petro-citation__micro h-cite\" aria-hidden=\"true\">\n                                            <span class=\"p-author\">Orynycz, P.<\/span>\n                                                                <time class=\"dt-published\" datetime=\"2023\">\n                            2023                        <\/time>\n                                                                <span class=\"p-name\">BLEU Skies for Endangered Language Revitalization: Lemko Rusyn and Ukrainian Neural AI Translation Accuracy Soars<\/span>\n                                                                <a class=\"u-url\" href=\"https:\/\/doi.org\/10.1007\/978-3-031-35894-4_10\"><\/a>\n                                    <\/span>\n                    <\/p>\n\n        <div class=\"petro-citation__actions\">\n            <button\n                type=\"button\"\n                class=\"petro-copy-btn\"\n                data-copy-target=\"#petro-cite-2023-bleu\"\n                data-copied-text=\"Skopiowano!\">\n                Skopiuj cytowanie            <\/button>\n\n                            <button\n                    type=\"button\"\n                    class=\"petro-copy-btn petro-copy-btn--bibtex\"\n                    data-copy-target=\"#petro-bibtex-2023-bleu\"\n                    data-copied-text=\"Skopiowano!\">\n                    Skopiuj BibTeX                <\/button>\n\n                <pre id=\"petro-bibtex-2023-bleu\" class=\"petro-bibtex\" aria-hidden=\"true\">@incollection{orynycz2023bleu,\n  author    = {Petro Orynycz},\n  title     = {BLEU Skies for Endangered Language Revitalization: Lemko Rusyn and Ukrainian Neural AI Translation Accuracy Soars},\n  booktitle = {Artificial Intelligence in HCI},\n  series    = {Lecture Notes in Computer Science},\n  volume    = {14051},\n  publisher = {Springer},\n  address   = {Cham},\n  year      = {2023},\n  doi       = {10.1007\/978-3-031-35894-4_10}\n}<\/pre>\n                    <\/div>\n\n                <script type=\"application\/ld+json\">\n{\n    \"@context\": \"https:\/\/schema.org\",\n    \"@type\": \"ScholarlyArticle\",\n    \"name\": \"BLEU Skies for Endangered Language Revitalization: Lemko Rusyn and Ukrainian Neural AI Translation Accuracy Soars\",\n    \"headline\": \"BLEU Skies for Endangered Language Revitalization: Lemko Rusyn and Ukrainian Neural AI Translation Accuracy Soars\",\n    \"author\": {\n        \"@type\": \"Person\",\n        \"name\": \"Petro Orynycz\",\n        \"alternateName\": \"\u041f\u0435\u0442\u0440\u043e \u041e\u0440\u0438\u043d\u0438\u0447\"\n    },\n    \"datePublished\": \"2023\",\n    \"inLanguage\": \"en\",\n    \"identifier\": {\n        \"@type\": \"PropertyValue\",\n        \"propertyID\": \"doi\",\n        \"value\": \"10.1007\/978-3-031-35894-4_10\"\n    },\n    \"url\": \"https:\/\/doi.org\/10.1007\/978-3-031-35894-4_10\",\n    \"sameAs\": [\n        \"https:\/\/doi.org\/10.1007\/978-3-031-35894-4_10\"\n    ],\n    \"isPartOf\": {\n        \"@type\": \"Book\",\n        \"name\": \"Artificial Intelligence in HCI\",\n        \"isPartOf\": {\n            \"@type\": \"Series\",\n            \"name\": \"Lecture Notes in Computer Science\",\n            \"volumeNumber\": \"14051\",\n            \"publisher\": {\n                \"@type\": \"Organization\",\n                \"name\": \"Springer\"\n            }\n        }\n    },\n    \"keywords\": [\n        \"Lemko\",\n        \"Lemko Rusyn\",\n        \"Ukrainian\",\n        \"neural machine translation\",\n        \"endangered languages\"\n    ]\n}        <\/script>\n            <\/section>\n    \n\n<p class=\"alert is-style-text-annotation has-text-color has-background has-link-color has-medium-font-size wp-elements-09d839f49467f7ad91fb6b76efb0d30d is-style-text-annotation--1 wp-block-paragraph\" style=\"border-radius:41px;color:#0f5132;background-color:#d1e7dd\">  \u2705 Ta wersja artyku\u0142u zosta\u0142a zaakceptowana do publikacji po recenzji, ale nie jest Wersj\u0105 Ostateczn\u0105 i nie zawiera ulepsze\u0144 po akceptacji ani \u017cadnych poprawek. Wersja Ostateczna jest dost\u0119pna online pod adresem <a href=\"https:\/\/doi.org\/10.1007\/978-3-031-35894-4_10\" rel=\"nofollow\">https:\/\/doi.org\/10.1007\/978-3-031-35894-4_10<\/a>. Korzystanie z tej Zaakceptowanej Wersji podlega warunkom wydawcy dotycz\u0105cym wykorzystania Zaakceptowanego Manuskryptu: <a href=\"https:\/\/www.springernature.com\/gp\/open-research\/policies\/accepted-manuscript-terms\" rel=\"nofollow\">https:\/\/www.springernature.com\/gp\/open-research\/policies\/accepted-manuscript-terms<\/a>.  <\/p>\n\n<div class=\"wp-block-yoast-seo-table-of-contents yoast-table-of-contents\"><h2>Spis tre\u015bci<\/h2><ul><li><a href=\"#h-abstract\" data-level=\"2\">Streszczenie<\/a><\/li><li><a href=\"#h-1-introduction\" data-level=\"2\">1 Wprowadzenie<\/a><ul><li><a href=\"#h-1-1-the-problem\" data-level=\"3\">1.1 Problem<\/a><\/li><li><a href=\"#h-1-2-system-under-study\" data-level=\"3\">1.2 Badany system<\/a><\/li><\/ul><\/li><li><a href=\"#h-2-state-of-the-art\" data-level=\"2\">2 Aktualny stan wiedzy<\/a><\/li><li><a href=\"#h-3-materials-and-methods\" data-level=\"2\">3 Materia\u0142y i metody<\/a><ul><li><a href=\"#h-3-1-materials\" data-level=\"3\">3.1 Materia\u0142y<\/a><\/li><li><a href=\"#h-3-2-methods\" data-level=\"3\">3.2 Metody<\/a><\/li><\/ul><\/li><li><a href=\"#h-4-results-and-discussion\" data-level=\"2\">4 Wyniki i dyskusja<\/a><ul><li><a href=\"#h-4-1-english-to-lemko-translation-quality\" data-level=\"3\">4.1 Jako\u015b\u0107 t\u0142umaczenia z j\u0119zyka angielskiego na \u0142emkowski<\/a><\/li><li><a href=\"#h-lemko-to-english-translation\" data-level=\"3\">T\u0142umaczenie z j\u0119zyka \u0142emkowskiego na angielski<\/a><\/li><\/ul><\/li><li><a href=\"#h-5-conclusion\" data-level=\"2\">5 Wnioski<\/a><ul><li><a href=\"#h-references\" data-level=\"3\">Referencje<\/a><\/li><\/ul><\/li><\/ul><\/div>\n\n<h2 class=\"wp-block-heading\" id=\"h-1-introduction\">1 Wprowadzenie<\/h2>\n\n<h3 class=\"wp-block-heading\" id=\"h-1-1-the-problem\">1.1 Problem<\/h3>\n\n<p class=\"wp-block-paragraph\">J\u0119zyki zanikaj\u0105 w tempie co najmniej jednego na kwarta\u0142, przy czym tempo to ma si\u0119 potroi\u0107 do roku 2062, a do 2100 roku wzrosn\u0105\u0107 pi\u0119ciokrotnie, obejmuj\u0105c ponad 1500 spo\u0142eczno\u015bci j\u0119zykowych [1, s. 163, 169]. Zjawisku temu towarzyszy zwi\u0119kszona cz\u0119sto\u015b\u0107 u\u017cywania substancji psychoaktywnych o nielegalnym statusie [2, s. 179], wyst\u0119powania cukrzycy typu 2 [3], epizod\u00f3w intensywnego picia alkoholu i napa\u015bci [4], a tak\u017ce sze\u015bciokrotnie wy\u017cszy wska\u017anik samob\u00f3jstw w\u015br\u00f3d m\u0142odzie\u017cy w spo\u0142eczno\u015bciach, w kt\u00f3rych mniej ni\u017c po\u0142owa cz\u0142onk\u00f3w zna dany j\u0119zyk [5]. <\/p>\n\n<p class=\"wp-block-paragraph\">Niedawne badanie w Stanach Zjednoczonych wykaza\u0142o, \u017ce u\u017cywanie j\u0119zyk\u00f3w rdzennych ma pozytywny wp\u0142yw na zdrowie, niezale\u017cnie od poziomu bieg\u0142o\u015bci [6]. Eksperyment przeprowadzony na u\u017cytkownikach w Polsce wykaza\u0142, \u017ce u\u017cywanie j\u0119zyka \u0142emkowskiego \u0142agodzi objawy emocjonalne, behawioralne i depresyjne wynikaj\u0105ce z poznawczej dost\u0119pno\u015bci traumy [7]. <\/p>\n\n<p class=\"wp-block-paragraph\">T\u0142umaczenie maszynowe oparte na sztucznej inteligencji mo\u017ce odegra\u0107 istotn\u0105 rol\u0119 w upowszechnianiu opisanych wy\u017cej efekt\u00f3w ochronnych w\u015br\u00f3d u\u017cytkownik\u00f3w j\u0119zyk\u00f3w dziedziczonych poprzez rewitalizacj\u0119 j\u0119zyk\u00f3w zagro\u017conych wymarciem oraz tzw. j\u0119zyk\u00f3w u\u015bpionych [8, s. 577]. Na przyk\u0142ad nowi u\u017cytkownicy j\u0119zyka mog\u0105 natychmiast wytwarza\u0107 poprawny tekst i korzysta\u0107 ze zrozumia\u0142ych t\u0142umacze\u0144 pisemnych, wspomagaj\u0105c si\u0119 automatycznymi systemami t\u0142umaczenia maszynowego do czasu osi\u0105gni\u0119cia pe\u0142nej, samodzielnej bieg\u0142o\u015bci. <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-1-2-system-under-study\">1.2 Badany system<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-language\"><strong>J\u0119zyk<\/strong><\/h4>\n\n<p class=\"wp-block-paragraph\"><dfn>J\u0119zyk \u0142emkowski<\/dfn> to definitywnie do powa\u017cnie zagro\u017cony [9, s. 177\u2013178] wschodnios\u0142owia\u0144ski dialekt o po\u0142udniowo-zachodniej ukrai\u0144skiej klasyfikacji genetycznej [10, s. 52; 11, s. 39] rodzimy dla pogranicza mi\u0119dzy Rzeczpospolit\u0105 Polsk\u0105 a Republik\u0105 S\u0142owack\u0105; niekt\u00f3rzy okre\u015blali go jako rusi\u0144ski [11, s. 39; 12].<\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-eastern-boundaries\">Granice wschodnie<\/h5>\n\n<p class=\"wp-block-paragraph\">Unikalna izoglosa r\u00f3\u017cnicuj\u0105ca j\u0119zyk \u0142emkowski na wschodzie to sta\u0142y akcent paroksytoniczny (przedostatnia sylaba), cecha wsp\u00f3lna z polskim i wschodnios\u0142owackimi dialektami [10, s. 161\u2013162 i 972\u2013973; 11, s. 50; 13, s. 70\u201373], czyni\u0105c jego zasi\u0119g na wschodniej S\u0142owacji co najmniej do rzeki Laborec, z stref\u0105 przej\u015bciow\u0105 rozci\u0105gaj\u0105c\u0105 si\u0119 dalej [13, s. 70; 11, s. 50]. Tymczasem w Polsce historyczny zasi\u0119g j\u0119zyka \u0142emkowskiego si\u0119ga co najmniej rzek Os\u0142awica lub Wis\u0142ok, ze stref\u0105 przej\u015bciow\u0105 poza nimi [11, s. 50]. <\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-western-boundaries\">Zachodnie granice<\/h5>\n\n<p class=\"wp-block-paragraph\">Historyczne zachodnie granice j\u0119zyka \u0142emkowskiego to rzeki Poprad i Dunajec [14, s. 459].<\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-locale\">Lokalizacja<\/h4>\n\n<p class=\"wp-block-paragraph\">Wioski przodk\u00f3w native speaker\u00f3w, kt\u00f3rych wywiady sk\u0142adaj\u0105 si\u0119 na korpus, znajduj\u0105 si\u0119 w obecnych granicach administracyjnych dzisiejszego wojew\u00f3dztwa ma\u0142opolskiego, kt\u00f3rego stolic\u0105 jest Krak\u00f3w.<\/p>\n\n<figure class=\"wp-block-table aligncenter\"><table><tbody><tr><td>Nazwa \u0142emkowska<\/td><td>Transliteracja<\/td><td>Polska nazwa<\/td><td>Siedziba powiatu<\/td><td>Siedziba gminy<\/td><\/tr><tr><td>\u0406\u0437\u0431\u044b<\/td><td>Izb\u0177<\/td><td>Izby<\/td><td>Gorlice<\/td><td>U\u015bcie Gorlickie<\/td><\/tr><tr><td>\u0490\u043ba\u0434\u044b\u0448i\u0432<\/td><td>Glad\u0177\u0161iv<\/td><td>G\u0142adysz\u00f3w<\/td><td>Gorlice<\/td><td>U\u015bcie Gorlickie<\/td><\/tr><tr><td>\u0427\u043e\u0440\u043d\u0435<\/td><td>\u010corne<\/td><td>Czarne<\/td><td>Gorlice<\/td><td>S\u0119kowa<\/td><\/tr><tr><td>\u0414\u043e\u043b\u0433\u0435<\/td><td>Dolhe<\/td><td>D\u0142ugie<\/td><td>Gorlice<\/td><td>S\u0119kowa<\/td><\/tr><tr><td>\u0411\u0456\u043b\u0446\u0430\u0440\u044c\u043e\u0432\u0430<\/td><td>Bilcar\u02b9ova<\/td><td>Binczarowa<\/td><td>Nowy S\u0105cz<\/td><td>Gryb\u00f3w<\/td><\/tr><tr><td>\u0424\u043b\u044c\u043e\u0440\u0438\u043d\u043a\u0430<\/td><td>Florynka<\/td><td>Florynka<\/td><td>Nowy S\u0105cz<\/td><td>Gryb\u00f3w<\/td><\/tr><tr><td>\u0427\u044b\u0440\u043d\u0430<\/td><td>\u010c\u0177rna<\/td><td>Czyrna<\/td><td>Nowy S\u0105cz<\/td><td>Krynica-Zdr\u00f3j<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\"><strong>Tabela 1.<\/strong> Miejscowo\u015bci pochodzenia rodzimych u\u017cytkownik\u00f3w j\u0119zyka \u0142emkowskiego, z kt\u00f3rymi przeprowadzono wywiady wchodz\u0105ce w sk\u0142ad materia\u0142u korpusowego.<\/figcaption><\/figure>\n\n<h2 class=\"wp-block-heading\" id=\"h-2-state-of-the-art\">2 Aktualny stan wiedzy<\/h2>\n\n<p class=\"wp-block-paragraph\">W zesz\u0142ym roku opublikowano pierwsze na \u015bwiecie wyniki oceny jako\u015bci t\u0142umacze\u0144 maszynowych na j\u0119zyk \u0142emkowski: BLEU 6,28, co by\u0142o prawie trzykrotnie wy\u017csze ni\u017c us\u0142uga ukrai\u0144ska Google Translate<a href=\"#_ftn1\" id=\"_ftnref1\">[1]<\/a> (BLEU 2,17) [15, s. 570]. Rok wcze\u015bniej moi koledzy i ja opublikowali\u015bmy i przedstawili\u015bmy pierwsze na \u015bwiecie wyniki t\u0142umaczenia maszynowego z j\u0119zyka \u0142emkowskiego na angielski: BLEU 14,57 [16].<\/p>\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n<p class=\"wp-block-paragraph\"><a href=\"#_ftnref1\" id=\"_ftn1\">[1]<\/a> Ujawnienie informacji: Pracuj\u0119 jako p\u0142atny specjalista ds. kontroli jako\u015bci t\u0142umacze\u0144 z j\u0119zyka ukrai\u0144skiego, polskiego i rosyjskiego w ramach projektu Google Translate. Siedziba mojego klienta znajduje si\u0119 w San Francisco w Kalifornii.<\/p>\n\n<p class=\"wp-block-paragraph\">Silnik zosta\u0142 wdro\u017cony i jest dost\u0119pny bezp\u0142atnie pod adresem <a href=\"https:\/\/www.LemkoTran.com\">https:\/\/www.LemkoTran.com<\/a>, gdzie od jesieni 2017 r. dzia\u0142a silnik transliteracji. Silnik t\u0142umaczeniowy zosta\u0142 po raz pierwszy wspomniany w druku przez dr. Scherrera i dr. Rabusa w czasopi\u015bmie Cambridge University Press <em>Natural Language Engineering<\/em> w 2019 roku [17]. <\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-3-materials-and-methods\">3 Materia\u0142y i metody<\/h2>\n\n<h3 class=\"wp-block-heading\" id=\"h-3-1-materials\">3.1 Materia\u0142y<\/h3>\n\n<p class=\"wp-block-paragraph\">Eksperyment zosta\u0142 przeprowadzony na dwuj\u0119zycznym korpusie obejmuj\u0105cym \u0142emkowskie transkrypty cyrylickie i angielskie t\u0142umaczenia wywiad\u00f3w z ocala\u0142ymi i dzie\u0107mi przymusowych przesiedle\u0144 z ziem przodk\u00f3w w Polsce. Transkrypty i ich t\u0142umaczenia<a href=\"#_ftn1\" id=\"_ftnref1\">[1]<\/a> zosta\u0142y wyr\u00f3wnane w 3 267 segmentach, przy czym Microsoft Word poda\u0142 \u0142emkowsk\u0105 liczb\u0119 s\u0142\u00f3w \u017ar\u00f3d\u0142owych 68 944 i angielsk\u0105 docelow\u0105 liczb\u0119 s\u0142\u00f3w 81 188. <\/p>\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n<p class=\"wp-block-paragraph\"><a href=\"#_ftnref1\" id=\"_ftn1\">[1]<\/a> Zosta\u0142em zatrudniony do sporz\u0105dzenia transkrypcji oraz ich t\u0142umaczenia przez Fundacj\u0119 Johna i Helen Timo z Wilmington w stanie Delaware, kt\u00f3ra nast\u0119pnie przekaza\u0142a powsta\u0142e materia\u0142y na potrzeby mojej dzia\u0142alno\u015bci badawczo-rozwojowej.<\/p>\n\n<p class=\"wp-block-paragraph\">Za podstawowe \u017ar\u00f3d\u0142a odniesienia przyj\u0119to s\u0142owniki Jaros\u0142awa Horoszczaka [18], Petra Pyrteja [19], Ihora Dudy [20] i Janusza Riegera [21], a tak\u017ce gramatyki Henryka Fonta\u0144skiego i Miros\u0142awy Chomiak [22] oraz Petra Pyrteja [23].<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-3-2-methods\">3.2 Metody<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-engine-upgrades\">Ulepszenia silnika<\/h4>\n\n<p class=\"wp-block-paragraph\">Do tego eksperymentu silnik wdro\u017cony na LemkoTran.com zosta\u0142 wyposa\u017cony w nowo zbudowane generatory poinformowane przez cz\u0119\u015b\u0107 mowy, przypadek gramatyczny i liczb\u0119 w celu tworzenia gramatycznie i syntaktycznie odpowiednich t\u0142umacze\u0144 dla 1 585 wpis\u00f3w s\u0142ownikowych, z kt\u00f3rych oko\u0142o po\u0142owa nie odmienia si\u0119 w j\u0119zyku polskim lub \u0142emkowskim, umo\u017cliwiaj\u0105c prost\u0105 substytucj\u0119.<\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-quality-assurance-tests\">Testy zapewnienia jako\u015bci<\/h4>\n\n<p class=\"wp-block-paragraph\">Jako\u015b\u0107 zosta\u0142a zapewniona przez 9 518 test\u00f3w skrzy\u017cowanych, gdy by\u0142o to mo\u017cliwe, z kodyfikacjami \u0142emkowskimi, gramatykami i s\u0142ownikami wymienionymi powy\u017cej w <em>Materia\u0142ach<\/em>. Same testy potwierdzaj\u0105, \u017ce system t\u0142umaczy dane wypowiedzi w po\u017c\u0105dany spos\u00f3b. <\/p>\n\n<figure class=\"wp-block-table aligncenter\"><table><tbody><tr><td>Opis<\/td><td>Liczba<\/td><\/tr><tr><td>Temat rzeczownika<\/td><td>414<\/td><\/tr><tr><td>Temat czasownika<\/td><td>296<\/td><\/tr><tr><td>Temat przymiotnika<\/td><td>167<\/td><\/tr><tr><td>Zaimek osobowy<\/td><td>87<\/td><\/tr><tr><td>Inny zaimek \/ Pozosta\u0142e zaimki<\/td><td>178<\/td><\/tr><tr><td>Liczebnik<\/td><td>86<\/td><\/tr><tr><td>Inne has\u0142a s\u0142ownikowe<\/td><td>357<\/td><\/tr><tr><td>Razem<\/td><td>1,585<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\"><strong>Tabela 2.<\/strong>  S\u0142ownictwo systemowe.<\/figcaption><\/figure>\n\n<h4 class=\"wp-block-heading\" id=\"h-rule-based-machine-translation-rmbt\">T\u0142umaczenie maszynowe oparte na regu\u0142ach (RMBT)<\/h4>\n\n<p class=\"wp-block-paragraph\">Tekst otrzyma\u0142 \u0142emkowski lub polski wygl\u0105d i charakter poprzez zast\u0105pienie sekwencji znak\u00f3w, a szczeg\u00f3lnie ko\u0144c\u00f3wek fleksyjnych.<\/p>\n\n<figure class=\"wp-block-table aligncenter\"><table><tbody><tr><td class=\"has-text-align-center\" data-align=\"center\">Sekwencja polska<\/td><td class=\"has-text-align-center\" data-align=\"center\">Sekwencja \u0142emkowska<\/td><td>Pozycja w wyrazie<\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\"><em>owa\u0107<\/em><\/td><td class=\"has-text-align-center\" data-align=\"center\"><em>uwaty<\/em><\/td><td>ko\u0144cowa (wyg\u0142os)<\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\"><em>iami<\/em><\/td><td class=\"has-text-align-center\" data-align=\"center\"><em>iamy<\/em><\/td><td>ko\u0144cowa (wyg\u0142os)<\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\"><em>aj\u0105<\/em><\/td><td class=\"has-text-align-center\" data-align=\"center\"><em>ajut<\/em><\/td><td>ko\u0144cowa (wyg\u0142os)<\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\"><em>ze<\/em><\/td><td class=\"has-text-align-center\" data-align=\"center\"><em>zo<\/em><\/td><td>pocz\u0105tkowa (nag\u0142os)<\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\"><em>pod<\/em><\/td><td class=\"has-text-align-center\" data-align=\"center\"><em>pid<\/em><\/td><td>pocz\u0105tkowa (nag\u0142os)<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\"><strong>Tabela 3.<\/strong>  Przyk\u0142adowe zamiany sekwencji znak\u00f3w.<\/figcaption><\/figure>\n\n<h4 class=\"wp-block-heading\" id=\"h-translation-quality-scoring\">Ocena jako\u015bci t\u0142umaczenia<\/h4>\n\n<p class=\"wp-block-paragraph\">Jako\u015b\u0107 t\u0142umaczenia zosta\u0142a zmierzona wed\u0142ug standardowych metryk bran\u017cowych przy u\u017cyciu domy\u015blnych ustawie\u0144 narz\u0119dzia SacreBLEU wynalezionego w Amazon Research przez Matta Posta [24]. Ze wzgl\u0119du na por\u00f3wnywalno\u015b\u0107, j\u0119zyk polski zosta\u0142 przedstawiony w cyrylicy \u0142emkowskiej w taki sam spos\u00f3b jak w ostatnim eksperymencie [15, s. 573]. <\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-bilingual-evaluation-understudy-bleu\">Metryka BLEU (Bilingual Evaluation Understudy)<\/h5>\n\n<p class=\"wp-block-paragraph\">Ta oparta na <em>n<\/em>-gramach metryka cieszy si\u0119 du\u017c\u0105 popularno\u015bci\u0105 od dziesi\u0119cioleci. Zosta\u0142a opracowana w Stanach Zjednoczonych w o\u015brodku IBM T. J. Watson Research Center przy wsparciu Agencji Zaawansowanych Projekt\u00f3w Badawczych Obrony (DARPA) oraz pod nadzorem Dow\u00f3dztwa System\u00f3w Kosmicznych i Morskich Marynarki Wojennej Stan\u00f3w Zjednoczonych (SPAWAR) [25]. <\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-translation-edit-rate-ter\">Wsp\u00f3\u0142czynnik edycji t\u0142umaczenia (TER)<\/h5>\n\n<p class=\"wp-block-paragraph\">Metryka ta odzwierciedla liczb\u0119 edycji niezb\u0119dnych do tego, aby wynik by\u0142 semantycznie zbli\u017cony do poprawnego t\u0142umaczenia, maj\u0105c na celu wi\u0119ksz\u0105 tolerancj\u0119 na przesuni\u0119cia frazowe ni\u017c BLEU i inne metryki <em>oparte na n-gramach<\/em>. Jest on okre\u015blany poprzez podzielenie obliczenia odleg\u0142o\u015bci edycji mi\u0119dzy hipotez\u0105 a odniesieniem przez \u015bredni\u0105 liczb\u0119 s\u0142\u00f3w odniesienia. Jego rozw\u00f3j w Stanach Zjednoczonych by\u0142 r\u00f3wnie\u017c wspierany przez DARPA [26].  <\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-character-n-gram-f-score-chrf\">Wska\u017anik F dla znakowych n-gram\u00f3w (chrF)<\/h5>\n\n<p class=\"wp-block-paragraph\">Wykazano, \u017ce ta opracowana w Europie metryka bardzo dobrze koreluje z ludzkimi ocenami, a nawet przewy\u017csza zar\u00f3wno BLEU, jak i TER [27].<\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-4-results-and-discussion\">4 Wyniki i dyskusja<\/h2>\n\n<p class=\"wp-block-paragraph\">System eksperymentalny, LemkoTran.com, przewy\u017cszy\u0142 ka\u017cd\u0105 us\u0142ug\u0119 Google Translate pod ka\u017cdym wzgl\u0119dem. Wyniki jako\u015bci BLEU t\u0142umaczenia z angielskiego na \u0142emkowski poprawi\u0142y si\u0119 o 35% w por\u00f3wnaniu z ostatnimi opublikowanymi wynikami [15], daj\u0105c rezultaty cztery razy lepsze ni\u017c najlepsza oferta Google Translate, jej us\u0142uga ukrai\u0144ska. Tymczasem jako\u015b\u0107 t\u0142umaczenia z \u0142emkowskiego na angielski poprawi\u0142a si\u0119 o 23% od ostatnich opublikowanych wynik\u00f3w [16], osi\u0105gaj\u0105c wyniki BLEU o 16% wy\u017csze ni\u017c najlepsze uzyskane przez Google Translate, kt\u00f3re automatycznie rozpozna\u0142o \u0142emkowski jako ukrai\u0144ski w 76% przypadk\u00f3w, jako rosyjski w 16% przypadk\u00f3w i jako bia\u0142oruski w 6% przypadk\u00f3w.  <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-4-1-english-to-lemko-translation-quality\">4.1 Jako\u015b\u0107 t\u0142umaczenia z j\u0119zyka angielskiego na \u0142emkowski<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-scores\">Wyniki<\/h4>\n\n<p class=\"wp-block-paragraph\">Silnik wdro\u017cony na LemkoTran.com przewy\u017cszy\u0142 Google Translate pod ka\u017cdym wzgl\u0119dem przy t\u0142umaczeniu z angielskiego na \u0142emkowski. Nast\u0119pnym najwy\u017cej punktowanym systemem w eksperymencie by\u0142 albo wynik us\u0142ugi ukrai\u0144skiej Google Translate (u\u017cywaj\u0105c metryk BLEU lub chrF) albo jej us\u0142ugi polskiej (u\u017cywaj\u0105c metryki TER). <\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-bleu\">BLEU<\/h5>\n\n<p class=\"wp-block-paragraph\">Jako\u015b\u0107 t\u0142umacze\u0144 systemu wdro\u017conego w serwisie LemkoTran.com, mierzona najpowszechniej stosowan\u0105 metryk\u0105 BLEU, wzros\u0142a do 8,48, co oznacza popraw\u0119 o 35% wzgl\u0119dem ostatnio opublikowanych w 2022 roku wynik\u00f3w [15] i obecnie czterokrotnie przewy\u017csza najwy\u017cszy wynik uzyskany przez Google Translate.<\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"692\" height=\"404\" src=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-2.png\" alt=\"\" class=\"wp-image-7250\" srcset=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-2.png 692w, https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-2-300x175.png 300w\" sizes=\"auto, (max-width: 692px) 100vw, 692px\" \/><figcaption class=\"wp-element-caption\"><strong>Rys. 1.<\/strong> Jako\u015b\u0107 t\u0142umaczenia z angielskiego na \u0142emkowski mierzona wynikiem Bilingual Evaluation Understudy (BLEU), us\u0142ugi Google Cloud Neural Machine Translation (NMT) versus LemkoTran.com. Im wy\u017cej, tym lepiej. <\/figcaption><\/figure>\n\n<h5 class=\"wp-block-heading\" id=\"h-chrf\">chrF<\/h5>\n\n<p class=\"wp-block-paragraph\">Silnik LemkoTran.com osi\u0105gn\u0105\u0142 najlepszy wynik f-score (chrF 37,30) dla <em>n<\/em>-gram\u00f3w znak\u00f3w w t\u0142umaczeniu z angielskiego na \u0142emkowski, kt\u00f3ry jest o 37% wy\u017cszy ni\u017c nast\u0119pny najlepszy, us\u0142uga ukrai\u0144ska Google Translate. Tymczasem us\u0142uga rosyjska Google Translate uzyska\u0142a wy\u017cszy wynik ni\u017c jej odpowiedniki polskie i bia\u0142oruskie przy pomiarze wzgl\u0119dem korpusu \u0142emkowskiego t\u0105 metryk\u0105. <\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"692\" height=\"404\" src=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-3.png\" alt=\"\" class=\"wp-image-7255\" srcset=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-3.png 692w, https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-3-300x175.png 300w\" sizes=\"auto, (max-width: 692px) 100vw, 692px\" \/><figcaption class=\"wp-element-caption\"><strong>Rys. 2.<\/strong> Jako\u015b\u0107 t\u0142umaczenia z angielskiego na \u0142emkowski mierzona wynikiem F-score (chrF) dla <em>n<\/em>-gram\u00f3w znak\u00f3w, Google Cloud Neural Machine Translation (NMT) versus system eksperymentalny LemkoTran.com. Im wy\u017cej, tym lepiej. <\/figcaption><\/figure>\n\n<h5 class=\"wp-block-heading\" id=\"h-ter\">TER<\/h5>\n\n<p class=\"wp-block-paragraph\">Silnik LemkoTran.com osi\u0105gn\u0105\u0142 najlepszy wska\u017anik Translation Edit Rate (TER) dla t\u0142umaczenia z angielskiego na \u0142emkowski, uzyskuj\u0105c wynik 81,33. Us\u0142uga polska Google Translate zaj\u0119\u0142a drugie miejsce, a tu\u017c za ni\u0105 jej us\u0142uga ukrai\u0144ska. <\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"692\" height=\"404\" src=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-4.png\" alt=\"\" class=\"wp-image-7260\" srcset=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-4.png 692w, https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-4-300x175.png 300w\" sizes=\"auto, (max-width: 692px) 100vw, 692px\" \/><figcaption class=\"wp-element-caption\"><strong>Rys. 3.<\/strong> Translation Edit Rate (TER) z angielskiego na \u0142emkowski, Google Cloud Neural Machine Translation (NMT) versus LemkoTran.com. Im ni\u017cej, tym lepiej. <\/figcaption><\/figure>\n\n<h4 class=\"wp-block-heading\" id=\"h-samples\">Pr\u00f3bki<\/h4>\n\n<p class=\"wp-block-paragraph\">Poni\u017cej przedstawiono wyniki dzia\u0142ania system\u00f3w t\u0142umaczeniowych dla zda\u0144 wej\u015bciowych w j\u0119zyku angielskim.<\/p>\n\n<figure class=\"wp-block-table alignwide\"><table><tbody><tr><td colspan=\"2\"><strong>Wej\u015bcie<\/strong><\/td><td colspan=\"3\"><strong>Our children were smart too. But where were they supposed to study? <\/strong><strong><\/strong><\/td><\/tr><tr><td colspan=\"2\">Opis<\/td><td>Wynik<\/td><td>Transliteracja<\/td><td>Wyniki jako\u015bci<\/td><\/tr><tr><td colspan=\"2\"><strong>Referencja \u0142emkowska<br\/>(native speaker)<\/strong><\/td><td><strong>\u0412 \u043d\u0430\u0441 \u0434\u0456\u0442\u0438 \u0442\u0456\u0436 \u0431\u044b\u043b\u0438 \u043c\u0443\u0434\u0440\u044b, \u0430\u043b\u0435 \u0434\u0435 \u043c\u0430\u043b\u0438 \u0441\u044f \u0432\u0447\u044b\u0442\u0438?<\/strong><\/td><td><strong>V nas dity ti\u017e b\u0177ly mudr\u0177, ale de maly sja v\u010d\u0177ty?<\/strong><\/td><td>BLEU 100<br\/>chrF2 100<br\/>TER 0<\/td><\/tr><tr><td colspan=\"2\">T\u0142umaczenie na \u0142emkowski przez<br\/>LemkoTran.com<\/td><td>\u041d\u0430\u0448\u044b \u0434\u0456\u0442\u0438 \u0442\u0456\u0436 \u0431\u044b\u043b\u0438 \u043c\u0443\u0434\u0440\u044b. \u0430\u043b\u0435 \u0434\u0435 \u043c\u0430\u043b\u0438 \u0441\u044f \u0432\u0447\u044b\u0442\u0438? <\/td><td>Na\u0161\u0177 dity ti\u017e b\u0177ly mudr\u0177. ale de maly sja v\u010d\u0177ty? <\/td><td>BLEU 58,34<br\/>chrF2 79,03<br\/>TER 27,27<\/td><\/tr><tr><td rowspan=\"3\">T\u0142umacz Google (kontrola)<\/td><td>T\u0142umaczenie na j\u0119zyk ukrai\u0144ski<\/td><td>\u041d\u0430\u0448\u0456 \u0434\u0456\u0442\u0438 \u0442\u0435\u0436 \u0431\u0443\u043b\u0438 \u0440\u043e\u0437\u0443\u043c\u043d\u0438\u043c\u0438. \u0410\u043b\u0435 \u0434\u0435 \u0432\u043e\u043d\u0438 \u043c\u0430\u043b\u0438 \u0432\u0447\u0438\u0442\u0438\u0441\u044f? <\/td><td>Na\u0161i dity te\u017e buly rozumnymy. Ale czy jest to mo\u017cliwe? <\/td><td>BLEU 4,41<br\/>chrF2 25,80<br\/>TER 72,73<\/td><\/tr><tr><td>T\u0142umaczenie na j\u0119zyk rosyjski<\/td><td>\u041d\u0430\u0448\u0438 \u0434\u0435\u0442\u0438 \u0442\u043e\u0436\u0435 \u0431\u044b\u043b\u0438 \u0443\u043c\u043d\u044b\u043c\u0438. \u041d\u043e \u0433\u0434\u0435 \u0438\u043c \u0431\u044b\u043b\u043e \u0443\u0447\u0438\u0442\u044c\u0441\u044f? <\/td><td>Na pewno byli umar\u0142ymi. Nie masz nic przeciwko? <\/td><td>BLEU 3,71<br\/>chrF2 16,95<br\/>TER 90,91<\/td><\/tr><tr><td>T\u0142umaczenie na j\u0119zyk polski<\/td><td>\u041d\u0430\u0448\u0435 \u0434\u0437\u0454\u0446\u0456 \u0442\u0435\u0436 \u0431\u0438\u043b\u0438 \u043c\u043e\u043d\u0434\u0440\u0435. \u0410\u043b\u0454 \u0491\u0434\u0437\u0454 \u043c\u0454\u043b\u0456 \u0441\u0454 \u0443\u0447\u0438\u0446\u044c? <\/td><td>Nie musisz si\u0119 martwi\u0107. Czy jeste\u015b w stanie to zrobi\u0107? <\/td><td>BLEU 3,12<br\/>chrF2 13,84<br\/>TER 100<\/td><\/tr><tr><td>\u00a0<\/td><td>T\u0142umaczenie na bia\u0142oruski<\/td><td>\u0420\u0430\u0437\u0443\u043c\u043d\u044b\u044f \u0431\u044b\u043b\u0456 \u0456 \u043d\u0430\u0448\u044b \u0434\u0437\u0435\u0446\u0456. \u0410\u043b\u0435 \u0434\u0437\u0435 \u044f\u043d\u044b \u043f\u0430\u0432\u0456\u043d\u043d\u044b \u0431\u044b\u043b\u0456 \u0432\u0443\u0447\u044b\u0446\u0446\u0430? <\/td><td>Razumnyja byli i na\u0161y dzeci. Ale czy tw\u00f3j pavinny byli wu\u010dycca? <\/td><td>BLEU 3,09<br\/>chrF2 12,83<br\/>TER 100<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\"><strong>Tabela 4.<\/strong> Por\u00f3wnanie hipotez t\u0142umaczeniowych dla zdania wej\u015bciowego w j\u0119zyku angielskim.<\/figcaption><\/figure>\n\n<figure class=\"wp-block-table alignwide\"><table><tbody><tr><td colspan=\"2\"><strong>Wej\u015bcie<\/strong><\/td><td colspan=\"3\"><strong>And generally speaking, Lemkos in Poland don&#8217;t have a leader, so to speak, who would say something.<\/strong><strong><\/strong><\/td><\/tr><tr><td colspan=\"2\">Opis<\/td><td>Wynik<\/td><td>Transliteracja<\/td><td>Wyniki jako\u015bci<\/td><\/tr><tr><td colspan=\"2\"><strong>Referencja \u0142emkowska (native speaker)<\/strong><\/td><td><strong>\u0410 \u0432\u043e\u0491\u0443\u043b\u0456 \u041b\u0435\u043c\u043a\u044b \u0432 \u041f\u043e\u043b\u044c\u0449\u044b \u043d\u0435 \u043c\u0430\u044e\u0442 \u0442\u0430\u043a\u043e\u0433\u043e, \u0436\u0435 \u0442\u0430\u043a \u043f\u043e\u0432\u0456\u043c, \u0442\u0430\u043a\u043e\u0433\u043e \u043b\u0456\u0434\u0435\u0440\u0430, \u043a\u043e\u0442\u0440\u0438\u0439 \u0431\u044b \u0448\u0442\u043e\u0441\u0438 \u043f\u043e\u0432\u0456\u043b.<\/strong><\/td><td><strong>A voguli Lemk\u0177 v Pol&#8217;\u0161\u010d\u0177 ne majut takoho, \u017ee tak povim, takoho lidera, kotryj b\u0177 \u0161tosy povil.<\/strong><\/td><td>BLEU 100<br\/>chrF2 100<br\/>TER 0<\/td><\/tr><tr><td colspan=\"2\">T\u0142umaczenie na \u0142emkowski przez LemkoTran.com<\/td><td>\u0406 \u0433\u0435\u043d\u0435\u0440\u0430\u043b\u044c\u043d\u0456 \u041b\u0435\u043c\u043a\u044b \u0432 \u041f\u043e\u043b\u044c\u0449\u044b \u043d\u0435 \u043c\u0430\u044e\u0442 \u043b\u0438\u0434\u0435\u0440\u0430, \u0436\u0435 \u0442\u0430\u043a \u043f\u043e\u0432\u0456\u043c, \u043a\u043e\u0442\u0440\u0438\u0439 \u0431\u044b \u0448\u0442\u043e\u0441\u0438 \u043f\u043e\u0432\u0456\u043b.<\/td><td>I heneral \u201eni Lemk\u0177 v Pol\u201d \u0161\u010d\u0177 ne majut lydera, \u017ee tak povim, kotryj b\u0177 \u0161tosy povil.<\/td><td>BLEU 55,58<br\/>chrF2 65,32<br\/>TER 29,41<\/td><\/tr><tr><td rowspan=\"3\">T\u0142umacz Google (kontrola)<\/td><td>T\u0142umaczenie na j\u0119zyk polski<\/td><td>\u0406 \u0491\u0435\u043d\u0435\u0440\u0430\u043b\u044c\u043d\u0454 \u041b\u0435\u043c\u043a\u043e\u0432\u0454 \u0432 \u041f\u043e\u043b\u044c\u0441\u0446\u0435 \u043d\u0454 \u043c\u0430\u0439\u043e\u043d \u043b\u0456\u0434\u0435\u0440\u0430, \u0436\u0435 \u0442\u0430\u043a \u043f\u043e\u0432\u0454\u043c, \u043a\u0442\u0443\u0440\u0438 \u0431\u0438 \u0446\u043e\u0441\u044c \u043f\u043e\u0432\u0454\u0434\u0437\u044f\u043b.<\/td><td>I general&#8217;nje Lemkovje v Pol&#8217;sce nie majon lidera, \u017ee tak povjem, ktury by cos&#8217; povjedzjal.<\/td><td>BLEU 9,26<br\/>chrF2 29,29<br\/>TER 82,35<br\/><br\/><\/td><\/tr><tr><td>T\u0142umaczenie na j\u0119zyk ukrai\u0144ski<\/td><td>\u0406 \u0432\u0437\u0430\u0433\u0430\u043b\u0456, \u043b\u0435\u043c\u043a\u0438 \u0432 \u041f\u043e\u043b\u044c\u0449\u0456 \u043d\u0435 \u043c\u0430\u044e\u0442\u044c \u043b\u0456\u0434\u0435\u0440\u0430, \u0442\u0430\u043a \u0431\u0438 \u043c\u043e\u0432\u0438\u0442\u0438, \u044f\u043a\u0438\u0439 \u0431\u0438 \u0449\u043e\u0441\u044c \u0441\u043a\u0430\u0437\u0430\u0432.<\/td><td>I vzahali, lemky v Pol&#8217;shchi ne mayut&#8217; lidera, tak by movyty, yakyj by shchos&#8217; skazav.<\/td><td>BLEU 5,15<br\/>chrF2 26,56<br\/>TER 82,35<\/td><\/tr><tr><td>T\u0142umaczenie na j\u0119zyk rosyjski<\/td><td>\u0418 \u0432\u043e\u043e\u0431\u0449\u0435, \u0443 \u043b\u0435\u043c\u043a\u043e\u0432 \u0432 \u041f\u043e\u043b\u044c\u0448\u0435 \u043d\u0435\u0442, \u0442\u0430\u043a \u0441\u043a\u0430\u0437\u0430\u0442\u044c, \u043b\u0438\u0434\u0435\u0440\u0430, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0431\u044b \u0447\u0442\u043e-\u0442\u043e \u0441\u043a\u0430\u0437\u0430\u043b.<\/td><td>I voob\u0161\u010de, u lemkov v Pol\u02b9\u0161e net, tak skazat\u02b9, lidera, kotoryj by \u010dto-to skazal.<\/td><td>BLEU 2,96<br\/>chrF2 25,87<br\/>TER 88,24<\/td><\/tr><tr><td>\u00a0<\/td><td>T\u0142umaczenie na j\u0119zyk bia\u0142oruski<\/td><td>\u0406 \u045e\u0432\u043e\u0433\u0443\u043b\u0435 \u043b\u044d\u043c\u043a\u0456 \u045e \u041f\u043e\u043b\u044c\u0448\u0447\u044b \u043d\u044f \u043c\u0430\u044e\u0446\u044c \u043b\u0456\u0434\u044d\u0440\u0430, \u0442\u0430\u043a \u0431\u044b \u043c\u043e\u0432\u0456\u0446\u044c, \u044f\u043a\u0456 \u0431 \u043d\u0435\u0448\u0442\u0430 \u0441\u043a\u0430\u0437\u0430\u045e.<\/td><td>I \u016dvohule l\u00e8mki \u016d Pol\u2032\u0161\u010dy nja majuc\u2032 lid\u00e8ra, tak by movic\u2032, jaki b ne\u0161ta skaza\u016d.<\/td><td>BLEU 2,72<br\/>chrF2 18,05<br\/>TER 94,12<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\"><strong>Tabela 5.<\/strong> Por\u00f3wnanie hipotez t\u0142umaczeniowych dla zdania wej\u015bciowego w j\u0119zyku angielskim.<\/figcaption><\/figure>\n\n<h3 class=\"wp-block-heading\" id=\"h-lemko-to-english-translation\">T\u0142umaczenie z j\u0119zyka \u0142emkowskiego na angielski<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-scores-0\">Wyniki<\/h4>\n\n<p class=\"wp-block-paragraph\">Pod ka\u017cdym wzgl\u0119dem silnik wdro\u017cony na LemkoTran.com przewy\u017cszy\u0142 Google Translate, dla kt\u00f3rego t\u0142umaczenie jak ze standardowego ukrai\u0144skiego by\u0142o zawsze drugie najlepsze, nast\u0119pnie automatyczne wykrywanie j\u0119zyka \u017ar\u00f3d\u0142owego, potem t\u0142umaczenie jak z bia\u0142oruskiego, a nast\u0119pnie polskiego, z rosyjskim zawsze na ostatnim miejscu. Google Translate rozpozna\u0142o \u0142emkowski jako ukrai\u0144ski w 76% przypadk\u00f3w, jako rosyjski w 16% przypadk\u00f3w, jako bia\u0142oruski w 6% przypadk\u00f3w i jako r\u00f3\u017cne j\u0119zyki u\u017cywaj\u0105ce alfabet\u00f3w cyrylickich (np. mongolski) w pozosta\u0142ych przypadkach. <\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-bleu-0\">BLEU<\/h5>\n\n<p class=\"wp-block-paragraph\">LemkoTran.com uzyska\u0142 wynik BLEU r\u00f3wny 17,95 podczas t\u0142umaczenia na j\u0119zyk angielski, co stanowi popraw\u0119 o 23% w stosunku do ostatnio opublikowanych wynik\u00f3w (BLEU 14,57) oraz warto\u015b\u0107 o 16% wy\u017csz\u0105 ni\u017c w przypadku ukrai\u0144skiej us\u0142ugi Google Translate (BLEU 15,43).<\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"692\" height=\"404\" src=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-5.png\" alt=\"\" class=\"wp-image-7265\" srcset=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-5.png 692w, https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-5-300x175.png 300w\" sizes=\"auto, (max-width: 692px) 100vw, 692px\" \/><figcaption class=\"wp-element-caption\"><strong>Rys. 4.<\/strong> Jako\u015b\u0107 t\u0142umaczenia z \u0142emkowskiego na angielski mierzona wynikiem Bilingual Evaluation Understudy (BLEU), us\u0142ugi Google Cloud Neural Machine Translation (NMT) versus system eksperymentalny LemkoTran.com. Im wy\u017cej, tym lepiej. <\/figcaption><\/figure>\n\n<h5 class=\"wp-block-heading\" id=\"h-chrf-0\">chrF<\/h5>\n\n<p class=\"wp-block-paragraph\">Silnik wdro\u017cony w serwisie LemkoTran.com osi\u0105gn\u0105\u0142 warto\u015b\u0107 wska\u017anika F dla znakowych n-gram\u00f3w (chrF) r\u00f3wn\u0105 45,89 podczas t\u0142umaczenia na j\u0119zyk angielski; jest to wynik o 5% lepszy ni\u017c w przypadku ukrai\u0144skiej us\u0142ugi Google Translate.<\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"692\" height=\"404\" src=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-6.png\" alt=\"\" class=\"wp-image-7270\" srcset=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-6.png 692w, https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-6-300x175.png 300w\" sizes=\"auto, (max-width: 692px) 100vw, 692px\" \/><figcaption class=\"wp-element-caption\"><strong>Rys. 5.<\/strong> Jako\u015b\u0107 t\u0142umaczenia z \u0142emkowskiego na angielski mierzona wynikiem F-score (chrF) dla <em>n<\/em>-gram\u00f3w znak\u00f3w, Google Cloud Neural Machine Translation (GNMT) versus system eksperymentalny LemkoTran.com. Im wy\u017cej, tym lepiej. <\/figcaption><\/figure>\n\n<h5 class=\"wp-block-heading\" id=\"h-ter-0\">TER<\/h5>\n\n<p class=\"wp-block-paragraph\">LemkoTran.com uzyska\u0142 warto\u015b\u0107 wsp\u00f3\u0142czynnika Translation Edit Rate (TER) r\u00f3wn\u0105 70,38 podczas t\u0142umaczenia na j\u0119zyk angielski; wynik ten jest o 7% lepszy ni\u017c w przypadku ukrai\u0144skiej us\u0142ugi Google Translate.<\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"692\" height=\"404\" src=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-7.png\" alt=\"\" class=\"wp-image-7275\" srcset=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-7.png 692w, https:\/\/www.orynycz.com\/wp-content\/uploads\/2024\/02\/image-7-300x175.png 300w\" sizes=\"auto, (max-width: 692px) 100vw, 692px\" \/><figcaption class=\"wp-element-caption\"><strong>Rys. 6.<\/strong> Translation Edit Rate (TER) z \u0142emkowskiego na angielski, Google Cloud Neural Machine Translation (GNMT) versus system eksperymentalny LemkoTran.com. Im ni\u017cej, tym lepiej. <\/figcaption><\/figure>\n\n<h4 class=\"wp-block-heading\" id=\"h-samples-0\">Pr\u00f3bki<\/h4>\n\n<p class=\"wp-block-paragraph\">Poni\u017cej przedstawiono wyniki dzia\u0142ania system\u00f3w t\u0142umaczeniowych dla zda\u0144 wej\u015bciowych w j\u0119zyku angielskim.<\/p>\n\n<figure class=\"wp-block-table alignwide\"><table><tbody><tr><td>\u00a0<\/td><td>Opis<\/td><td>Wynik<\/td><td>Wyniki<br\/>jako\u015bci<\/td><\/tr><tr><td colspan=\"2\"><strong>Transkrypcja wej\u015bciowa \u0142emkowskiego m\u00f3wionego przez native speakera<\/strong><\/td><td><strong>\u042f\u043a \u0440\u043e\u0437\u0434\u0456\u043b\u044f\u043c\u0435 \u044f\u0437\u044b\u043a\u044b, \u0442\u043e \u043c\u0430\u043b\u0430-\u043c \u043a\u043e\u043d\u0442\u0430\u043a\u0442 \u0437 \u043f\u043e\u043b\u044c\u0441\u043a\u044b\u043c, \u0442\u043e \u043d\u0435 \u0431\u044b\u043b\u043e \u0442\u0430\u043a, \u0436\u0435 \u043f\u0456\u0448\u043b\u0430-\u043c \u0434\u043e \u0448\u043a\u043e\u043b\u044b \u0431\u0435\u0437 \u043f\u043e\u043b\u044c\u0441\u043a\u043e\u0433\u043e, \u0431\u043e \u0437\u043c\u0435 \u043c\u0430\u043b\u0438 \u0441\u0443\u0441\u0456\u0434\u0456\u0432 \u041f\u043e\u043b\u044f\u043a\u0456\u0432.<\/strong><\/td><td>\u2014<\/td><\/tr><tr><td colspan=\"2\">Transliteracja<\/td><td>Jak rozdiljame jaz\u0177k\u0177, to mala-m kontakt z pol \u201esk\u0177m, to ne b\u0177lo tak, \u017ee pi\u0161la-m do \u0161kol\u0177 bez pol\u201d skoho, bo zme maly susidiv Poljakiv.<\/td><td>\u2014<\/td><\/tr><tr><td colspan=\"2\"><strong>T\u0142umaczenie referencyjne wykonane przez dwuj\u0119zycznego t\u0142umacza<\/strong><\/td><td><strong>When it comes to separating languages, I had contact with Polish. It wasn&#8217;t like I started school without knowing Polish because we had Polish neighbors. <\/strong><\/td><td>BLEU 100<br\/>chrF2 100<br\/>TER 0<strong><\/strong><\/td><\/tr><tr><td colspan=\"2\">T\u0142umaczenie z \u0142emkowskiego przez system na LemkoTran.com<\/td><td>When we separate languages, I had contact with Polish, it wasn&#8217;t like I went to school without Polish, because we had Polish neighbors.<\/td><td>BLEU 45,84<br\/>chrF2 69,60<br\/>TER 32,00<\/td><\/tr><tr><td rowspan=\"4\">T\u0142umacz Google (kontrola)<\/td><td>z ukrai\u0144skiego (autowykrycie, 92% pewno\u015bci)<\/td><td>As we divide the languages, then I had contact with Polish, then it was not like that, and I went to school without Polish, because I had Poles as neighbors.<\/td><td>BLEU 15,87<br\/>chrF2 54,38<br\/>TER 72,00<\/td><\/tr><tr><td>z bia\u0142oruskiego<\/td><td>As we separate the languages, then I had little contact with Polish, then it was not like that, but I went to school without Polish, because we had few Polish neighbors.<\/td><td>BLEU 11,.76<br\/>chrF2 58,92<br\/>TER 68,00<\/td><\/tr><tr><td>z rosyjskiego<\/td><td>As we spread languages, then there was little contact with Polish, then it wasn\u2019t like that, but I went to school without Polish, for the snakes were sucid in Polyakiv.<\/td><td>BLEU 6,87<br\/>chrF2 42,66<br\/>TER 92,00<\/td><\/tr><tr><td>z j\u0119zyka polskiego<\/td><td>As I spread the language, I have little contact with the Polish language, it wasn&#8217;t like that I went to school without Polish, because I will change my little Polish language.<\/td><td>BLEU 5,02<br\/>chrF2 45,35<br\/>TER 84,00<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\"><strong>Tabela 6.<\/strong>  Por\u00f3wnania hipotez t\u0142umaczeniowych dla wej\u015bcia \u0142emkowskiego.<\/figcaption><\/figure>\n\n<h2 class=\"wp-block-heading\" id=\"h-5-conclusion\">5 Wnioski<\/h2>\n\n<p class=\"wp-block-paragraph\">Po\u0142\u0105czenie morfologicznie i syntaktycznie poinformowanych generator\u00f3w z silnikami neuronowymi mo\u017ce poprawi\u0107 jako\u015b\u0107 t\u0142umaczenia maszynowego o co najmniej jedn\u0105 trzeci\u0105, maj\u0105c jednocze\u015bnie dodatkow\u0105 korzy\u015b\u0107 w postaci umo\u017cliwienia in\u017cynierom usuwania zapo\u017cycze\u0144 i przeciwdzia\u0142ania innej interferencji j\u0119zyka dominuj\u0105cego, a tak\u017ce zapewnienia zgodno\u015bci ze standardami, takimi jak kodyfikacje j\u0119zyk\u00f3w mniejszo\u015bciowych. Szklane sufity wynik\u00f3w jako\u015bci narzucone przez niedoskona\u0142o\u015bci nieod\u0142\u0105czne od modeli sztucznej inteligencji mog\u0105 r\u00f3wnie\u017c zosta\u0107 rozbite poprzez solidn\u0105 in\u017cynieri\u0119. Dla j\u0119zyka \u0142emkowskiego, jak r\u00f3wnie\u017c dla podobnych j\u0119zyk\u00f3w mniejszo\u015bciowych rdzennych o niskich zasobach, niebo jest teraz granic\u0105 dla jako\u015bci t\u0142umaczenia, a tak\u017ce dla rewolucji rewitalizacyjnych tu\u017c za horyzontem.  <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-acknowledgements\">Podzi\u0119kowania<\/h4>\n\n<p class=\"wp-block-paragraph\">Chcia\u0142bym podzi\u0119kowa\u0107 dr Mingowi Qianowi z Charles River Analytics za inspiracj\u0119 do przeprowadzenia tego eksperymentu, Michaelowi Decerbo z Raytheon BBN Technologies oraz dr. Jamesowi Joshui Penningtonowi za ich wnikliwe uwagi, a tak\u017ce dr. Yvesowi Scherrerowi z Uniwersytetu Helsi\u0144skiego za zainteresowanie projektem i zg\u0142oszone pomys\u0142y.<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-references\">Referencje<\/h3>\n\n<ol class=\"wp-block-list\">\n<li>Bromham, L., Dinnage, R., Skirg\u00e5rd, H., Ritchie, A., Cardillo, M., Meakins, F., Greenhill, S., Hua, X.: Globalne predyktory zagro\u017cenia j\u0119zykowego i przysz\u0142o\u015b\u0107 r\u00f3\u017cnorodno\u015bci j\u0119zykowej. Nature Ecology &amp; Evolution 6, 163\u2013173 (2022). <a href=\"https:\/\/doi.org\/10.1038\/s41559-021-01604-y\" rel=\"nofollow\">https:\/\/doi.org\/10.1038\/s41559-021-01604-y<\/a><\/li>\n\n\n\n<li>Gonzalez, M., Aronson, B., Kellar, S., Walls, M., Greenfield, B.: Language as a Facilitator of Cultural Connection. ab-Original 1(2), 176-194 (2017). <a href=\"https:\/\/doi.org\/10.5325\/aboriginal.1.2.0176\" rel=\"nofollow\">https:\/\/doi.org\/10.5325\/aboriginal.1.2.0176<\/a><\/li>\n\n\n\n<li>Oster, R., Grier, A., Lightning, R., Mayan, M., Toth, E.: Cultural continuity, traditional Indigenous language, and diabetes in Alberta First Nations: a mixed methods study. International Journal for Equity in Health 13, 92 (2014). <a href=\"https:\/\/doi.org\/10.1186\/s12939-014-0092-4\" rel=\"nofollow\">https:\/\/doi.org\/10.1186\/s12939-014-0092-4<\/a><\/li>\n\n\n\n<li>Culture, Heritage and Leisure: Speaking Aboriginal and Torres Strait Islander Languages. W: 4725.0 &#8211; Aboriginal and Torres Strait Islander Wellbeing: A focus on children and youth. Australian Bureau of Statistics (2011). <a href=\"https:\/\/www.abs.gov.au\/ausstats\/abs@.nsf\/Latestproducts\/1E6BE19175C1F8C3CA257A0600229ADC\" rel=\"nofollow\">https:\/\/www.abs.gov.au\/ausstats\/abs@.nsf\/Latestproducts\/1E6BE19175C1F8C3CA257A0600229ADC<\/a>  <\/li>\n\n\n\n<li>Hallett, D., Chandler, M., Lalonde, C.: Aboriginal language knowledge and youth suicide. Cognitive Development 22(3), 392\u2013399 (2007). <a href=\"https:\/\/doi.org\/10.1016\/j.cogdev.2007.02.001\">https:\/\/doi.org\/10.1016\/j.cogdev.2007.02.001<\/a><\/li>\n\n\n\n<li>Whalen, D., Lewis, M., Gillson, S., McBeath, B., Alexander, B., Nyhan, K.: Health effects of Indigenous language use and revitalization: a realist review. International Journal for Equity in Health 21, 169 (2022). <a href=\"https:\/\/doi.org\/10.1186\/s12939-022-01782-6\" rel=\"nofollow\">https:\/\/doi.org\/10.1186\/s12939-022-01782-6<\/a><\/li>\n\n\n\n<li>Skrodzka, M., Hansen, K., Olko, J., Bilewicz, M.: The Twofold Role of a Minority Language in Historical Trauma: The Case of Lemko Minority in Poland. Journal of Language and Social Psychology. 39(4) 551\u2013566 (2020). <a href=\"https:\/\/doi.org\/10.1177\/0261927X20932629\" rel=\"nofollow\">https:\/\/doi.org\/10.1177\/0261927X20932629<\/a><\/li>\n\n\n\n<li>Zhang, S., Frey, B., Bansal, M.: ChrEn: Cherokee-English Machine Translation for Endangered Language Revitalization. W: Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), s. 577\u2013595. Association for Computational Linguistics, Online (2020). <a href=\"http:\/\/dx.doi.org\/10.18653\/v1\/2020.emnlp-main.43\" rel=\"nofollow\">http:\/\/dx.doi.org\/10.18653\/v1\/2020.emnlp-main.43<\/a><\/li>\n\n\n\n<li>Du\u0107-Fajfer, O.: <em>Literatura a proces rozwoju i rewitalizacja to\u017csamo\u015bci j\u0119zykowej na przyk\u0142adzie literatury \u0142emkowskiej<\/em> (w j\u0119zyku polskim). W: Olko, J., Wicherkiewicz, T., Borges, R. (red.) Integral Strategies for Language Revitalization, 1. wyd., s. 175\u2013200. Faculty of &#8222;Artes Liberales\u201e, University of Warsaw, Warszawa (2016). <a href=\"https:\/\/culturalcontinuity.al.uw.edu.pl\/resource\/integral-strategies-for-language-revitalization\/\" rel=\"nofollow\">https:\/\/culturalcontinuity.al.uw.edu.pl\/resource\/integral-strategies-for-language-revitalization\/<\/a><\/li>\n\n\n\n<li>Shevelov, G.: A Historical Phonology of the Ukrainian Language. T\u0142um. S. Wakulenko, A. Danylenko, red. L. Uszkalow. Naukowe wydawnyctwo \u201eAKTA\u201d, Charkiw 2002 (wyd. oryg. 1979). <a href=\"http:\/\/irbis-nbuv.gov.ua\/ulib\/item\/UKR0001641\" rel=\"nofollow\">http:\/\/irbis-nbuv.gov.ua\/ulib\/item\/UKR0001641<\/a><\/li>\n\n\n\n<li>Rieger, J.: <em>Stanovysko i zri\u017enycjuvanja &#8222;rusynsk\u0177x\u201e dialektiv v Karpatax<\/em> (w j\u0119zyku rusi\u0144skim). W: Magosci, P. (red.) <em>Najnowsze dzieje j\u0119zyk\u00f3w s\u0142owia\u0144skich.<\/em> <em>Rusyn\u02b9sk\u0177j jaz\u0177k<\/em>, s. 39\u201366. 2. wyd. Uniwersytet Opolski \u2014 Instytut Filologii Polskiej, Opole (2007).    <a href=\"https:\/\/www.unipo.sk\/cjknm\/hlavne-sekcie\/urjk\/vedecko-vyskumna-cinnost\/publikacie\/26405\/\" rel=\"nofollow\">https:\/\/www.unipo.sk\/cjknm\/hlavne-sekcie\/urjk\/vedecko-vyskumna-cinnost\/publikacie\/26405\/<\/a><\/li>\n\n\n\n<li>Va\u0148ko, J.: <em>Klasifikacija i holovn\u0177 znak\u0177 Karpat\u02b9sk\u0177x Rusyn\u02b9sk\u0177x dialektiv<\/em> (w j\u0119zyku rusi\u0144skim). W: Magosci, P. (red.) <em>Najnowsze dzieje j\u0119zyk\u00f3w s\u0142owia\u0144skich.<\/em> <em>Rusyn\u02b9sk\u0177j jaz\u0177k<\/em>, s. 67\u201384. 2. wyd. Uniwersytet Opolski \u2014 Instytut Filologii Polskiej, Opole (2007).    <a href=\"https:\/\/www.unipo.sk\/cjknm\/hlavne-sekcie\/urjk\/vedecko-vyskumna-cinnost\/publikacie\/26405\/\" rel=\"nofollow\">https:\/\/www.unipo.sk\/cjknm\/hlavne-sekcie\/urjk\/vedecko-vyskumna-cinnost\/publikacie\/26405\/<\/a><\/li>\n\n\n\n<li>Va\u0148ko, J.: The Rusyn language in Slovakia: between a rock and a hard place. W: Duch\u00eane, A. (red.) International Journal of the Sociology of Language, t. 2007, nr 183, s. 75\u201396. Walter de Gruyter GmbH, Berlin (2007). <a href=\"https:\/\/doi.org\/10.1515\/IJSL.2007.005\" rel=\"nofollow\">https:\/\/doi.org\/10.1515\/IJSL.2007.005<\/a><\/li>\n\n\n\n<li>Sopolyha, M.: <em>Do pytan\u02b9 etni\u010dno\u00ef identyfikaci\u00ef ta su\u010dasnyx etni\u010dnyx procesiv ukra\u00efnciv Prja\u0161iv\u0161\u010dyny<\/em> (w j\u0119zyku ukrai\u0144skim). W: Skrypnyk, H. (red.) <em>Ukra\u00efnci-rusyny: etnol\u02b9inhvisty\u010dni ta etnokul\u02b9turni procesy v istory\u010dnomu rozvytku<\/em>, s. 454\u2013487. National Academy of Sciences of Ukraine, National Association of Ukrainian Studies, Rylsky Institute of Art Studies, Folklore and Ethnology, Kij\u00f3w (2013).   <a href=\"http:\/\/irbis-nbuv.gov.ua\/ulib\/item\/UKR0001502\" rel=\"nofollow\">http:\/\/irbis-nbuv.gov.ua\/ulib\/item\/UKR0001502<\/a><\/li>\n\n\n\n<li>Orynycz, P.: Powiedz to dobrze: AI Neural Machine Translation Empowers New Speakers to Revitalize Lemko. W: Degen, H., Ntoa, S. (red.) Artificial Intelligence in HCI. HCII 2022. Lecture Notes in Computer Science, vol 13336, pp. 567\u2013580. Springer, Cham (2022). <a href=\"https:\/\/doi.org\/10.1007\/978-3-031-05643-7_37\" rel=\"nofollow\">https:\/\/doi.org\/10.1007\/978-3-031-05643-7_37<\/a><\/li>\n\n\n\n<li>Orynycz, P., Dobry, T., Jackson, A., Litzenberg, K.: Yes I Speak\u2026 AI neural machine translation in multi-lingual training. W: Proceedings of the Interservice\/Industry Training, Simulation, and Education Conference (I\/ITSEC) 2021, Paper no. 21176. National Training and Simulation Association, Orlando (2021). <a href=\"https:\/\/www.xcdsystem.com\/iitsec\/proceedings\/index.cfm?Year=2021&amp;AbID=96953&amp;CID=862\" rel=\"nofollow\">https:\/\/www.xcdsystem.com\/iitsec\/proceedings\/index.cfm?Year=2021&amp;AbID=96953&amp;CID=862<\/a><\/li>\n\n\n\n<li>Scherrer, Y., Rabus, A.: Neural morphosyntactic tagging for Rusyn. W: Mitkov, R., Tait, J., Boguraev, B. (red.) Natural Language Engineering, t. 25, nr 5, s. 633\u2013650. Cambridge University Press, Cambridge (2019). <a href=\"https:\/\/doi.org\/10.1017\/S1351324919000287\" rel=\"nofollow\">https:\/\/doi.org\/10.1017\/S1351324919000287<\/a><\/li>\n\n\n\n<li>Horoszczak, J.: <em>S\u0142ownik \u0142emkowsko-polski, polsko-\u0142emkowski<\/em>. Rutenika, Warsaw (2004). <\/li>\n\n\n\n<li>Pyrtej, P.: <em>Korotkyj slovnyk lemkivs\u02b9kyx hovirok<\/em> (po ukrai\u0144sku). Siversiya MV, Ivano-Frankivsk (2004). <\/li>\n\n\n\n<li>Duda, I.: <em>Lemkivs\u02b9kyj slovnyk<\/em> (in Ukrainian). Aston, Ternopil (2011). <\/li>\n\n\n\n<li>Rieger, J.: <em>S\u0142ownictwo i nazewnictwo \u0142emkowskie<\/em> (in Polish). Wydawnictwo naukowe Semper, Warsaw (1995). <\/li>\n\n\n\n<li>Fonta\u0144ski, H., Chomiak, M.: <em>Gramatyka j\u0119zyka \u0142emkowskiego<\/em> (in Polish). Wydawnictwo Naukowe \u201e\u015al\u0105sk\u201d, Katowice (2000). <\/li>\n\n\n\n<li>Pyrtej, P.: <em>Dialekt \u0142emkowski. Fonetyka i morfologia<\/em>. Hojsak, W. (ed.). Zjednoczenie \u0141emk\u00f3w, Gorlice (2013).  <\/li>\n\n\n\n<li>Post, M.: A Call for Clarity in Reporting BLEU Scores. W: Proceedings of the Third Conference on Machine Translation (WMT), t. 1, s. 186\u2013191. Association for Computational Linguistics, Bruksela (2018). <a href=\"https:\/\/doi.org\/10.48550\/arXiv.1804.08771\" rel=\"nofollow\">https:\/\/doi.org\/10.48550\/arXiv.1804.08771<\/a><\/li>\n\n\n\n<li>Papineni, K., Roukos, S., Ward, T., Wei-Jing, Z.: BLEU: a Method for Automatic Evaluation of Machine Translation. W: Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL 02), s. 311\u2013318. Association for Computational Linguistics, Filadelfia (2002). <a href=\"https:\/\/doi.org\/10.3115\/1073083.1073135\" rel=\"nofollow\">https:\/\/doi.org\/10.3115\/1073083.1073135<\/a><\/li>\n\n\n\n<li>Snover, M., Dorr, B., Schwartz, R., Micciulla, L., Makhoul, J.: A Study of Translation Edit Rate with Targeted Human Annotation. W: Proceedings of the 7th Conference of the Association for Machine Translation in the Americas: Technical Papers, s. 223\u2013231. Association for Machine Translation in the Americas, Cambridge (2006). <a href=\"https:\/\/aclanthology.org\/2006.amta-papers.25\" rel=\"nofollow\">https:\/\/aclanthology.org\/2006.amta-papers.25<\/a><\/li>\n\n\n\n<li>Popovi\u0107, M.: chrF: character <em>n<\/em>-gram F-score for automatic MT evaluation. W: Proceedings of the Tenth Workshop on Statistical Machine Translation, s. 392\u2013395. Association for Computational Linguistics, Lizbona (2015).   <a href=\"http:\/\/dx.doi.org\/10.18653\/v1\/W15-3049\" rel=\"nofollow\">http:\/\/dx.doi.org\/10.18653\/v1\/W15-3049<\/a><\/li>\n<\/ol>\n","protected":false},"excerpt":{"rendered":"<p>Przyspieszaj\u0105ca globalna utrata j\u0119zyk\u00f3w, zwi\u0105zana z podwy\u017cszonym wska\u017anikiem u\u017cywania nielegalnych substancji, cukrzycy typu 2, upijania si\u0119 i napa\u015bci, a tak\u017ce sze\u015bciokrotnie wy\u017cszym wska\u017anikiem samob\u00f3jstw w\u015br\u00f3d m\u0142odzie\u017cy, stanowi rosn\u0105ce wyzwanie dla spo\u0142eczno\u015bci mniejszo\u015bciowych, rdzennych, uchod\u017aczych, skolonizowanych i imigranckich. W \u015brodowiskach, w kt\u00f3rych transmisja mi\u0119dzypokoleniowa jest cz\u0119sto zak\u0142\u00f3cana, systemy neuronowego t\u0142umaczenia maszynowego oparte na sztucznej inteligencji mog\u0105 potencjalnie o\u017cywi\u0107 j\u0119zyki dziedzictwa i wzmocni\u0107 pozycj\u0119 nowych u\u017cytkownik\u00f3w, umo\u017cliwiaj\u0105c im rozumienie innych i bycie rozumianymi dzi\u0119ki natychmiastowemu t\u0142umaczeniu. Jednak rozwi\u0105zania oparte na sztucznej inteligencji stwarzaj\u0105 tak\u017ce problemy, takie jak wyg\u00f3rowane koszty i w\u0105tpliwa jako\u015b\u0107 wynik\u00f3w. Rozwi\u0105zaniem jest po\u0142\u0105czenie silnik\u00f3w neuronowych z klasycznymi, opartymi na regu\u0142ach systemami, kt\u00f3re umo\u017cliwiaj\u0105 in\u017cynierom usuwanie zapo\u017cycze\u0144 i neutralizowanie zak\u0142\u00f3ce\u0144 ze strony j\u0119zyk\u00f3w dominuj\u0105cych. Niniejsza praca opisuje przebudow\u0119 silnika wdro\u017conego w serwisie LemkoTran.com w celu umo\u017cliwienia t\u0142umaczenia z i na j\u0119zyk \u0142emkowski, powa\u017cnie zagro\u017cony j\u0119zyk mniejszo\u015bciowy o ukrai\u0144skiej klasyfikowalno\u015bci genetycznej, u\u017cywany na pograniczu Polski i S\u0142owacji (gdzie bywa r\u00f3wnie\u017c okre\u015blany jako rusi\u0144ski). Modu\u0142y t\u0142umaczeniowe oparte na s\u0142ownikach zosta\u0142y wyposa\u017cone w morfologiczne i sk\u0142adniowe generatory rzeczownik\u00f3w, czasownik\u00f3w i przymiotnik\u00f3w zasilane 877 lematami oraz 708 has\u0142ami glosariusza, a ca\u0142y system zosta\u0142 poddany 9 518 automatycznym testom kontroli jako\u015bci odwo\u0142uj\u0105cym si\u0119 do kodyfikacji j\u0119zykowej. Owocem tej pracy jest 23-procentowa poprawa jako\u015bci t\u0142umaczenia na j\u0119zyk angielski od czasu ostatniej publikacji oraz 35-procentowy wzrost jako\u015bci t\u0142umaczenia z j\u0119zyka angielskiego na \u0142emkowski, co pozwala uzyska\u0107 t\u0142umaczenia przewy\u017cszaj\u0105ce ka\u017cd\u0105 us\u0142ug\u0119 T\u0142umacza Google pod ka\u017cdym wzgl\u0119dem i daj\u0105ce wynik o 396% wy\u017cszy ni\u017c ukrai\u0144ska wersja T\u0142umacza Google podczas t\u0142umaczenia na \u0142emkowski.<\/p>\n","protected":false},"author":2,"featured_media":10495,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[165],"tags":[166,167,168],"class_list":["post-9697","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-prace","tag-lemko","tag-neuronowe-tlumaczenie-maszynowe","tag-rewitalizacja-jezykowa"],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v27.3 (Yoast SEO v27.6) - https:\/\/yoast.com\/product\/yoast-seo-premium-wordpress\/ -->\n<title>BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI<\/title>\n<meta name=\"description\" content=\"Jak zbudowa\u0142em \u0142emkowski translator neuronowy, kt\u00f3ry osi\u0105ga wyniki o 396% lepsze ni\u017c ukrai\u0144ska us\u0142uga Google \u2013 pe\u0142ny tekst + PDF\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/\" \/>\n<meta property=\"og:locale\" content=\"pl_PL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI\" \/>\n<meta property=\"og:description\" content=\"Jak zbudowa\u0142em \u0142emkowski translator neuronowy 396% lepszy ni\u017c Google\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/\" \/>\n<meta property=\"og:site_name\" content=\"Petro Orynycz\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/orynycz\" \/>\n<meta property=\"article:author\" content=\"https:\/\/www.facebook.com\/orynycz\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-09T01:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2025-12-10T07:07:34+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2023-bleu-fi-pl-v03.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1200\" \/>\n\t<meta property=\"og:image:height\" content=\"628\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Admin\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:title\" content=\"BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI wzrasta\" \/>\n<meta name=\"twitter:description\" content=\"Jak zbudowa\u0142em \u0142emkowski translator neuronowy, kt\u00f3ry osi\u0105ga wyniki o 396% lepsze ni\u017c Google\" \/>\n<meta name=\"twitter:creator\" content=\"@OrynyczP\" \/>\n<meta name=\"twitter:label1\" content=\"Napisane przez\" \/>\n\t<meta name=\"twitter:data1\" content=\"Admin\" \/>\n\t<meta name=\"twitter:label2\" content=\"Szacowany czas czytania\" \/>\n\t<meta name=\"twitter:data2\" content=\"21 minut\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"ScholarlyArticle\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/\"},\"author\":{\"name\":\"Admin\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/person\\\/81acf6b0d8344b8d8832f55a0e4a9f63\"},\"headline\":\"BLEUkitne niebo dla rewitalizacji j\u0119zyk\u00f3w zagro\u017conych: Dok\u0142adno\u015b\u0107 t\u0142umaczenia neuronowej sztucznej inteligencji dla j\u0119zyka \u0142emkowskiego i ukrai\u0144skiego osi\u0105ga nowe wy\u017cyny (2023)\",\"datePublished\":\"2023-07-09T01:00:00+00:00\",\"dateModified\":\"2025-12-10T07:07:34+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/\"},\"wordCount\":4617,\"commentCount\":0,\"publisher\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/2023-bleu-fi-pl-v03.jpg\",\"keywords\":[\"\u0142emkowski\",\"neuronowe t\u0142umaczenie maszynowe (NMT)\",\"rewitalizacja j\u0119zykowa\"],\"articleSection\":[\"Recenzowane artyku\u0142y naukowe\"],\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/#respond\"]}],\"copyrightYear\":\"2023\",\"copyrightHolder\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\"},\"accessibilityFeature\":[\"tableOfContents\"]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/\",\"name\":\"BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/2023-bleu-fi-pl-v03.jpg\",\"datePublished\":\"2023-07-09T01:00:00+00:00\",\"dateModified\":\"2025-12-10T07:07:34+00:00\",\"description\":\"Jak zbudowa\u0142em \u0142emkowski translator neuronowy, kt\u00f3ry osi\u0105ga wyniki o 396% lepsze ni\u017c ukrai\u0144ska us\u0142uga Google \u2013 pe\u0142ny tekst + PDF\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/#breadcrumb\"},\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/#primaryimage\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/2023-bleu-fi-pl-v03.jpg\",\"contentUrl\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/2023-bleu-fi-pl-v03.jpg\",\"width\":1200,\"height\":628,\"caption\":\"BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI wzrasta (Orynycz, 2023).\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/2023-bleukitne-niebo-lemko-translator-neuronowy\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Strona g\u0142\u00f3wna\",\"item\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Nauka\",\"item\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/moc\\\/nauka\\\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Recenzowane artyku\u0142y naukowe\",\"item\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/moc\\\/nauka\\\/prace\\\/\"},{\"@type\":\"ListItem\",\"position\":4,\"name\":\"BLEUkitne niebo (2023)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#website\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/\",\"name\":\"Orynycz.com\",\"description\":\"Naukowiec. In\u017cynier AI. Lingwista.\",\"publisher\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\"},\"alternateName\":\"\u041e\u0440\u0438\u043d\u0438\u0447.com\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pl-PL\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\",\"name\":\"orynycz.com\",\"alternateName\":\"\u041e\u0440\u0438\u043d\u0438\u0447.com\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/logo-1.jpg\",\"contentUrl\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/logo-1.jpg\",\"width\":512,\"height\":512,\"caption\":\"orynycz.com\"},\"image\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/orynycz\"],\"publishingPrinciples\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"ownershipFundingInfo\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"actionableFeedbackPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"correctionsPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"ethicsPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"diversityPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"diversityStaffingReport\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/person\\\/81acf6b0d8344b8d8832f55a0e4a9f63\",\"name\":\"Admin\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p\",\"caption\":\"Admin\"},\"description\":\"I am a scientist (ORCID iD 0000-0003-3094-9156), software engineer, computational linguist, localization and natural language engineer, Slavist, and Silicon Valley consultant. His research currently focuses on artificial intelligence (AI), neural machine translation (NMT), and hybrid systems to revitalize endangered, indigenous languages like Lemko. He received his degree in Russian at the Institute of East Slavic Philology of Jagiellonian University in Cracow, Poland, where he worked for Google amid its 2016 neural machine translation artificial intelligence breakthrough. His engines were recently mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25, Issue 5, page 634). Mr. Orynycz also has two decades of transatlantic experience as a linguist specializing in Russian, Polish, Ukrainian, Rusyn and Lemko for top language service providers, national defense, heavy industry, Raytheon, Amazon, Siemens, Mercedes-Benz, Daimler, investigators, philanthropists, and scientists.\",\"sameAs\":[\"https:\\\/\\\/www.orynycz.com\",\"https:\\\/\\\/www.facebook.com\\\/orynycz\",\"https:\\\/\\\/www.linkedin.com\\\/in\\\/orynycz\\\/\",\"https:\\\/\\\/x.com\\\/OrynyczP\",\"https:\\\/\\\/www.youtube.com\\\/channel\\\/UCOBzL010xr3XfzJcEZbaZyQ\"],\"gender\":\"male\",\"award\":[\"Engines mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25\",\"Issue 5\",\"page 634)\"],\"knowsAbout\":[\"Natural Language Processing\",\"Machine Translation\"],\"knowsLanguage\":[\"Ukrainian\",\"Lemko\",\"English\",\"Polish\",\"Russian\",\"Hungarian\"],\"jobTitle\":\"scientist\",\"worksFor\":\"Orynycz.com\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI","description":"Jak zbudowa\u0142em \u0142emkowski translator neuronowy, kt\u00f3ry osi\u0105ga wyniki o 396% lepsze ni\u017c ukrai\u0144ska us\u0142uga Google \u2013 pe\u0142ny tekst + PDF","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/","og_locale":"pl_PL","og_type":"article","og_title":"BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI","og_description":"Jak zbudowa\u0142em \u0142emkowski translator neuronowy 396% lepszy ni\u017c Google","og_url":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/","og_site_name":"Petro Orynycz","article_publisher":"https:\/\/www.facebook.com\/orynycz","article_author":"https:\/\/www.facebook.com\/orynycz","article_published_time":"2023-07-09T01:00:00+00:00","article_modified_time":"2025-12-10T07:07:34+00:00","og_image":[{"width":1200,"height":628,"url":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2023-bleu-fi-pl-v03.jpg","type":"image\/jpeg"}],"author":"Admin","twitter_card":"summary_large_image","twitter_title":"BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI wzrasta","twitter_description":"Jak zbudowa\u0142em \u0142emkowski translator neuronowy, kt\u00f3ry osi\u0105ga wyniki o 396% lepsze ni\u017c Google","twitter_creator":"@OrynyczP","twitter_misc":{"Napisane przez":"Admin","Szacowany czas czytania":"21 minut"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"ScholarlyArticle","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/#article","isPartOf":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/"},"author":{"name":"Admin","@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/person\/81acf6b0d8344b8d8832f55a0e4a9f63"},"headline":"BLEUkitne niebo dla rewitalizacji j\u0119zyk\u00f3w zagro\u017conych: Dok\u0142adno\u015b\u0107 t\u0142umaczenia neuronowej sztucznej inteligencji dla j\u0119zyka \u0142emkowskiego i ukrai\u0144skiego osi\u0105ga nowe wy\u017cyny (2023)","datePublished":"2023-07-09T01:00:00+00:00","dateModified":"2025-12-10T07:07:34+00:00","mainEntityOfPage":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/"},"wordCount":4617,"commentCount":0,"publisher":{"@id":"https:\/\/www.orynycz.com\/#organization"},"image":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/#primaryimage"},"thumbnailUrl":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2023-bleu-fi-pl-v03.jpg","keywords":["\u0142emkowski","neuronowe t\u0142umaczenie maszynowe (NMT)","rewitalizacja j\u0119zykowa"],"articleSection":["Recenzowane artyku\u0142y naukowe"],"inLanguage":"pl-PL","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/#respond"]}],"copyrightYear":"2023","copyrightHolder":{"@id":"https:\/\/www.orynycz.com\/#organization"},"accessibilityFeature":["tableOfContents"]},{"@type":"WebPage","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/","url":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/","name":"BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI","isPartOf":{"@id":"https:\/\/www.orynycz.com\/pl\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/#primaryimage"},"image":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/#primaryimage"},"thumbnailUrl":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2023-bleu-fi-pl-v03.jpg","datePublished":"2023-07-09T01:00:00+00:00","dateModified":"2025-12-10T07:07:34+00:00","description":"Jak zbudowa\u0142em \u0142emkowski translator neuronowy, kt\u00f3ry osi\u0105ga wyniki o 396% lepsze ni\u017c ukrai\u0144ska us\u0142uga Google \u2013 pe\u0142ny tekst + PDF","breadcrumb":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/#breadcrumb"},"inLanguage":"pl-PL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/"]}]},{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/#primaryimage","url":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2023-bleu-fi-pl-v03.jpg","contentUrl":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/2023-bleu-fi-pl-v03.jpg","width":1200,"height":628,"caption":"BLEUkitne niebo: Dok\u0142adno\u015b\u0107 \u0142emkowskiego t\u0142umaczenia AI wzrasta (Orynycz, 2023)."},{"@type":"BreadcrumbList","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/2023-bleukitne-niebo-lemko-translator-neuronowy\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Strona g\u0142\u00f3wna","item":"https:\/\/www.orynycz.com\/pl\/"},{"@type":"ListItem","position":2,"name":"Nauka","item":"https:\/\/www.orynycz.com\/pl\/moc\/nauka\/"},{"@type":"ListItem","position":3,"name":"Recenzowane artyku\u0142y naukowe","item":"https:\/\/www.orynycz.com\/pl\/moc\/nauka\/prace\/"},{"@type":"ListItem","position":4,"name":"BLEUkitne niebo (2023)"}]},{"@type":"WebSite","@id":"https:\/\/www.orynycz.com\/pl\/#website","url":"https:\/\/www.orynycz.com\/pl\/","name":"Orynycz.com","description":"Naukowiec. In\u017cynier AI. Lingwista.","publisher":{"@id":"https:\/\/www.orynycz.com\/#organization"},"alternateName":"\u041e\u0440\u0438\u043d\u0438\u0447.com","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.orynycz.com\/pl\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pl-PL"},{"@type":"Organization","@id":"https:\/\/www.orynycz.com\/#organization","name":"orynycz.com","alternateName":"\u041e\u0440\u0438\u043d\u0438\u0447.com","url":"https:\/\/www.orynycz.com\/pl\/","logo":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/logo\/image\/","url":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/logo-1.jpg","contentUrl":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/logo-1.jpg","width":512,"height":512,"caption":"orynycz.com"},"image":{"@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/orynycz"],"publishingPrinciples":"https:\/\/www.orynycz.com\/pl\/polityka\/","ownershipFundingInfo":"https:\/\/www.orynycz.com\/pl\/polityka\/","actionableFeedbackPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","correctionsPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","ethicsPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","diversityPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","diversityStaffingReport":"https:\/\/www.orynycz.com\/pl\/polityka\/"},{"@type":"Person","@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/person\/81acf6b0d8344b8d8832f55a0e4a9f63","name":"Admin","image":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/secure.gravatar.com\/avatar\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p","url":"https:\/\/secure.gravatar.com\/avatar\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p","caption":"Admin"},"description":"I am a scientist (ORCID iD 0000-0003-3094-9156), software engineer, computational linguist, localization and natural language engineer, Slavist, and Silicon Valley consultant. His research currently focuses on artificial intelligence (AI), neural machine translation (NMT), and hybrid systems to revitalize endangered, indigenous languages like Lemko. He received his degree in Russian at the Institute of East Slavic Philology of Jagiellonian University in Cracow, Poland, where he worked for Google amid its 2016 neural machine translation artificial intelligence breakthrough. His engines were recently mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25, Issue 5, page 634). Mr. Orynycz also has two decades of transatlantic experience as a linguist specializing in Russian, Polish, Ukrainian, Rusyn and Lemko for top language service providers, national defense, heavy industry, Raytheon, Amazon, Siemens, Mercedes-Benz, Daimler, investigators, philanthropists, and scientists.","sameAs":["https:\/\/www.orynycz.com","https:\/\/www.facebook.com\/orynycz","https:\/\/www.linkedin.com\/in\/orynycz\/","https:\/\/x.com\/OrynyczP","https:\/\/www.youtube.com\/channel\/UCOBzL010xr3XfzJcEZbaZyQ"],"gender":"male","award":["Engines mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25","Issue 5","page 634)"],"knowsAbout":["Natural Language Processing","Machine Translation"],"knowsLanguage":["Ukrainian","Lemko","English","Polish","Russian","Hungarian"],"jobTitle":"scientist","worksFor":"Orynycz.com"}]}},"_links":{"self":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts\/9697","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/comments?post=9697"}],"version-history":[{"count":21,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts\/9697\/revisions"}],"predecessor-version":[{"id":10541,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts\/9697\/revisions\/10541"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/media\/10495"}],"wp:attachment":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/media?parent=9697"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/categories?post=9697"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/tags?post=9697"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}