{"id":10670,"date":"2021-12-07T12:00:00","date_gmt":"2021-12-07T12:00:00","guid":{"rendered":"https:\/\/www.orynycz.com\/kultura\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/"},"modified":"2025-12-13T18:04:38","modified_gmt":"2025-12-13T18:04:38","slug":"tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021","status":"publish","type":"post","link":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/","title":{"rendered":"Tak, m\u00f3wi\u0119&#8230; T\u0142umaczenie maszynowe AI w szkoleniu wieloj\u0119zycznym (2021)"},"content":{"rendered":"    <section class=\"petro-citation\" aria-labelledby=\"petro-citation-heading-2021-yes\">\n        <h3 id=\"petro-citation-heading-2021-yes\">\n            Prosz\u0119 cytowa\u0107:        <\/h3>\n\n        <p class=\"petro-citation__text\">\n            <cite id=\"petro-cite-2021-yes\" class=\"p-name\">\n                Orynycz, P., Dobry, T., Jackson, A., &amp; Litzenberg, K. (2021). Yes I Speak\u2026 AI neural machine translation in multi-lingual training. W: Proceedings of the Interservice\/Industry Training, Simulation, and Education Conference (I\/ITSEC). https:\/\/www.xcdsystem.com\/iitsec\/proceedings\/index.cfm?Year=2021&amp;AbID=96953&amp;CID=862            <\/cite>\n\n                            <span class=\"petro-citation__micro h-cite\" aria-hidden=\"true\">\n                                            <span class=\"p-author\">Orynycz, P.; Dobry, T.; Jackson, A.; Litzenberg, K.<\/span>\n                                                                <time class=\"dt-published\" datetime=\"2021\">\n                            2021                        <\/time>\n                                                                <span class=\"p-name\">Yes I Speak\u2026 AI neural machine translation in multi-lingual training<\/span>\n                                                                <a class=\"u-url\" href=\"https:\/\/www.xcdsystem.com\/iitsec\/proceedings\/index.cfm?Year=2021&#038;AbID=96953&#038;CID=862\"><\/a>\n                                    <\/span>\n                    <\/p>\n\n        <div class=\"petro-citation__actions\">\n            <button\n                type=\"button\"\n                class=\"petro-copy-btn\"\n                data-copy-target=\"#petro-cite-2021-yes\"\n                data-copied-text=\"Skopiowano!\">\n                Skopiuj cytowanie            <\/button>\n\n                            <button\n                    type=\"button\"\n                    class=\"petro-copy-btn petro-copy-btn--bibtex\"\n                    data-copy-target=\"#petro-bibtex-2021-yes\"\n                    data-copied-text=\"Skopiowano!\">\n                    Skopiuj BibTeX                <\/button>\n\n                <pre id=\"petro-bibtex-2021-yes\" class=\"petro-bibtex\" aria-hidden=\"true\">@inproceedings{orynycz2021yes,\n  author    = {Petro Orynycz and T. Dobry and A. Jackson and K. Litzenberg},\n  title     = {Yes I Speak\u2026 AI neural machine translation in multi-lingual training},\n  booktitle = {Proceedings of the Interservice\/Industry Training, Simulation, and Education Conference (I\/ITSEC)},\n  year      = {2021},\n  url       = {https:\/\/www.xcdsystem.com\/iitsec\/proceedings\/index.cfm?Year=2021&amp;AbID=96953&amp;CID=862}\n}<\/pre>\n                    <\/div>\n\n                <script type=\"application\/ld+json\">\n{\n    \"@context\": \"https:\/\/schema.org\",\n    \"@type\": \"ScholarlyArticle\",\n    \"name\": \"Yes I Speak\u2026 AI neural machine translation in multi-lingual training\",\n    \"headline\": \"Yes I Speak\u2026 AI neural machine translation in multi-lingual training\",\n    \"author\": [\n        {\n            \"@type\": \"Person\",\n            \"name\": \"Petro Orynycz\",\n            \"alternateName\": \"\u041f\u0435\u0442\u0440\u043e \u041e\u0440\u0438\u043d\u0438\u0447\"\n        },\n        {\n            \"@type\": \"Person\",\n            \"name\": \"T. Dobry\"\n        },\n        {\n            \"@type\": \"Person\",\n            \"name\": \"A. Jackson\"\n        },\n        {\n            \"@type\": \"Person\",\n            \"name\": \"K. Litzenberg\"\n        }\n    ],\n    \"datePublished\": \"2021\",\n    \"inLanguage\": \"en\",\n    \"url\": \"https:\/\/www.xcdsystem.com\/iitsec\/proceedings\/index.cfm?Year=2021&AbID=96953&CID=862\",\n    \"isPartOf\": {\n        \"@type\": \"PublicationVolume\",\n        \"name\": \"Proceedings of the Interservice\/Industry Training, Simulation, and Education Conference (I\/ITSEC)\"\n    }\n}        <\/script>\n            <\/section>\n    \n\n<p class=\"alert is-style-text-annotation has-text-color has-background has-link-color wp-elements-886dfdf2bffb50b3626b7d7a56c6a411 is-style-text-annotation--1\" style=\"color:#0f5132;background-color:#d1e7dd\">\u2705 Ta wersja artyku\u0142u zosta\u0142a przyj\u0119ta do publikacji po recenzji, ale nie jest Wersj\u0105 Ostateczn\u0105 i nie odzwierciedla ulepsze\u0144 po akceptacji ani \u017cadnych poprawek. Wersja Ostateczna jest dost\u0119pna online <u>pod <a href=\"https:\/\/www.xcdsystem.com\/iitsec\/proceedings\/index.cfm?Year=2021&amp;AbID=96953&amp;CID=862\" rel=\"nofollow\">tym linkiem<\/a><\/u>. Korzystanie z tej Zaakceptowanej Wersji podlega warunkom u\u017cytkowania Zaakceptowanego Manuskryptu <u><a href=\"https:\/\/www.iitsec.org\/get-involved\/authors\" rel=\"nofollow\">wydawcy<\/a><\/u>.  <\/p>\n\n<div class=\"wp-block-file\"><a id=\"wp-block-file--media-ae46704c-4258-4daa-acf2-05b712a19593\" href=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2021\/12\/Orynycz_2021_yes-i-speak.pdf\">Orynycz_2021_tak-m\u00f3wi\u0119<\/a><a href=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2021\/12\/Orynycz_2021_yes-i-speak.pdf\" class=\"wp-block-file__button wp-element-button\" download=\"\" aria-describedby=\"wp-block-file--media-ae46704c-4258-4daa-acf2-05b712a19593\">Pobierz<\/a><\/div>\n\n<h2 class=\"wp-block-heading\" id=\"h-abstract\">Streszczenie<\/h2>\n\n<p>Szybko wsp\u00f3\u0142dzielone i wsp\u00f3lnie wykorzystywane szkolenia mi\u0119dzy partnerami koalicyjnymi musz\u0105 by\u0107 dostosowane j\u0119zykowo i kulturowo (czyli <em>zlokalizowane<\/em>) do j\u0119zyk\u00f3w sojusznik\u00f3w spoza angloj\u0119zycznego \u015bwiata, reprezentuj\u0105cych podmioty pierwszej linii o ograniczonej lub potencjalnie \u017cadnej znajomo\u015bci j\u0119zyka angielskiego. Tradycyjnie lokalizacja by\u0142a procesem czasoch\u0142onnym i pracoch\u0142onnym, gdzie ekspert potrzebowa\u0142 ponad dw\u00f3ch miesi\u0119cy na przet\u0142umaczenie ksi\u0105\u017cki \u015bredniej wielko\u015bci. Tymczasem \u0107wiczenia szkoleniowe musz\u0105 odpowiada\u0107 na ca\u0142kowite terminy rozwoju licz\u0105ce dni i tygodnie, a nie miesi\u0105ce i lata, aby reagowa\u0107 na zmieniaj\u0105ce si\u0119 realia \u015bwiata operacyjnego. W tym kontek\u015bcie tradycyjna lokalizacja staje si\u0119 g\u0142\u00f3wnym w\u0105skim gard\u0142em dla przedsi\u0119wzi\u0119\u0107 koalicyjnych. W szybko rozwijaj\u0105cych si\u0119 sytuacjach sojusznicy po prostu nie mog\u0105 czeka\u0107 miesi\u0105cami i latami na szkolenie potrzebne dzi\u015b wieczorem lub na przysz\u0142otygodniow\u0105 misj\u0119 w j\u0119zykach \u0142atwo zrozumia\u0142ych na pierwszej linii &#8211; czyli na realizacj\u0119 d\u0142ugo oczekiwanego marzenia o lokalnie dostosowanym szkoleniu odpowiadaj\u0105cym potrzebom w terenie.    <\/p>\n\n<p>Wkracza tu nowa technologia sztucznej inteligencji w postaci <em>t\u0142umaczenia maszynowego opartego na sieciach neuronowych<\/em>, kt\u00f3ra mo\u017ce wykona\u0107 w kilka minut to, co do\u015bwiadczonym lingwistom zajmuje godzin\u0119, czyni\u0105c wykonalnym wieloj\u0119zyczne wdro\u017cenie w skali koalicji w ci\u0105gu dni i tygodni, z uwzgl\u0119dnieniem stale rosn\u0105cej z\u0142o\u017cono\u015bci. Jest to mo\u017cliwe dzi\u0119ki uczeniu maszynowemu, czyli trenowaniu sztucznych rekurencyjnych sieci neuronowych do t\u0142umaczenia z jednego j\u0119zyka naturalnego na drugi. <\/p>\n\n<p>Zbudowali\u015bmy silniki oparte na sztucznej inteligencji, zmierzyli\u015bmy czas t\u0142umaczenia materia\u0142\u00f3w szkoleniowych NATO i zmierzyli\u015bmy ich dok\u0142adno\u015b\u0107 za pomoc\u0105 metryki BLEU. Nasz silnik t\u0142umaczy\u0142 z rosyjskiego 1.169,51% szybciej i 58,37% dok\u0142adniej ni\u017c nasz profesjonalny lingwista u\u017cyty jako kontrola. Nasz polski silnik neuronowy by\u0142 o 17,29% dok\u0142adniejszy i o 488,45% szybszy ni\u017c cz\u0142owiek. Nasze silniki t\u0142umacz\u0105ce na j\u0119zyk \u0142emkowski s\u0105 pierwszymi na \u015bwiecie i uzyska\u0142y przyzwoity wynik BLEU 14,57. Tymczasem wykonali\u015bmy powy\u017csze na niedrogim laptopie w odizolowanym, kontrolowanym \u015brodowisku odci\u0119tym od \u015bwiata zewn\u0119trznego.    <\/p>\n\n<div data-wp-interactive=\"core\/file\" class=\"wp-block-file\"><object data-wp-bind--hidden=\"!state.hasPdfPreview\" hidden class=\"wp-block-file__embed\" data=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2021\/12\/Orynycz_2021_yes-i-speak.pdf\" type=\"application\/pdf\" style=\"width:100%;height:442px\" aria-label=\"Osadzone z Orynycz_2021_yes-i-speak.\"><\/object><a id=\"wp-block-file--media-26b96727-5605-42d8-a93e-0718c7d7136a\" href=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2021\/12\/Orynycz_2021_yes-i-speak.pdf\">Orynycz_2021_tak-m\u00f3wi\u0119<\/a><a href=\"https:\/\/www.orynycz.com\/wp-content\/uploads\/2021\/12\/Orynycz_2021_yes-i-speak.pdf\" class=\"wp-block-file__button wp-element-button\" download=\"\" aria-describedby=\"wp-block-file--media-26b96727-5605-42d8-a93e-0718c7d7136a\">Pobierz<\/a><\/div>\n\n<ul class=\"mpdl-file-links-list\">\n      <li class=\"mpdl-file-links-item\">\n      <a  href=\"https:\/\/www.orynycz.com\/pl\/mp-files\/byteclub.zip\/\" class=\"mpdl-file-archive\">byteclub.zip<\/a>\n          <\/li>\n  <\/ul>\n\n<div class=\"wp-block-yoast-seo-table-of-contents yoast-table-of-contents\"><h2>Spis tre\u015bci<\/h2><ul><li><a href=\"#h-abstract\" data-level=\"2\">Streszczenie<\/a><\/li><li><a href=\"#h-introduction\" data-level=\"2\">Wprowadzenie<\/a><ul><li><a href=\"#h-the-problem\" data-level=\"3\">Problem<\/a><\/li><li><a href=\"#h-solutions-so-far\" data-level=\"3\">Dotychczasowe rozwi\u0105zania<\/a><\/li><li><a href=\"#h-the-wider-system\" data-level=\"3\">Szerszy system<\/a><\/li><\/ul><\/li><li><a href=\"#h-hypotheses-and-predictions\" data-level=\"2\">Hipotezy i przewidywania<\/a><ul><li><a href=\"#h-translation-speed\" data-level=\"3\">Szybko\u015b\u0107 t\u0142umaczenia<\/a><\/li><li><a href=\"#h-translation-accuracy\" data-level=\"3\">Dok\u0142adno\u015b\u0107 t\u0142umaczenia<\/a><\/li><li><a href=\"#h-translation-security\" data-level=\"3\">Bezpiecze\u0144stwo t\u0142umaczenia<\/a><\/li><li><a href=\"#h-hybrid-rule-dictionary-based-and-neural-lemko-english-engine\" data-level=\"3\">Hybrydowy silnik \u0142emkowsko-angielski oparty na regu\u0142ach\/s\u0142owniku i sieciach neuronowych<\/a><\/li><li><a href=\"#h-introduction-to-methods-and-justification\" data-level=\"3\">Wprowadzenie do metod i uzasadnienie<\/a><\/li><li><a href=\"#h-principal-results-in-brief\" data-level=\"3\">G\u0142\u00f3wne wyniki w skr\u00f3cie<\/a><\/li><\/ul><\/li><li><a href=\"#h-materials-and-methods\" data-level=\"2\">Materia\u0142y i metody<\/a><ul><li><a href=\"#h-introduction-0\" data-level=\"3\">Wprowadzenie<\/a><\/li><li><a href=\"#h-lab-set-up\" data-level=\"3\">Konfiguracja laboratorium<\/a><\/li><\/ul><\/li><li><a href=\"#h-results\" data-level=\"2\">Wyniki<\/a><ul><li><a href=\"#h-translation-speed-the-higher-resource-the-language-pair-the-faster-the-engine\" data-level=\"3\">Pr\u0119dko\u015b\u0107 t\u0142umaczenia: im wy\u017cszy zas\u00f3b pary j\u0119zykowej, tym szybszy silnik<\/a><\/li><li><a href=\"#h-translation-accuracy-the-higher-resource-the-language-pair-the-more-accurate-the-engine\" data-level=\"3\">Dok\u0142adno\u015b\u0107 t\u0142umaczenia: im wy\u017cszy zas\u00f3b pary j\u0119zykowej, tym dok\u0142adniejszy silnik<\/a><\/li><li><a href=\"#h-translation-security-0\" data-level=\"3\">Bezpiecze\u0144stwo t\u0142umaczenia<\/a><\/li><li><a href=\"#h-rule-based-machine-translation-between-lemko-and-polish\" data-level=\"3\">T\u0142umaczenie maszynowe oparte na regu\u0142ach mi\u0119dzy j\u0119zykiem \u0142emkowskim a polskim<\/a><\/li><\/ul><\/li><li><a href=\"#h-discussion\" data-level=\"2\">Dyskusja<\/a><ul><li><a href=\"#h-a-new-era\" data-level=\"3\">Nowa era<\/a><\/li><li><a href=\"#h-speed\" data-level=\"3\">Pr\u0119dko\u015b\u0107<\/a><\/li><li><a href=\"#h-accuracy\" data-level=\"3\">Dok\u0142adno\u015b\u0107<\/a><\/li><li><a href=\"#h-next-steps\" data-level=\"3\">Nast\u0119pne kroki<\/a><\/li><li><a href=\"#h-in-closing\" data-level=\"3\">Podsumowanie<\/a><\/li><\/ul><\/li><li><a href=\"#h-footnotes\" data-level=\"2\">Przypisy<\/a><\/li><li><a href=\"#h-acknowledgements\" data-level=\"2\">Podzi\u0119kowania<\/a><\/li><li><a href=\"#h-references\" data-level=\"2\">Referencje<\/a><\/li><\/ul><\/div>\n\n<h2 class=\"wp-block-heading is-style-default\" id=\"h-introduction\" style=\"text-transform:uppercase\">Wprowadzenie<\/h2>\n\n<h3 class=\"wp-block-heading\" id=\"h-the-problem\">Problem<\/h3>\n\n<p>Us\u0142ugi t\u0142umaczeniowe online dzia\u0142aj\u0105 do momentu, gdy trzeba t\u0142umaczy\u0107 w tajemnicy lub z j\u0119zyka nienale\u017c\u0105cego do g\u00f3rnych 2% pod wzgl\u0119dem zasob\u00f3w. Korzystanie nawet z najbezpieczniejszych us\u0142ug t\u0142umaczeniowych online lub w chmurze oznacza dzielenie si\u0119 informacjami z osob\u0105 trzeci\u0105, co narusza wi\u0119kszo\u015b\u0107 komercyjnych um\u00f3w o zachowaniu poufno\u015bci, nie wspominaj\u0105c o wymogach przemys\u0142u obronnego. Ponadto, wiod\u0105ca platforma t\u0142umaczeniowa online obs\u0142uguje tylko 109 j\u0119zyk\u00f3w (Google, 2021), co stanowi mniej ni\u017c 2% z 7.139 j\u0119zyk\u00f3w u\u017cywanych dzi\u015b na \u015bwiecie (Eberhard, Simons, &amp; Fennig, 2021). W obliczu nieod\u0142\u0105cznego ryzyka zwi\u0105zanego z zewn\u0119trznymi dostawcami us\u0142ug w chmurze, wielu zwraca si\u0119 do zweryfikowanych lingwist\u00f3w, kt\u00f3rzy w najlepszym razie mog\u0105 przet\u0142umaczy\u0107 ksi\u0105\u017ck\u0119 miesi\u0119cznie, a w najgorszym stanowi\u0105 do\u017cywotnie zagro\u017cenie nieuprawnionego ujawnienia. Aby da\u0107 wieloj\u0119zycznym przedsi\u0119biorstwom i organizacjom wi\u0119cej opcji, postanowili\u015bmy rozwi\u0105za\u0107 problem wykorzystania sztucznej inteligencji do szybkiego, dok\u0142adnego i dyskretnego t\u0142umaczenia materia\u0142\u00f3w z j\u0119zyk\u00f3w o wysokich, \u015brednich i niskich zasobach na odizolowanych, niedrogich laptopach \u015bredniej klasy od\u0142\u0105czonych od internetu i \u015bwiata zewn\u0119trznego.    <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-solutions-so-far\">Dotychczasowe rozwi\u0105zania<\/h3>\n\n<p>Podczas gdy podstawy t\u0142umaczenia maszynowego zosta\u0142y po\u0142o\u017cone w Bagdadzie al-Kind\u012bego ponad tysi\u0105c lat temu (DuPont, 2018; zobacz tak\u017ce al-Kind\u012b, 2002), prawie ca\u0142y spektakularny, widoczny post\u0119p mia\u0142 miejsce w Dolinie Krzemowej w ci\u0105gu ostatnich pi\u0119ciu lat. G\u0142\u00f3wny prze\u0142om nast\u0105pi\u0142 w Google (Lewis-Kraus, 2016), a Facebook do\u0142\u0105czy\u0142 teraz do klubu t\u0142umaczenia maszynowego opartego na sieciach neuronowych (Ott, et al., 2019). Opierali\u015bmy si\u0119 na pracy ich silnika <em>FAIRseq<\/em>, dla kt\u00f3rego S\u0142awomir Dadas udost\u0119pni\u0142 doskona\u0142y model polsko-angielski (Dadas, 2019). Bazuj\u0105c na pracy Pana Dadasa, stworzyli\u015bmy hybrydowe silniki neuronowe\/oparte na regu\u0142ach\/s\u0142ownikowe, kt\u00f3re t\u0142umacz\u0105 z j\u0119zyka \u0142emkowskiego na angielski i odwrotnie. Pomys\u0142 zastosowania <em>transfer learningu<\/em> do przetwarzania j\u0119zyka naturalnego (NLP) dla j\u0119zyka rusi\u0144skiego by\u0142 omawiany z naszymi szanownymi kolegami Yvesem Scherrerem i Achimem Rabusem, kt\u00f3rzy jako pierwsi opublikowali wyniki w recenzowanym czasopi\u015bmie i uprzejmie wykorzystali okazj\u0119, aby wspomnie\u0107 o hybrydowym neuronowo-regu\u0142owym silniku t\u0142umaczenia maszynowego j\u0119zyka \u0142emkowskiego Petra Orynycza (Scherrer &amp; Rabus, Neural morphosyntactic tagging for Rusyn, 2019, p. 634), kt\u00f3ry jest operacyjny i dost\u0119pny bezp\u0142atnie do u\u017cytku publicznego pod adresem <a href=\"https:\/\/www.lemkotran.com\/\">www.lemkotran.com<\/a> od marca 2019 roku, a jego modu\u0142 transliteracji NLP zosta\u0142 udost\u0119pniony do u\u017cytku publicznego we wrze\u015bniu 2017 roku.    <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-the-wider-system\">Szerszy system<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-high-medium-and-low-resource-languages\"><strong>J\u0119zyki o wysokich, \u015brednich i niskich zasobach<\/strong><\/h4>\n\n<p>Pary j\u0119zykowe s\u0105 klasyfikowane w literaturze naukowej jako <em>wysokozasobowe<\/em>, <em>\u015bredniozasobowe<\/em> i <em>niskozasobowe<\/em>, w zale\u017cno\u015bci od ilo\u015bci dost\u0119pnych technologii i zbior\u00f3w danych w stosunku do ich mi\u0119dzynarodowego znaczenia (Cieri, Maxwell, Strassel, &amp; Tracey, 2016, p. 4545). Pary wysokozasobowe obejmuj\u0105 czesko-angielsk\u0105 (Kocmi, 2020, p. 171), rosyjsko-angielsk\u0105, niemiecko-angielsk\u0105 (Ng, et al., 2019, p. 314) i chi\u0144sko-angielsk\u0105 (Kocmi &amp; Bojar, 2019, pp. 234\u2013235). Polsko-angielska jest par\u0105 \u015bredniozasobow\u0105 (J\u00f3nsson, S\u00edmonarson, Sn\u00e6bjarnarson, Steingr\u00edmsson, &amp; Loftsson, 2020, p. 2). Pary niskozasobowe obejmuj\u0105 gud\u017caracko-angielsk\u0105, kazachsko-angielsk\u0105 (Kocmi &amp; Bojar, p. 234), inuktitut-angielsk\u0105 (Kocmi, p. 171) i \u0142emkowsko-angielsk\u0105 (Scherrer &amp; Rabus, 2019, p. 85). Poniewa\u017c trenowanie modeli j\u0119zykowych sztucznej inteligencji wymaga ogromnych ilo\u015bci danych dwuj\u0119zycznych, j\u0119zyki o wy\u017cszych zasobach generalnie ciesz\u0105 si\u0119 dost\u0119pno\u015bci\u0105 silnik\u00f3w t\u0142umaczenia neuronowego. Tymczasem, ze wzgl\u0119du na brak danych treningowych do uczenia maszynowego, silniki neuronowe s\u0105 rzadsze dla j\u0119zyk\u00f3w o ni\u017cszych zasobach, kt\u00f3re cz\u0119sto s\u0105 lepiej obs\u0142ugiwane przez silniki <em>t\u0142umaczenia statystycznego<\/em> (SMT) poprzedniej generacji.     <\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-high-resource-language-under-experiment-russian\"><strong>J\u0119zyk wysokozasobowy w eksperymencie: rosyjski<\/strong><\/h5>\n\n<p>Rosyjski jest u\u017cywany jako pierwszy j\u0119zyk przez ponad 168 milion\u00f3w os\u00f3b, a jako dodatkowy j\u0119zyk przez kolejne 114 milion\u00f3w (Maximova, Noyanzina, Omelchenko, &amp; Maximova, 2018, p. 2). Automatyzacja jego t\u0142umaczenia na angielski by\u0142a \u015bwi\u0119tym Graalem powojennych wysi\u0142k\u00f3w w dziedzinie t\u0142umaczenia maszynowego. Jako jeden z oficjalnych j\u0119zyk\u00f3w Organizacji Narod\u00f3w Zjednoczonych, ogromne ilo\u015bci dwuj\u0119zycznego tekstu rosyjsko-angielskiego s\u0105 dost\u0119pne na liberalnej licencji (Ziemski, Junczys-Dowmunt, &amp; Pouliquen, 2016, p. 3530).  <\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-medium-resource-language-under-experiment-polish\"><strong>J\u0119zyk \u015bredniozasobowy w eksperymencie: polski<\/strong><\/h5>\n\n<p>Polski jest j\u0119zykiem zachodnios\u0142owia\u0144skim u\u017cywanym przez oko\u0142o 38 milion\u00f3w os\u00f3b w dzisiejszej Polsce, liczba ta ma spa\u015b\u0107 cz\u0119\u015bciowo z powodu trwaj\u0105cej w momencie publikacji pandemii (Associated Press, 2021). Kolejne 10 milion\u00f3w m\u00f3wi po polsku w pewnym stopniu poza granicami kraju (Jassem, 2003, p. 103). Jako jeden z oficjalnych j\u0119zyk\u00f3w Unii Europejskiej, du\u017ce ilo\u015bci dwuj\u0119zycznego tekstu s\u0105 dost\u0119pne do trenowania modeli t\u0142umaczenia sztucznej inteligencji, w tym 22.630 dokument\u00f3w Parlamentu Europejskiego (Hajlaoui, Kolovratnik, Vaeyrynen, Steinberger, &amp; Varga, 2014, p. 3165).  <\/p>\n\n<h5 class=\"wp-block-heading\" id=\"h-low-resource-language-under-experiment-lemko\"><strong>J\u0119zyk niskozasobowy w eksperymencie: \u0142emkowski<\/strong><\/h5>\n\n<p>\u0141emkowski jest j\u0119zykiem niskozasobowym (Scherrer &amp; Rabus, 2019, p. 85), kt\u00f3ry spe\u0142nia tradycyjne kryteria klasyfikacji jako wschodnios\u0142owia\u0144ski. Na przyk\u0142ad, \u0142emkowski wykazuje wschodnios\u0142owia\u0144sk\u0105 pleofonie, to znaczy, wynik pras\u0142owia\u0144skich sekwencji &#8222;<em>ToRT<\/em>\u201e to <em>ToRoT<\/em> (Fortson IV, 2004, pp. 371-372), jak w \u0142emkowskim <em>horodyty<\/em> 'grodzi\u0107, ogrodzi\u0107&#8217; (Horoszczak, 2004, p. 45), jak r\u00f3wnie\u017c w standardowym ukrai\u0144skim <em>horodyty<\/em>, rusi\u0144skim <em>horodyty<\/em> i rosyjskim <em>gorodit&#8217;<\/em> (Ker\u010da, 2007, p. 176). Tymczasem por\u00f3wnaj polski (j\u0119zyk zachodnios\u0142owia\u0144ski) z <em>-ro-<\/em> w <em>grodzi\u0107<\/em>, ale chorwacki (j\u0119zyk po\u0142udniowos\u0142owia\u0144ski) z <em>-ra-<\/em> w <em>graditi<\/em>, 'budowa\u0107&#8217;.   Dalej, jest angielski z <em>-ar-<\/em> w <em>yard<\/em> i <em>garden<\/em>, awestyjski (staro\u017cytny ira\u0144ski) z <em>-\u01ddr\u01dd-<\/em> w <em>g\u01ddr\u01dd\u03b4\u014d<\/em> 'jaskinia&#8217;, i sanskryt (staro\u017cytny indyjski) z <em>-\u1e5b-<\/em> w <em>g\u1e5bh\u00e1s<\/em> 'dom&#8217; (Vasmer, p. 1443).<\/p>\n\n<p>Podczas gdy dok\u0142adna klasyfikacja j\u0119zyka \u0142emkowskiego i jego status wzgl\u0119dem standardowego ukrai\u0144skiego i skodyfikowanego rusi\u0144skiego jest przedmiotem kontrowersji (Rabus &amp; Scherrer, 2017), tak wysokie wyniki naszego silnika \u0142emkowsko-angielskiego bez odwo\u0142ywania si\u0119 do zasob\u00f3w standardowego ukrai\u0144skiego lub rusi\u0144skiego skodyfikowanego na S\u0142owacji mog\u0142yby wspiera\u0107 wniosek Watrala (2015), \u017ce \u0142emkowski jest pe\u0142noprawnym j\u0119zykiem samym w sobie, a nie dialektem jakiegokolwiek innego j\u0119zyka. Zach\u0119ceni rosn\u0105cymi obiektywnymi wynikami jako\u015bci, zdecydowali\u015bmy si\u0119 priorytetowo potraktowa\u0107 transfer learning z j\u0119zyka polskiego ze wzgl\u0119du na jego bezpo\u015bredni zwrot z inwestycji w zakresie dok\u0142adno\u015bci t\u0142umaczenia \u0142emkowskiego, naszej najwy\u017cszej warto\u015bci. Mo\u017cliwe, \u017ce wyniki jako\u015bciowe zosta\u0142y podwy\u017cszone przez interferencj\u0119 z obserwowanego j\u0119zyka hybrydowego, w kt\u00f3rym \u0142emkowskie ko\u0144c\u00f3wki gramatyczne s\u0105 retrofitowane do standardowych polskich s\u0142\u00f3w (Watral, 2016, p. 242).  <\/p>\n\n<p>Wed\u0142ug spisu ludno\u015bci w Polsce w 2011 roku odnotowano 6279 os\u00f3b m\u00f3wi\u0105cych w domu po \u0142emkowsku, w por\u00f3wnaniu z 5605 w 2002 roku <em>(Departament Wyzna\u0144 Religijnych oraz Mniejszo\u015bci Narodowych i Etnicznych<\/em>, 2013, str. 7), przy czym w momencie publikacji trwa\u0142 nowy spis. Okre\u015blenie, ilu spo\u015br\u00f3d 24 539 mieszka\u0144c\u00f3w Polski, kt\u00f3rzy w 2011 roku deklarowali u\u017cywanie j\u0119zyka ukrai\u0144skiego w domu, lub 626 m\u00f3wi\u0105cych &#8222;po rusku\u201e (<em>j\u0119zyk ruski<\/em>) z innymi cz\u0142onkami gospodarstwa domowego <em>(Departament Wyzna\u0144 Religijnych oraz Mniejszo\u015bci Narodowych i Etnicznych<\/em>, 2013, str. 7) mog\u0142o by\u0107 u\u017cytkownikami j\u0119zyka \u0142emkowskiego, wykracza poza zakres niniejszego opracowania. Pa\u0144stwowa S\u0142u\u017cba Statystyki Ukrainy odnotowa\u0142a 672 \u0141emk\u00f3w w granicach kraju (<em>Der\u017eavna slu\u017eba statystyky Ukra\u00efny<\/em>, 2001). W skali zagro\u017cenia j\u0119zyk\u00f3w ONZ od 0 do 5, gdzie 0 oznacza wymar\u0142y, a 5 &#8222;bezpieczny\u201e (UNESCO Ad Hoc Expert Group on Endangered Languages, 2003, str. 7-8), j\u0119zyk \u0142emkowski zbli\u017ca si\u0119 do poziomu 2, czyli jest <g id=\"gid_4\">powa\u017cnie zagro\u017cony<\/g>: naturalna mi\u0119dzypokoleniowa transmisja j\u0119zyka jest coraz rzadsza, a m\u0142odszych u\u017cytkownik\u00f3w jest coraz mniej (Du\u0107-Fajfer, 2016, str. 178). Pojawiaj\u0105 si\u0119 jednak oznaki poprawy, dzi\u0119ki coraz cz\u0119stszemu wykorzystywaniu przepis\u00f3w chroni\u0105cych i promuj\u0105cych u\u017cywanie j\u0119zyk\u00f3w mniejszo\u015bciowych w edukacji, mediach, publikacjach, oznakowaniu dr\u00f3g i nauce (Du\u0107-Fajfer, 2016, str. 178-179).    <\/p>\n\n<p>Sytuacja zasob\u00f3w r\u00f3wnie\u017c si\u0119 poprawia. Petro Orynycz skompilowa\u0142 i wyr\u00f3wna\u0142 dwuj\u0119zyczny korpus \u0142emkowsko-angielski zawieraj\u0105cy 68.599 s\u0142\u00f3w \u017ar\u00f3d\u0142owych wraz z ich t\u0142umaczeniami na angielski (jedyny istniej\u0105cy tekst r\u00f3wnoleg\u0142y, o kt\u00f3rym wiemy). Korpus zosta\u0142 zestawiony przy u\u017cyciu wywiad\u00f3w przeprowadzonych w j\u0119zyku \u0142emkowskim przez Fundacj\u0119 Johna i Helen Timo ze Stan\u00f3w Zjednoczonych, kt\u00f3ra zleci\u0142a Panu Orynyczowi ich transkrypcj\u0119 i t\u0142umaczenie, a tak\u017ce zezwoli\u0142a mu na wykorzystanie tej pracy w jego badaniach naukowych i rozwoju. Gromadzi on r\u00f3wnie\u017c jednoj\u0119zyczny korpus \u0142emkowski licz\u0105cy ponad milion s\u0142\u00f3w. Podczas gdy z\u0142o\u017cone relacje socjolingwistyczne mi\u0119dzy spo\u0142eczno\u015bciami j\u0119zykowymi \u0142emkowsk\u0105, rusi\u0144sk\u0105, standardow\u0105 ukrai\u0144sk\u0105 i s\u0142owack\u0105 wykraczaj\u0105 poza zakres tego artyku\u0142u, to w\u0142a\u015bnie zasoby polskie (konkretnie polskie modele neuronowe) by\u0142y kluczowe dla hybrydowych silnik\u00f3w \u0142emkowskich Pana Orynycza.    <\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-hypotheses-and-predictions\" style=\"text-transform:uppercase\">Hipotezy i przewidywania<\/h2>\n\n<h3 class=\"wp-block-heading\" id=\"h-translation-speed\">Szybko\u015b\u0107 t\u0142umaczenia<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-hypothesis-air-gapped-artificial-intelligence-machine-translation-now-as-fast-as-humans\">Hipoteza: odizolowane t\u0142umaczenie maszynowe oparte na sztucznej inteligencji jest teraz tak szybkie jak ludzkie<\/h4>\n\n<p>Postawili\u015bmy hipotez\u0119, \u017ce silniki t\u0142umaczenia neuronowego dzia\u0142aj\u0105ce offline na laptopach \u015bredniej klasy s\u0105 obecnie por\u00f3wnywalne pod wzgl\u0119dem szybko\u015bci do t\u0142umaczy ludzkich. By\u0142o to oparte na obserwacjach podczas rozwoju silnika, \u017ce t\u0142umaczenie neuronowe maszynowe wydawa\u0142o si\u0119 zajmowa\u0107 od kilku sekund do mniej ni\u017c minuty na przet\u0142umaczenie zdania na laptopie \u015bredniej klasy, co jest por\u00f3wnywalne z ludzkimi pr\u0119dko\u015bciami obserwowanymi przez Petra Orynycza w jego do\u015bwiadczeniu w bran\u017cy lokalizacyjnej. <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-prediction-machine-translation-engines-will-process-more-words-per-hour-than-human-translators\">Przewidywanie: silniki t\u0142umaczenia maszynowego b\u0119d\u0105 przetwarza\u0107 wi\u0119cej s\u0142\u00f3w na godzin\u0119 ni\u017c t\u0142umacze ludzcy<\/h4>\n\n<p>Na podstawie naszej hipotezy, \u017ce odizolowane od sieci silniki t\u0142umaczenia maszynowego dzia\u0142aj\u0105ce offline na laptopach \u015bredniej klasy b\u0119d\u0105 tak szybkie jak ludzie, przewidzieli\u015bmy, \u017ce ich pr\u0119dko\u015b\u0107 przewy\u017cszy pr\u0119dko\u015b\u0107 ludzkich lingwist\u00f3w i b\u0119d\u0105 t\u0142umaczy\u0107 wi\u0119cej s\u0142\u00f3w na sekund\u0119 ni\u017c nasz ludzki podmiot kontrolny.<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-translation-accuracy\">Dok\u0142adno\u015b\u0107 t\u0142umaczenia<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-hypothesis-artificial-intelligence-machine-translation-engines-are-now-almost-as-accurate-as-human-translators\">Hipoteza: silniki t\u0142umaczenia maszynowego oparte na sztucznej inteligencji s\u0105 obecnie niemal tak dok\u0142adne jak t\u0142umacze ludzcy<\/h4>\n\n<p>Postawili\u015bmy hipotez\u0119, \u017ce silniki t\u0142umaczenia maszynowego s\u0105 obecnie niemal tak dok\u0142adne jak t\u0142umacze ludzcy. Opiera\u0142o si\u0119 to na profesjonalnej obserwacji Petra Orynycza jako specjalisty ds. kontroli jako\u015bci t\u0142umacze\u0144, \u017ce komercyjne us\u0142ugi t\u0142umaczenia maszynowego w chmurze nie tylko znacznie si\u0119 poprawi\u0142y, ale cz\u0119sto produkuj\u0105 wyniki nie do odr\u00f3\u017cnienia od tych tworzonych przez ludzkich lingwist\u00f3w. <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-prediction-artificial-intelligence-machine-translation-engines-will-achieve-at-least-75-the-bleu-quality-score-of-professional-human-translators\">Przewidywanie: silniki t\u0142umaczenia maszynowego opartego na sztucznej inteligencji osi\u0105gn\u0105 co najmniej 75% wyniku jako\u015bci BLEU profesjonalnych t\u0142umaczy<\/h4>\n\n<p>Chocia\u017c wiedzieli\u015bmy, \u017ce silniki t\u0142umaczenia maszynowego mog\u0105 by\u0107 lepsze od dwuj\u0119zycznych amator\u00f3w pr\u00f3buj\u0105cych swoich si\u0142 w t\u0142umaczeniu po raz pierwszy, nie wierzyli\u015bmy, \u017ce nasze silniki pokonaj\u0105 do\u015bwiadczonych, profesjonalnych lingwist\u00f3w w bezpo\u015bredniej rywalizacji. Na szcz\u0119\u015bcie, nasze w\u0105tpliwo\u015bci mo\u017cna by\u0142o podda\u0107 testom. Algorytm BLEU (bilingual evaluation understudy) jest dominuj\u0105c\u0105 metryk\u0105 w badaniach nad t\u0142umaczeniem maszynowym, b\u0119d\u0105c niezale\u017cnym od j\u0119zyka, tanim i \u0142atwym w obliczeniach, a tak\u017ce rozs\u0105dnie skorelowanym z ocenami ludzkimi (Post, 2018). Przewidzieli\u015bmy, \u017ce nasze silniki neuronowe uzyskaj\u0105 75% punkt\u00f3w jako\u015bci uzyskanych przez ludzkiego lingwist\u0119. Na przyk\u0142ad, je\u015bli ludzki lingwista uzyska\u0142 40 punkt\u00f3w, t\u0142umaczenie maszynowe uzyska\u0142oby 30. Tymczasem przewidzieli\u015bmy, \u017ce nasz hybrydowy silnik \u0142emkowsko-angielski osi\u0105gnie \u0142\u0105czny wynik BLEU na poziomie 15.     <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-translation-security\">Bezpiecze\u0144stwo t\u0142umaczenia<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-hypothesis-artificial-intelligence-machine-translation-can-be-performed-offline-on-laptops-in-high-security-field-settings\">Hipoteza: t\u0142umaczenie maszynowe oparte na sztucznej inteligencji mo\u017ce by\u0107 wykonywane offline na laptopach w warunkach wysokiego bezpiecze\u0144stwa<\/h4>\n\n<p>Postawili\u015bmy hipotez\u0119, \u017ce t\u0142umaczenie maszynowe mo\u017ce by\u0107 wykonywane offline na odizolowanym, przeno\u015bnym sprz\u0119cie ca\u0142kowicie odci\u0119tym od \u015bwiata zewn\u0119trznego. Opiera\u0142o si\u0119 to na obserwacji, \u017ce wszystkie komponenty naszego rozwi\u0105zania nie wykonywa\u0142y \u017cadnych po\u0142\u0105cze\u0144 z internetem po zainstalowaniu zale\u017cno\u015bci. Domy\u015blnym za\u0142o\u017ceniem jest, \u017ce odizolowane systemy t\u0142umaczeniowe z w\u0142\u0105czonym <em>trybem samolotowym<\/em> nie mog\u0105 by\u0107 zdalnie monitorowane ani zhakowane. Kolejnym za\u0142o\u017ceniem jest to, \u017ce operatorzy nie tylko zostali odpowiednio zweryfikowani, ale podj\u0119li odpowiednie \u015brodki ostro\u017cno\u015bci przeciwko zagro\u017ceniom zewn\u0119trznym i wewn\u0119trznym. Kolejnym domy\u015blnym za\u0142o\u017ceniem jest to, \u017ce \u0142atwiej jest zabezpieczy\u0107 jedn\u0105 mobiln\u0105 stacj\u0119 robocz\u0105 przez kilka godzin ni\u017c zapobiec temu, by ludzcy lingwi\u015bci zarabiaj\u0105cy \u015brednio 25,01 USD na godzin\u0119 (Biuro Statystyki Pracy, Departament Pracy Stan\u00f3w Zjednoczonych, 2021) dokonywali nieautoryzowanych ujawnie\u0144 przez ca\u0142e \u017cycie, szczeg\u00f3lnie w \u015bwietle doniesie\u0144 o aresztowaniach lingwist\u00f3w podejrzanych o ujawnianie tajemnic (Biuro Spraw Publicznych Departamentu Sprawiedliwo\u015bci, 2009, 2018, 2020).    <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-prediction-artificial-intelligence-machine-translation-will-succeed-on-an-air-gapped-lenovo-legion-y730-17ich-laptop-computer-running-offline-in-airplane-mode\">Przewidywanie: t\u0142umaczenie maszynowe oparte na sztucznej inteligencji b\u0119dzie dzia\u0142a\u0107 na odizolowanym laptopie Lenovo Legion Y730-17ICH pracuj\u0105cym offline w trybie samolotowym<\/h4>\n\n<p>Przewidzieli\u015bmy, \u017ce nasz system t\u0142umaczeniowy nie b\u0119dzie dzia\u0142a\u0142 wadliwie i uko\u0144czy swoje zadania gdy b\u0119dzie fizycznie oddzielony i od\u0142\u0105czony od wszystkich sieci lub urz\u0105dze\u0144 poprzez aktywacj\u0119 funkcji trybu samolotowego w systemie Windows 10 Pro na laptopie Lenovo Legion Y730-17ICH (Typ 81HG).<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-hybrid-rule-dictionary-based-and-neural-lemko-english-engine\">Hybrydowy silnik \u0142emkowsko-angielski oparty na regu\u0142ach\/s\u0142owniku i sieciach neuronowych<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-hypothesis-hybrid-dictionary-rule-based-engines-improve-machine-translation-accuracy\">Hipoteza: hybrydowe silniki oparte na s\u0142ownikach\/regu\u0142ach poprawiaj\u0105 dok\u0142adno\u015b\u0107 t\u0142umaczenia maszynowego<\/h4>\n\n<p>Postawili\u015bmy hipotez\u0119, \u017ce nasz silnik t\u0142umaczenia maszynowego oparty na regu\u0142ach (RBMT) polsko-\u0142emkowski, silnik t\u0142umaczenia maszynowego oparty na s\u0142owniku (DBMT) polsko-\u0142emkowski, silnik DBMT \u0142emkowsko-polski uruchomiony w odwrotnym kierunku oraz neuronowy silnik polsko-angielski mog\u0105 by\u0107 synergicznie po\u0142\u0105czone w silnik hybrydowy, kt\u00f3ry osi\u0105ga wy\u017csze wyniki jako\u015bci z ka\u017cd\u0105 dodatkow\u0105 cz\u0119\u015bci\u0105. Hipoteza ta opiera\u0142a si\u0119 na obserwacjach autora pracuj\u0105cego jako profesjonalny t\u0142umacz \u0142emkowsko-angielski, \u017ce odpowiedniki mi\u0119dzy j\u0119zykiem \u0142emkowskim a polskim by\u0142y wystarczaj\u0105co cz\u0119ste, aby uczyni\u0107 silnik hybrydowy realn\u0105 propozycj\u0105. <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-prediction-each-sub-engine-added-to-our-hybrid-lemko-english-engine-will-increase-bleu-by-5-points\">Przewidywanie: ka\u017cdy podsilnik dodany do naszego hybrydowego silnika \u0142emkowsko-angielskiego zwi\u0119kszy BLEU o 5 punkt\u00f3w<\/h4>\n\n<p>Przewidzieli\u015bmy, \u017ce dla ka\u017cdego podsilnika \u0142emkowsko-polskiego opartego na regu\u0142ach lub s\u0142owniku, kt\u00f3ry dodamy do naszego hybrydowego silnika \u0142emkowsko-angielskiego, og\u00f3lny wynik dok\u0142adno\u015bci BLEU wzro\u015bnie o 5 punkt\u00f3w.<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-introduction-to-methods-and-justification\">Wprowadzenie do metod i uzasadnienie<\/h3>\n\n<p>Zestawili\u015bmy cz\u0142owieka z maszyn\u0105, daj\u0105c obu laptop \u015bredniej klasy odizolowany od sieci, uruchamiaj\u0105cy nasz w\u0142asny program wspomaganego komputerowo t\u0142umaczenia (szczeg\u00f3\u0142owo opisany poni\u017cej) w trybie offline z w\u0142\u0105czonym trybem samolotowym Windows. Rejestrowali\u015bmy szybko\u015b\u0107 i dok\u0142adno\u015b\u0107 t\u0142umaczenia z rosyjskiego na angielski (para j\u0119zyk\u00f3w o du\u017cych zasobach), z polskiego na angielski (para o \u015brednich zasobach) i z \u0142emkowskiego na angielski (para o ma\u0142ych zasobach). Do wyra\u017cenia szybko\u015bci u\u017cyli\u015bmy metryki s\u0142\u00f3w na godzin\u0119, poniewa\u017c jest ona podstaw\u0105 dla kierownik\u00f3w projekt\u00f3w lokalizacyjnych, a tak\u017ce jest stosowana w literaturze naukowej (Macken, Prou, &amp; Tezcan, 2020, s. 4). Do pomiaru dok\u0142adno\u015bci u\u017cyli\u015bmy metryki BLEU, poniewa\u017c jest ona najbardziej rozpowszechniona w dziedzinie bada\u0144 i rozwoju (Post, 2018).   <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-principal-results-in-brief\">G\u0142\u00f3wne wyniki w skr\u00f3cie<\/h3>\n\n<p>Nie tylko uda\u0142o nam si\u0119 zastosowa\u0107 prze\u0142omow\u0105 technologi\u0119 neuronowego t\u0142umaczenia maszynowego do wykorzystania sztucznej inteligencji na odizolowanym, offline&#8217;owym laptopie w trybie samolotowym do t\u0142umaczenia j\u0119zyka o bogatych zasobach (rosyjskiego) ponad 10 razy szybciej ni\u017c nasz kontrolny t\u0142umacz-cz\u0142owiek, ale jako\u015b\u0107 t\u0142umaczenia naszej maszyny by\u0142a o ponad 58 procent &#8222;lepsza ni\u017c ludzka\u201e. Co wi\u0119cej, jeste\u015bmy pierwszym zespo\u0142em na \u015bwiecie, kt\u00f3ry opublikowa\u0142 w czasopi\u015bmie naukowym wyniki dotycz\u0105ce silnik\u00f3w t\u0142umaczenia maszynowego dla j\u0119zyka \u0142emkowskiego. <\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-materials-and-methods\" style=\"text-transform:uppercase\">Materia\u0142y i metody<\/h2>\n\n<h3 class=\"wp-block-heading\" id=\"h-introduction-0\">Wprowadzenie<\/h3>\n\n<p>Aby przetestowa\u0107 nasze przewidywania, zbudowali\u015bmy szereg silnik\u00f3w t\u0142umaczeniowych opartych na sztucznej inteligencji i hybrydowych, obliczyli\u015bmy ich szybko\u015b\u0107 i dok\u0142adno\u015b\u0107 na odizolowanym laptopie w trybie samolotowym Windows i zrobili\u015bmy to samo z profesjonalnym lingwist\u0105, aby uczyni\u0107 nasz eksperyment kontrolowanym.<\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-lab-set-up\">Konfiguracja laboratorium<\/h3>\n\n<h4 class=\"wp-block-heading\" id=\"h-hardware\">Sprz\u0119t<\/h4>\n\n<p>U\u017cywali\u015bmy laptopa Lenovo Legion Y730-17ICH (Typ 81HG) z systemem Windows 10 Pro (64-bit). Model zosta\u0142 wycofany ze sprzeda\u017cy i kosztuje oko\u0142o 850 USD w stanie u\u017cywanym w momencie publikacji. <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-operating-system\">System operacyjny<\/h4>\n\n<p>Zwirtualizowanym systemem operacyjnym u\u017cywanym do eksperymentu by\u0142 Linux Subsystem for Windows, a dok\u0142adnie Ubuntu 18.04 LTS zainstalowany przez platform\u0119 dystrybucji cyfrowej <em>Microsoft Store<\/em>.<\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-dependencies\">Zale\u017cno\u015bci<\/h4>\n\n<p>Python 3.8 zosta\u0142 zainstalowany przy u\u017cyciu polecenia <code>sudo apt install python3.8<\/code>.<\/p>\n\n<p>Polecenie sudo <code>python3.8 -m pip install \u2013upgrade<\/code> zosta\u0142o u\u017cyte do zainstalowania g\u0142\u00f3wnych zale\u017cno\u015bci, w tym <code>bleu, fastBPE, hydra-core, python-dev-tools, PyYAML, omegaconf, pip, pytz, nltk, setuptools, sacremoses, subword-nmt, torch, and torchvision<\/code>.<\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-toolkits\">Narz\u0119dzia<\/h4>\n\n<p>Zainstalowali\u015bmy Facebook AI Research Sequence-to-Sequence Toolkit, uruchamiaj\u0105c nast\u0119puj\u0105ce polecenia:<\/p>\n\n<p><code>sudo git clone <a href=\"https:\/\/github.com\/pytorch\/fairseq\">https:\/\/github.com\/pytorch\/fairseq<\/a><br\/>cd fairseq<br\/>sudo python3.8 -m pip install --upgrade --ignore-installed PyYAML --editable .\/<\/code><\/p>\n\n<p>Dokumentacja i wsparcie techniczne s\u0105 dost\u0119pne na <a href=\"https:\/\/github.com\/pytorch\/fairseq\" rel=\"nofollow\"><code>https:\/\/github.com\/pytorch\/fairseq<\/code><\/a><\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-neural-machine-translation-models\">Modele t\u0142umaczenia maszynowego<\/h4>\n\n<p>Dla naszych silnik\u00f3w neuronowych polsko-angielskich i hybrydowych \u0142emkowsko-angielskich u\u017cyli\u015bmy modelu konwolucyjnego polsko-angielskiego S\u0142awomira Dadasa, dost\u0119pnego i udokumentowanego w jego repozytorium Polish Natural Language Processing (NLP) Resources (Dadas, 2019).<\/p>\n\n<p>Model: <a href=\"https:\/\/github.com\/sdadas\/polish-nlp-resources\/releases\/download\/nmt-models-conv\/polish-english-conv.zip\" rel=\"nofollow\"><code>https:\/\/github.com\/sdadas\/polish-nlp-resources\/releases\/download\/nmt-models-conv\/polish-english-conv.zip<\/code><\/a><\/p>\n\n<p>Dokumentacja: <a href=\"https:\/\/github.com\/sdadas\/polish-nlp-resources#machine-translation-models\" rel=\"nofollow\"><code>https:\/\/github.com\/sdadas\/polish-nlp-resources#machine-translation-models<\/code><\/a><\/p>\n\n<p>Dla naszego silnika rosyjsko-angielskiego wykorzystali\u015bmy wst\u0119pnie wytrenowany pojedynczy model transformatora Facebook AI Research Sequence-to-Sequence (FAIRseq) z rosyjskiego na angielski bez dostrajania, kt\u00f3ry zosta\u0142 zg\u0142oszony na Fourth Conference on Machine Translation (WMT19) w 2019 roku.<\/p>\n\n<p>Model: <a href=\"https:\/\/dl.fbaipublicfiles.com\/fairseq\/models\/wmt19.ru-en.ffn8192.tar.gz\" rel=\"nofollow\"><code>https:\/\/dl.fbaipublicfiles.com\/fairseq\/models\/wmt19.ru-en.ffn8192.tar.gz<\/code><\/a><br\/>Dokumentacja: <a href=\"https:\/\/github.com\/pytorch\/fairseq\/tree\/master\/examples\/wmt19\" rel=\"nofollow\"><code>https:\/\/github.com\/pytorch\/fairseq\/tree\/master\/examples\/wmt19<\/code><\/a><\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-electronic-dictionaries\">S\u0142owniki elektroniczne<\/h4>\n\n<p>Nasz profesjonalny lingwista mia\u0142 dost\u0119p offline do elektronicznych wersji <em>New Ko\u015bciuszko Foundation American English to Polish Dictionary<\/em> (12,99 USD), a tak\u017ce <em>Oxford Russian Dictionary<\/em> (19,99 USD). Oba zosta\u0142y zakupione przez Microsoft Store. S\u0142ownik \u0142emkowsko-polski i polsko-\u0142emkowski Jaros\u0142awa Horoszczaka (2004) by\u0142 r\u00f3wnie\u017c dost\u0119pny dla naszego lingwisty do u\u017cytku offline.  <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-experiment-control\">Kontrola eksperymentu<\/h4>\n\n<p>Eksperyment by\u0142 kontrolowany poprzez posadzenie profesjonalnego lingwisty przy odizolowanym laptopie w trybie samolotowym, z wy\u017cej wymienionymi s\u0142ownikami elektronicznymi dost\u0119pnymi na maszynie. Lingwista naciska\u0142 klawisz enter, w tym momencie uruchamia\u0142 si\u0119 timer i wy\u015bwietla\u0142o si\u0119 zdanie \u017ar\u00f3d\u0142owe do przet\u0142umaczenia. Lingwista m\u00f3g\u0142 wpisa\u0107 swoje t\u0142umaczenie w Microsoft Word (aby skorzysta\u0107 z funkcji sprawdzania pisowni i innych pomocy do przetwarzania tekstu), a nast\u0119pnie wklei\u0107 je do naszego w\u0142asnego programu wspomaganego komputerowo t\u0142umaczenia. Po ponownym naci\u015bni\u0119ciu klawisza enter, t\u0142umaczenie ludzkie zosta\u0142o przes\u0142ane i timer zatrzymany. Szybko\u015b\u0107 ludzkiego lingwisty w zakresie s\u0142\u00f3w na godzin\u0119 i dok\u0142adno\u015b\u0107 w zakresie wyniku BLEU by\u0142y obliczane dla ka\u017cdego przet\u0142umaczonego zdania.    <\/p>\n\n<p>Petro Orynycz, kt\u00f3ry ma dwudziestoletnie do\u015bwiadczenie jako lingwista rosyjski i polski, polski dyplom uniwersytecki z j\u0119zyka rosyjskiego i ponad 5-letnie do\u015bwiadczenie jako profesjonalny t\u0142umacz \u0142emkowsko-angielski, s\u0142u\u017cy\u0142 jako podmiot kontrolny. Wykona\u0142 t\u0142umaczenia zwrotne materia\u0142\u00f3w rosyjskich i polskich wymienionych poni\u017cej, a tak\u017ce retranslacje na angielski z \u0142emkowskiego. <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-experiment-material-reference-translations\">Materia\u0142 eksperymentalny: t\u0142umaczenia referencyjne<\/h4>\n\n<p>Tekst rosyjsko-angielski i polsko-angielski do eksperymentu zosta\u0142 pozyskany z materia\u0142\u00f3w edukacyjnych udost\u0119pnionych publicznie i przet\u0142umaczonych z j\u0119zyka angielskiego na rosyjski i polski przez publikacj\u0119 <em>NATO Review<\/em> Organizacji Traktatu P\u00f3\u0142nocnoatlantyckiego (NATO). Cytuj\u0105c: &#8222;Reprodukcja cz\u0119\u015bci, fragment\u00f3w lub artyku\u0142\u00f3w NATO Review jest dozwolona do cel\u00f3w niekomercyjnych, pod warunkiem podania \u017ar\u00f3d\u0142a: NATO Review\u201e. Zgodnie ze standardow\u0105 praktyk\u0105 (Post, 2018), dane korpusu zosta\u0142y oczyszczone i znormalizowane poprzez zamian\u0119 tekstu na ma\u0142e litery i tokenizacj\u0119. Zadbano o to, aby tekst \u017ar\u00f3d\u0142owy i t\u0142umaczenia docelowe by\u0142y wyr\u00f3wnane na poziomie zda\u0144.   <\/p>\n\n<p>Do tego eksperymentu wykorzystali\u015bmy wyk\u0142ad wyg\u0142oszony przez dr. Jamiego Shea, \u00f3wczesnego zast\u0119pc\u0119 sekretarza generalnego NATO ds. nowych wyzwa\u0144 bezpiecze\u0144stwa. Jego tytu\u0142 to <em>What Can We Learn Today from the 'Three Wise Men&#8217;?<\/em> Oryginalny tekst angielski wyk\u0142adu dr. Shea i jego t\u0142umaczenia na rosyjski i polski zlecone przez NATO zosta\u0142y pobrane z nast\u0119puj\u0105cych jednolitych lokalizator\u00f3w zasob\u00f3w: <\/p>\n\n<p>Angielski orygina\u0142: <a href=\"https:\/\/www.nato.int\/docu\/review\/articles\/2016\/12\/05\/what-can-we-learn-today-from-the-three-wise-men\/index.html\" rel=\"nofollow\"><code>https:\/\/www.nato.int\/docu\/review\/articles\/2016\/12\/05\/what-can-we-learn-today-from-the-three-wise-men\/index.html<\/code><\/a><\/p>\n\n<p>T\u0142umaczenie rosyjskie: <a href=\"https:\/\/www.nato.int\/docu\/review\/ru\/articles\/2016\/12\/05\/chemu-my-moyoem-nauchit-sya-segodnya-u-treh-mudretsov\/index.html\" rel=\"nofollow\"><code>https:\/\/www.nato.int\/docu\/review\/ru\/articles\/2016\/12\/05\/chemu-my-moyoem-nauchit-sya-segodnya-u-treh-mudretsov\/index.html<\/code><\/a><\/p>\n\n<p>T\u0142umaczenie polskie: <a href=\"https:\/\/www.nato.int\/docu\/review\/pl\/articles\/2016\/12\/05\/czego-mozemy-nauczyc-sie-dzisiaj-od-trzech-medrcow\/index.html\" rel=\"nofollow\"><code>https:\/\/www.nato.int\/docu\/review\/pl\/articles\/2016\/12\/05\/czego-mozemy-nauczyc-sie-dzisiaj-od-trzech-medrcow\/index.html<\/code><\/a><\/p>\n\n<p>Materia\u0142 \u0142emkowsko-angielski do eksperymentu obejmowa\u0142 wywiady przeprowadzone osobi\u015bcie przez John &amp; Helen Timo Foundation ze Stan\u00f3w Zjednoczonych, kt\u00f3ra zatrudni\u0142a Petra Orynycza do transkrypcji wywiad\u00f3w i przet\u0142umaczenia ich na angielski. Fundacja p\u00f3\u017aniej uprzejmie przekaza\u0142a powsta\u0142e korpusy dwuj\u0119zyczne na rzecz bada\u0144 naukowych i rozwoju. Aby chroni\u0107 prywatno\u015b\u0107 os\u00f3b omawianych w wywiadach i z poszanowaniem og\u00f3lnego rozporz\u0105dzenia o ochronie danych Unii Europejskiej (RODO), materia\u0142y nie zosta\u0142y udost\u0119pnione publicznie. Zachowano ostro\u017cno\u015b\u0107, aby zredagowa\u0107 wszelkie dane umo\u017cliwiaj\u0105ce identyfikacj\u0119 osoby (PII) i informacje o zdrowiu osobistym (PHI) przed udost\u0119pnieniem pr\u00f3bek.   <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-method-for-scoring-translation-accuracy-bleu\">Metoda oceny dok\u0142adno\u015bci t\u0142umaczenia: BLEU<\/h4>\n\n<p>Metryka bilingual understudy evaluation (BLEU) zosta\u0142a u\u017cyta do pomiaru podobie\u0144stwa do t\u0142umaczenia referencyjnego, a tym samym, cho\u0107 niedoskonale, dok\u0142adno\u015bci. Chocia\u017c wynik BLEU nie jest doskona\u0142\u0105 miar\u0105 dok\u0142adno\u015bci lub jako\u015bci, jest najszerzej stosowany w bran\u017cy (Post, 2018). Modu\u0142 Python zosta\u0142 pozyskany z pakietu Python bleu, udokumentowanego pod nast\u0119puj\u0105cym jednolitym lokalizatorem zasob\u00f3w:   <a href=\"https:\/\/pypi.org\/project\/bleu\/\" rel=\"nofollow\"><code>https:\/\/pypi.org\/project\/bleu\/<\/code><\/a><\/p>\n\n<p>Upewnili\u015bmy si\u0119, \u017ce gdy podane s\u0105 referencyjne ci\u0105gi zda\u0144 <code>\u201cit is a white cat .\u201d<\/code> i <code>\u201cwow , this dog is huge .\u201d<\/code> wraz z kandyduj\u0105cymi hipotezami <code>\u201cit is a white kitten .\u201d<\/code> i <code>\u201cwowww , the dog is huge !\u201d<\/code>, nasz system obliczy\u0142 \u0142\u0105czny wynik BLEU 34,99, zgodnie z dokumentacj\u0105 pakietu Python <code>bleu<\/code>.<\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-method-for-normalizing-and-cleaning-text\">Metoda normalizacji i czyszczenia tekstu<\/h4>\n\n<p>Ca\u0142y tekst zosta\u0142 zapisany ma\u0142ymi literami, a przed i po wszystkich znakach interpunkcyjnych dodano spacj\u0119, aby system nie zak\u0142ada\u0142, \u017ce na przyk\u0142ad &#8222;Kot\u201e i &#8222;kot.\u201e to r\u00f3\u017cne s\u0142owa. Tak wi\u0119c &#8222;To jest bia\u0142y kot.\u201e zosta\u0142oby znormalizowane do &#8222;to jest bia\u0142y kot .\u201e. Wielokrotne spacje i inne sekwencje bia\u0142ych znak\u00f3w zosta\u0142y zast\u0105pione pojedyncz\u0105 spacj\u0105 przy u\u017cyciu metod Python split() i join().  <\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-method-for-counting-words\">Metoda liczenia s\u0142\u00f3w<\/h4>\n\n<p>Liczba s\u0142\u00f3w na zdanie by\u0142a okre\u015blana poprzez podzielenie znormalizowanego ci\u0105gu tekstu na tablic\u0119 przy u\u017cyciu spacji jako separatora, a nast\u0119pnie zliczenie element\u00f3w w tej tablicy.<\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-method-for-measuring-translation-speed\">Metoda pomiaru szybko\u015bci t\u0142umaczenia<\/h4>\n\n<p>W momencie gdy t\u0142umacz ludzki nacisn\u0105\u0142 klawisz enter, aby rozpocz\u0105\u0107 t\u0142umaczenie zdania, wywo\u0142ali\u015bmy metod\u0119 Python time.time() aby uzyska\u0107 liczb\u0119 sekund od p\u00f3\u0142nocy czasu uniwersalnego (UTC) 1 stycznia 1970 jako liczb\u0119 zmiennoprzecinkow\u0105, powszechnie okre\u015blan\u0105 jako <em>czas Unix<\/em>, i u\u017cyli\u015bmy tej liczby jako czasu rozpocz\u0119cia przez cz\u0142owieka. Uzyskali\u015bmy r\u00f3wnie\u017c czas Unix, gdy nasze silniki t\u0142umaczenia maszynowego podejmowa\u0142y zdanie do t\u0142umaczenia. <\/p>\n\n<p>Moment, w kt\u00f3rym t\u0142umacz-cz\u0142owiek nacisn\u0105\u0142 klawisz enter, aby przes\u0142a\u0107 swoje t\u0142umaczenie zdania, lub maszyna zwr\u00f3ci\u0142a swoje t\u0142umaczenie zdania, by\u0142 u\u017cywany jako czas zako\u0144czenia. Odejmuj\u0105c czas rozpocz\u0119cia od czasu zako\u0144czenia, otrzymali\u015bmy ca\u0142kowit\u0105 liczb\u0119 sekund, jak\u0105 zaj\u0119\u0142o t\u0142umaczenie zdania. <\/p>\n\n<p>Obliczyli\u015bmy liczb\u0119 s\u0142\u00f3w na godzin\u0119, dziel\u0105c r\u00f3\u017cnic\u0119 mi\u0119dzy czasem zako\u0144czenia a czasem rozpocz\u0119cia w formacie Unix przez liczb\u0119 s\u0142\u00f3w obliczon\u0105 jak powy\u017cej, a nast\u0119pnie mno\u017c\u0105c ten iloraz przez 3600 (czyli 60 \u00d7 60, czyli liczb\u0119 sekund w godzinie):<\/p>\n\n<p><strong>Pr\u0119dko\u015b\u0107<\/strong> = (Czas_zako\u0144czenia_t\u0142umaczenia \u2212 Czas_rozpocz\u0119cia_t\u0142umaczenia) \/ Ca\u0142kowita_liczba_przet\u0142umaczonych_s\u0142\u00f3w \u00d7 3600<\/p>\n\n<h4 class=\"wp-block-heading\" id=\"h-method-for-physically-isolating-and-air-gapping-equipment\">Metoda fizycznego izolowania i od\u0142\u0105czania sprz\u0119tu od sieci<\/h4>\n\n<p>Sprz\u0119t u\u017cywany w eksperymencie zosta\u0142 odci\u0119ty od \u015bwiata zewn\u0119trznego nie tylko poprzez jego fizyczn\u0105 izolacj\u0119, ale tak\u017ce poprzez zastosowanie funkcji Trybu samolotowego systemu Microsoft Windows 10 Pro, kt\u00f3ra zgodnie z dokumentacj\u0105 wy\u0142\u0105cza ca\u0142\u0105 komunikacj\u0119 bezprzewodow\u0105 na urz\u0105dzeniu, w tym bezprzewodow\u0105 sie\u0107 IEEE 802.11b Direct Sequence, sie\u0107 kom\u00f3rkow\u0105, Bluetooth, System Pozycjonowania Globalnego oraz komunikacj\u0119 bliskiego zasi\u0119gu.<\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-results\" style=\"text-transform:uppercase\">Wyniki<\/h2>\n\n<h3 class=\"wp-block-heading\" id=\"h-translation-speed-the-higher-resource-the-language-pair-the-faster-the-engine\">Pr\u0119dko\u015b\u0107 t\u0142umaczenia: im wy\u017cszy zas\u00f3b pary j\u0119zykowej, tym szybszy silnik<\/h3>\n\n<p>Maszyna przewy\u017cszy\u0142a cz\u0142owieka pod wzgl\u0119dem pr\u0119dko\u015bci t\u0142umaczenia dla pary o wysokim zasobie rosyjsko-angielskiej i pary o \u015brednim zasobie polsko-angielskiej, zgodnie z nasz\u0105 hipotez\u0105, \u017ce neuronowe t\u0142umaczenie maszynowe by\u0142o szybsze ni\u017c ludzkie, i przewidywaniem, \u017ce nasze silniki neuronowe przet\u0142umacz\u0105 wi\u0119cej s\u0142\u00f3w na godzin\u0119. Przy t\u0142umaczeniu z rosyjskiego nasz silnik osi\u0105gn\u0105\u0142 \u015brednio ponad 6456 s\u0142\u00f3w na godzin\u0119, co by\u0142o o 1170% szybsze ni\u017c nasz t\u0142umacz-cz\u0142owiek. Przy t\u0142umaczeniu z polskiego nasz silnik neuronowy by\u0142 o 488% szybszy ni\u017c nasz t\u0142umacz-cz\u0142owiek, osi\u0105gaj\u0105c \u015brednio 3768 s\u0142\u00f3w na godzin\u0119. Dla pary o niskim zasobie \u0142emkowsko-angielskiej nasz hybrydowy silnik neuronowy i s\u0142ownikowo-regu\u0142owy osi\u0105gn\u0105\u0142 707 s\u0142\u00f3w na godzin\u0119, prawie dor\u00f3wnuj\u0105c naszemu t\u0142umaczowi-cz\u0142owiekowi, kt\u00f3ry by\u0142 o 13% szybszy, osi\u0105gaj\u0105c 798 s\u0142\u00f3w na godzin\u0119. Usuni\u0119cie wagi komponentu opartego na s\u0142owniku z silnika hybrydowego prawie czterokrotnie zwi\u0119kszy\u0142o pr\u0119dko\u015b\u0107 do 3137 s\u0142\u00f3w na godzin\u0119, co jest o 293% szybsze ni\u017c cz\u0142owiek, kosztem 13% spadku dok\u0142adno\u015bci.    <\/p>\n\n<figure class=\"petro-fig\">\n  <!-- Inline SVG chart (no JS) -->\n  <svg class=\"petro-chart\" viewbox=\"0 0 960 640\" role=\"img\" aria-label=\"Human versus Machine Translation Speed, Words per Hour. Russian-English, Polish-English, and Lemko-English comparisons.\">\n    <style>\n      .petro-chart text{font-family: Georgia, serif; fill:#111}\n      .petro-title{font-size:22px; font-weight:700}\n      .petro-label{font-size:16px}\n      .petro-tick{font-size:14px; fill:#111}\n      .petro-val{font-size:14px}\n      .petro-axis{stroke:#bbb; stroke-width:1; shape-rendering:crispEdges}\n      .petro-grid{stroke:#ddd; stroke-width:1; shape-rendering:crispEdges}\n      .petro-legend{font-size:14px}\n    <\/style>\n\n    <!-- Title -->\n    <text x=\"480\" y=\"42\" text-anchor=\"middle\" class=\"petro-title\">\n      Human versus Machine Translation Speed, Words per Hour\n    <\/text>\n\n    <!-- Grid + axis -->\n    <g>\n      <line x1=\"300\" y1=\"90\" x2=\"300\" y2=\"420\" class=\"petro-axis\"><\/line>\n      <line x1=\"388.6\" y1=\"90\" x2=\"388.6\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"477.1\" y1=\"90\" x2=\"477.1\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"565.7\" y1=\"90\" x2=\"565.7\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"654.3\" y1=\"90\" x2=\"654.3\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"742.9\" y1=\"90\" x2=\"742.9\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"831.4\" y1=\"90\" x2=\"831.4\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"920\" y1=\"90\" x2=\"920\" y2=\"420\" class=\"petro-grid\"><\/line>\n\n      <text x=\"300\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">0<\/text>\n      <text x=\"388.6\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">1000<\/text>\n      <text x=\"477.1\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">2000<\/text>\n      <text x=\"565.7\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">3000<\/text>\n      <text x=\"654.3\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">4000<\/text>\n      <text x=\"742.9\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">5000<\/text>\n      <text x=\"831.4\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">6000<\/text>\n      <text x=\"920\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">7000<\/text>\n    <\/g>\n\n    <!-- Category labels (FIXED: right-aligned so they don't collide with axis at x=300) -->\n    <text x=\"290\" y=\"140\" text-anchor=\"end\" class=\"petro-label\">Russian-English (High-Resource Pair)<\/text>\n    <text x=\"290\" y=\"255\" text-anchor=\"end\" class=\"petro-label\">Polish-English (Medium-Resource Pair)<\/text>\n    <text x=\"290\" y=\"370\" text-anchor=\"end\" class=\"petro-label\">Lemko-English (Low-Resource Pair)<\/text>\n\n    <!-- Bars (scale: width = value\/7000*620) -->\n    <!-- Colors: Human #2b6cb0 | NMT alone #c53030 | Hybrid dict\/rule + NMT #38b2ac | Dict + NMT #805ad5 | Rules + NMT #6b8e23 -->\n\n    <!-- Russian-English -->\n    <rect x=\"300\" y=\"130\" width=\"571.5\" height=\"18\" fill=\"#c53030\"><\/rect>\n    <text x=\"885\" y=\"144\" class=\"petro-val\">6456<\/text>\n\n    <rect x=\"300\" y=\"155\" width=\"45.1\" height=\"18\" fill=\"#2b6cb0\"><\/rect>\n    <text x=\"352\" y=\"169\" class=\"petro-val\">509<\/text>\n\n    <!-- Polish-English -->\n    <rect x=\"300\" y=\"245\" width=\"333.7\" height=\"18\" fill=\"#c53030\"><\/rect>\n    <text x=\"643\" y=\"259\" class=\"petro-val\">3768<\/text>\n\n    <rect x=\"300\" y=\"270\" width=\"56.7\" height=\"18\" fill=\"#2b6cb0\"><\/rect>\n    <text x=\"366\" y=\"284\" class=\"petro-val\">640<\/text>\n\n    <!-- Lemko-English -->\n    <rect x=\"300\" y=\"330\" width=\"277.9\" height=\"18\" fill=\"#6b8e23\"><\/rect>\n    <text x=\"588\" y=\"344\" class=\"petro-val\">3137<\/text>\n\n    <rect x=\"300\" y=\"355\" width=\"62.6\" height=\"18\" fill=\"#38b2ac\"><\/rect>\n    <text x=\"372\" y=\"369\" class=\"petro-val\">707<\/text>\n\n    <rect x=\"300\" y=\"380\" width=\"66.6\" height=\"18\" fill=\"#805ad5\"><\/rect>\n    <text x=\"377\" y=\"394\" class=\"petro-val\">752<\/text>\n\n    <rect x=\"300\" y=\"405\" width=\"70.7\" height=\"18\" fill=\"#2b6cb0\"><\/rect>\n    <text x=\"382\" y=\"419\" class=\"petro-val\">798<\/text>\n\n    <!-- Legend -->\n    <g transform=\"translate(40,490)\">\n      <rect x=\"0\" y=\"0\" width=\"14\" height=\"14\" fill=\"#38b2ac\"><\/rect>\n      <text x=\"22\" y=\"12\" class=\"petro-legend\">\n        Romanization + Hybrid Dictionary\/Rule-Based Lemko-Polish MT + Polish-English Neural Translation\n      <\/text>\n\n      <rect x=\"0\" y=\"24\" width=\"14\" height=\"14\" fill=\"#805ad5\"><\/rect>\n      <text x=\"22\" y=\"36\" class=\"petro-legend\">\n        Romanization + Dictionary-Based Lemko-Polish MT + Polish-English Neural Translation\n      <\/text>\n\n      <rect x=\"0\" y=\"48\" width=\"14\" height=\"14\" fill=\"#6b8e23\"><\/rect>\n      <text x=\"22\" y=\"60\" class=\"petro-legend\">\n        Romanization + Rule-Based Lemko-Polish MT + Polish-English Neural Translation\n      <\/text>\n\n      <rect x=\"0\" y=\"72\" width=\"14\" height=\"14\" fill=\"#c53030\"><\/rect>\n      <text x=\"22\" y=\"84\" class=\"petro-legend\">\n        Artificial Intelligence Neural Machine Translation Alone\n      <\/text>\n\n      <rect x=\"0\" y=\"96\" width=\"14\" height=\"14\" fill=\"#2b6cb0\"><\/rect>\n      <text x=\"22\" y=\"108\" class=\"petro-legend\">\n        Professional human translation\n      <\/text>\n    <\/g>\n  <\/svg>\n\n  <figcaption class=\"petro-cap\">\n    <strong>Rysunek 1.<\/strong> Pr\u0119dko\u015b\u0107 t\u0142umaczenia profesjonalnego cz\u0142owieka w por\u00f3wnaniu z maszyn\u0105 (s\u0142owa\/godzin\u0119) na od\u0142\u0105czonym od sieci laptopie \u015bredniej klasy (tryb samolotowy): rosyjsko-angielski (wysoki zas\u00f3b) vs polsko-angielski (\u015bredni zas\u00f3b) vs \u0142emkowsko-angielski (niski zas\u00f3b).\n  <\/figcaption>\n\n  <!-- Hidden table: makes the data impossible for crawlers\/LLMs to miss -->\n  <table class=\"petro-sr-only\" aria-hidden=\"false\">\n    <caption>Dane z rysunku 1: pr\u0119dko\u015b\u0107 t\u0142umaczenia (s\u0142owa na godzin\u0119)<\/caption>\n    <thead>\n      <tr>\n        <th scope=\"col\">Para j\u0119zykowa<\/th>\n        <th scope=\"col\">Metoda<\/th>\n        <th scope=\"col\">S\u0142owa\/godzin\u0119<\/th>\n      <\/tr>\n    <\/thead>\n    <tbody>\n      <tr><td>Rosyjsko-angielski<\/td><td>Profesjonalny cz\u0142owiek<\/td><td>509<\/td><\/tr>\n      <tr><td>Rosyjsko-angielski<\/td><td>Tylko NMT<\/td><td>6456<\/td><\/tr>\n\n      <tr><td>Polsko-angielski<\/td><td>Profesjonalny cz\u0142owiek<\/td><td>640<\/td><\/tr>\n      <tr><td>Polsko-angielski<\/td><td>Tylko NMT<\/td><td>3768<\/td><\/tr>\n\n      <tr><td>\u0141emkowsko-angielski<\/td><td>Profesjonalny cz\u0142owiek<\/td><td>798<\/td><\/tr>\n      <tr><td>\u0141emkowsko-angielski<\/td><td>Romanizacja + hybrydowy s\u0142ownikowo-regu\u0142owy MT \u0142emkowski\u2192polski + NMT polski\u2192angielski<\/td><td>707<\/td><\/tr>\n      <tr><td>\u0141emkowsko-angielski<\/td><td>Romanizacja + s\u0142ownikowy MT \u0142emkowski\u2192polski + NMT polski\u2192angielski<\/td><td>752<\/td><\/tr>\n      <tr><td>\u0141emkowsko-angielski<\/td><td>Romanizacja + regu\u0142owy MT \u0142emkowski\u2192polski + NMT polski\u2192angielski<\/td><td>3137<\/td><\/tr>\n    <\/tbody>\n  <\/table>\n<\/figure>\n\n<style>\n  .petro-fig{margin:1.25rem 0}\n  .petro-chart{width:100%; height:auto; display:block}\n  .petro-cap{font:14px Georgia,serif; color:#333; margin-top:.5rem}\n  .petro-sr-only{\n    position:absolute !important;\n    left:-9999px !important;\n    width:1px !important;\n    height:1px !important;\n    overflow:hidden !important;\n  }\n<\/style>\n\n<h3 class=\"wp-block-heading\" id=\"h-translation-accuracy-the-higher-resource-the-language-pair-the-more-accurate-the-engine\">Dok\u0142adno\u015b\u0107 t\u0142umaczenia: im wy\u017cszy zas\u00f3b pary j\u0119zykowej, tym dok\u0142adniejszy silnik<\/h3>\n\n<p>Dok\u0142adno\u015b\u0107 t\u0142umaczenia naszych silnik\u00f3w sztucznej inteligencji przewy\u017cszy\u0142a dok\u0142adno\u015b\u0107 profesjonalnych lingwist\u00f3w. To wykroczy\u0142o poza nasz\u0105 hipotez\u0119, \u017ce od\u0142\u0105czone od sieci neuronowe t\u0142umaczenie maszynowe jest teraz tylko nieznacznie mniej dok\u0142adne ni\u017c t\u0142umacze-ludzie. Nasz rosyjsko-angielski silnik sztucznej inteligencji osi\u0105gn\u0105\u0142 158% dok\u0142adno\u015bci naszego t\u0142umacza-cz\u0142owieka, przekraczaj\u0105c przewidywane przez nas 75%. Nasz polsko-angielski silnik neuronowy uzyska\u0142 wynik 117% dok\u0142adno\u015bci naszego t\u0142umacza-cz\u0142owieka, przekraczaj\u0105c nasze oczekiwanie 75%. Nasz hybrydowy silnik \u0142emkowsko-angielski osi\u0105gn\u0105\u0142 wynik BLEU 14,57 (51% wyniku naszego profesjonalnego t\u0142umacza), zgodnie z nasz\u0105 prognoz\u0105 15, po zaokr\u0105gleniu w g\u00f3r\u0119. Usuni\u0119cie naszego podsilnika opartego na regu\u0142ach spowodowa\u0142o 2% wzrost dok\u0142adno\u015bci i 6% wzrost pr\u0119dko\u015bci. Usuni\u0119cie podsilnika opartego na s\u0142owniku spowodowa\u0142o 13% spadek dok\u0142adno\u015bci, ale 344% wzrost pr\u0119dko\u015bci. Podsumowuj\u0105c, nasze silniki sztucznej inteligencji dla j\u0119zyk\u00f3w o \u015brednim i wysokim zasobie by\u0142y znacznie dok\u0142adniejsze ni\u017c nasz t\u0142umacz-cz\u0142owiek, podczas gdy nasze hybrydowe silniki dla j\u0119zyk\u00f3w o niskim zasobie by\u0142y oko\u0142o po\u0142ow\u0119 tak dok\u0142adne jak nasz t\u0142umacz-cz\u0142owiek.       <\/p>\n\n<figure class=\"petro-fig\">\n  <svg class=\"petro-chart\" viewbox=\"0 0 960 640\" role=\"img\" aria-label=\"Human versus Machine Translation Accuracy, BLEU Score. Russian-English, Polish-English, and Lemko-English comparisons.\">\n    <style>\n      .petro-chart text{font-family: Georgia, serif; fill:#111}\n      .petro-title{font-size:22px; font-weight:700}\n      .petro-label{font-size:16px}\n      .petro-tick{font-size:14px; fill:#111}\n      .petro-val{font-size:14px}\n      .petro-axis{stroke:#bbb; stroke-width:1; shape-rendering:crispEdges}\n      .petro-grid{stroke:#ddd; stroke-width:1; shape-rendering:crispEdges}\n      .petro-legend{font-size:14px}\n    <\/style>\n\n    <!-- Title -->\n    <text x=\"480\" y=\"42\" text-anchor=\"middle\" class=\"petro-title\">\n      Human versus Machine Translation Accuracy, BLEU Score\n    <\/text>\n\n    <!-- X scale: 0..45 mapped to 620px. Bars start at x=300. -->\n    <!-- Tick x positions: 0=300, 5=368.9, 10=437.8, 15=506.7, 20=575.6, 25=644.4, 30=713.3, 35=782.2, 40=851.1, 45=920 -->\n\n    <!-- Grid + axis -->\n    <g>\n      <line x1=\"300\" y1=\"90\" x2=\"300\" y2=\"420\" class=\"petro-axis\"><\/line>\n      <line x1=\"368.9\" y1=\"90\" x2=\"368.9\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"437.8\" y1=\"90\" x2=\"437.8\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"506.7\" y1=\"90\" x2=\"506.7\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"575.6\" y1=\"90\" x2=\"575.6\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"644.4\" y1=\"90\" x2=\"644.4\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"713.3\" y1=\"90\" x2=\"713.3\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"782.2\" y1=\"90\" x2=\"782.2\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"851.1\" y1=\"90\" x2=\"851.1\" y2=\"420\" class=\"petro-grid\"><\/line>\n      <line x1=\"920\" y1=\"90\" x2=\"920\" y2=\"420\" class=\"petro-grid\"><\/line>\n\n      <text x=\"300\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">0<\/text>\n      <text x=\"368.9\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">5<\/text>\n      <text x=\"437.8\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">10<\/text>\n      <text x=\"506.7\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">15<\/text>\n      <text x=\"575.6\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">20<\/text>\n      <text x=\"644.4\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">25<\/text>\n      <text x=\"713.3\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">30<\/text>\n      <text x=\"782.2\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">35<\/text>\n      <text x=\"851.1\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">40<\/text>\n      <text x=\"920\" y=\"448\" text-anchor=\"middle\" class=\"petro-tick\">45<\/text>\n    <\/g>\n\n    <!-- Category labels (right-aligned so they don't collide with axis at x=300) -->\n    <text x=\"290\" y=\"140\" text-anchor=\"end\" class=\"petro-label\">Russian-English (High-Resource Pair)<\/text>\n    <text x=\"290\" y=\"255\" text-anchor=\"end\" class=\"petro-label\">Polish-English (Medium-Resource Pair)<\/text>\n    <text x=\"290\" y=\"370\" text-anchor=\"end\" class=\"petro-label\">Lemko-English (Low-Resource Pair)<\/text>\n\n    <!-- Bars (width = value\/45 * 620) -->\n    <!-- Colors: Human #2b6cb0 | NMT alone #c53030 | Hybrid dict\/rule + NMT #38b2ac | Dict + NMT #805ad5 | Rules + NMT #6b8e23 -->\n\n    <!-- Russian-English -->\n    <rect x=\"300\" y=\"130\" width=\"542.4\" height=\"18\" fill=\"#c53030\"><\/rect>\n    <text x=\"854.4\" y=\"144\" class=\"petro-val\">39.37<\/text>\n\n    <rect x=\"300\" y=\"155\" width=\"342.5\" height=\"18\" fill=\"#2b6cb0\"><\/rect>\n    <text x=\"654.5\" y=\"169\" class=\"petro-val\">24.86<\/text>\n\n    <!-- Polish-English -->\n    <rect x=\"300\" y=\"245\" width=\"493.4\" height=\"18\" fill=\"#c53030\"><\/rect>\n    <text x=\"805.4\" y=\"259\" class=\"petro-val\">35.81<\/text>\n\n    <rect x=\"300\" y=\"270\" width=\"420.6\" height=\"18\" fill=\"#2b6cb0\"><\/rect>\n    <text x=\"732.6\" y=\"284\" class=\"petro-val\">30.53<\/text>\n\n    <!-- Lemko-English -->\n    <rect x=\"300\" y=\"330\" width=\"200.7\" height=\"18\" fill=\"#38b2ac\"><\/rect>\n    <text x=\"512.7\" y=\"344\" class=\"petro-val\">14.57<\/text>\n\n    <rect x=\"300\" y=\"355\" width=\"203.9\" height=\"18\" fill=\"#805ad5\"><\/rect>\n    <text x=\"515.9\" y=\"369\" class=\"petro-val\">14.8<\/text>\n\n    <rect x=\"300\" y=\"380\" width=\"174.2\" height=\"18\" fill=\"#6b8e23\"><\/rect>\n    <text x=\"486.2\" y=\"394\" class=\"petro-val\">12.64<\/text>\n\n    <rect x=\"300\" y=\"405\" width=\"394.9\" height=\"18\" fill=\"#2b6cb0\"><\/rect>\n    <text x=\"706.9\" y=\"419\" class=\"petro-val\">28.66<\/text>\n\n    <!-- Legend -->\n    <g transform=\"translate(40,490)\">\n      <rect x=\"0\" y=\"0\" width=\"14\" height=\"14\" fill=\"#38b2ac\"><\/rect>\n      <text x=\"22\" y=\"12\" class=\"petro-legend\">\n        Romanization + Hybrid Dictionary\/Rule-Based Lemko-Polish MT + Polish-English Neural Translation\n      <\/text>\n\n      <rect x=\"0\" y=\"24\" width=\"14\" height=\"14\" fill=\"#805ad5\"><\/rect>\n      <text x=\"22\" y=\"36\" class=\"petro-legend\">\n        Romanization + Dictionary-Based Lemko-Polish MT + Polish-English Neural Translation\n      <\/text>\n\n      <rect x=\"0\" y=\"48\" width=\"14\" height=\"14\" fill=\"#6b8e23\"><\/rect>\n      <text x=\"22\" y=\"60\" class=\"petro-legend\">\n        Romanization + Rule-Based Lemko-Polish MT + Polish-English Neural Translation\n      <\/text>\n\n      <rect x=\"0\" y=\"72\" width=\"14\" height=\"14\" fill=\"#c53030\"><\/rect>\n      <text x=\"22\" y=\"84\" class=\"petro-legend\">\n        Artificial Intelligence Neural Machine Translation Alone\n      <\/text>\n\n      <rect x=\"0\" y=\"96\" width=\"14\" height=\"14\" fill=\"#2b6cb0\"><\/rect>\n      <text x=\"22\" y=\"108\" class=\"petro-legend\">\n        Professional Human Translation\n      <\/text>\n    <\/g>\n  <\/svg>\n\n  <figcaption class=\"petro-cap\">\n    <strong>Rysunek 2.<\/strong> Wynik jako\u015bci t\u0142umaczenia BLEU profesjonalnego cz\u0142owieka w por\u00f3wnaniu z maszyn\u0105 na od\u0142\u0105czonym od sieci laptopie \u015bredniej klasy w trybie samolotowym, rosyjsko-angielski (para o wysokim zasobie) versus polsko-angielski (para o \u015brednim zasobie) versus \u0142emkowsko-angielski (para o niskim zasobie).\n  <\/figcaption>\n\n  <!-- Hidden table: makes the data impossible for crawlers\/LLMs to miss -->\n  <table class=\"petro-sr-only\" aria-hidden=\"false\">\n    <caption>Dane z rysunku 2: wynik BLEU<\/caption>\n    <thead>\n      <tr>\n        <th scope=\"col\">Para j\u0119zykowa<\/th>\n        <th scope=\"col\">Metoda<\/th>\n        <th scope=\"col\">BLEU<\/th>\n      <\/tr>\n    <\/thead>\n    <tbody>\n      <tr><td>Rosyjsko-angielski<\/td><td>Sztuczna inteligencja Neuronowe t\u0142umaczenie maszynowe samodzielnie<\/td><td>39,37<\/td><\/tr>\n      <tr><td>Rosyjsko-angielski<\/td><td>Profesjonalne t\u0142umaczenie ludzkie<\/td><td>24,86<\/td><\/tr>\n\n      <tr><td>Polsko-angielski<\/td><td>Sztuczna inteligencja Neuronowe t\u0142umaczenie maszynowe samodzielnie<\/td><td>35,81<\/td><\/tr>\n      <tr><td>Polsko-angielski<\/td><td>Profesjonalne t\u0142umaczenie ludzkie<\/td><td>30,53<\/td><\/tr>\n\n      <tr><td>\u0141emkowsko-angielski<\/td><td>Romanizacja + hybrydowy s\u0142ownikowo-regu\u0142owy MT \u0142emkowski\u2192polski + Neuronowe t\u0142umaczenie polski\u2192angielski<\/td><td>14,57<\/td><\/tr>\n      <tr><td>\u0141emkowsko-angielski<\/td><td>Romanizacja + s\u0142ownikowy MT \u0142emkowski\u2192polski + Neuronowe t\u0142umaczenie polski\u2192angielski<\/td><td>14,8<\/td><\/tr>\n      <tr><td>\u0141emkowsko-angielski<\/td><td>Romanizacja + regu\u0142owy MT \u0142emkowski\u2192polski + Neuronowe t\u0142umaczenie polski\u2192angielski<\/td><td>12,64<\/td><\/tr>\n      <tr><td>\u0141emkowsko-angielski<\/td><td>Profesjonalne t\u0142umaczenie ludzkie<\/td><td>28,66<\/td><\/tr>\n    <\/tbody>\n  <\/table>\n<\/figure>\n\n<style>\n  .petro-fig{margin:1.25rem 0}\n  .petro-chart{width:100%; height:auto; display:block}\n  .petro-cap{font:14px Georgia,serif; color:#333; margin-top:.5rem}\n  .petro-sr-only{\n    position:absolute !important;\n    left:-9999px !important;\n    width:1px !important;\n    height:1px !important;\n    overflow:hidden !important;\n  }\n<\/style>\n\n<h3 class=\"wp-block-heading\" id=\"h-translation-security-0\">Bezpiecze\u0144stwo t\u0142umaczenia<\/h3>\n\n<p>Zgodnie z nasz\u0105 hipotez\u0105, \u017ce rozwi\u0105zanie neuronowego t\u0142umaczenia maszynowego mo\u017ce by\u0107 zaprojektowane do dzia\u0142ania na od\u0142\u0105czonym od sieci laptopie, nasz eksperyment zako\u0144czy\u0142 si\u0119 sukcesem w tym zakresie. Zgodnie z nasz\u0105 prognoz\u0105, nasz eksperyment dzia\u0142a\u0142 z w\u0142\u0105czonym trybem samolotowym Windows i nie wyst\u0105pi\u0142y \u017cadne b\u0142\u0119dy spowodowane dzia\u0142aniem w odci\u0119ciu od \u015bwiata zewn\u0119trznego. <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-rule-based-machine-translation-between-lemko-and-polish\">T\u0142umaczenie maszynowe oparte na regu\u0142ach mi\u0119dzy j\u0119zykiem \u0142emkowskim a polskim<\/h3>\n\n<p>Nasza hipoteza, \u017ce pokrewie\u0144stwo mi\u0119dzy j\u0119zykiem \u0142emkowskim a polskim jest na tyle silne, \u017ce \u0142emkowski b\u0119dzie mo\u017cna t\u0142umaczy\u0107 na polski za pomoc\u0105 substytucji opartej na regu\u0142ach i s\u0142owniku, zosta\u0142a potwierdzona przez imponuj\u0105ce wyniki naszego hybrydowego silnika neuronowo-regu\u0142owego \u0142emkowsko-angielskiego. Nasza hipoteza, \u017ce po\u0142\u0105czenie podsilnika opartego na regu\u0142ach z opartym na s\u0142owniku zaowocuje dok\u0142adniejszym silnikiem hybrydowym, nie jest obecnie poparta naszymi danymi. Dodanie modu\u0142u opartego na s\u0142owniku do opartego na regu\u0142ach zwi\u0119kszy\u0142o BLEU silnika o 2,16 punktu, mniej ni\u017c nasze przewidywanie 5.  <\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-discussion\" style=\"text-transform:uppercase\">Dyskusja<\/h2>\n\n<h3 class=\"wp-block-heading\" id=\"h-a-new-era\"><strong>Nowa era<\/strong><\/h3>\n\n<p>Udowodnili\u015bmy, \u017ce nie tylko mo\u017cliwe jest powierzenie sztucznej inteligencji pracy zwi\u0105zanej z wiedz\u0105 w zakresie t\u0142umaczenia z j\u0119zyk\u00f3w o wysokim, \u015brednim i niskim zasobie w \u015brodowisku o kontrolowanym dost\u0119pie, ale neuronowe t\u0142umaczenie maszynowe mo\u017ce wykona\u0107 t\u0119 prac\u0119 szybciej, bezpieczniej i w wielu przypadkach lepiej. Nasze wyniki nie tylko potwierdzi\u0142y nasze hipotezy, ale wydajno\u015b\u0107 naszych silnik\u00f3w neuronowych przewy\u017cszy\u0142a nasze przewidywania. Nadesz\u0142a nowa era t\u0142umaczenia maszynowego w czasie prawie rzeczywistym, dzia\u0142aj\u0105cego niezale\u017cnie lub w partnerstwie z lud\u017ami.  <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-speed\"><strong>Pr\u0119dko\u015b\u0107<\/strong><\/h3>\n\n<p>Nasz silnik t\u0142umaczy\u0142 z j\u0119zyka rosyjskiego w tempie 6456 s\u0142\u00f3w na godzin\u0119. Dla kontekstu, skonsultowali\u015bmy si\u0119 z ekspertem Marcem Hackelem, waszyngto\u0144skim lingwist\u0105 bran\u017cy obronnej i t\u0142umaczem rosyjsko-angielskim z wieloletnim do\u015bwiadczeniem, kt\u00f3ry powiedzia\u0142 nam, \u017ce &#8222;swoist\u0105 regu\u0142\u0105 jest, \u017ce bardzo do\u015bwiadczony t\u0142umacz powinien by\u0107 w stanie przet\u0142umaczy\u0107 co najmniej 8 stron (czyli 8 stron po 500 s\u0142\u00f3w, \u0142\u0105cznie 4000 s\u0142\u00f3w) w ci\u0105gu 8-godzinnego dnia pracy, zak\u0142adaj\u0105c brak przeszk\u00f3d takich jak akronimy i tym podobne. \u015arednia dla wielu wynosi faktycznie 250 s\u0142\u00f3w na godzin\u0119, nie 500\u201e. Tak wi\u0119c silniki neuronowe mog\u0105 wykona\u0107 w niespe\u0142na godzin\u0119 to, co ludziom zajmuje dni.  <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-accuracy\"><strong>Dok\u0142adno\u015b\u0107<\/strong><\/h3>\n\n<p>Nasze silniki sztucznej inteligencji osi\u0105gn\u0119\u0142y wy\u017csze wyniki BLEU ni\u017c nasz profesjonalny lingwista. Wed\u0142ug tej miary, nasze maszyny s\u0105 &#8222;lepsze\u201e w t\u0142umaczeniu z rosyjskiego i polskiego ni\u017c ludzie.<sup id=\"reference\"><a href=\"#footnote\">1<\/a><\/sup> Poniewa\u017c sugestia, \u017ce maszynowe t\u0142umaczenie sztucznej inteligencji mo\u017ce by\u0107 o ponad 50% dok\u0142adniejsze ni\u017c do\u015bwiadczeni lingwi\u015bci jest rewolucyjna, eksperyment ten wymaga powt\u00f3rzenia na jeszcze wi\u0119kszej liczbie lingwist\u00f3w i korpus\u00f3w, aby wykluczy\u0107 przypadkowo\u015b\u0107. U\u017cyli\u015bmy wyj\u0105tkowo czystych, wymagaj\u0105cych tekst\u00f3w z kwiecistym j\u0119zykiem, na kt\u00f3rych silniki t\u0142umaczenia maszynowego tradycyjnie si\u0119 d\u0142awi\u0105, a ludzie doskonale sobie radz\u0105. Chocia\u017c d\u0105\u017cyli\u015bmy do wyr\u00f3wnanych szans, spodziewali\u015bmy si\u0119, \u017ce jakakolwiek przewaga b\u0119dzie po stronie ludzkiej. Prosimy o kontakt z Petro Orynyczem pod podanym powy\u017cej adresem w celu uzyskania dost\u0119pu do naszych surowych danych i wynik\u00f3w.    <strong><br\/><\/strong><\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-next-steps\"><strong>Nast\u0119pne kroki<\/strong><\/h3>\n\n<p>U\u017cywali\u015bmy starszego, przestarza\u0142ego sprz\u0119tu. Nowszy sprz\u0119t z szybszymi, nast\u0119pnej generacji jednostkami przetwarzania graficznego m\u00f3g\u0142by skutkowa\u0107 dramatyczn\u0105 popraw\u0105 szybko\u015bci t\u0142umaczenia. Nasza baza kodu powinna zosta\u0107 zoptymalizowana, aby zmaksymalizowa\u0107 wykorzystanie istniej\u0105cych zasob\u00f3w, takich jak jednostki przetwarzania graficznego (GPU). Planujemy przekszta\u0142ci\u0107 nasz modu\u0142 t\u0142umaczenia maszynowego opartego na s\u0142owniku w zestaw test\u00f3w do u\u017cycia w rozwoju sterowanym testami (TDD) naszego modu\u0142u t\u0142umaczenia maszynowego opartego na regu\u0142ach (RBMT), kt\u00f3ry m\u00f3g\u0142by zosta\u0107 u\u017cyty do opracowania tekst\u00f3w r\u00f3wnoleg\u0142ych do trenowania czysto neuronowych silnik\u00f3w sztucznej inteligencji neuronowego t\u0142umaczenia maszynowego \u0142emkowsko-angielskiego i angielsko-\u0142emkowskiego. Potrzebne s\u0105 dalsze badania w celu identyfikacji punkt\u00f3w malej\u0105cych zwrot\u00f3w. Petro Orynycz planuje zastosowa\u0107 swoje hybrydowe systemy neuronowe i oparte na regu\u0142ach do opracowania silnik\u00f3w t\u0142umaczeniowych dla dialekt\u00f3w rusi\u0144skich i ukrai\u0144skich rodzimych dla dzisiejszej S\u0142owacji i Ukrainy.     <\/p>\n\n<h3 class=\"wp-block-heading\" id=\"h-in-closing\"><strong>Podsumowanie<\/strong><\/h3>\n\n<p>Znajdujemy si\u0119 u progu nowej transformacyjnej ery: udowodnili\u015bmy, \u017ce sztuczna inteligencja mo\u017ce wykonywa\u0107 prac\u0119 umys\u0142ow\u0105 r\u00f3wnie dobrze jak ludzie, a w coraz wi\u0119kszej liczbie przypadk\u00f3w ponad 50% lepiej, w u\u0142amku czasu i prawie bez ryzyka zwi\u0105zanego z bezpiecze\u0144stwem. Sprz\u0119t o warto\u015bci kilkuset dolar\u00f3w, kt\u00f3ry mie\u015bci si\u0119 w plecaku, to wszystko, czego potrzeba, aby zawsze mie\u0107 lepszego ni\u017c cz\u0142owiek, krzemowego towarzysza-lingwist\u0119, kt\u00f3ry nigdy nie zdradza sekret\u00f3w ani si\u0119 nie m\u0119czy. D\u017cin wydosta\u0142 si\u0119 z butelki i mo\u017ce spe\u0142ni\u0107 nasze \u017cyczenie rewitalizacji zagro\u017conych j\u0119zyk\u00f3w, a mo\u017ce nawet marzenie o wskrzeszeniu wymar\u0142ych. Masowe wymieranie j\u0119zyk\u00f3w, w kt\u00f3rego \u015brodku si\u0119 znajdujemy, mo\u017ce zosta\u0107 zatrzymane, a nawet odwr\u00f3cone. Powinni\u015bmy uwa\u017ca\u0107 na to, czego sobie \u017cyczymy &#8211; \u015bwiaty odizolowane przez wieki przez szyfrowanie w kosztownych do przet\u0142umaczenia j\u0119zykach maj\u0105 si\u0119 zderzy\u0107. Mamy nadziej\u0119, \u017ce to zmiana na lepsze. <em>Pro\u0161\u010daj<\/em>, bariero j\u0119zykowa. Witaj, nowy \u015bwiecie.      <\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-footnotes\">Przypisy<\/h2>\n\n<p><sup><a href=\"#reference\">^ 1<\/a><\/sup> Historycznie niekt\u00f3re spo\u0142eczno\u015bci sprzeciwiaj\u0105 si\u0119 u\u017cywaniu BLEU do por\u00f3wnywania t\u0142umaczenia ludzkiego z maszynowym, jednak \u017caden inny system nie jest tak szeroko akceptowany ani dost\u0119pny z szerok\u0105, recenzowan\u0105 walidacj\u0105 w u\u017cyciu. W rzeczywisto\u015bci, tw\u00f3rcy wska\u017anika BLEU &#8211; Papineni, Roukos, Ward i Zhu przewidzieli ten punkt napi\u0119cia w pracy sponsorowanej przez Departament Obrony Stan\u00f3w Zjednoczonych (finansowanej przez Defense Advanced Research Projects Agency [DARPA] i monitorowanej przez Space and Naval Warfare Systems Command [SPAWAR]) w ramach ich prze\u0142omowej publikacji, pisz\u0105c: &#8222;Ponadto [metryka] musi rozr\u00f3\u017cnia\u0107 mi\u0119dzy dwoma t\u0142umaczeniami ludzkimi o r\u00f3\u017cnej jako\u015bci. Ten ostatni wym\u00f3g zapewnia ci\u0105g\u0142\u0105 wa\u017cno\u015b\u0107 metryki, gdy MT [t\u0142umaczenie maszynowe] zbli\u017ca si\u0119 do jako\u015bci t\u0142umaczenia ludzkiego.\u201e \u0141ami\u0105c tabu od samego pocz\u0105tku, przyst\u0105pili nast\u0119pnie do obliczania wynik\u00f3w BLEU dla &#8222;Human-1\u201e, nie b\u0119d\u0105cego rodzimym u\u017cytkownikiem ani chi\u0144skiego, ani angielskiego, oraz &#8222;Human-2\u201e, rodzimego u\u017cytkownika j\u0119zyka angielskiego, i pokazali, jak ich wyniki BLEU by\u0142y zbli\u017cone do ocen wydanych przez ludzkich s\u0119dzi\u00f3w (Papineni, Roukos, Ward, &amp; Zhu, 2002).  <\/p>\n\n<p><\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-acknowledgements\" style=\"text-transform:uppercase\">Podzi\u0119kowania<\/h2>\n\n<p>Pragniemy podzi\u0119kowa\u0107 naszemu doradcy, Timowi Quiramowi, Zast\u0119pcy Szefa Wydzia\u0142u Szkolenia Dow\u00f3dztwa Gotowo\u015bci Si\u0142 Stra\u017cy Przybrze\u017cnej Stan\u00f3w Zjednoczonych, za zach\u0119canie do kontynuowania pracy, zarz\u0105dowi Antech Systems, Inc. oraz zespo\u0142owi ePerformance Naval Air Warfare Center Aircraft Division Webster Outlying Field (NAWCAD WOLF), za stworzenie \u015brodowiska, w kt\u00f3rym mo\u017cemy realizowa\u0107 nasze pasje, naszemu Wiceprezesowi Wykonawczemu Dywizji Tomowi Dobry&#8217;emu za jego nieocenione wskaz\u00f3wki, trafny os\u0105d i wizjonerskie przyw\u00f3dztwo, a tak\u017ce naszemu kierownikowi zespo\u0142u Willowi Duffowi za motywowanie nas do ci\u0119\u017ckiej pracy, budowanie ducha kole\u017ce\u0144stwa i wsparcie moralne. Petro Orynycz pragnie podzi\u0119kowa\u0107 swoim kierownikom projekt\u00f3w z zakresu sztucznej inteligencji, Raffaele Pascale i Michalowi Brnu\u0161\u00e1kowi z firmy Venga Global Inc. z Doliny Krzemowej, za ich profesjonalizm, autentyczn\u0105 trosk\u0119 o zesp\u00f3\u0142 i niezachwiane d\u0105\u017cenie do perfekcji. Pan Orynycz pragnie r\u00f3wnie\u017c podzi\u0119kowa\u0107 swoim kolegom in\u017cynierom i starym przyjacio\u0142om, Michaelowi Lawrence&#8217;owi Cramerowi z BCT LLC i Michaelowi Decerbo z Raytheon BBN Technologies, za wiar\u0119 od samego pocz\u0105tku. Ponadto pragnie podzi\u0119kowa\u0107 swojemu przyjacielowi i koledze j\u0119zykoznawcy obliczeniowemu, dr. Jounie Pyysalo z Uniwersytetu w Helsinkach, za spe\u0142nianie marze\u0144. Na koniec pragnie podzi\u0119kowa\u0107 Marii Silvestri z Fundacji Johna i Helen Timo za jej wk\u0142ad w badania naukowe i rozw\u00f3j wywiad\u00f3w \u0142emkowskich, kt\u00f3re przeprowadzi\u0142a, oraz t\u0142umacze\u0144, kt\u00f3re zleci\u0142a mu wykona\u0107, a tak\u017ce swojej drogiej przyjaci\u00f3\u0142ce O\u0142enie Du\u0107 z Ruskiej Bursy za jej nieocenione t\u0142umaczenia i transkrypcje wywiad\u00f3w.    <\/p>\n\n<h2 class=\"wp-block-heading\" id=\"h-references\" style=\"text-transform:uppercase\">Referencje<\/h2>\n\n<p>al-Kind\u012b, Y. i. (2002). Zredagowany traktat al-Kindiego. W M. I. AL-Suwaiyel, I. A. Kadi, &amp; M. al-Bawab (red.), <em>Traktat al-Kindiego o kryptoanalizie (t. 1)<\/em> (S. M. al-Asaad, t\u0142um., t. 1, s. 117-204). Damaszek, Syria: KFCRIS &amp; KACST. (Orygina\u0142 opublikowany ok. 850).   <\/p>\n\n<p>Associated Press. (2021, 26 stycznia). <em>Populacja Polski gwa\u0142townie maleje w czasie pandemii.<\/em> Pobrano 19 czerwca 2021 z lokalizacji AP NEWS: <a href=\"https:\/\/apnews.com\/article\/pandemics-demographics-coronavirus-pandemic-birth-rates-covid-19-pandemic-5895d554be280b0ade9068c75872976e\" rel=\"nofollow\">https:\/\/apnews.com\/article\/pandemics-demographics-coronavirus-pandemic-birth-rates-covid-19-pandemic-5895d554be280b0ade9068c75872976e<\/a> <\/p>\n\n<p>Biuro Statystyki Pracy, Departament Pracy Stan\u00f3w Zjednoczonych. (2021).  <em>Informator zawodowy, T\u0142umacze ustni i pisemni.<\/em>  Waszyngton, DC. Pobrano 1 czerwca 2021 z: <a href=\"https:\/\/www.bls.gov\/ooh\/media-and-communication\/interpreters-and-translators.htm\" rel=\"nofollow\">https:\/\/www.bls.gov\/ooh\/media-and-communication\/interpreters-and-translators.htm<\/a> <\/p>\n\n<p>Cieri, C., Maxwell, M., Strassel, S., &amp; Tracey, J. (2016). Kryteria wyboru program\u00f3w dla j\u0119zyk\u00f3w o ograniczonych zasobach. <em>Materia\u0142y z Dziesi\u0105tej Mi\u0119dzynarodowej Konferencji na temat Zasob\u00f3w i Ewaluacji J\u0119zykowej (LREC&#8217;16)<\/em> (s. 4543\u20134549). Portoro\u017e, S\u0142owenia: European Language Resources Association (ELRA). Pobrano 27 czerwca 2021 z: <a href=\"https:\/\/www.aclweb.org\/anthology\/L16-1720\" rel=\"nofollow\">https:\/\/www.aclweb.org\/anthology\/L16-1720<\/a>   <\/p>\n\n<p>Dadas, S. (2019). Repozytorium zasob\u00f3w NLP dla j\u0119zyka polskiego. Pobrano 26 maja 2021 z: <a href=\"https:\/\/github.com\/sdadas\/polish-nlp-resources\/\" rel=\"nofollow\">https:\/\/github.com\/sdadas\/polish-nlp-resources\/<\/a>  <\/p>\n\n<p>Departament Wyzna\u0144 Religijnych oraz Mniejszo\u015bci Narodowych i Etnicznych. (2013).  <em>IV Raport dotycz\u0105cy sytuacji mniejszo\u015bci narodowych i etnicznych oraz j\u0119zyka regionalnego w Rzeczypospolitej Polskiej &#8211; 2013.<\/em>  Warszawa, Polska: Ministerstwo Spraw Wewn\u0119trznych i Administracji. Pobrano 13 czerwca 2021 z: <a href=\"http:\/\/mniejszosci.narodowe.mswia.gov.pl\/download\/86\/14637\/TekstIVRaportu.pdf\" rel=\"nofollow\">http:\/\/mniejszosci.narodowe.mswia.gov.pl\/download\/86\/14637\/TekstIVRaportu.pdf<\/a> <\/p>\n\n<p>Biuro Informacji Publicznej Departamentu Sprawiedliwo\u015bci. (2009, 17 grudnia). <em>By\u0142y t\u0142umacz kontraktowy FBI przyznaje si\u0119 do ujawnienia informacji niejawnych blogerowi.<\/em> Pobrano 9 czerwca 2021 z Departamentu Sprawiedliwo\u015bci Stan\u00f3w Zjednoczonych: <a href=\"https:\/\/www.justice.gov\/opa\/pr\/former-fbi-contract-linguist-pleads-guilty-leaking-classified-information-blogger\" rel=\"nofollow\">https:\/\/www.justice.gov\/opa\/pr\/former-fbi-contract-linguist-pleads-guilty-leaking-classified-information-blogger<\/a> <\/p>\n\n<p>Biuro Informacji Publicznej Departamentu Sprawiedliwo\u015bci. (2018, 23 sierpnia). <em>Kontrahent rz\u0105du federalnego skazany za usuni\u0119cie i przekazanie materia\u0142\u00f3w niejawnych do agencji informacyjnej.<\/em> Pobrano 9 czerwca 2021 z Departamentu Sprawiedliwo\u015bci Stan\u00f3w Zjednoczonych: <a href=\"https:\/\/www.justice.gov\/opa\/pr\/federal-government-contractor-sentenced-removing-and-transmitting-classified-materials-news\" rel=\"nofollow\">https:\/\/www.justice.gov\/opa\/pr\/federal-government-contractor-sentenced-removing-and-transmitting-classified-materials-news<\/a> <\/p>\n\n<p>Biuro Informacji Publicznej Departamentu Sprawiedliwo\u015bci. (2020, 17 sierpnia). <em>By\u0142y oficer CIA aresztowany i oskar\u017cony o szpiegostwo.<\/em> Pobrano 9 czerwca 2021 z Departamentu Sprawiedliwo\u015bci Stan\u00f3w Zjednoczonych: <a href=\"https:\/\/www.justice.gov\/opa\/pr\/former-cia-officer-arrested-and-charged-espionage\" rel=\"nofollow\">https:\/\/www.justice.gov\/opa\/pr\/former-cia-officer-arrested-and-charged-espionage<\/a> <\/p>\n\n<p>Pa\u0144stwowa S\u0142u\u017cba Statystyki Ukrainy. (2001). <em>Liczebno\u015b\u0107 os\u00f3b poszczeg\u00f3lnych grup etnograficznych narodu ukrai\u0144skiego i ich j\u0119zyk ojczysty<\/em>. Pobrano 26 sierpnia 2021 z Og\u00f3lnoukrai\u0144skiego spisu ludno\u015bci 2001: <a href=\"http:\/\/2001.ukrcensus.gov.ua\/results\/nationality_population\/nationality_popul2\/select_5\/?botton=cens_db&amp;box=5.5W&amp;k_t=00&amp;p=0&amp;rz=1_1&amp;rz_b=2_1&amp;n_page=1\" rel=\"nofollow\">http:\/\/2001.ukrcensus.gov.ua\/results\/nationality_population\/nationality_popul2\/select_5\/?botton=cens_db&amp;box=5.5W&amp;k_t=00&amp;p=0&amp;rz=1_1&amp;rz_b=2_1&amp;n_page=1<\/a>  <\/p>\n\n<p>Du\u0107-Fajfer, O. (2016). Literatura a proces rozwoju i rewitalizacja to\u017csamo\u015bci j\u0119zykowej na przyk\u0142adzie literatury \u0142emkowskiej. In J. Olko, T. Wicherkiewicz, &amp; R. Borges (red.), <em>Integral Strategies for Language Revitalization<\/em> (pp. 177-178). Warszawa, Poland: Faculty of &#8222;Artes Liberales\u201e, University of Warsaw. Retrieved from <a href=\"http:\/\/revitalization.al.uw.edu.pl\/Content\/Uploaded\/Documents\/integral-strategies-a91f7f0d-ae2f-4977-8615-90e4b7678fcc.pdf#page=177\" rel=\"nofollow\">http:\/\/revitalization.al.uw.edu.pl\/Content\/Uploaded\/Documents\/integral-strategies-a91f7f0d-ae2f-4977-8615-90e4b7678fcc.pdf#page=177<\/a>    <\/p>\n\n<p>DuPont, Q. (2018, maj). Kryptologiczne pocz\u0105tki t\u0142umaczenia maszynowego, od al-Kindiego do Weavera. (C. Mitchell, &amp; R. Raley, red.) <em>amodern<\/em>(8), 1-20. Pobrano 22 maja 2021 z: <a href=\"http:\/\/amodern.net\/article\/cryptological-origins-machine-translation\/\" rel=\"nofollow\">http:\/\/amodern.net\/article\/cryptological-origins-machine-translation\/<\/a>   <\/p>\n\n<p>Eberhard, D. M., Simons, G. F., &amp; Fennig, C. D. (2021).  <em>Ile j\u0119zyk\u00f3w jest na \u015bwiecie?<\/em>  (D. M. Eberhard, G. F. Simons, &amp; C. D. Fennig, red.) Pobrano 13 czerwca 2021 z Ethnologue: Languages of the World: <a href=\"https:\/\/www.ethnologue.com\/guides\/how-many-languages\" rel=\"nofollow\">https:\/\/www.ethnologue.com\/guides\/how-many-languages<\/a> <\/p>\n\n<p>Fortson IV, B. W. (2004).  <em>J\u0119zyk i kultura indoeuropejska.<\/em> Malden, MA, USA: Blackwell Publishing.<\/p>\n\n<p>Google. (2021, 8 czerwca). <em>Obs\u0142ugiwane j\u0119zyki | Cloud Translation.<\/em> Pobrano 13 czerwca 2021 z Google Cloud: <a href=\"https:\/\/cloud.google.com\/translate\/docs\/languages\" rel=\"nofollow\">https:\/\/cloud.google.com\/translate\/docs\/languages<\/a> <\/p>\n\n<p>Hajlaoui, N., Kolovratnik, D., Vaeyrynen, J., Steinberger, R., &amp; Varga, D. (2014). DCEP &#8211; Cyfrowy Korpus Parlamentu Europejskiego. <em>Konferencja Zasob\u00f3w J\u0119zykowych i Ewaluacji (LREC 2014)<\/em>, (s. 3164-3171). Reykjavik, Islandia. Pobrano 19 czerwca 2021 z: <a href=\"http:\/\/www.lrec-conf.org\/proceedings\/lrec2014\/pdf\/943_Paper.pdf\" rel=\"nofollow\">http:\/\/www.lrec-conf.org\/proceedings\/lrec2014\/pdf\/943_Paper.pdf<\/a>   <\/p>\n\n<p>Horoszczak, J. (2004).  <em>S\u0142ownik \u0142emkowsko-polski, polsko-\u0142emkowski.<\/em>  Warszawa, Polska: Fundacja Wspierania Mniejszo\u015bci \u0141emkowskiej Rutenika.<\/p>\n\n<p>Jassem, W. (2003, czerwiec). Polski. <em>Journal of the International Phonetic Association, 33<\/em>(1), 103-107. doi:10.1017\/S0025100303001191  <\/p>\n\n<p>J\u00f3nsson, H. P., S\u00edmonarson, H. B., Sn\u00e6bjarnarson, V., Steingr\u00edmsson, S., &amp; Loftsson, H. (2020). Eksperymentowanie z r\u00f3\u017cnymi modelami t\u0142umaczenia maszynowego w warunkach \u015brednich zasob\u00f3w. W P. Sojka, I. Kope\u010dek, K. Pala, &amp; A. Hor\u00e1k (red.), <em>Text, Speech, and Dialogue. TSD 2020. Lecture Notes in Computer Science.<\/em> <em>12284<\/em>, s. 2.   Springer, Cham. doi:10.1007\/978-3-030-58323-1_10<\/p>\n\n<p>Ker\u010da, I. (2007). <em>S\u0142ownik rusi\u0144sko-rosyjski<\/em> (t. 1). U\u017chorod, Ukraina: PolyPrynt. <\/p>\n\n<p>Kocmi, T. (2020). Zg\u0142oszenie CUNI dla j\u0119zyka inuktitut w WMT News 2020. <em>Materia\u0142y z 5. Konferencji o T\u0142umaczeniu Maszynowym (WMT)<\/em>, (s. 171\u2013174). Association for Computational Linguistics. Pobrano 19 czerwca 2021 z: <a href=\"https:\/\/www.aclweb.org\/anthology\/2020.wmt-1.14\" rel=\"nofollow\">https:\/\/www.aclweb.org\/anthology\/2020.wmt-1.14<\/a>   <\/p>\n\n<p>Kocmi, T., &amp; Bojar, O. (2019). Zg\u0142oszenie CUNI dla j\u0119zyk\u00f3w o ograniczonych zasobach w WMT News 2019. <em>Materia\u0142y z Czwartej Konferencji o T\u0142umaczeniu Maszynowym (WMT).<\/em> <em>Tom 2: Artyku\u0142y o zadaniach wsp\u00f3lnych (Dzie\u0144 1)<\/em>, s. 234\u2013240. Florencja, W\u0142ochy: Association for Computational Linguistics. Pobrano 13 czerwca 2021 z: <a href=\"https:\/\/www.aclweb.org\/anthology\/W19-5322.pdf\" rel=\"nofollow\">https:\/\/www.aclweb.org\/anthology\/W19-5322.pdf<\/a>   <\/p>\n\n<p>Lewis-Kraus, G. (2016, 14 grudnia). Wielkie przebudzenie SI (Going Neural). <em>The New York Times<\/em>, s. 40. Pobrano z: <a href=\"https:\/\/www.nytimes.com\/2016\/12\/14\/magazine\/the-great-ai-awakening.html\" rel=\"nofollow\">https:\/\/www.nytimes.com\/2016\/12\/14\/magazine\/the-great-ai-awakening.html<\/a>  <\/p>\n\n<p>Macken, L., Prou, D., &amp; Tezcan, A. (2020, 23 kwietnia). Kwantyfikacja wp\u0142ywu t\u0142umaczenia maszynowego w procesie produkcji t\u0142umacze\u0144 wysokiej jako\u015bci. <em>Informatics, 7<\/em>(2). doi:10.3390\/informatics7020012  <\/p>\n\n<p>Maximova, S., Noyanzina, O., Omelchenko, D., &amp; Maximova, M. (2018). The Russian-speakers in the CIS countries: migration activity and preservation of the Russian language. W: P. Vladimirovich (red.), <em>2018 International Scientific Conference &#8222;Investment, Construction, Real Estate: New Technologies and Special-Purpose Development Priorities\u201e (ICRE 2018)<\/em>, <em>212.<\/em> Irkuck, Rosja. doi:10.1051\/matecconf\/201821210005   <\/p>\n\n<p>Microsoft. (b.d.). <em>W\u0142\u0105czanie i wy\u0142\u0105czanie trybu samolotowego.<\/em> Pobrano 9 czerwca 2021 z Microsoft: <a href=\"https:\/\/support.microsoft.com\/en-us\/windows\/turn-airplane-mode-on-or-off-f2c2e0a1-706f-ff26-c4b2-4a37f9796df1\" rel=\"nofollow\">https:\/\/support.microsoft.com\/en-us\/windows\/turn-airplane-mode-on-or-off-f2c2e0a1-706f-ff26-c4b2-4a37f9796df1<\/a> <\/p>\n\n<p>NATO Review. (b.d.). <em>O nas.<\/em> Pobrano 9 czerwca 2021 z Organizacji Traktatu P\u00f3\u0142nocnoatlantyckiego: <a href=\"https:\/\/www.nato.int\/docu\/review\/about.html\" rel=\"nofollow\">https:\/\/www.nato.int\/docu\/review\/about.html<\/a> <\/p>\n\n<p>Ng, N., Yee, K., Baevski, A., Ott, M., Auli, M., &amp; Edunov, S. (2019, sierpie\u0144). Zg\u0142oszenie Facebook FAIR do zadania t\u0142umaczenia wiadomo\u015bci WMT19. <em>Materia\u0142y z Czwartej Konferencji o T\u0142umaczeniu Maszynowym (Tom 2: Artyku\u0142y o zadaniach wsp\u00f3lnych, Dzie\u0144 1)<\/em>, 314-319. Florencja, W\u0142ochy: Association for Computational Linguistics. doi:10.18653\/v1\/W19-5333   <\/p>\n\n<p>Ott, M., Edunov, S., Baevski, A., Fan, A., Gross, S., Ng, N., . . . Auli, M. (2019). fairseq: Szybkie, rozszerzalne narz\u0119dzie do modelowania sekwencyjnego. <em>Materia\u0142y z NAACL-HLT 2019: Demonstracje.<\/em> <em>Materia\u0142y z Konferencji P\u00f3\u0142nocnoameryka\u0144skiego Oddzia\u0142u Stowarzyszenia Lingwistyki Komputerowej 2019 (Demonstracje)<\/em>, s. 48-53. Minneapolis, MN: Association for Computational Linguistics. doi:10.18653\/v1\/N19-4009   <\/p>\n\n<p>Papineni, K., Roukos, S., Ward, T., &amp; Zhu, W.-J. (2002). BLEU: Metoda automatycznej ewaluacji t\u0142umaczenia maszynowego. <em>Materia\u0142y z 40. Dorocznego Spotkania Stowarzyszenia Lingwistyki Komputerowej<\/em> (s. 311-318). Filadelfia, PA: Annual Meeting of the Association for Computational Linguistics. <\/p>\n\n<p>Post, M. (2018, 12 wrze\u015bnia). Apel o jasno\u015b\u0107 w raportowaniu wynik\u00f3w BLEU. <em>Amazon Research<\/em>. <\/p>\n\n<p>Rabus, A., &amp; Scherrer, Y. (2017). Indukcja leksykonu dla m\u00f3wionego j\u0119zyka rusi\u0144skiego \u2013 wyzwania i wyniki. <em>Materia\u0142y z 6. Warsztat\u00f3w Przetwarzania J\u0119zyka Naturalnego dla J\u0119zyk\u00f3w Ba\u0142to-S\u0142owia\u0144skich<\/em>, (s. 27-32). Walencja, Hiszpania.  <\/p>\n\n<p>Scherrer, Y., &amp; Rabus, A. (2017). Wielo\u017ar\u00f3d\u0142owe tagowanie morfosk\u0142adniowe dla m\u00f3wionego j\u0119zyka rusi\u0144skiego. <em>Materia\u0142y z Czwartych Warsztat\u00f3w NLP dla Podobnych J\u0119zyk\u00f3w, Odmian i Dialekt\u00f3w<\/em> (s. 84-92). Walencja, Hiszpania: Association for Computational Linguistics. doi:<a href=\"http:\/\/dx.doi.org\/10.18653\/v1\/W17-1210\" rel=\"nofollow\">http:\/\/dx.doi.org\/10.18653\/v1\/W17-1210<\/a>   <\/p>\n\n<p>Scherrer, Y., &amp; Rabus, A. (2019, wrzesie\u0144). Neuronowe tagowanie morfosk\u0142adniowe dla j\u0119zyka rusi\u0144skiego. (R. Mitkov, red.) <em>Natural Language Engineering, 25<\/em>(5), s. 633-650. doi:10.1017\/S1351324919000287   <\/p>\n\n<p>Shea, J. (2016, 5 grudnia). What can we learn today from the 'three wise men&#8217;? <em>NATO Review<\/em>. Pobrano 26 maja 2021, z <a href=\"https:\/\/www.nato.int\/docu\/review\/articles\/2016\/12\/05\/what-can-we-learn-today-from-the-three-wise-men\/index.html\" rel=\"nofollow\">https:\/\/www.nato.int\/docu\/review\/articles\/2016\/12\/05\/what-can-we-learn-today-from-the-three-wise-men\/index.html<\/a>  <\/p>\n\n<p>Grupa Ekspert\u00f3w Ad Hoc UNESCO ds. J\u0119zyk\u00f3w Zagro\u017conych. (2003). \u017bywotno\u015b\u0107 i zagro\u017cenie j\u0119zyk\u00f3w.  <em>Mi\u0119dzynarodowe Spotkanie Ekspert\u00f3w w sprawie Programu UNESCO Ochrony J\u0119zyk\u00f3w Zagro\u017conych.<\/em>  Pary\u017c: UNESCO. Pobrano 19 czerwca 2021 z: <a href=\"http:\/\/www.unesco.org\/new\/fileadmin\/MULTIMEDIA\/HQ\/CLT\/pdf\/Language_vitality_and_endangerment_EN.pdf\" rel=\"nofollow\">http:\/\/www.unesco.org\/new\/fileadmin\/MULTIMEDIA\/HQ\/CLT\/pdf\/Language_vitality_and_endangerment_EN.pdf<\/a> <\/p>\n\n<p>Vasmer, M. J. (b.d.).  <em>S\u0142ownik etymologiczny j\u0119zyka rosyjskiego.<\/em>  (O. N. Truba\u010d\u00ebv, t\u0142um.) Moskwa: AST (Orygina\u0142 opublikowany w 1950). <\/p>\n\n<p>Watral, M. (2015, luty). Rewitalizacja \u0141emk\u00f3w. <em>Znak<\/em>(717), 38-44. Pobrano 24 sierpnia 2021 z: <a href=\"https:\/\/www.miesiecznik.znak.com.pl\/7172015marta-wartalrewitalizacja-lemkow\/\" rel=\"nofollow\">https:\/\/www.miesiecznik.znak.com.pl\/7172015marta-wartalrewitalizacja-lemkow\/<\/a>  <\/p>\n\n<p>Watral, M. (2016). Postawy wzgl\u0119dem j\u0119zyka \u0142emkowskiego \u2013 wz\u00f3r i jego realizacja. In J. Olko, T. Wicherkiewicz, &amp; R. Borges (red.), <em>Integral Strategies for Language Revitalization<\/em> (pp. 221-260). Warsaw, Poland: Faculty of &#8222;Artes Liberales\u201e, University of Warsaw. Retrieved August 24, 2021, from <a href=\"http:\/\/revitalization.al.uw.edu.pl\/Content\/Uploaded\/Documents\/integral-strategies-a91f7f0d-ae2f-4977-8615-90e4b7678fcc.pdf#page=243\" rel=\"nofollow\">http:\/\/revitalization.al.uw.edu.pl\/Content\/Uploaded\/Documents\/integral-strategies-a91f7f0d-ae2f-4977-8615-90e4b7678fcc.pdf#page=243<\/a>    <\/p>\n\n<p>Ziemski, M., Junczys-Dowmunt, M., &amp; Pouliquen, B. (2016). Korpus r\u00f3wnoleg\u0142y Narod\u00f3w Zjednoczonych v1.0. <em>Materia\u0142y z Dziesi\u0105tej Mi\u0119dzynarodowej Konferencji na temat Zasob\u00f3w i Ewaluacji J\u0119zykowej (LREC&#8217;16)<\/em>, (s. 3530\u20133534). Portoro\u017e, S\u0142owenia. Pobrano z: <a href=\"https:\/\/www.aclweb.org\/anthology\/L16-1561\" rel=\"nofollow\">https:\/\/www.aclweb.org\/anthology\/L16-1561<\/a>   <\/p>\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n","protected":false},"excerpt":{"rendered":"<p>\u2705 Ta wersja artyku\u0142u zosta\u0142a przyj\u0119ta do publikacji po recenzji, ale nie jest Wersj\u0105 Ostateczn\u0105 i nie odzwierciedla ulepsze\u0144 po akceptacji ani \u017cadnych poprawek. Wersja Ostateczna jest dost\u0119pna online pod tym linkiem. Korzystanie z tej Zaakceptowanej Wersji podlega warunkom u\u017cytkowania Zaakceptowanego Manuskryptu wydawcy. Streszczenie Szybko wsp\u00f3\u0142dzielone i wsp\u00f3lnie wykorzystywane szkolenia mi\u0119dzy partnerami koalicyjnymi musz\u0105 by\u0107 [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[165],"tags":[166,167,350],"class_list":["post-10670","post","type-post","status-publish","format-standard","hentry","category-prace","tag-lemko","tag-neuronowe-tlumaczenie-maszynowe","tag-si"],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v27.3 (Yoast SEO v27.4) - https:\/\/yoast.com\/product\/yoast-seo-premium-wordpress\/ -->\n<title>Tak, m\u00f3wi\u0119... T\u0142umaczenie maszynowe AI w szkoleniu wieloj\u0119zycznym (2021)<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/\" \/>\n<meta property=\"og:locale\" content=\"pl_PL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Tak, m\u00f3wi\u0119... T\u0142umaczenie maszynowe AI w szkoleniu wieloj\u0119zycznym (2021)\" \/>\n<meta property=\"og:description\" content=\"\u2705 Ta wersja artyku\u0142u zosta\u0142a przyj\u0119ta do publikacji po recenzji, ale nie jest Wersj\u0105 Ostateczn\u0105 i nie odzwierciedla ulepsze\u0144 po akceptacji ani \u017cadnych poprawek. Wersja Ostateczna jest dost\u0119pna online pod tym linkiem. Korzystanie z tej Zaakceptowanej Wersji podlega warunkom u\u017cytkowania Zaakceptowanego Manuskryptu wydawcy. Streszczenie Szybko wsp\u00f3\u0142dzielone i wsp\u00f3lnie wykorzystywane szkolenia mi\u0119dzy partnerami koalicyjnymi musz\u0105 by\u0107 [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/\" \/>\n<meta property=\"og:site_name\" content=\"Petro Orynycz\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/orynycz\" \/>\n<meta property=\"article:author\" content=\"https:\/\/www.facebook.com\/orynycz\" \/>\n<meta property=\"article:published_time\" content=\"2021-12-07T12:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2025-12-13T18:04:38+00:00\" \/>\n<meta name=\"author\" content=\"Admin\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@OrynyczP\" \/>\n<meta name=\"twitter:label1\" content=\"Napisane przez\" \/>\n\t<meta name=\"twitter:data1\" content=\"Admin\" \/>\n\t<meta name=\"twitter:label2\" content=\"Szacowany czas czytania\" \/>\n\t<meta name=\"twitter:data2\" content=\"40 minut\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\\\/\"},\"author\":{\"name\":\"Admin\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/person\\\/81acf6b0d8344b8d8832f55a0e4a9f63\"},\"headline\":\"Tak, m\u00f3wi\u0119&#8230; T\u0142umaczenie maszynowe AI w szkoleniu wieloj\u0119zycznym (2021)\",\"datePublished\":\"2021-12-07T12:00:00+00:00\",\"dateModified\":\"2025-12-13T18:04:38+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\\\/\"},\"wordCount\":7820,\"commentCount\":0,\"publisher\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\"},\"keywords\":[\"\u0142emkowski\",\"neuronowe t\u0142umaczenie maszynowe (NMT)\",\"sztuczna inteligencja (SI)\"],\"articleSection\":[\"Recenzowane artyku\u0142y naukowe\"],\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\\\/#respond\"]}],\"copyrightYear\":\"2021\",\"copyrightHolder\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\"},\"accessibilityFeature\":[\"tableOfContents\"]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\\\/\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\\\/\",\"name\":\"Tak, m\u00f3wi\u0119... T\u0142umaczenie maszynowe AI w szkoleniu wieloj\u0119zycznym (2021)\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#website\"},\"datePublished\":\"2021-12-07T12:00:00+00:00\",\"dateModified\":\"2025-12-13T18:04:38+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\\\/#breadcrumb\"},\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\\\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/nauka\\\/prace\\\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Strona g\u0142\u00f3wna\",\"item\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Nauka\",\"item\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/moc\\\/nauka\\\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Recenzowane artyku\u0142y naukowe\",\"item\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/moc\\\/nauka\\\/prace\\\/\"},{\"@type\":\"ListItem\",\"position\":4,\"name\":\"2021\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#website\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/\",\"name\":\"Orynycz.com\",\"description\":\"Naukowiec. In\u017cynier AI. Lingwista.\",\"publisher\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\"},\"alternateName\":\"\u041e\u0440\u0438\u043d\u0438\u0447.com\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pl-PL\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/#organization\",\"name\":\"orynycz.com\",\"alternateName\":\"\u041e\u0440\u0438\u043d\u0438\u0447.com\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/logo-1.jpg\",\"contentUrl\":\"https:\\\/\\\/www.orynycz.com\\\/wp-content\\\/uploads\\\/2025\\\/12\\\/logo-1.jpg\",\"width\":512,\"height\":512,\"caption\":\"orynycz.com\"},\"image\":{\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/orynycz\"],\"publishingPrinciples\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"ownershipFundingInfo\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"actionableFeedbackPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"correctionsPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"ethicsPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"diversityPolicy\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\",\"diversityStaffingReport\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/polityka\\\/\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/www.orynycz.com\\\/pl\\\/#\\\/schema\\\/person\\\/81acf6b0d8344b8d8832f55a0e4a9f63\",\"name\":\"Admin\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p\",\"caption\":\"Admin\"},\"description\":\"I am a scientist (ORCID iD 0000-0003-3094-9156), software engineer, computational linguist, localization and natural language engineer, Slavist, and Silicon Valley consultant. His research currently focuses on artificial intelligence (AI), neural machine translation (NMT), and hybrid systems to revitalize endangered, indigenous languages like Lemko. He received his degree in Russian at the Institute of East Slavic Philology of Jagiellonian University in Cracow, Poland, where he worked for Google amid its 2016 neural machine translation artificial intelligence breakthrough. His engines were recently mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25, Issue 5, page 634). Mr. Orynycz also has two decades of transatlantic experience as a linguist specializing in Russian, Polish, Ukrainian, Rusyn and Lemko for top language service providers, national defense, heavy industry, Raytheon, Amazon, Siemens, Mercedes-Benz, Daimler, investigators, philanthropists, and scientists.\",\"sameAs\":[\"https:\\\/\\\/www.orynycz.com\",\"https:\\\/\\\/www.facebook.com\\\/orynycz\",\"https:\\\/\\\/www.linkedin.com\\\/in\\\/orynycz\\\/\",\"https:\\\/\\\/x.com\\\/OrynyczP\",\"https:\\\/\\\/www.youtube.com\\\/channel\\\/UCOBzL010xr3XfzJcEZbaZyQ\"],\"gender\":\"male\",\"award\":[\"Engines mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25\",\"Issue 5\",\"page 634)\"],\"knowsAbout\":[\"Natural Language Processing\",\"Machine Translation\"],\"knowsLanguage\":[\"Ukrainian\",\"Lemko\",\"English\",\"Polish\",\"Russian\",\"Hungarian\"],\"jobTitle\":\"scientist\",\"worksFor\":\"Orynycz.com\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"Tak, m\u00f3wi\u0119... T\u0142umaczenie maszynowe AI w szkoleniu wieloj\u0119zycznym (2021)","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/","og_locale":"pl_PL","og_type":"article","og_title":"Tak, m\u00f3wi\u0119... T\u0142umaczenie maszynowe AI w szkoleniu wieloj\u0119zycznym (2021)","og_description":"\u2705 Ta wersja artyku\u0142u zosta\u0142a przyj\u0119ta do publikacji po recenzji, ale nie jest Wersj\u0105 Ostateczn\u0105 i nie odzwierciedla ulepsze\u0144 po akceptacji ani \u017cadnych poprawek. Wersja Ostateczna jest dost\u0119pna online pod tym linkiem. Korzystanie z tej Zaakceptowanej Wersji podlega warunkom u\u017cytkowania Zaakceptowanego Manuskryptu wydawcy. Streszczenie Szybko wsp\u00f3\u0142dzielone i wsp\u00f3lnie wykorzystywane szkolenia mi\u0119dzy partnerami koalicyjnymi musz\u0105 by\u0107 [&hellip;]","og_url":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/","og_site_name":"Petro Orynycz","article_publisher":"https:\/\/www.facebook.com\/orynycz","article_author":"https:\/\/www.facebook.com\/orynycz","article_published_time":"2021-12-07T12:00:00+00:00","article_modified_time":"2025-12-13T18:04:38+00:00","author":"Admin","twitter_card":"summary_large_image","twitter_creator":"@OrynyczP","twitter_misc":{"Napisane przez":"Admin","Szacowany czas czytania":"40 minut"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/#article","isPartOf":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/"},"author":{"name":"Admin","@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/person\/81acf6b0d8344b8d8832f55a0e4a9f63"},"headline":"Tak, m\u00f3wi\u0119&#8230; T\u0142umaczenie maszynowe AI w szkoleniu wieloj\u0119zycznym (2021)","datePublished":"2021-12-07T12:00:00+00:00","dateModified":"2025-12-13T18:04:38+00:00","mainEntityOfPage":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/"},"wordCount":7820,"commentCount":0,"publisher":{"@id":"https:\/\/www.orynycz.com\/#organization"},"keywords":["\u0142emkowski","neuronowe t\u0142umaczenie maszynowe (NMT)","sztuczna inteligencja (SI)"],"articleSection":["Recenzowane artyku\u0142y naukowe"],"inLanguage":"pl-PL","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/#respond"]}],"copyrightYear":"2021","copyrightHolder":{"@id":"https:\/\/www.orynycz.com\/#organization"},"accessibilityFeature":["tableOfContents"]},{"@type":"WebPage","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/","url":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/","name":"Tak, m\u00f3wi\u0119... T\u0142umaczenie maszynowe AI w szkoleniu wieloj\u0119zycznym (2021)","isPartOf":{"@id":"https:\/\/www.orynycz.com\/pl\/#website"},"datePublished":"2021-12-07T12:00:00+00:00","dateModified":"2025-12-13T18:04:38+00:00","breadcrumb":{"@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/#breadcrumb"},"inLanguage":"pl-PL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/www.orynycz.com\/pl\/nauka\/prace\/tak-mowie-tlumaczenie-maszynowe-ai-w-szkoleniu-wielojezycznym-2021\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Strona g\u0142\u00f3wna","item":"https:\/\/www.orynycz.com\/pl\/"},{"@type":"ListItem","position":2,"name":"Nauka","item":"https:\/\/www.orynycz.com\/pl\/moc\/nauka\/"},{"@type":"ListItem","position":3,"name":"Recenzowane artyku\u0142y naukowe","item":"https:\/\/www.orynycz.com\/pl\/moc\/nauka\/prace\/"},{"@type":"ListItem","position":4,"name":"2021"}]},{"@type":"WebSite","@id":"https:\/\/www.orynycz.com\/pl\/#website","url":"https:\/\/www.orynycz.com\/pl\/","name":"Orynycz.com","description":"Naukowiec. In\u017cynier AI. Lingwista.","publisher":{"@id":"https:\/\/www.orynycz.com\/#organization"},"alternateName":"\u041e\u0440\u0438\u043d\u0438\u0447.com","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.orynycz.com\/pl\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pl-PL"},{"@type":"Organization","@id":"https:\/\/www.orynycz.com\/#organization","name":"orynycz.com","alternateName":"\u041e\u0440\u0438\u043d\u0438\u0447.com","url":"https:\/\/www.orynycz.com\/pl\/","logo":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/logo\/image\/","url":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/logo-1.jpg","contentUrl":"https:\/\/www.orynycz.com\/wp-content\/uploads\/2025\/12\/logo-1.jpg","width":512,"height":512,"caption":"orynycz.com"},"image":{"@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/orynycz"],"publishingPrinciples":"https:\/\/www.orynycz.com\/pl\/polityka\/","ownershipFundingInfo":"https:\/\/www.orynycz.com\/pl\/polityka\/","actionableFeedbackPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","correctionsPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","ethicsPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","diversityPolicy":"https:\/\/www.orynycz.com\/pl\/polityka\/","diversityStaffingReport":"https:\/\/www.orynycz.com\/pl\/polityka\/"},{"@type":"Person","@id":"https:\/\/www.orynycz.com\/pl\/#\/schema\/person\/81acf6b0d8344b8d8832f55a0e4a9f63","name":"Admin","image":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/secure.gravatar.com\/avatar\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p","url":"https:\/\/secure.gravatar.com\/avatar\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/9a38941f48011a0de6d533516cefcfcbff0b865d9bbce556ca1778430b8139cf?s=96&d=initials&r=pg&initials=p","caption":"Admin"},"description":"I am a scientist (ORCID iD 0000-0003-3094-9156), software engineer, computational linguist, localization and natural language engineer, Slavist, and Silicon Valley consultant. His research currently focuses on artificial intelligence (AI), neural machine translation (NMT), and hybrid systems to revitalize endangered, indigenous languages like Lemko. He received his degree in Russian at the Institute of East Slavic Philology of Jagiellonian University in Cracow, Poland, where he worked for Google amid its 2016 neural machine translation artificial intelligence breakthrough. His engines were recently mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25, Issue 5, page 634). Mr. Orynycz also has two decades of transatlantic experience as a linguist specializing in Russian, Polish, Ukrainian, Rusyn and Lemko for top language service providers, national defense, heavy industry, Raytheon, Amazon, Siemens, Mercedes-Benz, Daimler, investigators, philanthropists, and scientists.","sameAs":["https:\/\/www.orynycz.com","https:\/\/www.facebook.com\/orynycz","https:\/\/www.linkedin.com\/in\/orynycz\/","https:\/\/x.com\/OrynyczP","https:\/\/www.youtube.com\/channel\/UCOBzL010xr3XfzJcEZbaZyQ"],"gender":"male","award":["Engines mentioned in the Cambridge University Press journal Natural Language Engineering (Volume 25","Issue 5","page 634)"],"knowsAbout":["Natural Language Processing","Machine Translation"],"knowsLanguage":["Ukrainian","Lemko","English","Polish","Russian","Hungarian"],"jobTitle":"scientist","worksFor":"Orynycz.com"}]}},"_links":{"self":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts\/10670","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/comments?post=10670"}],"version-history":[{"count":1,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts\/10670\/revisions"}],"predecessor-version":[{"id":10672,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/posts\/10670\/revisions\/10672"}],"wp:attachment":[{"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/media?parent=10670"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/categories?post=10670"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.orynycz.com\/pl\/wp-json\/wp\/v2\/tags?post=10670"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}