Jestem recenzowanym autorem i prelegentem na największej na świecie konferencji szkoleniowej w dziedzinie obronności (I/ITSEC), a także na międzynarodowych konferencjach dotyczących interakcji człowiek-komputer (HCI), publikowanych przez Springer Nature, jedno z najbardziej prestiżowych, o najwyższym wpływie i najdłużej nieprzerwanie działających wydawnictw akademickich.
2023
Zdobywanie serc i języków: studium przypadku tłumaczenia z polskiego na język łemkowski
Utrata języka to nie tylko strata kulturowa—to strata operacyjna. Ta praca przedstawia i ocenia tłumaczenie maszynowe polski ↔ łemkowski (ekspercki system regułowy + Transformer NMT) oraz porównuje oba kierunki za pomocą metryk wspieranych przez DARPA (BLEU, TER), włączając punkt odniesienia w postaci Google Translate.
Kluczowe wkłady
- Tworzy stos tłumaczeniowy polski ↔ łemkowski łączący ekspercki system regułowy i Transformer NMT dla języka o ograniczonych zasobach.
- Ocenia oba kierunki (PL→LEM, LEM→PL) za pomocą standaryzowanych, powtarzalnych metryk (BLEU + TER).
- Łączy tłumaczenie maszynowe języków mniejszościowych z realnymi efektami: skutecznością szkolenia, dostępnością i odpornością w środowiskach o kwestionowanych informacjach.
Kluczowe wyniki
- PL → LEM: system ekspercki BLEU 29,49 / TER 53,73; raportowany jako ~6,5× lepszy od Google Translate w tłumaczeniu polski→ukraiński według BLEU.
- LEM → PL: system ekspercki BLEU 31,13 / TER 54,10.
- Transformer (PL → LEM): BLEU 15,90 (30k kroków)—powyżej bazowego punktu odniesienia, poniżej systemu eksperckiego w tej konfiguracji.
BLEUkitne niebo dla rewitalizacji zagrożonych języków: Dokładność tłumaczenia łemkowskiego i ukraińskiego dzięki neuronowej sztucznej inteligencji wzrasta
Utrata języka mniejszościowego to nie tylko strata kulturowa—to mierzalna szkoda. Ta praca przedstawia znaczącą aktualizację LemkoTran.com, łączącą generowanie regułowe z neuronowym MT, dzięki czemu użytkownicy języka łemkowskiego i nowi uczący się mogą natychmiast czytać i pisać. Dodaję generatory świadome morfologii dla rzeczowników/czasowników/przymiotników, rozszerzam leksykon, egzekwuję 9 518 obowiązkowych testów kontroli jakości i porównuję jakość tłumaczenia za pomocą BLEU, TER i chrF z różnymi usługami Google Translate.
Kluczowe wkłady
- Ulepsza hybrydowy stos LemkoTran (regułowy + neuronowy) do tłumaczenia na język łemkowski i z języka łemkowskiego z generowaniem świadomym morfologii.
- Wzmacnia poprawność poprzez 9 518 testów opartych na kodyfikacji, przekształcając jakość tłumaczenia w egzekwowalną kontrolę jakości.
- Rozszerza pokrycie językowe o ~1 585 elementów słownictwa opartego na regułach plus generatory zasilane przez 877 lematów + 708 wpisów glosariusza.
- Rygorystycznie testuje używając domyślnych ustawień SacreBLEU i trzech uzupełniających się metryk (BLEU / TER / chrF) dla powtarzalnych porównań.
- Pokazuje inżynieryjną ścieżkę do de-interferencji: moduły oparte na regułach umożliwiają usuwanie zapożyczeń / przenikania języka dominującego (gdzie pożądane).
Kluczowe wyniki
- EN → LEM: BLEU wzrasta do 8,48 (+35% w porównaniu z poprzednią publikacją), raportowany jako ~4× lepszy od najlepszej usługi Google Translate według BLEU.
- LEM → EN: BLEU osiąga 17,95 (+23% w porównaniu z poprzednią pracą), raportowany jako ~16% wyższy niż usługa ukraińska Google Translate (najlepiej działający punkt odniesienia).
- Według wszystkich metryk: LemkoTran przewyższa Google we wszystkich miarach BLEU + TER + chrF, przy czym Google często błędnie identyfikuje język łemkowski (częste wykrywanie jako ukraiński/rosyjski/białoruski).
2022
Powiedz to dobrze: Tłumaczenie maszynowe oparte na sztucznej inteligencji umożliwia nowym użytkownikom rewitalizację języka łemkowskiego
Sztuczna inteligencja może dać zagrożonym językom przewagę: nowi użytkownicy mogą od pierwszego dnia tworzyć zdania bliższe normie literackiej. Powiedz to dobrze (2022) przedstawia niskobudżetowy proces (transfer learning + tłumaczenie maszynowe oparte na regułach), udostępnia publicznie system tłumaczenia z angielskiego na łemkowski i ocenia jakość za pomocą metody BLEU.
Kluczowe wkłady
- Transfer learning + silnik oparty na regułach dla języka o ograniczonych zasobach.
- Ocena ilościowa (BLEU), nie subiektywne odczucia.
- Wdrożony jako narzędzie publiczne (LemkoTran).
Kluczowe wyniki
- System angielsko-łemkowski: BLEU 6,28 (raportowany).
- Porównany z wynikami tłumaczeń Google dla języka ukraińskiego/rosyjskiego/polskiego (raportowane).
- Zbudowany z myślą o ograniczonych zasobach (przyjazny dla laptopów/pracy offline).
2021
Tak, mówię… Tłumaczenie maszynowe AI w szkoleniu wielojęzycznym (2021)
Ten artykuł pokazuje, jak tłumaczenie maszynowe oparte na sieciach neuronowych (NMT) może przełamać wąskie gardła lokalizacji w szkoleniach koalicyjnych: zamiast czekać miesiące na tłumaczenie wykonane przez człowieka, można wdrożyć wielojęzyczne treści w ciągu dni/tygodni, wykorzystując NMT do szybkiej lokalizacji.
Kluczowe wyniki
- Rosyjski: +1 169,51% szybciej i +58,37% dokładniej w porównaniu z bazową wersją profesjonalnego lingwisty.
- Polski: +17,29% dokładniej i +488,45% szybciej w porównaniu z człowiekiem.
- Łemkowski: silnik „pierwszy na świecie”, zgłoszono BLEU 14.57.
Kluczowe wkłady
- Lokalizacja klatek jako wąskie gardło operacyjne i cele w zakresie harmonogramów „szkolenie dziś wieczorem / w przyszłym tygodniu”.
- Buduje i ocenia silniki NMT na materiałach szkoleniowych NATO, używając BLEU jako metryki oceny.
- Demonstruje praktyczny przepływ pracy na niedrogim, odizolowanym od sieci laptopie (realistyczne ograniczenia wdrożeniowe).
