Jestem recenzowanym autorem i prelegentem na największej na świecie konferencji szkoleniowej w dziedzinie obronności (I/ITSEC), a także na międzynarodowych konferencjach dotyczących interakcji człowiek-komputer (HCI), publikowanych przez Springer Nature, jedno z najbardziej prestiżowych, o najwyższym wpływie i najdłużej nieprzerwanie działających wydawnictw akademickich.


2023

Zdobywanie serc i języków: studium przypadku tłumaczenia z polskiego na język łemkowski

Utrata języka to nie tylko strata kulturowa—to strata operacyjna. Ta praca przedstawia i ocenia tłumaczenie maszynowe polski ↔ łemkowski (ekspercki system regułowy + Transformer NMT) oraz porównuje oba kierunki za pomocą metryk wspieranych przez DARPA (BLEU, TER), włączając punkt odniesienia w postaci Google Translate.

Kluczowe wkłady

  • Tworzy stos tłumaczeniowy polski ↔ łemkowski łączący ekspercki system regułowy i Transformer NMT dla języka o ograniczonych zasobach.
  • Ocenia oba kierunki (PL→LEM, LEM→PL) za pomocą standaryzowanych, powtarzalnych metryk (BLEU + TER).
  • Łączy tłumaczenie maszynowe języków mniejszościowych z realnymi efektami: skutecznością szkolenia, dostępnością i odpornością w środowiskach o kwestionowanych informacjach.

Kluczowe wyniki

  • PL → LEM: system ekspercki BLEU 29,49 / TER 53,73; raportowany jako ~6,5× lepszy od Google Translate w tłumaczeniu polski→ukraiński według BLEU.
  • LEM → PL: system ekspercki BLEU 31,13 / TER 54,10.
  • Transformer (PL → LEM): BLEU 15,90 (30k kroków)—powyżej bazowego punktu odniesienia, poniżej systemu eksperckiego w tej konfiguracji.

BLEUkitne niebo dla rewitalizacji zagrożonych języków: dokładność neuronowego tłumaczenia AI dla języków Lemko Rusyn and Ukrainian gwałtownie wzrasta

Utrata języka mniejszościowego to nie tylko strata kulturowa—to mierzalna szkoda. Ta praca przedstawia znaczącą aktualizację LemkoTran.com, łączącą generowanie regułowe z neuronowym MT, dzięki czemu użytkownicy języka łemkowskiego i nowi uczący się mogą natychmiast czytać i pisać. Dodaję generatory świadome morfologii dla rzeczowników/czasowników/przymiotników, rozszerzam leksykon, egzekwuję 9 518 obowiązkowych testów kontroli jakości i porównuję jakość tłumaczenia za pomocą BLEU, TER i chrF z różnymi usługami Google Translate.

Kluczowe wkłady

  • Ulepsza hybrydowy stos LemkoTran (regułowy + neuronowy) do tłumaczenia na język łemkowski i z języka łemkowskiego z generowaniem świadomym morfologii.
  • Wzmacnia poprawność poprzez 9 518 testów opartych na kodyfikacji, przekształcając jakość tłumaczenia w egzekwowalną kontrolę jakości.
  • Rozszerza pokrycie językowe o ~1 585 elementów słownictwa opartego na regułach plus generatory zasilane przez 877 lematów + 708 wpisów glosariusza.
  • Rygorystycznie testuje używając domyślnych ustawień SacreBLEU i trzech uzupełniających się metryk (BLEU / TER / chrF) dla powtarzalnych porównań.
  • Pokazuje inżynieryjną ścieżkę do de-interferencji: moduły oparte na regułach umożliwiają usuwanie zapożyczeń / przenikania języka dominującego (gdzie pożądane).

Kluczowe wyniki

  • EN → LEM: BLEU wzrasta do 8,48 (+35% w porównaniu z poprzednią publikacją), raportowany jako ~4× lepszy od najlepszej usługi Google Translate według BLEU.
  • LEM → EN: BLEU osiąga 17,95 (+23% w porównaniu z poprzednią pracą), raportowany jako ~16% wyższy niż usługa ukraińska Google Translate (najlepiej działający punkt odniesienia).
  • Według wszystkich metryk: LemkoTran przewyższa Google we wszystkich miarach BLEU + TER + chrF, przy czym Google często błędnie identyfikuje język łemkowski (częste wykrywanie jako ukraiński/rosyjski/białoruski).

2022

Powiedz to dobrze: Tłumaczenie maszynowe oparte na sztucznej inteligencji umożliwia nowym użytkownikom rewitalizację języka łemkowskiego

Sztuczna inteligencja może dać zagrożonym językom przewagę: nowi użytkownicy mogą od pierwszego dnia tworzyć zdania bliższe normie literackiej. Powiedz to dobrze (2022) przedstawia niskobudżetowy proces (transfer learning + tłumaczenie maszynowe oparte na regułach), udostępnia publicznie system tłumaczenia z angielskiego na łemkowski i ocenia jakość za pomocą metody BLEU.

Kluczowe wkłady

  • Transfer learning + silnik oparty na regułach dla języka o ograniczonych zasobach.
  • Ocena ilościowa (BLEU), nie subiektywne odczucia.
  • Wdrożony jako narzędzie publiczne (LemkoTran).

Kluczowe wyniki

  • System angielsko-łemkowski: BLEU 6,28 (raportowany).
  • Porównany z wynikami tłumaczeń Google dla języka ukraińskiego/rosyjskiego/polskiego (raportowane).
  • Zbudowany z myślą o ograniczonych zasobach (przyjazny dla laptopów/pracy offline).

2021

Tak, mówię… Tłumaczenie maszynowe AI w szkoleniu wielojęzycznym (2021)


Ten artykuł pokazuje, jak tłumaczenie maszynowe oparte na sieciach neuronowych (NMT) może przełamać wąskie gardła lokalizacji w szkoleniach koalicyjnych: zamiast czekać miesiące na tłumaczenie wykonane przez człowieka, można wdrożyć wielojęzyczne treści w ciągu dni/tygodni, wykorzystując NMT do szybkiej lokalizacji.

Kluczowe wyniki

  • Rosyjski: +1 169,51% szybciej i +58,37% dokładniej w porównaniu z bazową wersją profesjonalnego lingwisty.
  • Polski: +17,29% dokładniej i +488,45% szybciej w porównaniu z człowiekiem.
  • Łemkowski: silnik „pierwszy na świecie”, zgłoszono BLEU 14.57.

Kluczowe wkłady

  • Lokalizacja klatek jako wąskie gardło operacyjne i cele w zakresie harmonogramów „szkolenie dziś wieczorem / w przyszłym tygodniu”.
  • Buduje i ocenia silniki NMT na materiałach szkoleniowych NATO, używając BLEU jako metryki oceny.
  • Demonstruje praktyczny przepływ pracy na niedrogim, odizolowanym od sieci laptopie (realistyczne ograniczenia wdrożeniowe).