This site is undergoing a full revamp. Layout may be temporarily broken.
Strona główna » Publikacje

Recenzowane publikacje naukowe

Jestem recenzowanym autorem i prelegentem na największej na świecie konferencji szkoleniowej w dziedzinie obronności (I/ITSEC), a także na międzynarodowych konferencjach dotyczących interakcji człowiek-komputer (HCI), publikowanych przez Springer Nature, jedno z najbardziej prestiżowych, o najwyższym wpływie i najdłużej nieprzerwanie działających wydawnictw akademickich.


2023

Zdobywanie serc i języków: studium przypadku tłumaczenia z polskiego na język łemkowski

Utrata języka to nie tylko strata kulturowa—to strata operacyjna. Ta praca przedstawia i ocenia tłumaczenie maszynowe polski ↔ łemkowski (ekspercki system regułowy + Transformer NMT) oraz porównuje oba kierunki za pomocą metryk wspieranych przez DARPA (BLEU, TER), włączając punkt odniesienia w postaci Google Translate.

Kluczowe wkłady

  • Tworzy stos tłumaczeniowy polski ↔ łemkowski łączący ekspercki system regułowy i Transformer NMT dla języka o ograniczonych zasobach.
  • Ocenia oba kierunki (PL→LEM, LEM→PL) za pomocą standaryzowanych, powtarzalnych metryk (BLEU + TER).
  • Łączy tłumaczenie maszynowe języków mniejszościowych z realnymi efektami: skutecznością szkolenia, dostępnością i odpornością w środowiskach o kwestionowanych informacjach.

Kluczowe wyniki

  • PL → LEM: system ekspercki BLEU 29,49 / TER 53,73; raportowany jako ~6,5× lepszy od Google Translate w tłumaczeniu polski→ukraiński według BLEU.
  • LEM → PL: system ekspercki BLEU 31,13 / TER 54,10.
  • Transformer (PL → LEM): BLEU 15,90 (30k kroków)—powyżej bazowego punktu odniesienia, poniżej systemu eksperckiego w tej konfiguracji.

BLEUkitne niebo dla rewitalizacji zagrożonych języków: Dokładność tłumaczenia łemkowskiego i ukraińskiego dzięki neuronowej sztucznej inteligencji wzrasta

Utrata języka mniejszościowego to nie tylko strata kulturowa—to mierzalna szkoda. Ta praca przedstawia znaczącą aktualizację LemkoTran.com, łączącą generowanie regułowe z neuronowym MT, dzięki czemu użytkownicy języka łemkowskiego i nowi uczący się mogą natychmiast czytać i pisać. Dodaję generatory świadome morfologii dla rzeczowników/czasowników/przymiotników, rozszerzam leksykon, egzekwuję 9 518 obowiązkowych testów kontroli jakości i porównuję jakość tłumaczenia za pomocą BLEU, TER i chrF z różnymi usługami Google Translate.

Kluczowe wkłady

  • Ulepsza hybrydowy stos LemkoTran (regułowy + neuronowy) do tłumaczenia na język łemkowski i z języka łemkowskiego z generowaniem świadomym morfologii.
  • Wzmacnia poprawność poprzez 9 518 testów opartych na kodyfikacji, przekształcając jakość tłumaczenia w egzekwowalną kontrolę jakości.
  • Rozszerza pokrycie językowe o ~1 585 elementów słownictwa opartego na regułach plus generatory zasilane przez 877 lematów + 708 wpisów glosariusza.
  • Rygorystycznie testuje używając domyślnych ustawień SacreBLEU i trzech uzupełniających się metryk (BLEU / TER / chrF) dla powtarzalnych porównań.
  • Pokazuje inżynieryjną ścieżkę do de-interferencji: moduły oparte na regułach umożliwiają usuwanie zapożyczeń / przenikania języka dominującego (gdzie pożądane).

Kluczowe wyniki

  • EN → LEM: BLEU wzrasta do 8,48 (+35% w porównaniu z poprzednią publikacją), raportowany jako ~4× lepszy od najlepszej usługi Google Translate według BLEU.
  • LEM → EN: BLEU osiąga 17,95 (+23% w porównaniu z poprzednią pracą), raportowany jako ~16% wyższy niż usługa ukraińska Google Translate (najlepiej działający punkt odniesienia).
  • Według wszystkich metryk: LemkoTran przewyższa Google we wszystkich miarach BLEU + TER + chrF, przy czym Google często błędnie identyfikuje język łemkowski (częste wykrywanie jako ukraiński/rosyjski/białoruski).

2022

Powiedz to dobrze: Tłumaczenie maszynowe oparte na sztucznej inteligencji umożliwia nowym użytkownikom rewitalizację języka łemkowskiego

Sztuczna inteligencja może dać zagrożonym językom przewagę: nowi użytkownicy mogą od pierwszego dnia tworzyć zdania bliższe normie literackiej. Powiedz to dobrze (2022) przedstawia niskobudżetowy proces (transfer learning + tłumaczenie maszynowe oparte na regułach), udostępnia publicznie system tłumaczenia z angielskiego na łemkowski i ocenia jakość za pomocą metody BLEU.

Kluczowe wkłady

  • Transfer learning + silnik oparty na regułach dla języka o ograniczonych zasobach.
  • Ocena ilościowa (BLEU), nie subiektywne odczucia.
  • Wdrożony jako narzędzie publiczne (LemkoTran).

Kluczowe wyniki

  • System angielsko-łemkowski: BLEU 6,28 (raportowany).
  • Porównany z wynikami tłumaczeń Google dla języka ukraińskiego/rosyjskiego/polskiego (raportowane).
  • Zbudowany z myślą o ograniczonych zasobach (przyjazny dla laptopów/pracy offline).

2021

Tak, mówię… Tłumaczenie maszynowe AI w szkoleniu wielojęzycznym (2021)


Ten artykuł pokazuje, jak tłumaczenie maszynowe oparte na sieciach neuronowych (NMT) może przełamać wąskie gardła lokalizacji w szkoleniach koalicyjnych: zamiast czekać miesiące na tłumaczenie wykonane przez człowieka, można wdrożyć wielojęzyczne treści w ciągu dni/tygodni, wykorzystując NMT do szybkiej lokalizacji.

Kluczowe wyniki

  • Rosyjski: +1 169,51% szybciej i +58,37% dokładniej w porównaniu z bazową wersją profesjonalnego lingwisty.
  • Polski: +17,29% dokładniej i +488,45% szybciej w porównaniu z człowiekiem.
  • Łemkowski: silnik „pierwszy na świecie”, zgłoszono BLEU 14.57.

Kluczowe wkłady

  • Lokalizacja klatek jako wąskie gardło operacyjne i cele w zakresie harmonogramów „szkolenie dziś wieczorem / w przyszłym tygodniu”.
  • Buduje i ocenia silniki NMT na materiałach szkoleniowych NATO, używając BLEU jako metryki oceny.
  • Demonstruje praktyczny przepływ pracy na niedrogim, odizolowanym od sieci laptopie (realistyczne ograniczenia wdrożeniowe).