Som recenzovaný autor a rečník na najväčšej svetovej konferencii o obrannej príprave (I/ITSEC), ako aj na medzinárodných konferenciách o interakcii človeka s počítačom (HCI) vydávaných spoločnosťou Springer Nature, jedným z najprestížnejších, najvplyvnejších a najstarších nepretržite fungujúcich akademických vydavateľstiev.

ResearchGate
Google Scholar

2023

Winning Hearts & Tongues: Prípadová štúdia z poľštiny do lemkovského jazyka

Strata jazyka nie je len kultúrna – je aj operačná. Tento článok vytvára a hodnotí strojový preklad z poľštiny do lemkovského jazyka a naopak (expertný systém založený na pravidlách + Transformer NMT) a porovnáva oba smery s metrikami podporovanými agentúrou DARPA (BLEU, TER), vrátane základnej línie proxy prekladača Google Translate.

Kľúčové príspevky

  • Vytvára prekladový zásobník z poľštiny do lemkovského jazyka, ktorý kombinuje expertný systém založený na pravidlách a Transformer NMT pre prostredie s nízkymi zdrojmi.
  • Hodnotí oba smery (PL→LEM, LEM→PL) so štandardizovanými, reprodukovateľnými metrikami (BLEU + TER).
  • Spája MT menšinových jazykov so skutočnými výsledkami: efektívnosťou školenia, prístupom a odolnosťou v sporných informačných prostrediach.

Kľúčové výsledky

  • PL → LEM: expertný systém BLEU 29.49 / TER 53.73; uvádza sa ako ~6.5× proxy Google Translate z poľštiny do ukrajinčiny na BLEU.
  • LEM → PL: expertný systém BLEU 31.13 / TER 54.10.
  • Transformer (PL → LEM): BLEU 15.90 (30k krokov) – nad základnou líniou proxy, pod expertným systémom v tomto nastavení.

BLEU Skies pre revitalizáciu ohrozených jazykov: Presnosť neurálneho AI prekladu pre Lemko Rusyn and Ukrainian prudko stúpa

Strata menšinového jazyka nie je len kultúrna – je to merateľná škoda. Tento článok informuje o významnom vylepšení LemkoTran.com, ktoré kombinuje generovanie založené na pravidlách s neurónovým strojovým prekladom, aby si hovoriaci lemkovským jazykom a noví študenti mohli okamžite čítať a písať. Pridávam generátory podstatných mien/slovies/prídavných mien s ohľadom na morfológiu, rozširujem lexikón, vynucujem 9 518 nevyhnutných QC testov a porovnávam kvalitu prekladu s metrikami BLEU, TER a chrF proti viacerým službám Google Translate.

Kľúčové príspevky

  • Vylepšuje hybridný zásobník LemkoTran (založený na pravidlách + neurónový) na preklad do a z lemkovského jazyka s generovaním s ohľadom na morfológiu.
  • Zvyšuje správnosť pomocou 9 518 testov odkazujúcich na kodifikáciu, čím sa kvalita prekladu mení na vynútiteľnú kontrolu kvality.
  • Rozširuje jazykové pokrytie o ~1 585 slovníkových položiek založených na pravidlách plus generátory poháňané 877 lemami + 708 glosárovými záznamami.
  • Dôsledne porovnáva pomocou predvolených nastavení SacreBLEU a troch doplnkových metrík (BLEU / TER / chrF) pre reprodukovateľné porovnania.
  • Ukazuje inžiniersku cestu k deinterferencii: moduly založené na pravidlách umožňujú čistenie od výpožičiek / presakovania dominantného jazyka (kde je to žiaduce).

Kľúčové výsledky

  • EN → LEM: BLEU stúpa na 8.48 (+35% oproti predchádzajúcej publikácii), uvádza sa ako ~4× najlepšia služba Google Translate na BLEU.
  • LEM → EN: BLEU dosahuje 17.95 (+23% oproti predchádzajúcej práci), uvádza sa ako ~16% vyššie ako ukrajinská služba Google Translate (najvýkonnejšia základná línia).
  • Naprieč metrikami: LemkoTran prekonáva Google v BLEU + TER + chrF, pričom Google často nesprávne identifikuje lemkovský jazyk (častá detekcia ukrajinčiny/ruštiny/bieloruštiny).

2022

Say It Right: Neurálny strojový preklad AI pomáha novým hovoriacim revitalizovať lemkovský jazyk

AI môže ohrozeným jazykom poskytnúť výhodu: noví hovoriaci môžu od prvého dňa tvoriť vety bližšie k literárnej norme. Say It Right (2022) predstavuje pipeline s nízkymi zdrojmi (transferové učenie + strojový preklad založený na pravidlách), dodáva verejný systém z angličtiny do lemkovského jazyka a hodnotí kvalitu pomocou BLEU.

Kľúčové príspevky

  • Transfer learning + engine založený na pravidlách pre jazyk s nízkymi zdrojmi.
  • Kvantitatívne hodnotenie (BLEU), nie pocity.
  • Nasadené ako verejný nástroj (LemkoTran).

Kľúčové výsledky

  • Systém z angličtiny do lemkovského jazyka: BLEU 6.28 (hlásené).
  • Porovnané s výstupmi Google v ukrajinčine/ruštine/poľštine (hlásené).
  • Vytvorené pre vykonávanie s obmedzenými zdrojmi (pracovný postup vhodný pre notebook/offline).

2021

Áno, hovorím… Neuronový strojový preklad AI vo viacjazyčnom školení (2021)


Tento článok ukazuje, ako môže neurónový strojový preklad (NMT) prekonať prekážky lokalizácie pre koaličné školenia: namiesto čakania mesiacov na ľudský preklad môžete nasadiť viacjazyčný obsah v priebehu dní/týždňov pomocou NMT pre rýchlu lokalizáciu.

Kľúčové výsledky

  • Ruština: o 1 169,51% rýchlejšie a o 58,37% presnejšie oproti základnej línii profesionálneho ľudského lingvistu.
  • Poľština: o 17,29% presnejšie a o 488,45% rýchlejšie oproti človeku.
  • Lemko: „prvý“ engine na svete, hlásené BLEU 14.57.

Kľúčové príspevky

  • Rámuje lokalizáciu ako operačnú prekážku a zameriava sa na časové osi „školenie dnes večer / budúci týždeň“.
  • Vytvára a hodnotí NMT enginy na školiacich materiáloch NATO pomocou BLEU ako hodnotiacej metriky.
  • Demonštruje praktický pracovný postup na lacnom, vzduchom oddelenom notebooku (realistické obmedzenia nasadenia).