This site is undergoing a full revamp. Layout may be temporarily broken.
Domov » Publikácie

Recenzované vedecké publikácie

Som recenzovaný autor a rečník na najväčšej svetovej konferencii o obrannej príprave (I/ITSEC), ako aj na medzinárodných konferenciách o interakcii človeka s počítačom (HCI) vydávaných spoločnosťou Springer Nature, jedným z najprestížnejších, najvplyvnejších a najstarších nepretržite fungujúcich akademických vydavateľstiev.


2023

Winning Hearts & Tongues: Prípadová štúdia prekladu z poľštiny do Lemko

Strata jazyka nie je len kultúrna – je aj operačná. Tento článok vytvára a hodnotí strojový preklad z poľštiny ↔ Lemko (expertne založený na pravidlách + Transformer NMT) a porovnáva oba smery s metrikami podporovanými DARPA (BLEU, TER), vrátane základnej línie proxy Google Translate.

Kľúčové príspevky

  • Vytvára prekladový zásobník z poľštiny ↔ Lemko, ktorý kombinuje expertne založený engine na pravidlách a Transformer NMT pre prostredie s obmedzenými zdrojmi.
  • Hodnotí oba smery (PL→LEM, LEM→PL) so štandardizovanými, reprodukovateľnými metrikami (BLEU + TER).
  • Spája MT menšinových jazykov so skutočnými výsledkami: efektívnosťou školenia, prístupom a odolnosťou v sporných informačných prostrediach.

Kľúčové výsledky

  • PL → LEM: expertný systém BLEU 29.49 / TER 53.73; uvádza sa ako ~6.5× proxy Google Translate z poľštiny do ukrajinčiny na BLEU.
  • LEM → PL: expertný systém BLEU 31.13 / TER 54.10.
  • Transformer (PL → LEM): BLEU 15.90 (30k krokov) – nad základnou líniou proxy, pod expertným systémom v tomto nastavení.

BLEU Skies pre revitalizáciu ohrozených jazykov: Presnosť neurónového prekladu AI pre Lemko Rusyn and Ukrainian stúpa

Strata menšinového jazyka nie je len kultúrna – je to merateľná škoda. Tento článok informuje o významnej aktualizácii LemkoTran.com, ktorá kombinuje generovanie založené na pravidlách s neurónovým strojovým prekladom, aby používatelia Lemko a noví študenti mohli okamžite čítať a písať. Pridávam generátory podstatných mien/slovies/prídavných mien citlivé na morfológiu, rozširujem lexikón, vynucujem 9 518 povinných QC testov a porovnávam kvalitu prekladu pomocou BLEU, TER a chrF proti viacerým službám Google Translate.

Kľúčové príspevky

  • Vylepšuje hybridný zásobník LemkoTran (založený na pravidlách + neurónový) na preklad do a z Lemko s generovaním citlivým na morfológiu.
  • Zvyšuje správnosť pomocou 9 518 testov odkazujúcich na kodifikáciu, čím sa kvalita prekladu mení na vynútiteľnú kontrolu kvality.
  • Rozširuje jazykové pokrytie o ~1 585 slovníkových položiek založených na pravidlách plus generátory poháňané 877 lemami + 708 glosárovými záznamami.
  • Dôsledne porovnáva pomocou predvolených nastavení SacreBLEU a troch doplnkových metrík (BLEU / TER / chrF) pre reprodukovateľné porovnania.
  • Ukazuje inžiniersku cestu k deinterferencii: moduly založené na pravidlách umožňujú čistenie od výpožičiek / presakovania dominantného jazyka (kde je to žiaduce).

Kľúčové výsledky

  • EN → LEM: BLEU stúpa na 8.48 (+35% oproti predchádzajúcej publikácii), uvádza sa ako ~4× najlepšia služba Google Translate na BLEU.
  • LEM → EN: BLEU dosahuje 17.95 (+23% oproti predchádzajúcej práci), uvádza sa ako ~16% vyššie ako ukrajinská služba Google Translate (najvýkonnejšia základná línia).
  • Naprieč metrikami: LemkoTran prekonáva Google v BLEU + TER + chrF, pričom Google často nesprávne identifikuje Lemko (častá detekcia ukrajinčiny/ruštiny/bieloruštiny).

2022

Say It Right: Neurónový strojový preklad AI posilňuje nových hovorcov pri revitalizácii Lemko

AI môže poskytnúť ohrozeným jazykom výhodu: noví hovorcovia môžu od prvého dňa tvoriť vety bližšie k literárnej norme. Say It Right (2022) predstavuje pipeline s nízkymi zdrojmi (transfer learning + MT založený na pravidlách), dodáva verejný systém angličtina→Lemko a hodnotí kvalitu pomocou BLEU.

Kľúčové príspevky

  • Transfer learning + engine založený na pravidlách pre jazyk s nízkymi zdrojmi.
  • Kvantitatívne hodnotenie (BLEU), nie pocity.
  • Nasadené ako verejný nástroj (LemkoTran).

Kľúčové výsledky

  • Systém angličtina→Lemko: BLEU 6.28 (hlásené).
  • Porovnané s výstupmi Google v ukrajinčine/ruštine/poľštine (hlásené).
  • Vytvorené pre vykonávanie s obmedzenými zdrojmi (pracovný postup vhodný pre notebook/offline).

2021

Áno, hovorím… Neurónový strojový preklad AI vo viacjazyčnom školení (2021)


Tento článok ukazuje, ako môže neurónový strojový preklad (NMT) prekonať prekážky lokalizácie pre koaličné školenia: namiesto čakania mesiacov na ľudský preklad môžete nasadiť viacjazyčný obsah v priebehu dní/týždňov pomocou NMT pre rýchlu lokalizáciu.

Kľúčové výsledky

  • Ruština: o 1 169,51% rýchlejšie a o 58,37% presnejšie oproti základnej línii profesionálneho ľudského lingvistu.
  • Poľština: o 17,29% presnejšie a o 488,45% rýchlejšie oproti človeku.
  • Lemko: „prvý na svete“ engine, BLEU 14.57 hlásené.

Kľúčové príspevky

  • Rámuje lokalizáciu ako operačnú prekážku a zameriava sa na časové osi „školenie dnes večer / budúci týždeň“.
  • Vytvára a hodnotí NMT enginy na školiacich materiáloch NATO pomocou BLEU ako hodnotiacej metriky.
  • Demonštruje praktický pracovný postup na lacnom, vzduchom oddelenom notebooku (realistické obmedzenia nasadenia).