Som recenzovaný autor a rečník na najväčšej svetovej konferencii o obrannej príprave (I/ITSEC), ako aj na medzinárodných konferenciách o interakcii človeka s počítačom (HCI) vydávaných spoločnosťou Springer Nature, jedným z najprestížnejších, najvplyvnejších a najstarších nepretržite fungujúcich akademických vydavateľstiev.
2023
Winning Hearts & Tongues: Prípadová štúdia prekladu z poľštiny do Lemko
Strata jazyka nie je len kultúrna – je aj operačná. Tento článok vytvára a hodnotí strojový preklad z poľštiny ↔ Lemko (expertne založený na pravidlách + Transformer NMT) a porovnáva oba smery s metrikami podporovanými DARPA (BLEU, TER), vrátane základnej línie proxy Google Translate.
Kľúčové príspevky
- Vytvára prekladový zásobník z poľštiny ↔ Lemko, ktorý kombinuje expertne založený engine na pravidlách a Transformer NMT pre prostredie s obmedzenými zdrojmi.
- Hodnotí oba smery (PL→LEM, LEM→PL) so štandardizovanými, reprodukovateľnými metrikami (BLEU + TER).
- Spája MT menšinových jazykov so skutočnými výsledkami: efektívnosťou školenia, prístupom a odolnosťou v sporných informačných prostrediach.
Kľúčové výsledky
- PL → LEM: expertný systém BLEU 29.49 / TER 53.73; uvádza sa ako ~6.5× proxy Google Translate z poľštiny do ukrajinčiny na BLEU.
- LEM → PL: expertný systém BLEU 31.13 / TER 54.10.
- Transformer (PL → LEM): BLEU 15.90 (30k krokov) – nad základnou líniou proxy, pod expertným systémom v tomto nastavení.
BLEU Skies pre revitalizáciu ohrozených jazykov: Presnosť neurónového prekladu AI pre Lemko Rusyn and Ukrainian stúpa
Strata menšinového jazyka nie je len kultúrna – je to merateľná škoda. Tento článok informuje o významnej aktualizácii LemkoTran.com, ktorá kombinuje generovanie založené na pravidlách s neurónovým strojovým prekladom, aby používatelia Lemko a noví študenti mohli okamžite čítať a písať. Pridávam generátory podstatných mien/slovies/prídavných mien citlivé na morfológiu, rozširujem lexikón, vynucujem 9 518 povinných QC testov a porovnávam kvalitu prekladu pomocou BLEU, TER a chrF proti viacerým službám Google Translate.
Kľúčové príspevky
- Vylepšuje hybridný zásobník LemkoTran (založený na pravidlách + neurónový) na preklad do a z Lemko s generovaním citlivým na morfológiu.
- Zvyšuje správnosť pomocou 9 518 testov odkazujúcich na kodifikáciu, čím sa kvalita prekladu mení na vynútiteľnú kontrolu kvality.
- Rozširuje jazykové pokrytie o ~1 585 slovníkových položiek založených na pravidlách plus generátory poháňané 877 lemami + 708 glosárovými záznamami.
- Dôsledne porovnáva pomocou predvolených nastavení SacreBLEU a troch doplnkových metrík (BLEU / TER / chrF) pre reprodukovateľné porovnania.
- Ukazuje inžiniersku cestu k deinterferencii: moduly založené na pravidlách umožňujú čistenie od výpožičiek / presakovania dominantného jazyka (kde je to žiaduce).
Kľúčové výsledky
- EN → LEM: BLEU stúpa na 8.48 (+35% oproti predchádzajúcej publikácii), uvádza sa ako ~4× najlepšia služba Google Translate na BLEU.
- LEM → EN: BLEU dosahuje 17.95 (+23% oproti predchádzajúcej práci), uvádza sa ako ~16% vyššie ako ukrajinská služba Google Translate (najvýkonnejšia základná línia).
- Naprieč metrikami: LemkoTran prekonáva Google v BLEU + TER + chrF, pričom Google často nesprávne identifikuje Lemko (častá detekcia ukrajinčiny/ruštiny/bieloruštiny).
2022
Say It Right: Neurónový strojový preklad AI posilňuje nových hovorcov pri revitalizácii Lemko
AI môže poskytnúť ohrozeným jazykom výhodu: noví hovorcovia môžu od prvého dňa tvoriť vety bližšie k literárnej norme. Say It Right (2022) predstavuje pipeline s nízkymi zdrojmi (transfer learning + MT založený na pravidlách), dodáva verejný systém angličtina→Lemko a hodnotí kvalitu pomocou BLEU.
Kľúčové príspevky
- Transfer learning + engine založený na pravidlách pre jazyk s nízkymi zdrojmi.
- Kvantitatívne hodnotenie (BLEU), nie pocity.
- Nasadené ako verejný nástroj (LemkoTran).
Kľúčové výsledky
- Systém angličtina→Lemko: BLEU 6.28 (hlásené).
- Porovnané s výstupmi Google v ukrajinčine/ruštine/poľštine (hlásené).
- Vytvorené pre vykonávanie s obmedzenými zdrojmi (pracovný postup vhodný pre notebook/offline).
2021
Áno, hovorím… Neurónový strojový preklad AI vo viacjazyčnom školení (2021)
Tento článok ukazuje, ako môže neurónový strojový preklad (NMT) prekonať prekážky lokalizácie pre koaličné školenia: namiesto čakania mesiacov na ľudský preklad môžete nasadiť viacjazyčný obsah v priebehu dní/týždňov pomocou NMT pre rýchlu lokalizáciu.
Kľúčové výsledky
- Ruština: o 1 169,51% rýchlejšie a o 58,37% presnejšie oproti základnej línii profesionálneho ľudského lingvistu.
- Poľština: o 17,29% presnejšie a o 488,45% rýchlejšie oproti človeku.
- Lemko: „prvý na svete“ engine, BLEU 14.57 hlásené.
Kľúčové príspevky
- Rámuje lokalizáciu ako operačnú prekážku a zameriava sa na časové osi „školenie dnes večer / budúci týždeň“.
- Vytvára a hodnotí NMT enginy na školiacich materiáloch NATO pomocou BLEU ako hodnotiacej metriky.
- Demonštruje praktický pracovný postup na lacnom, vzduchom oddelenom notebooku (realistické obmedzenia nasadenia).
