This site is undergoing a full revamp. Layout may be temporarily broken.
Kezdőlap » Lektorált tudományos publikációk

Lektorált tudományos publikációk

Lektorált szerző és előadó vagyok a világ legnagyobb védelmi képzési konferenciáján (I/ITSEC), valamint ember-számítógép interakció (HCI) nemzetközi konferenciákon, amelyeket a Springer Nature, az egyik legrangosabb, legnagyobb hatású és legrégebben folyamatosan működő tudományos kiadó jelentet meg.


2023

BLEU kilátások a veszélyeztetett nyelvek revitalizációjához: A lemkó-ruszin nyelv és az ukrán neurális mesterséges intelligencia fordítási pontossága szárnyal

Absztrakt

A felgyorsuló globális nyelvesztés, amely az illegális szerhasználat, a 2-es típusú cukorbetegség, a mértéktelen alkoholfogyasztás és a támadások megnövekedett előfordulásával, valamint hatszor magasabb ifjúsági öngyilkossági arányokkal jár, egyre nagyobb kihívást jelent a kisebbségi, őslakos, menekült, gyarmatosított és bevándorló közösségek számára. Azokban a környezetekben, ahol a nemzedékek közötti átadás gyakran megszakad, a mesterséges intelligencia alapú neurális gépi fordítórendszerek potenciálisan feléleszthetik az örökségnyelveket és felhatalmazhatják az új beszélőket azáltal, hogy lehetővé teszik számukra az azonnali fordítás révén történő megértést és megértetést. Azonban a mesterséges intelligencia megoldások problémákat is felvetnek, mint például a tiltó magas költségek és a kimeneti minőségi problémák. A megoldás az, hogy a neurális motorokat klasszikus, szabályalapú motorokkal párosítjuk, amelyek lehetővé teszik a mérnökök számára, hogy megtisztítsák a jövevényszavaktól és semlegesítsék a domináns nyelvek interferenciáját. Ez a munka a LemkoTran.com-on telepített motor átfogó felülvizsgálatát írja le, hogy lehetővé tegye a fordítást a lemkó nyelvre és nyelvről, amely egy súlyosan veszélyeztetett, kisebbségi ukrán genetikai besorolású nyelvjárás, amely Lengyelország és Szlovákia határvidékén őshonos (ahol ruszin néven is emlegetik). Szótár alapú fordítási modulokat szereltek fel morfológiailag és szintaktikailag informált főnév-, ige- és melléknév-generátorokkal, amelyeket 877 lemma és 708 szószedet bejegyzés táplált, és az egész rendszert 9 518 automatikus, kodifikációra hivatkozó, kötelezően átmenő minőségellenőrzési teszttel erősítették meg. E munka gyümölcse egy 23%-os javulás az angolra fordítás minőségében az utolsó publikáció óta, és 35%-os minőségi növekedés az angolról lemkóra fordításban, olyan fordításokat biztosítva, amelyek minden mérőszám szerint felülmúlják a Google Fordító összes szolgáltatását, és 396%-kal magasabb pontszámot érnek el, mint a Google ukrán szolgáltatása lemkóra fordításkor.

Kérem, hivatkozzon így:

Orynycz, P. (2023). BLEU Skies for Endangered Language Revitalization: Lemko Rusyn and Ukrainian Neural AI Translation Accuracy Soars. In: Degen, H., Ntoa, S. (szerk.), Artificial Intelligence in HCI. HCII 2023. Lecture Notes in Computer Science, 14051. kötet. Cham: Springer. https://doi.org/10.1007/978-3-031-35894-4_10


Szívek és nyelvek megnyerése: Lengyel-lemkó esettanulmány

Absztrakt

Amikor a kisebbségi és helyi nyelvek elvesznek, a nemzetbiztonság szenved: nemcsak az öngyilkossági arány, a depresszió, a cukorbetegség, a támadások és a kábítószer-fogyasztás jelentős növekedését dokumentálják gyakran, hanem egy űrt is teremt, amelyet történelmileg kihasználtak az ellenfelek. Például kisebbségi nyelvi közösségekből származó milliók történelmietlenül sajátjuknak tekintik az orosz nyelvet és/vagy identitást Ukrajnában, Fehéroroszországban, NATO-szövetséges országokban, sőt még az Egyesült Államokban is. Ha az anyanyelvi kommunikációs hiányosságok kizárólag az ellenfelek kezében maradnak, akik kihasználják az ezen nyelvekkel kapcsolatos hosszú tapasztalatukat, a NATO jelentős hátrányban marad, amikor megpróbálja bevonni ezeket a közösségeket. Európában a nyelvi veszteség által részben okozott lelki sebek nem gyógyultak be az asszimilációval. Ehelyett a városok elszigetelő feszültségek fellángolását élik át Nyugaton, és a keleti lakosságot az ellenfél hatalmak meggyőzik arról, hogy ezek a hatalmak az igazi szövetségeseik, akik megértik és tisztelik őket. Az oktatás sem csodaszer a hivatalos nyelven: Ukrajna (sőt Spanyolország) esetében a helyi nyelvjárások és a hivatalos nyelv közötti nem elhanyagolható különbségek lehetőséget teremtenek az ellenfelek számára a szeparatizmus lángjainak szítására.

A gépi fordítóprogramok használata a NATO és partnerei felhatalmazására az újoncok képzésében vagy a helyszíni fellépésben, a szívükhöz és elméjükhöz legközelebb álló nyelven, azonnali összetartozás-érzést teremthet, és bemutathatja a NATO elfogadott polikulturális vízióját. Mesterséges intelligencia és szabályalapú motorok összeállításra kerültek, hogy fordítsanak Lengyelország hivatalos nyelve és az őshonos lemkó kisebbség nyelve között, amelyet régóta külföldi hatalmak céloztak meg. A motorokat lemkó nyelvről lengyelre fordítva értékelték a DARPA támogatásával kifejlesztett metrikák felhasználásával, 31,13-as kétnyelvű értékelési alvizsgálati (BLEU) pontszámot és 54,10-es fordítási szerkesztési arányt (TER) eredményezve. Eközben, a másik irányban a motorok 53,73-as TER és 29,49-es BLEU pontszámot értek el, ami 6,5-szer jobb pontszám, mint a Google Fordító lengyel-ukrán szolgáltatásáé.

Kérem, hivatkozzon így:

Orynycz, P., & Dobry, T. (2023). Winning Hearts & Tongues: A Polish to Lemko Case Study. In: Proceedings of the Interservice/Industry Training, Simulation, and Education Conference (I/ITSEC). https://www.xcdsystem.com/iitsec/proceedings/index.cfm?AbID=121223&CID=1001


2022

Mondd jól: Az AI neurális gépi fordítás felhatalmazza az új beszélőket a lemkó nyelv újjáélesztésére

Absztrakt

A mesterséges intelligencia által működtetett neurális gépi fordítás hamarosan újjáélesztheti a veszélyeztetett nyelveket azáltal, hogy felhatalmazza az új beszélőket a valós idejű kommunikációra, olyan mondatok használatával, amelyek számszerűsíthetően közelebb állnak az irodalmi normához, mint az anyanyelvi beszélőké, és a nyelvi visszaszerzésük első napjától kezdve. Míg a Szilícium-völgy hatalmas erőforrásokat fektetett a neurális fordítási technológiába, amely emberfeletti sebességre és pontosságra képes a világ legszélesebb körben használt nyelvei esetében, addig 98%-uk lemaradt, korpuszok hiánya miatt: a neurális gépi fordítási modellek több millió szavas kétnyelvű szövegen alapulnak, amelyek egyszerűen nem léteznek a legtöbb nyelv esetében, és nyelvénként több mint százezer amerikai dollárba kerül az összeállításuk.

Az alacsony erőforrású nyelvek esetében létezik egy leleményesebb, ha nem hatékonyabb megközelítés: az átviteli tanulás, amely lehetővé teszi az alacsonyabb erőforrású nyelvek számára, hogy profitáljanak a magasabb erőforrású nyelvek eredményeiből. Ebben a kísérletben a Google angol-lengyel neurális fordítási szolgáltatása párosításra került a klasszikus, szabályalapú motorommal, hogy angolról a veszélyeztetett, alacsony erőforrású, kelet-szláv lemkó nyelvre fordítson. A rendszer 6,28-as kétnyelvű értékelési alvizsgálati (BLEU) minőségi pontszámot ért el, ami többszörösen jobb, mint a Google Fordító angol-standard ukrán (BLEU 2,17), orosz (BLEU 1,10) és lengyel (BLEU 1,70) szolgáltatásai. Végül ennek a kísérletnek a gyümölcse, a világ első angol-lemkó fordítási szolgáltatása, elérhetővé vált a következő webcímen www.LemkoTran.com, hogy felhatalmazza az új beszélőket nyelvük újraélesztésére.

Az új beszélők kulcsfontosságúak a nyelv újraélesztésében, és a „Mondd jól” képessége lemkóul most már a rendelkezésükre áll.

Kérem, hivatkozzon így:

Orynycz, P. (2022). Say It Right: AI Neural Machine Translation Empowers New Speakers to Revitalize Lemko. In: Degen, H., Ntoa, S. (szerk.), Artificial Intelligence in HCI. HCII 2022. Lecture Notes in Computer Science, 13336. kötet. Cham: Springer. https://doi.org/10.1007/978-3-031-05643-7_37