Я є рецензованим автором і доповідачем на найбільшій у світі оборонній навчальній конференції (I/ITSEC), а також на міжнародних конференціях з питань взаємодії людини та комп’ютера (HCI), що публікуються Springer, одним з найпрестижніших, найвпливовіших і найстаріших академічних видавництв, що безперервно функціонують.
2023
Завоювання сердець і язиків: Дослідження перекладу з польської на лемківську
Втрата мови — це не лише культурна, але й операційна проблема. У цій статті розроблено та оцінено машинний переклад польська ↔ лемківська (експертна система на основі правил + трансформерна нейронна машина перекладу) та проведено порівняльний аналіз в обох напрямках за допомогою метрик, підтриманих DARPA (BLEU, TER), включаючи базовий рівень Google Translate як проксі.
Ключові внески
- Створює стек перекладу польська ↔ лемківська, поєднуючи експертну систему на основі правил та трансформерну нейронну машину перекладу для умов обмежених ресурсів.
- Оцінює обидва напрямки (PL→LEM, LEM→PL) за допомогою стандартизованих, відтворюваних метрик (BLEU + TER).
- Пов’язує машинний переклад мов меншин з реальними результатами: ефективність навчання, доступність та стійкість в умовах конкурентного інформаційного середовища.
Ключові результати
- PL → LEM: експертна система BLEU 29,49 / TER 53,73; повідомляється як ~6,5× порівняно з проксі Google Translate польська→українська за метрикою BLEU.
- LEM → PL: експертна система BLEU 31,13 / TER 54,10.
- Трансформер (PL → LEM): BLEU 15,90 (30 тис. кроків) — вище базового рівня проксі, нижче експертної системи в цій конфігурації.
BLEUкитне небо для відродження зникаючих мов: Точність нейронного ШІ-перекладу лемківської та української мов стрімко зростає
Втрата мов меншин — це не лише культурна проблема, це вимірювана шкода. У цій статті повідомляється про значне оновлення LemkoTran.com, яке поєднує генерацію на основі правил з нейронним машинним перекладом, щоб носії лемківської мови та нові учні могли миттєво читати та писати. Я додаю генератори іменників/дієслів/прикметників з урахуванням морфології, розширюю лексикон, застосовую 9 518 обов’язкових тестів контролю якості та оцінюю якість перекладу за допомогою BLEU, TER та chrF порівняно з кількома сервісами Google Translate.
Ключові внески
- Оновлює гібридний стек LemkoTran (на основі правил + нейронний) для перекладу з лемківської та на лемківську з урахуванням морфології при генерації.
- Підвищує коректність за допомогою 9 518 тестів, що посилаються на кодифікацію, перетворюючи якість перекладу на обов’язковий контроль якості.
- Розширює лінгвістичне охоплення приблизно 1 585 словниковими одиницями на основі правил плюс генератори, що працюють на основі 877 лем + 708 глосарних записів.
- Ретельно проводить порівняльний аналіз використовуючи стандартні налаштування SacreBLEU та три додаткові метрики (BLEU / TER / chrF) для відтворюваних порівнянь.
- Показує інженерний шлях до усунення інтерференції: модулі на основі правил дозволяють очищати запозичені слова / проникнення домінуючої мови (де це бажано).
Ключові результати
- EN → LEM: BLEU зростає до 8,48 (+35% порівняно з попередньою публікацією), повідомляється як ~4× кращий сервіс Google Translate за метрикою BLEU.
- LEM → EN: BLEU досягає 17,95 (+23% порівняно з попередньою роботою), повідомляється як ~16% вище, ніж український сервіс Google Translate (найкращий базовий рівень).
- За всіма метриками: LemkoTran перевершує Google за BLEU + TER + chrF, при цьому Google часто неправильно ідентифікує лемківську мову (часто визначає як українську/російську/білоруську).
2022
Скажи як треба: Нейронний машинний переклад на базі ШІ дає можливість новим мовцям відроджувати лемківську мову
ШІ може надати переваги мовам, що перебувають під загрозою зникнення: нові мовці можуть створювати речення, ближчі до літературної норми з першого дня. Скажи як треба (2022) представляє конвеєр для мов з обмеженими ресурсами (трансферне навчання + машинний переклад на основі правил), випускає публічну систему англійська→лемківська та оцінює якість за допомогою BLEU.
Ключові внески
- Трансферне навчання + рушій на основі правил для мови з обмеженими ресурсами.
- Кількісне оцінювання (BLEU), не суб’єктивні враження.
- Розгорнуто як публічний інструмент (LemkoTran).
Ключові результати
- Система англійська→лемківська: BLEU 6,28 (зафіксовано).
- Порівняно з результатами перекладу Google українською/російською/польською мовами (задокументовано).
- Розроблено для виконання в умовах обмежених ресурсів (робочий процес, сумісний з ноутбуком/офлайн-режимом).
2021
Так, я розмовляю… Нейронний машинний переклад із використанням штучного інтелекту в багатомовному навчанні (2021)
Ця стаття демонструє, як нейронний машинний переклад (NMT) може подолати проблеми локалізації для коаліційного навчання: замість того, щоб місяцями чекати на переклад від людини, ви можете розгорнути багатомовний контент за дні/тижні, використовуючи NMT для швидкої локалізації.
Ключові результати
- Російська: на 1169,51% швидше та на 58,37% точніше порівняно з базовим рівнем професійного лінгвіста.
- Польська: на 17,29% точніше та на 488,45% швидше порівняно з людиною.
- Лемківська: “перший у світі” рушій, досягнуто показника BLEU 14,57.
Ключові внески
- Розглядає локалізацію як операційне вузьке місце і орієнтується на терміни “навчання сьогодні ввечері / наступного тижня”.
- Створює та оцінює рушії NMT на навчальних матеріалах НАТО, використовуючи BLEU як метрику оцінки.
- Демонструє практичний робочий процес на недорогому ноутбуці без підключення до мережі (реалістичні обмеження розгортання).
