This site is undergoing a full revamp. Layout may be temporarily broken.
Головна » Публікації

Рецензовані наукові публікації

Я є рецензованим автором і доповідачем на найбільшій у світі оборонній навчальній конференції (I/ITSEC), а також на міжнародних конференціях з питань взаємодії людини та комп’ютера (HCI), що публікуються Springer, одним з найпрестижніших, найвпливовіших і найстаріших академічних видавництв, що безперервно функціонують.


2023

Завоювання сердець і язиків: Дослідження перекладу з польської на лемківську

Втрата мови — це не лише культурна, але й операційна проблема. У цій статті розроблено та оцінено машинний переклад польська ↔ лемківська (експертна система на основі правил + трансформерна нейронна машина перекладу) та проведено порівняльний аналіз в обох напрямках за допомогою метрик, підтриманих DARPA (BLEU, TER), включаючи базовий рівень Google Translate як проксі.

Ключові внески

  • Створює стек перекладу польська ↔ лемківська, поєднуючи експертну систему на основі правил та трансформерну нейронну машину перекладу для умов обмежених ресурсів.
  • Оцінює обидва напрямки (PL→LEM, LEM→PL) за допомогою стандартизованих, відтворюваних метрик (BLEU + TER).
  • Пов’язує машинний переклад мов меншин з реальними результатами: ефективність навчання, доступність та стійкість в умовах конкурентного інформаційного середовища.

Ключові результати

  • PL → LEM: експертна система BLEU 29,49 / TER 53,73; повідомляється як ~6,5× порівняно з проксі Google Translate польська→українська за метрикою BLEU.
  • LEM → PL: експертна система BLEU 31,13 / TER 54,10.
  • Трансформер (PL → LEM): BLEU 15,90 (30 тис. кроків) — вище базового рівня проксі, нижче експертної системи в цій конфігурації.

BLEUкитне небо для відродження зникаючих мов: Точність нейронного ШІ-перекладу лемківської та української мов стрімко зростає

Втрата мов меншин — це не лише культурна проблема, це вимірювана шкода. У цій статті повідомляється про значне оновлення LemkoTran.com, яке поєднує генерацію на основі правил з нейронним машинним перекладом, щоб носії лемківської мови та нові учні могли миттєво читати та писати. Я додаю генератори іменників/дієслів/прикметників з урахуванням морфології, розширюю лексикон, застосовую 9 518 обов’язкових тестів контролю якості та оцінюю якість перекладу за допомогою BLEU, TER та chrF порівняно з кількома сервісами Google Translate.

Ключові внески

  • Оновлює гібридний стек LemkoTran (на основі правил + нейронний) для перекладу з лемківської та на лемківську з урахуванням морфології при генерації.
  • Підвищує коректність за допомогою 9 518 тестів, що посилаються на кодифікацію, перетворюючи якість перекладу на обов’язковий контроль якості.
  • Розширює лінгвістичне охоплення приблизно 1 585 словниковими одиницями на основі правил плюс генератори, що працюють на основі 877 лем + 708 глосарних записів.
  • Ретельно проводить порівняльний аналіз використовуючи стандартні налаштування SacreBLEU та три додаткові метрики (BLEU / TER / chrF) для відтворюваних порівнянь.
  • Показує інженерний шлях до усунення інтерференції: модулі на основі правил дозволяють очищати запозичені слова / проникнення домінуючої мови (де це бажано).

Ключові результати

  • EN → LEM: BLEU зростає до 8,48 (+35% порівняно з попередньою публікацією), повідомляється як ~4× кращий сервіс Google Translate за метрикою BLEU.
  • LEM → EN: BLEU досягає 17,95 (+23% порівняно з попередньою роботою), повідомляється як ~16% вище, ніж український сервіс Google Translate (найкращий базовий рівень).
  • За всіма метриками: LemkoTran перевершує Google за BLEU + TER + chrF, при цьому Google часто неправильно ідентифікує лемківську мову (часто визначає як українську/російську/білоруську).

2022

Скажи як треба: Нейронний машинний переклад на базі ШІ дає можливість новим мовцям відроджувати лемківську мову

ШІ може надати переваги мовам, що перебувають під загрозою зникнення: нові мовці можуть створювати речення, ближчі до літературної норми з першого дня. Скажи як треба (2022) представляє конвеєр для мов з обмеженими ресурсами (трансферне навчання + машинний переклад на основі правил), випускає публічну систему англійська→лемківська та оцінює якість за допомогою BLEU.

Ключові внески

  • Трансферне навчання + рушій на основі правил для мови з обмеженими ресурсами.
  • Кількісне оцінювання (BLEU), не суб’єктивні враження.
  • Розгорнуто як публічний інструмент (LemkoTran).

Ключові результати

  • Система англійська→лемківська: BLEU 6,28 (зафіксовано).
  • Порівняно з результатами перекладу Google українською/російською/польською мовами (задокументовано).
  • Розроблено для виконання в умовах обмежених ресурсів (робочий процес, сумісний з ноутбуком/офлайн-режимом).

2021

Так, я розмовляю… Нейронний машинний переклад із використанням штучного інтелекту в багатомовному навчанні (2021)


Ця стаття демонструє, як нейронний машинний переклад (NMT) може подолати проблеми локалізації для коаліційного навчання: замість того, щоб місяцями чекати на переклад від людини, ви можете розгорнути багатомовний контент за дні/тижні, використовуючи NMT для швидкої локалізації.

Ключові результати

  • Російська: на 1169,51% швидше та на 58,37% точніше порівняно з базовим рівнем професійного лінгвіста.
  • Польська: на 17,29% точніше та на 488,45% швидше порівняно з людиною.
  • Лемківська: “перший у світі” рушій, досягнуто показника BLEU 14,57.

Ключові внески

  • Розглядає локалізацію як операційне вузьке місце і орієнтується на терміни “навчання сьогодні ввечері / наступного тижня”.
  • Створює та оцінює рушії NMT на навчальних матеріалах НАТО, використовуючи BLEU як метрику оцінки.
  • Демонструє практичний робочий процес на недорогому ноутбуці без підключення до мережі (реалістичні обмеження розгортання).