Ssylka

Современные тенденции и метрики качества машинного перевода

Машинный перевод прошел долгий путь развития от rule-based систем, основанных на лингвистических правилах, до статистических и нейронных подходов. Rule-based системы, несмотря на свою основательность, оказались сложными в масштабировании и адаптации к новым языкам, а также подвержены искажению смысла.
Современные тенденции и метрики качества машинного перевода
Изображение носит иллюстративный характер

Статистический машинный перевод (SMT) с использованием двуязычных корпусов стал следующим этапом, предложив более универсальный подход, но требующий огромных объемов данных. Современные системы машинного перевода, такие как Яндекс. Переводчик и Google Translate, перешли к нейронным моделям, делегируя задачи определения корректных форм и употреблений слов нейронным сетям, обученным на больших объемах текстов.

В последнее время наблюдается тенденция к использованию больших языковых моделей (LLM) для машинного перевода. LLM показывают неплохие результаты в общем машинном переводе и позволяют вносить корректировки в стилистику и другие особенности перевода. Однако LLM подвержены артефактам и галлюцинациям, а также требуют больших вычислительных ресурсов.

Оценка качества машинного перевода – сложная задача, поскольку содержит субъективную составляющую. Существуют референсные метрики, требующие наличия эталонного перевода для сравнения, и безреференсные метрики. Классические метрики, такие как BLEU и TER, подвергаются критике из-за своих конструктивных недостатков и слабой корреляции с экспертной оценкой. Нейронные метрики, такие как Comet, показывают более точные результаты, но также имеют свои ограничения, связанные с неинтерпретируемостью и доменоспецифичностью.


Новое на сайте

14786Память, ожившая на сцене: как Cat Hunter создает театр в честь сына 14785Смертельная рулетка: как нелегальные препараты для похудения угрожают жизни 14783Птицы от рассвета до заката: персональная выставка Джима мойра в Lady Lever Art Gallery 14782Новая жизнь фасада: надежда и история на стенах кинотеатра ABC 14781Поворот в доступности абортов: как законы и технологии меняют картину в США 14780Что стало с лицом Lil Nas X? 14779Взлом аккаунта министра: криптовалютная афера на платформе X 14778Google под прицелом антимонопольной комиссии Японии 14777Хор для тех, кто не умеет петь: как Zest Choir меняет отношение к музыке 14776Поглотила ли покупка Instagram конкуренцию на рынке соцсетей? 14775Как у прилавка с суши возникла уэльская морская трава? 14774Почему муравьи становятся новой целью международных браконьеров? 14773Как пятеро друзей из Dude Perfect стали символом семейного развлечения? 14772Может ли Хельсинки стать новой столицей европейских стартапов?