По итогам международного независимого бенчмарка DiBiMT Яндекс Переводчик* лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. Об этом сообщает пресс-служба Яндекс.
Рейтинг опубликовали итальянские институты Sapienza и SSML Carlo Bo, одни из ведущих мировых центров изучения языка в машинном обучении. Также сервис занял третье место по качеству перевода с английского на китайский, немецкий, итальянский и испанский языки. Тест показал, что Переводчик лучше других определяет значение конкретных английских слов в предложениях и допускает меньшее количество семантических ошибок.
Бенчмарк DiBiMT — это эталонный тест для измерения процента ошибок (т. е. неверного определения смысла или значения слова в контексте) в машинном переводе. Тестирование проходили как онлайн-переводчики, такие как Google Translate и DeepL, так и открытые большие языковые модели: mBART-50, M2M100, а также проект OPUS.
Как работают нейросети в Яндекс Переводчике
Сервис использует разработанную в Яндексе технологию машинного перевода на основе нейросетей. Они анализируют массивы текстов, учатся находить в них закономерности и составляют списки всех употребляемых слов и фраз. Во время перевода каждое предложение не разбивается на слова и фразы, а переводится полностью. Нейросети определяют семантику слов и взаимосвязь между ними, даже если они не находятся рядом.
Чтобы повысить точность, на этапе обучения модели AI-тренеры Яндекса вручную размечают качественные варианты перевода, чтобы она лучше учитывала важные для восприятия человека аспекты.
* О Яндекс Переводчике
Яндекс Переводчик — сервис для автоматического перевода более чем со 100 языков. Он может переводить надписи на картинках и фотографиях, целые сайты, отдельные тексты и поддерживает голосовой ввод. Сервис доступен на translate.yandex.ru и в виде мобильного приложения для Android и iOS. Также он интегрирован в приложение Яндекс с Алисой, где работает в связке с умной камерой и может переводить тексты в режиме реального времени, и в Яндекс Браузер.
Как проводилось тестирование
Исследователи собрали базу данных из нескольких тысяч предложений на английском языке с омонимами — одинаковыми по написанию словами, имеющими разное значение. Модели и сервисы перевели эти предложения, а алгоритмы бенчмарка определили процент корректно переведённых слов. Кроме того, правильные варианты выборочно проверяли профессиональные переводчики, что обеспечило высокое качество замеров. На основе этих показателей и был сформирован публичный рейтинг.