Компания Яндекс сообщила о запуске YandexGPT 3 Lite — облегчённой версии собственной генеративной нейросети третьего поколения. Она будет доступна клиентам облачной платформы Yandex Cloud через API. Новая модель полезна в сценариях, где важна скорость ответа: например, её можно использовать в чат-ботах, для проверки орфографии или анализа данных. По заявлению компании, это оптимальная по цене и качеству коммерческая модель Яндекса для решения рутинных задач.

YandexGPT 3 Lite подходит для разных типов бизнеса, от небольших компаний до крупных организаций. С её помощью можно оптимизировать такие задачи, как консультация клиентов в чате и по телефону, подготовка ответов для службы поддержки, создание маркетинговых материалов или дайджеста рабочих встреч. Крупные компании со сложными бизнес-процессами и большим потоком информации могут применять её для анализа данных, необходимых для принятия решений.

Новая модель по многим параметрам превосходит YandexGPT 2 Lite — облегчённую модель предыдущего поколения. По итогам теста YaMMLU_ru (русскоязычной версии международного эталонного теста MMLU), новая модель даёт на 6 п. п. больше верных ответов, чем модель предыдущего поколения.

Модели сравнивали также по методике Side by Side: нейросети отвечали на одни и те же вопросы, а эксперты выбирали лучший ответ. В среднем YandexGPT 3 Lite отвечала лучше, чем YandexGPT 2 Lite, в 68% случаев. Эксперты оценивали также, насколько хорошо новая модель справляется с задачами классификации, генерации контента, ответами на вопросы и другими основными типами бизнес-задач. Кроме того, новая модель допускает меньше орфографических и фактических ошибок, чем модель второго поколения YandexGPT 2 Lite.

Для создания новой модели разработчики усовершенствовали все этапы обучения. В частности, улучшили отбор данных для предварительного этапа обучения (pretraining), повысив долю полезной информации. А кроме того, на этом этапе они стали использовать технологию curriculum learning, позволяющую поэтапно усложнять данные. На втором этапе обучения (alignment, или выравнивание модели), включающем в себя обучение с подкреплением (reinforcement learning), улучшили модель для оценки качества ответов нейросети. (Подробнее об этом можно узнать на Хабре). Кроме того, в архитектуру нейросети добавили технологию Grouped Query Attention — она ускоряет обработку данных без потери качества.
YandexGPT 3 Lite можно интегрировать в свои продукты через API в сервисе Foundation Models. Новая модель заменит предыдущую в течение месяца, но попробовать её можно уже сейчас. Стоимость использования YandexGPT 3 Lite — 20 копеек за тысячу токенов. Новые пользователи Yandex Cloud смогут бесплатно протестировать её в демо-режиме.

О YandexGPT

YandexGPT — нейросеть, которая умеет создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы. Она доступна в виртуальном помощнике Алисе и на a.ya.ru, работает в Поиске, Нейро, Браузере и других сервисах Яндекса. YandexGPT обобщает информацию из отзывов на товары в Поиске, помогает создавать описания товаров для Маркета, составлять рекламные объявления и не только. Её можно также использовать в своих продуктах с помощью API.