YandexGPT 2 улучшает взаимодействие с "Алисой" на 67%

7 сентября 2023
YandexGPT 2 улучшает взаимодействие с "Алисой" на 67%

"Яндекс" анонсировал выпуск обновленной версии своей языковой модели YandexGPT 2, которая теперь поддерживается голосовым помощником "Алиса". По результатам тестирования, новая версия модели обеспечивает более точные и уместные ответы на запросы пользователей в 67% случаев по сравнению с предыдущей версией.

Исследование качества работы обеих моделей было проведено на основе 500 разнообразных пользовательских заданий. В результате сравнения выявлено, что YandexGPT 2 превзошла предыдущую модель по следующим категориям:

  • Генерация текста: новая модель показала лучший результат в 69% заданий;
  • Пересказ и анализ текста: улучшение составило 68%;
  • Генерация идей: новая модель была лучше в 66% случаев;
  • Стилизация текста под аудиторию или конкретного пользователя: улучшение на 62%;
  • Ответы на вопросы: также 62% преимущество перед старой моделью.

Обучение нейросетей проходит в два этапа: претрейнинг и файнтюнинг. Претрейнинг отвечает за сбор фактической информации, в то время как файнтюнинг настраивает формат и стиль ответов. Улучшения на этапе претрейнинга имеют ключевое значение, так как именно здесь ИИ "поглощает" информацию для последующего использования.

Разработчики столкнулись с проблемой необходимости обновления датасетов, что является ресурсоемким процессом. Они решили эту задачу, автоматизировав процесс обучения с помощью тестирования небольших моделей, которые затем сравниваются по качеству работы. В дополнение к этому, были внедрены инструменты для улучшения качества датасетов:

  • Классификатор некачественного текста выявляет кодировочные ошибки, лишние HTML-теги и повторы предложений;
  • Классификатор полезного текста определяет, насколько материал отвечает на вопрос пользователя;
  • Увеличена доля текстов с высокой цитируемостью;
  • Сокращена доля дубликатов до менее 0,5%;
  • Запущен инструмент для оценки фактовой полноты, обученный отвечать на 80% фактовых запросов, с которыми справляется поисковик "Яндекса".

YandexGPT 2 уже интегрирована в различные продукты "Яндекса", включая "Яндекс Станции", умные телевизоры, мобильное приложение и "Яндекс Браузер". Разработчики планируют продолжить усовершенствование датасетов и внедрение методов обучения, таких как обучение с подкреплением от человека (RLHF), а также расширение применения модели в других сервисах компании.

Новости и обзоры

Читать все

Нейросети

смотреть все
Нейросеть InVideo - Редактирование видео

InVideo

Платформа, которая облегчит редактирование и создание видео. Раскройте свой творческий потенциал с помощью помощника — искусственного интеллекта

Редактирование видео
Условно-бесплатно
Платно — $15/мес
8 млн
Нейросеть Luma Dream Machine - Генерация видео

Luma Dream Machine

Создавайте реалистичные 5s-видео из текста или изображений. Плавные движения, точная физика и потрясающая кинематографическая работа камеры!

Генерация видео
Бесплатно
5.1 млн
Нейросеть DALL·E 3 - Генерация изображений

DALL·E 3

Генератор изображений, интегрируемый с интерфейсом ChatGPT. Легко манипулируйте и создавайте свои собственные изображения с помощью подсказок.

Генерация изображений
Бесплатно
25.7 млн