Сбербанк представил обновленный чат-бот GigaChat с одной из крупнейших нейронных сетей на русском языке

Специалисты Сбербанка анонсировали новую версию чат-бота GigaChat в рамках международной конференции по искусственному интеллекту AI Journey. Основой обновленного решения стала одна из наиболее продвинутых языковых моделей для русского языка, содержащая 29 млрд параметров. В скором времени доступ к API новой модели смогут получить бизнес-клиенты банка для создания собственных решений на базе GigaChat. Также возможность использовать обновленную нейронную сеть в исследованиях появится у представителей академического сообщества.
Применение новой языковой модели улучшило способность чат-бота выполнять инструкции и решать сложные задачи. Заметно выросло качество суммаризации, рерайтинга текстов, редактирования и ответов на разнообразные вопросы. Сравнение ответов обновленной и предыдущей версий GigaChat показало общее повышение качества на 23%. Кроме того, работа с фактической информацией в новой модели улучшилась на 25%.
Для повышения эффективности обучения языковой модели специалисты Сбербанка провели множество экспериментов. В частности, использовался специальный фреймворк, позволяющий распределять веса нейронной сети между видеокартами. Это дало возможность сократить потребление памяти. Внутренняя оценка в бенчмарке Massive Multitask Language Understanding показала, что версия GigaChat с 29 млрд параметров превзошла популярный аналог LLaMA 2 34B.
По словам Андрея Белевцева, старшего вице-президента и руководителя блока «Технологии» Сбербанка, обучение моделей для GigaChat стало масштабным и сложным вычислительным проектом. Количество операций почти в 6 раз превысило аналогичный показатель при создании модели ruGPT-3 в 2021 году. Для чат-бота также был собран уникальный набор данных, над которым работают сотни сотрудников банка. Это помогает повысить качество ответов в различных предметных областях и дает пользователям максимум пользы от сервиса.