Сбербанк представил обновленный чат-бот GigaChat с одной из крупнейших нейронных сетей на русском языке

23 ноября 2023
Сбербанк представил обновленный чат-бот GigaChat с одной из крупнейших нейронных сетей на русском языке

Специалисты Сбербанка анонсировали новую версию чат-бота GigaChat в рамках международной конференции по искусственному интеллекту AI Journey. Основой обновленного решения стала одна из наиболее продвинутых языковых моделей для русского языка, содержащая 29 млрд параметров. В скором времени доступ к API новой модели смогут получить бизнес-клиенты банка для создания собственных решений на базе GigaChat. Также возможность использовать обновленную нейронную сеть в исследованиях появится у представителей академического сообщества.

Применение новой языковой модели улучшило способность чат-бота выполнять инструкции и решать сложные задачи. Заметно выросло качество суммаризации, рерайтинга текстов, редактирования и ответов на разнообразные вопросы. Сравнение ответов обновленной и предыдущей версий GigaChat показало общее повышение качества на 23%. Кроме того, работа с фактической информацией в новой модели улучшилась на 25%.

Для повышения эффективности обучения языковой модели специалисты Сбербанка провели множество экспериментов. В частности, использовался специальный фреймворк, позволяющий распределять веса нейронной сети между видеокартами. Это дало возможность сократить потребление памяти. Внутренняя оценка в бенчмарке Massive Multitask Language Understanding показала, что версия GigaChat с 29 млрд параметров превзошла популярный аналог LLaMA 2 34B.

По словам Андрея Белевцева, старшего вице-президента и руководителя блока «Технологии» Сбербанка, обучение моделей для GigaChat стало масштабным и сложным вычислительным проектом. Количество операций почти в 6 раз превысило аналогичный показатель при создании модели ruGPT-3 в 2021 году. Для чат-бота также был собран уникальный набор данных, над которым работают сотни сотрудников банка. Это помогает повысить качество ответов в различных предметных областях и дает пользователям максимум пользы от сервиса.

Новости и обзоры

Читать все

Нейросети

смотреть все
Нейросеть Grok-3 - Чат-бот,Модель LLM

Grok-3

Мощный чат-ассистент, способный выполнять такие задачи, как математика и программирование. Эта модель ИИ может похвастаться десятикратной вычислительной мощностью и продвинутыми режимами рассуждений

Чат-бот
Модель LLM
Платно
1.2 млн
Нейросеть Sora by OpenAI - Генерация видео

Sora by OpenAI

Модель, созданная OpenAI, способная генерировать 60-секундные видеоролики по простым текстовым подсказкам: детализированные сцены, сложные движения камеры, выразительные персонажи и т.д.

Генерация видео
Платно
558.3 млн
Нейросеть Looka - Генерация логотипа

Looka

Дизайн логотипа для вашего сайта или компании. Используйте искусственный интеллект для разработки логотипа вашего бренда

Генерация логотипа
Условно-бесплатно
Платно — $20
82 тыс