Сбербанк представил обновленный чат-бот GigaChat с одной из крупнейших нейронных сетей на русском языке

23 ноября 2023
Сбербанк представил обновленный чат-бот GigaChat с одной из крупнейших нейронных сетей на русском языке

Специалисты Сбербанка анонсировали новую версию чат-бота GigaChat в рамках международной конференции по искусственному интеллекту AI Journey. Основой обновленного решения стала одна из наиболее продвинутых языковых моделей для русского языка, содержащая 29 млрд параметров. В скором времени доступ к API новой модели смогут получить бизнес-клиенты банка для создания собственных решений на базе GigaChat. Также возможность использовать обновленную нейронную сеть в исследованиях появится у представителей академического сообщества.

Применение новой языковой модели улучшило способность чат-бота выполнять инструкции и решать сложные задачи. Заметно выросло качество суммаризации, рерайтинга текстов, редактирования и ответов на разнообразные вопросы. Сравнение ответов обновленной и предыдущей версий GigaChat показало общее повышение качества на 23%. Кроме того, работа с фактической информацией в новой модели улучшилась на 25%.

Для повышения эффективности обучения языковой модели специалисты Сбербанка провели множество экспериментов. В частности, использовался специальный фреймворк, позволяющий распределять веса нейронной сети между видеокартами. Это дало возможность сократить потребление памяти. Внутренняя оценка в бенчмарке Massive Multitask Language Understanding показала, что версия GigaChat с 29 млрд параметров превзошла популярный аналог LLaMA 2 34B.

По словам Андрея Белевцева, старшего вице-президента и руководителя блока «Технологии» Сбербанка, обучение моделей для GigaChat стало масштабным и сложным вычислительным проектом. Количество операций почти в 6 раз превысило аналогичный показатель при создании модели ruGPT-3 в 2021 году. Для чат-бота также был собран уникальный набор данных, над которым работают сотни сотрудников банка. Это помогает повысить качество ответов в различных предметных областях и дает пользователям максимум пользы от сервиса.

Новости и обзоры

Читать все

Нейросети

смотреть все
Нейросеть Looka - Генерация логотипа

Looka

Дизайн логотипа для вашего сайта или компании. Используйте искусственный интеллект для разработки логотипа вашего бренда

Генерация логотипа
Условно-бесплатно
Платно — $20
82 тыс
Нейросеть Gemini 2.0 - Модель LLM

Gemini 2.0

Новейшая модель ИИ от Google с мультимодальными и агентными возможностями. Генерируйте текст, изображения и аудио с помощью различных внешних инструментов

Модель LLM
Бесплатно
Нейросеть FaceSwapper - Развлечения,Дипфейк,Редактирование изображений

FaceSwapper

Реалистично замените любое лицо на ваших фотографиях или видео. Этот ИИ является экспертом в распознавании лиц и технологии подмены лиц