Сбербанк представил обновленный чат-бот GigaChat с одной из крупнейших нейронных сетей на русском языке

23 ноября 2023
Сбербанк представил обновленный чат-бот GigaChat с одной из крупнейших нейронных сетей на русском языке

Специалисты Сбербанка анонсировали новую версию чат-бота GigaChat в рамках международной конференции по искусственному интеллекту AI Journey. Основой обновленного решения стала одна из наиболее продвинутых языковых моделей для русского языка, содержащая 29 млрд параметров. В скором времени доступ к API новой модели смогут получить бизнес-клиенты банка для создания собственных решений на базе GigaChat. Также возможность использовать обновленную нейронную сеть в исследованиях появится у представителей академического сообщества.

Применение новой языковой модели улучшило способность чат-бота выполнять инструкции и решать сложные задачи. Заметно выросло качество суммаризации, рерайтинга текстов, редактирования и ответов на разнообразные вопросы. Сравнение ответов обновленной и предыдущей версий GigaChat показало общее повышение качества на 23%. Кроме того, работа с фактической информацией в новой модели улучшилась на 25%.

Для повышения эффективности обучения языковой модели специалисты Сбербанка провели множество экспериментов. В частности, использовался специальный фреймворк, позволяющий распределять веса нейронной сети между видеокартами. Это дало возможность сократить потребление памяти. Внутренняя оценка в бенчмарке Massive Multitask Language Understanding показала, что версия GigaChat с 29 млрд параметров превзошла популярный аналог LLaMA 2 34B.

По словам Андрея Белевцева, старшего вице-президента и руководителя блока «Технологии» Сбербанка, обучение моделей для GigaChat стало масштабным и сложным вычислительным проектом. Количество операций почти в 6 раз превысило аналогичный показатель при создании модели ruGPT-3 в 2021 году. Для чат-бота также был собран уникальный набор данных, над которым работают сотни сотрудников банка. Это помогает повысить качество ответов в различных предметных областях и дает пользователям максимум пользы от сервиса.

Новости и обзоры

Читать все

Нейросети

смотреть все
Нейросеть Roamaround - Маркетинг,Продуктивность,Наука и исследования

Roamaround

Генератор туристических маршрутов с помощью искусственного интеллекта. Простой и удобный в использовании сайт

Нейросеть Rytr - Генерация текста,Копирайтинг

Rytr

Интеллектуальный редакторский помощник, который поможет вам создавать качественный контент

Генерация текста
Копирайтинг
Условно-бесплатно
Платно — $9/мес
1 млн
Нейросеть Undetectable AI - Определение ИИ,Копирайтинг

Undetectable AI

Сделайте ваши тексты, сгенерированные ИИ, необнаруживаемыми, очеловечив их. Идеально подходит для студентов, SEO-копирайтеров, журналистов и т. д.

Определение ИИ
Копирайтинг
Условно-бесплатно
4 млн