Pixtral12B — мультимодальная модель с 12 миллиардами параметров, способная обрабатывать текст и изображения. Генерируйте контент, анализируйте визуальные образы и отвечайте на вопросы об изображениях.
Похожие нейросети
Смотреть все
MARS5 by Camb.ai
Модель TTS, способная воспроизводить реалистичные голоса на более чем 140 языках. Наслаждайтесь естественным воспроизведением видео, используя всего 2-3 секунды эталонного аудио.

Qwen2.5-Max
Мультимодальная языковая модель, превосходящая GPT-4 и DeepSeek в основных бенчмарках. Оптимизированная архитектура MoE позволяет снизить вычислительные затраты на 30% при сохранении выдающейся производительности.

PROTEUS by Apparate
ИИ, создающий сверхреалистичных, выразительных виртуальных людей в режиме реального времени. Эти модели могут смеяться, петь, говорить и даже плакать! Простой и высокопроизводительный API
Новости и обзоры
Читать все


