Anthropic выпускает Claude 3.7 Sonnet: первую гибридную модель с расширенным мышлением

10 марта 2025

Anthropic выпустила свою самую интеллектуальную ИИ-модель на сегодняшний день и первую гибридную модель с функцией рассуждения на рынке — Claude 3.7 Sonnet. Гибридность означает, что модель работает одновременно как модель рассуждения и как большая языковая модель (LLM).

В то время как OpenAI недавно анонсировала, что GPT-5 будет унифицированной моделью, Anthropic уже представила Claude 3.7 Sonnet, способную как на быстрые ответы, так и на глубокие рассуждения, опережая конкурентов в этом конкретном подходе к развитию ИИ.

Эта новая модель может «думать» над вопросами так долго, как пользователи ее попросят, поэтому в зависимости от продолжительности обдумывания, ее ответы могут существенно различаться.

Claude 3.7 Sonnet также может создавать сложные приложения с помощью одного запроса, а с появлением нового продукта под названием Claude Code, разработчики теперь могут поручать значительные инженерные задачи Claude прямо из своего терминала.

Ключевые особенности Claude 3.7 Sonnet

Claude 3.7 Sonnet обладает несколькими важными функциями, которые отличают ее от предыдущих моделей и других ИИ-систем на рынке:

1. Режим расширенного мышления

Пожалуй, самой заметной особенностью является возможность расширенного мышления. В отличие от большинства ИИ-моделей, которые дают мгновенные ответы, Claude 3.7 Sonnet может потратить время на «обдумывание» перед ответом на вопросы. Процесс обдумывания виден пользователям, что делает рассуждения ИИ более прозрачными.

При использовании API пользователи могут точно контролировать, сколько именно времени модель размышляет. Вы можете указать Claude думать определенное количество токенов, вплоть до предела вывода в 128 тысяч токенов. Это позволяет балансировать между скоростью и стоимостью в зависимости от требуемого качества ответов.

Вот пример кода на TypeScript для расширенного мышления:

import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic();

const response = await client.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 20000,
  thinking: {
    type: "enabled",
    budget_tokens: 16000
  },
  messages: [{
    role: "user",
    content: "Существует ли бесконечное количество простых чисел таких, что n mod 4 == 3?"
  }]
});

// Вывод процесса мышления и итогового ответа
console.log(response);

Ответ API будет включать блоки как с процессом мышления, так и с текстовым содержанием:

{
    "content": [
        {
            "type": "thinking",
            "thinking": "Чтобы подойти к этому, давайте подумаем о том, что мы знаем о простых числах...",
            "signature": "zbbJhbGciOiJFU8zI1NiIsImtakcjsu38219c0.eyJoYXNoIjoiYWJjMTIzIiwiaWFxxxjoxNjE0NTM0NTY3fQ...."
        },
        {
            "type": "text",
            "text": "Да, существует бесконечно много простых чисел таких, что..."
        }
    ]
}

Для людей, которым требуется более высокая точность, особенно по сложным темам, таким как математика, физика или программирование, режим расширенного мышления дает большое преимущество. Модель может поэтапно решать проблемы, подобно тому, как думают люди, что приводит к более надежным ответам.

2. Увеличенная емкость вывода

Claude 3.7 Sonnet поддерживает до 128 тысяч выходных токенов (в бета-версии), что в 15 раз больше, чем раньше. Это очень полезно для:

Генерации сложного кода
Детального планирования документов
Написания длинных текстов
Обработки крупных задач по анализу данных

Благодаря расширенным возможностям модель может решать гораздо более сложные задачи, не упираясь в ограничения по количеству токенов.

3. Улучшенные возможности программирования

Модель демонстрирует значительные улучшения в программировании по многим направлениям:

Планирование и решение сложных задач программирования
Обработка полнофункциональных обновлений
Работа со сложными кодовыми базами
Создание с нуля сложных веб-приложений и панелей управления
Создание готового к продакшену кода с меньшим количеством ошибок

Несколько технологических компаний, таких как Cursor, Cognition, Vercel и Replit, уже протестировали Claude 3.7 Sonnet и обнаружили, что он лучше других моделей справляется с реальными задачами программирования.

4. Сокращение необоснованных отказов

По данным Anthropic, Claude 3.7 Sonnet более тщательно различает вредные и безвредные запросы, сокращая необоснованные отказы на 45% по сравнению с более ранними моделями. Это помогает ИИ быть более полезным, не блокируя постоянно разумные запросы.

Это огромное достижение, потому что одна из причин, по которой некоторые люди не использовали Claude в последние пару месяцев, — это высокая частота отказов. Честно говоря, это была раздражающая особенность.

5. Claude Code

Claude Code — это совершенно новый инструмент командной строки для того, что Anthropic называет «агентным программированием». В настоящее время он доступен в виде ограниченной предварительной исследовательской версии и позволяет разработчикам передавать существенные инженерные задачи Claude прямо из своего терминала.

Инструмент выступает в роли партнера по кодингу, который может:

Искать и читать код
Редактировать файлы
Писать и запускать тесты
Коммитить и отправлять код в GitHub
Использовать инструменты командной строки
Информировать вас на каждом этапе

В ходе раннего тестирования было обнаружено, что Claude Code может за один проход выполнить задачи, которые обычно требуют 45+ минут ручной работы, что сокращает время разработки.

Claude Code в настоящее время доступен в качестве ограниченного исследовательского превью. Разработчикам, заинтересованным в его тестировании, необходимо присоединиться к программе превью.

Производительность Claude 3.7 Sonnet

Производительность Claude 3.7 Sonnet показывает значительные улучшения по сравнению с предыдущими моделями в нескольких ключевых областях:

Производительность в программировании

Claude 3.7 Sonnet показал впечатляющие результаты на эталонных тестах по программированию и в реальных испытаниях. Он достигает наилучших в своем классе показателей на SWE-bench Verified, который оценивает способность ИИ-моделей решать реальные проблемы разработки программного обеспечения.

Производительность рассуждений

Anthropic также сообщила, что Claude 3.7 Sonnet достигает лучших в своем классе показателей на TAU-bench, фреймворке, который проверяет ИИ-агентов на сложных реальных задачах с взаимодействием с пользователем и инструментами.

Компания говорит, что их цель с Claude Code — лучше понять, как разработчики используют Claude для программирования, что поможет им улучшить будущие модели.

Производительность рассуждений

Благодаря расширенному режиму мышления Claude 3.7 Sonnet лучше справляется с задачами, требующими тщательного рассуждения:

Задачи по математике и естественным наукам показывают заметное улучшение
Сложные задачи планирования выигрывают от пошагового процесса мышления
Следование инструкциям становится более точным
Модель делает меньше ошибок в задачах, требующих нескольких шагов рассуждения

Эта способность к рассуждению переводит Claude 3.7 Sonnet в новую категорию ИИ-моделей, которые могут глубже размышлять над проблемами, а не просто генерировать текст на основе шаблонов.

Как получить доступ к Claude 3.7 Sonnet

Claude 3.7 Sonnet теперь доступен как на веб-сайте Claude, так и через API-доступ. Для доступа через интерфейс чата вы можете использовать следующие способы:

Веб-интерфейс в браузере
iOS-приложение
Android-приложение

Просто переключитесь на Claude 3.7 Sonnet из выпадающего списка моделей.

Все тарифные планы Claude могут получить доступ к модели, включая Free, Pro, Team и Enterprise. Однако режим расширенного мышления доступен только для платных планов (Pro, Team и Enterprise).

Разработчики также могут получить доступ к Claude 3.7 Sonnet через:

API Anthropic
Amazon Bedrock
Google Cloud`s Vertex AI

При использовании API разработчики имеют полный контроль над бюджетом мышления модели, что позволяет им указать, сколько токенов модель может использовать для размышлений.

Вот пример вызова API с использованием TypeScript:

import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: 'my_api_key', // по умолчанию process.env["ANTHROPIC_API_KEY"]
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Привет, Claude" }],
});
console.log(msg);

Цены на Claude 3.7 Sonnet

Claude 3.7 Sonnet включен в бесплатный тарифный план на claude.ai, но без режима расширенного мышления. Вы также можете перейти на тариф Pro ($20 в месяц) или Team ($30 в месяц).

Тариф Pro: Полный доступ, включая режим расширенного мышления
Планы Team и Enterprise: Полный доступ с дополнительными функциями для организаций

Claude 3.7 Sonnet сохраняет те же цены, что и предыдущие модели:

$3 за миллион входных токенов
$15 за миллион выходных токенов

Эта цена включает токены мышления при использовании режима расширенного мышления. Для пользователей API есть возможности для экономии:

До 90% экономии с кэшированием запросов
50% экономии с пакетной обработкой

Почему это так важно?

Наличие более мощной ИИ-модели означает, что можно быть более уверенным в том, что она будет лучше осознавать кодовую базу вашего проекта и будет более способна генерировать более безопасный и более полный код.

Особенно ценна способность понимать контекст всей кодовой базы. Предыдущие модели часто теряли представление о том, как разные части проекта сочетаются между собой, но Claude 3.7 Sonnet, похоже, поддерживает более целостное понимание крупных проектов.

Для исследователей глубокая способность мышления этой модели означает меньшую вероятность галлюцинаций, и она действительно генерирует более осмысленные и фактические ответы. Видимый процесс рассуждения также помогает исследователям понять, как модель пришла к своим выводам, что важно для доверия и проверки.

Для обычных пользователей ответы от этой новой модели на самом деле более надежны и менее роботизированы. Более длинное окно контекста и улучшенное рассуждение приводят к беседам, которые кажутся более естественными и полезными.

Для разработчиков ИИ, claude-3.7-sonnet и claude-3.7–sonnet-thinking теперь поддерживаются в Cursor!

Вот как вы можете переключиться на новые модели в Cursor.

Anthropic выпустила Claude 3.7 Sonnet неожиданно. Ожидалось, что сначала будет выпущен Claude 3.5 Opus, но похоже, что они уже отказались от этой модели.

Теперь очевидно, что крупные технологические компании участвуют в гонке за выпуск лучшей ИИ-модели с возможностями рассуждения. Прошло всего несколько недель с тех пор, как DeepSeek выпустил R-1, затем xAI запустил Grok 3 с возможностями рассуждения, а теперь у нас есть Claude 3.7 Sonnet.

Больше всего радует интеграция Claude 3.7 Sonnet в инструменты кодирования, такие как Cursor.

Особенно для разработчиков улучшения в возможностях программирования и появление Claude Code могут изменить способ работы. Наличие ИИ, который может понимать большие кодовые базы и выполнять существенные инженерные задачи, может освободить нас для сосредоточения на более творческих аспектах разработки.

Хотя будем осторожны в отношении некоторых заявлений, Claude 3.7 Sonnet указывает на будущее, где ИИ работает вместе с людьми как настоящий мыслящий партнер, а не просто как сложный инструмент автозаполнения.

Все чат-боты

Все LLM-модели