В мае 2025 года Anthropic выпустил новые модели Claude Opus 4 и Claude Sonnet 4 из линейки Claude 4 — обе — прорыв для AI-кодинга. На фоне Gemini 2.5 Pro от Google они демонстрируют более высокие показатели на ключевых задачах, сохраняя гибкость и эффективность.

Узнать больше о том, где и как можно использовать нейросети уже сегодня — можно на нашем бесплатном вебинаре!

Что важно знать об Opus 4 и Sonnet 4

Claude Opus 4

Лучший в мире для кодинга: лидер на SWE-bench с 72,5 %, превосходит OpenAI Codex-1 и Gemini 2.5 Pro. В режиме параллельного вычисления достигает 79,4 %, сравнимо с «Deep Think» у Gemini.

Еще он обладает монотонной производительностью: способен неделю без остановки (например, семь часов, как показало тестирование в Rakuten).  Плюс нативное использование инструментов: встроенный доступ к поиску, исполняемому коду, локальным файлам — например, создаёт вспомогательные «файлы памяти». Активирован уровень безопасности ASL‑3 с защитой от jailbreak-атак.

Claude Sonnet 4

Немного обгоняет Opus на SWE-bench: 72,7 % без тяжёлых вычислений и 80,2 % в агенте. Балансирует между мощностью и доступностью, оптимизирован для широкой аудитории и случаев, где важна цена. Доступен бесплатно для пользователей без подписки (с базовым режимом мышления).

ОНЛАЙН-ПРАКТИКУМ
ЗАПУСК DEEPSEEK R1 ЛОКАЛЬНО НА СВОЕМ КОМПЬЮТЕРЕ
ЧТО БУДЕТ НА ОБУЧЕНИИ?
  • ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ
  • Где и как применять? Потестируем модель после установки на разных задачах
  • Как дообучить модель под себя?

Сравнение с Gemini 2.5 Pro

На фоне Claude 4 Gemini 2.5 Pro проигрывает на ключевых метриках.

Вывод: новые Claude 4 обошли Gemini 2.5 Pro по SWE‑bench на ~9 п.п. в обычном режиме, и аж на ~16–17 п.п. в «глубоком» режиме.

Кому и зачем они подойдут

  • Для профессионалов в GitHub/VS Code: удобны в использовании благодаря интеграции и умению длительно удерживать контекст.
  • Для агентных систем: Opus 4 — оптимален для автоматизации, заботясь о целостности потока операций.
  • Для экономных пользователей: Sonnet 4 — пропускной уровень с топ-качеством, доступный бесплатно.
  • Для масштабных задач: Opus 4 держит контекст до десятков тысяч токенов и способен обрабатывать кодовые базы целиком.

Когда Gemini 2.5 Pro – лучше

  1. Если нужна огромная контекстная память — до 1 млн (скоро 2 млн) токенов, в отличие от Claude 4, где лимит ~200k.
  2. Если важна глубокая мультимодальность — Gemini живёт со связью с изображениями, звуком, видео и сложными интерфейсами.
  3. Если вы привязаны к экоcистеме Google Cloud / Vertex AI — Gemini интегрирован нативно.

Итог

Антропику удалось установить новую планку в области ИИ-кодирования. Модель Claude Opus 4 стала флагманом среди инструментов для программирования — она демонстрирует выдающиеся результаты на сложных инженерных задачах, обеспечивая стабильную и глубокую работу, как при кодировании, так и при анализе и планировании.

Её младший собрат — Claude Sonnet 4 — представляет собой сбалансированное решение: несмотря на меньшие ресурсы, модель показывает сравнимую (а в некоторых случаях и более высокую) точность, оставаясь при этом максимально доступной — в том числе для бесплатного использования. Это делает её оптимальным выбором для тех, кто ищет надёжный, эффективный и экономичный ИИ-инструмент.

Тем временем Gemini 2.5 Pro продолжает лидировать в других направлениях — прежде всего в работе с большими объемами данных благодаря расширенному контекстному окну и продвинутой мультимодальности. Однако в задачах, связанных именно с кодированием, модели от Anthropic в текущей версии демонстрируют более высокую производительность.

Большой практикум
ЗАМЕНИ ВСЕ НЕЙРОСЕТИ НА ОДНУ — PERPLEXITY
ПОКАЖЕМ НА КОНКРЕТНЫХ КЕЙСАХ
  • Освой Perplexity и узнай, как пользоваться функционалом остальных ИИ в одном
  • УЧАСТВОВАТЬ ЗА 0 РУБ.
  • Расскажем, как получить подписку (240$) бесплатно
Участвовать бесплатно
ОНЛАЙН-ПРАКТИКУМ
ЗАПУСК DEEPSEEK R1 ЛОКАЛЬНО НА СВОЕМ КОМПЬЮТЕРЕ
ЧТО БУДЕТ НА ОБУЧЕНИИ?
  • ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ
Участвовать бесплатно