Летом-2025 появились сразу два «титана» — OpenAI GPT-5 (7 августа) и xAI Grok 4 (9 июля). Они не однотипны: GPT-5 сильнее в кодинге и интеграции для бизнеса, а Grok 4 — в сложном рассуждении и работе с живыми источниками.

О том, как и где использовать нейросети уже сегодня — расскажем на бесплатном вебинаре!

Контекст выпуска и стратегический смысл

Обе компании вышли на новый этап одновременно: xAI поспешил на рынок с Grok 4, опираясь на огромные вычислительные ресурсы (в материале упоминается суперкомпьютер «Colossus» с \~200 000 GPU), OpenAI ответил GPT-5 с упором на экосистему и «единый» пользовательский опыт. Это как гонка между старой школой мастерства (OpenAI) и лабораторией быстрой экспериментальной науки (xAI).

Архитектуры и философия — две разные школы

GPT-5 использует «унифицированный» подход: в одной системе есть лёгкие и тяжёлые варианты (мини-, нано-, pro-версии), а «роутер» сам выбирает режим по сложности задачи. У GPT-5 — гигантское контекстное окно: \~272k входных + 128k для рассуждений/вывода (\~400k токенов). Это делает модель удобной для анализа больших документов и больших кодовых баз.

Grok 4 — про командную работу: базовая модель может работать как один агент, а Grok 4 Heavy развёртывает несколько агентов, которые проверяют и дополняют друг друга в реальном времени. Архитектура фокусируется на нативном использовании инструментов (браузинг, исполнение кода, поиск в реальном времени) и мультиагентной валидации.

Контекст и «память» — кто что запоминает

GPT-5 выигрывает по «объёму памяти» (контекстному окну) — это важно для работы с большими репозиториями кода, длинными документами и сложными инструкциями. Grok 4 тоже имеет большой контекст (256k), но делает ставку на динамический доступ к веб-источникам и многопользовательское координирование агентов.

Бенчмарки: где кто сильнее

По доступным данным модели проявляют разные сильные стороны.

GPT-5:

  • SWE-bench Verified (код): 74.9% — лидер в задачах по программированию.
  • Aider Polyglot: 88% (многоплатформенная генерация/редактирование кода).
  • AIME 2025 с Python-инструментами: 100% (высокие результаты в математике с инструментами).

Grok 4:

  • ARC-AGI-2 (сложное рассуждение): 16.2% против 9.9% у GPT-5 — заметное преимущество в задачах общего рассуждения.
  • Humanity’s Last Exam: около 50% — первая модель, перешедшая важный порог в этом наборе.
  • ARC-AGI-1 и прочие тесты показывают, что Grok сильнее там, где нужна «многопроходная» проверка гипотез и исследовательская работа.

Вывод: для чистого кода и производственных сценариев — GPT-5; для исследовательских задач и работы с живыми источниками — Grok 4.

Инструменты и агентность — как они действуют в реальном мире

OpenAI делает ставку на ChatGPT Agent: безопасная среда (виртуальная машина/изолированный браузер), интеграции с почтой, Google Drive, GitHub и прочими корпоративными сервисами, административные и конформные настройки — то, что нужно бизнесу.

xAI у Grok 4 — нативное использование инструментов: браузинг в реальном времени, «видимые» следы поиска, естественное использование внешних инструментов внутри процесса рассуждения. Это даёт Grok быстрое преимущество в задачах, где нужны ап-то-дейт данные и социальная аналитика.

Цена и экономическая сторона

Стоимость по токенам:

  • GPT-5: \$1.25 за 1M входных токенов, \$10 за 1M выходных токенов; есть дешёвые варианты (Nano/Mini).
  • Grok 4: \$3 за 1M входных токенов, \$15 за 1M выходных токенов; live search — \$25 за 1000 источников.

Подписки:

  • ChatGPT Pro ≈ \$200/мес (приблизительно, для полнофункционального доступа).
  • SuperGrok Heavy ≈ \$300/мес — дороже, но даёт multi-agent и приоритетную ресурсную базу.

Grok дороже за токен и за поиск, но даёт «прямой» доступ к реальному времени — это ценно для некоторых бизнесов.

Безопасность и надежность

OpenAI подчёркивает надёжность GPT-5: меньше фактических ошибок, низкий уровень выдумок (hallucinations) в «thinking» режиме, масштабное red-teaming. Grok делает упор на прозрачность: видимые логи поиска и «показывает работу», но у xAI были вопросы по модерации контента — это фактор для брендов и органов контроля.

Кому какая модель подходит — практические рекомендации

Если вы разрабатываете ПО, автоматизируете корпоративные процессы, нуждаетесь в compliance и интеграциях — GPT-5 скорее ваш выбор. Если вы занимаетесь исследованием, разведкой, аналитикой трендов в соцсетях, журналистикой или экспериментами с мультиагентной логикой — Grok 4 даст больше возможностей.

Если у вас разные задачи — разумно комбинировать: GPT-5 для pipeline-а и production, Grok 4 для research/triage и живого поиска.

Итог — кто «выиграл»?

Нет абсолютного победителя: выбор зависит от целей. GPT-5 — мастер производства и масштабирования кода; Grok 4 — исследователь и «живой» аналитик с преимуществами в рассуждении и реальном времени. В 2025-м конкурентная гонка только ускорит инновации — и это на руку вам: модели становятся лучше, а цены и инструменты — гибче.

РОССИЙСКИЕ НЕЙРОСЕТИ ДЛЯ ЖИЗНИ И КАРЬЕРЫ В 2025
Присоединяйся к онлайн-вебинару.
В прямом эфире разберем и потестируем лучшие на сегодняшний день отечественные ИИ!
Вы узнаете о том:
  • Выполним базовые задачи на российских нейросетях и посмотрим на результаты!
  • PDF-инструкцию «Как сделать нейрофотосессию из своего фото бесплатно, без иностранных карт и прочих сложностей»
  • Покажем 10+ способов улучшить свою жизнь с ИИ каждому — от ребенка и пенсионера до управленца и предпринимателя
Участвовать бесплатно
ОБЗОРНЫЙ ПРАКТИКУМ ПО НАШУМЕВШИМ НЕЙРОСЕТЯМ
DEEPSEEK И QWEN
За 2 часа сделаем полный обзор новых мощных AI-моделей, которые бросают вызов ChatGPT
Вы узнаете:
  • Возможность получить Доступ в Нейроклуб на целый месяц
  • Как AI ускоряет работу и приносит деньги
  • За 2 часа вы получите четкий план, как начать работать с AI прямо сейчас!
Участвовать бесплатно