Летом-2025 появились сразу два «титана» — OpenAI GPT-5 (7 августа) и xAI Grok 4 (9 июля). Они не однотипны: GPT-5 сильнее в кодинге и интеграции для бизнеса, а Grok 4 — в сложном рассуждении и работе с живыми источниками.
О том, как и где использовать нейросети уже сегодня — расскажем на бесплатном вебинаре!
Контекст выпуска и стратегический смысл
Обе компании вышли на новый этап одновременно: xAI поспешил на рынок с Grok 4, опираясь на огромные вычислительные ресурсы (в материале упоминается суперкомпьютер «Colossus» с \~200 000 GPU), OpenAI ответил GPT-5 с упором на экосистему и «единый» пользовательский опыт. Это как гонка между старой школой мастерства (OpenAI) и лабораторией быстрой экспериментальной науки (xAI).
Архитектуры и философия — две разные школы
GPT-5 использует «унифицированный» подход: в одной системе есть лёгкие и тяжёлые варианты (мини-, нано-, pro-версии), а «роутер» сам выбирает режим по сложности задачи. У GPT-5 — гигантское контекстное окно: \~272k входных + 128k для рассуждений/вывода (\~400k токенов). Это делает модель удобной для анализа больших документов и больших кодовых баз.
Grok 4 — про командную работу: базовая модель может работать как один агент, а Grok 4 Heavy развёртывает несколько агентов, которые проверяют и дополняют друг друга в реальном времени. Архитектура фокусируется на нативном использовании инструментов (браузинг, исполнение кода, поиск в реальном времени) и мультиагентной валидации.
Контекст и «память» — кто что запоминает
GPT-5 выигрывает по «объёму памяти» (контекстному окну) — это важно для работы с большими репозиториями кода, длинными документами и сложными инструкциями. Grok 4 тоже имеет большой контекст (256k), но делает ставку на динамический доступ к веб-источникам и многопользовательское координирование агентов.
Бенчмарки: где кто сильнее
По доступным данным модели проявляют разные сильные стороны.
GPT-5:
- SWE-bench Verified (код): 74.9% — лидер в задачах по программированию.
- Aider Polyglot: 88% (многоплатформенная генерация/редактирование кода).
- AIME 2025 с Python-инструментами: 100% (высокие результаты в математике с инструментами).
Grok 4:
- ARC-AGI-2 (сложное рассуждение): 16.2% против 9.9% у GPT-5 — заметное преимущество в задачах общего рассуждения.
- Humanity’s Last Exam: около 50% — первая модель, перешедшая важный порог в этом наборе.
- ARC-AGI-1 и прочие тесты показывают, что Grok сильнее там, где нужна «многопроходная» проверка гипотез и исследовательская работа.
Вывод: для чистого кода и производственных сценариев — GPT-5; для исследовательских задач и работы с живыми источниками — Grok 4.
Инструменты и агентность — как они действуют в реальном мире
OpenAI делает ставку на ChatGPT Agent: безопасная среда (виртуальная машина/изолированный браузер), интеграции с почтой, Google Drive, GitHub и прочими корпоративными сервисами, административные и конформные настройки — то, что нужно бизнесу.
xAI у Grok 4 — нативное использование инструментов: браузинг в реальном времени, «видимые» следы поиска, естественное использование внешних инструментов внутри процесса рассуждения. Это даёт Grok быстрое преимущество в задачах, где нужны ап-то-дейт данные и социальная аналитика.
Цена и экономическая сторона
Стоимость по токенам:
- GPT-5: \$1.25 за 1M входных токенов, \$10 за 1M выходных токенов; есть дешёвые варианты (Nano/Mini).
- Grok 4: \$3 за 1M входных токенов, \$15 за 1M выходных токенов; live search — \$25 за 1000 источников.
Подписки:
- ChatGPT Pro ≈ \$200/мес (приблизительно, для полнофункционального доступа).
- SuperGrok Heavy ≈ \$300/мес — дороже, но даёт multi-agent и приоритетную ресурсную базу.
Grok дороже за токен и за поиск, но даёт «прямой» доступ к реальному времени — это ценно для некоторых бизнесов.
Безопасность и надежность
OpenAI подчёркивает надёжность GPT-5: меньше фактических ошибок, низкий уровень выдумок (hallucinations) в «thinking» режиме, масштабное red-teaming. Grok делает упор на прозрачность: видимые логи поиска и «показывает работу», но у xAI были вопросы по модерации контента — это фактор для брендов и органов контроля.
Кому какая модель подходит — практические рекомендации
Если вы разрабатываете ПО, автоматизируете корпоративные процессы, нуждаетесь в compliance и интеграциях — GPT-5 скорее ваш выбор. Если вы занимаетесь исследованием, разведкой, аналитикой трендов в соцсетях, журналистикой или экспериментами с мультиагентной логикой — Grok 4 даст больше возможностей.
Если у вас разные задачи — разумно комбинировать: GPT-5 для pipeline-а и production, Grok 4 для research/triage и живого поиска.
Итог — кто «выиграл»?
Нет абсолютного победителя: выбор зависит от целей. GPT-5 — мастер производства и масштабирования кода; Grok 4 — исследователь и «живой» аналитик с преимуществами в рассуждении и реальном времени. В 2025-м конкурентная гонка только ускорит инновации — и это на руку вам: модели становятся лучше, а цены и инструменты — гибче.
- Выполним базовые задачи на российских нейросетях и посмотрим на результаты!
- PDF-инструкцию «Как сделать нейрофотосессию из своего фото бесплатно, без иностранных карт и прочих сложностей»
- Покажем 10+ способов улучшить свою жизнь с ИИ каждому — от ребенка и пенсионера до управленца и предпринимателя
- Возможность получить Доступ в Нейроклуб на целый месяц
- Как AI ускоряет работу и приносит деньги
- За 2 часа вы получите четкий план, как начать работать с AI прямо сейчас!
