Инструменты для программистов меняются быстрее, чем версии браузеров. И если раньше ИИ в кодинге был чем-то вроде «умного автодополнения», то сегодня он всё больше напоминает полноценного напарника по проекту. Именно в эту сторону и делает шаг OpenAI, представляя GPT-5.1-Codex-Max — новую флагманскую модель для агентного программирования.

Это не просто обновление Codex. Это попытка переосмыслить, как ИИ может работать с кодом долго, осмысленно и на уровне целых проектов.

Codex Max — что это вообще такое

GPT-5.1-Codex-Max — это специализированная модель для программирования, построенная на обновлённой базовой reasoning-архитектуре OpenAI. Её обучали не абстрактным примерам, а реальным инженерным задачам: pull request’ы, код-ревью, фронтенд, CLI-утилиты, дебаг, вопросы-ответы — всё то, чем живёт разработчик каждый день.

Если упрощать, Codex Max — это:

  • не «напиши мне функцию»
  • а «давай вместе доведём этот проект до рабочего состояния»

И да, она реально для этого предназначена.

ОНЛАЙН-ПРАКТИКУМ
ЗАПУСК DEEPSEEK R1 ЛОКАЛЬНО НА СВОЕМ КОМПЬЮТЕРЕ
ЧТО БУДЕТ НА ОБУЧЕНИИ?
  • ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ
  • Где и как применять? Потестируем модель после установки на разных задачах
  • Как дообучить модель под себя?

Главное отличие — умение думать долго

Ключевая фишка Codex Max — compaction. Это первый модельный подход OpenAI, который позволяет ИИ работать с миллионами токенов в рамках одной задачи, не теряя контекст.

Простая аналогия: обычные модели — как человек с короткой памятью, который каждый раз перечитывает последние страницы. Codex Max — как инженер, который ведёт рабочий дневник и умеет сжимать прошлый опыт, оставляя только важное.

Что это даёт на практике:

  • масштабные рефакторинги
  • многочасовой дебаг
  • длинные агентные циклы
  • проекты, которые раньше просто «не влезали» в контекст

Во внутренних тестах OpenAI модель работала над одной задачей более 24 часов, итеративно исправляя ошибки и доводя код до финального результата.

Производительность: цифры без магии

Маркетинг маркетингом, но давайте к цифрам.

SWE-bench Verified (n = 500)

  • GPT-5.1-Codex (high) — 73,7%
  • GPT-5.1-Codex-Max (xhigh)77,9%

SWE-Lancer IC SWE

  • Codex (high): 66,3%
  • Codex Max: 79,9%

Terminal-Bench 2.0

  • Codex: 52,8%
  • Codex Max: 58,1%

Важно другое: Codex Max показывает лучшую точность, используя на 30% меньше thinking-токенов при среднем уровне рассуждений. То есть он не просто умнее — он ещё и экономнее.

Скорость и деньги — редкое сочетание

Обычно выбор такой: либо быстро, либо качественно, либо дёшево. Codex Max неожиданно пытается совместить всё сразу.

OpenAI вводит режим Extra High reasoning (xhigh) — для задач, где скорость не критична, а качество решает всё. Но для повседневной работы по-прежнему рекомендуют medium — он даёт лучший баланс.

На реальных примерах:

  • те же frontend-приложения
  • та же логика
  • та же эстетика

…но значительно дешевле по токенам, чем у предыдущей версии Codex.

Реальный пример: CartPole и не только

Один из показательных кейсов — генерация полноценного браузерного приложения с RL-симуляцией CartPole:

  • canvas-графика
  • policy-gradient
  • визуализация весов нейросети
  • метрики, награды, survival time
  • сохранение в один index.html

Codex Max не просто написал код — он поддерживал целостность проекта, не развалившись на середине. Это и есть разница между «умным помощником» и «агентом».

Безопасность без розовых очков

OpenAI отдельно подчёркивает: рост возможностей — это рост ответственности.

Codex Max:

  • работает в изолированном sandbox по умолчанию
  • не имеет сетевого доступа без разрешения
  • логирует все действия
  • цитирует tool-вызовы и тесты

Да, модель стала сильнее в кибербезопасности, но пока не достигает High-уровня по внутренней классификации. При этом OpenAI уже усиливает защиту и активно отслеживает злоупотребления.

Главная мысль честная и взрослая: Codex — это ещё один ревьюер, а не замена человеку.

Доступность и планы

На данный момент GPT-5.1-Codex-Max доступен в Codex для пользователей:

  • ChatGPT Plus
  • Pro
  • Business
  • Edu
  • Enterprise

В ближайшее время ожидается доступ через API. Также Codex Max становится моделью по умолчанию, заменяя GPT-5.1-Codex.

Важно: это не универсальная модель «на всё». OpenAI прямо рекомендует использовать Codex-семейство только для агентного кодинга.

Почему это важно

Внутренняя статистика OpenAI звучит почти дерзко:

  • 95% инженеров OpenAI используют Codex еженедельно
  • они стали выпускать примерно на 70% больше pull request’ов

Это не про «ИИ заменит программистов». Это про то, что хороший инженер с Codex Max — это инженер с усилителем.

Итог

GPT-5.1-Codex-Max — это не очередная «умная модель». Это шаг к ИИ, который:

  • держит контекст
  • не устаёт
  • не теряет нить
  • и реально доводит задачи до конца

Если раньше ИИ в кодинге был быстрым помощником, то теперь он всё больше становится спокойным, усидчивым и внимательным напарником, с которым не страшно браться за большие проекты.

И, честно говоря, дальше будет только интереснее.

Большой практикум
ЗАМЕНИ ВСЕ НЕЙРОСЕТИ НА ОДНУ — PERPLEXITY
ПОКАЖЕМ НА КОНКРЕТНЫХ КЕЙСАХ
  • Освой Perplexity и узнай, как пользоваться функционалом остальных ИИ в одном
  • УЧАСТВОВАТЬ ЗА 0 РУБ.
  • Расскажем, как получить подписку (240$) бесплатно
Участвовать бесплатно
ОНЛАЙН-ПРАКТИКУМ
ЗАПУСК DEEPSEEK R1 ЛОКАЛЬНО НА СВОЕМ КОМПЬЮТЕРЕ
ЧТО БУДЕТ НА ОБУЧЕНИИ?
  • ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ
Участвовать бесплатно