Новая модель для кодирования от OpenAI

Инструменты для программистов меняются быстрее, чем версии браузеров. И если раньше ИИ в кодинге был чем-то вроде «умного автодополнения», то сегодня он всё больше напоминает полноценного напарника по проекту. Именно в эту сторону и делает шаг OpenAI, представляя GPT-5.1-Codex-Max — новую флагманскую модель для агентного программирования.

Это не просто обновление Codex. Это попытка переосмыслить, как ИИ может работать с кодом долго, осмысленно и на уровне целых проектов.

Codex Max — что это вообще такое

GPT-5.1-Codex-Max — это специализированная модель для программирования, построенная на обновлённой базовой reasoning-архитектуре OpenAI. Её обучали не абстрактным примерам, а реальным инженерным задачам: pull request’ы, код-ревью, фронтенд, CLI-утилиты, дебаг, вопросы-ответы — всё то, чем живёт разработчик каждый день.

Если упрощать, Codex Max — это:

не «напиши мне функцию»
а «давай вместе доведём этот проект до рабочего состояния»

И да, она реально для этого предназначена.

ОНЛАЙН-ПРАКТИКУМ

ЗАПУСК нейросети DEEPSEEK R1 ЛОКАЛЬНО НА СВОЕМ КОМПЬЮТЕРЕ

ЧТО БУДЕТ НА ОБУЧЕНИИ?

ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ нейросети DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ
Где и как применять? Потестируем модель после установки на разных задачах
Как дообучить модель под себя?

Участвовать бесплатно

Главное отличие — умение думать долго

Ключевая фишка Codex Max — compaction. Это первый модельный подход OpenAI, который позволяет ИИ работать с миллионами токенов в рамках одной задачи, не теряя контекст.

Простая аналогия: обычные модели — как человек с короткой памятью, который каждый раз перечитывает последние страницы. Codex Max — как инженер, который ведёт рабочий дневник и умеет сжимать прошлый опыт, оставляя только важное.

Что это даёт на практике:

масштабные рефакторинги
многочасовой дебаг
длинные агентные циклы
проекты, которые раньше просто «не влезали» в контекст

Во внутренних тестах OpenAI модель работала над одной задачей более 24 часов, итеративно исправляя ошибки и доводя код до финального результата.

Производительность: цифры без магии

Маркетинг маркетингом, но давайте к цифрам.

SWE-bench Verified (n = 500)

GPT-5.1-Codex (high) — 73,7%
GPT-5.1-Codex-Max (xhigh) — 77,9%

SWE-Lancer IC SWE

Codex (high): 66,3%
Codex Max: 79,9%

Terminal-Bench 2.0

Codex: 52,8%
Codex Max: 58,1%

Важно другое: Codex Max показывает лучшую точность, используя на 30% меньше thinking-токенов при среднем уровне рассуждений. То есть он не просто умнее — он ещё и экономнее.

Скорость и деньги — редкое сочетание

Обычно выбор такой: либо быстро, либо качественно, либо дёшево. Codex Max неожиданно пытается совместить всё сразу.

OpenAI вводит режим Extra High reasoning (xhigh) — для задач, где скорость не критична, а качество решает всё. Но для повседневной работы по-прежнему рекомендуют medium — он даёт лучший баланс.

На реальных примерах:

те же frontend-приложения
та же логика
та же эстетика

…но значительно дешевле по токенам, чем у предыдущей версии Codex.

Реальный пример: CartPole и не только

Один из показательных кейсов — генерация полноценного браузерного приложения с RL-симуляцией CartPole:

canvas-графика
policy-gradient
визуализация весов нейросети
метрики, награды, survival time
сохранение в один index.html

Codex Max не просто написал код — он поддерживал целостность проекта, не развалившись на середине. Это и есть разница между «умным помощником» и «агентом».

Безопасность без розовых очков

OpenAI отдельно подчёркивает: рост возможностей — это рост ответственности.

Codex Max:

работает в изолированном sandbox по умолчанию
не имеет сетевого доступа без разрешения
логирует все действия
цитирует tool-вызовы и тесты

Да, модель стала сильнее в кибербезопасности, но пока не достигает High-уровня по внутренней классификации. При этом OpenAI уже усиливает защиту и активно отслеживает злоупотребления.

Главная мысль честная и взрослая: Codex — это ещё один ревьюер, а не замена человеку.

Доступность и планы

На данный момент GPT-5.1-Codex-Max доступен в Codex для пользователей:

ChatGPT Plus
Pro
Business
Edu
Enterprise

В ближайшее время ожидается доступ через API. Также Codex Max становится моделью по умолчанию, заменяя GPT-5.1-Codex.

Важно: это не универсальная модель «на всё». OpenAI прямо рекомендует использовать Codex-семейство только для агентного кодинга.

Почему это важно

Внутренняя статистика OpenAI звучит почти дерзко:

95% инженеров OpenAI используют Codex еженедельно
они стали выпускать примерно на 70% больше pull request’ов

Это не про «ИИ заменит программистов». Это про то, что хороший инженер с Codex Max — это инженер с усилителем.

Итог

GPT-5.1-Codex-Max — это не очередная «умная модель». Это шаг к ИИ, который:

держит контекст
не устаёт
не теряет нить
и реально доводит задачи до конца

Если раньше ИИ в кодинге был быстрым помощником, то теперь он всё больше становится спокойным, усидчивым и внимательным напарником, с которым не страшно браться за большие проекты.

И, честно говоря, дальше будет только интереснее.

Большой практикум

ЗАМЕНИ ВСЕ НЕЙРОСЕТИ НА ОДНУ — PERPLEXITY

ПОКАЖЕМ НА КОНКРЕТНЫХ КЕЙСАХ

Освой нейросеть Perplexity и узнай, как пользоваться функционалом остальных ИИ в одном
УЧАСТВОВАТЬ ЗА 0 РУБ.
Расскажем, как получить подписку

Участвовать бесплатно

ОНЛАЙН-ПРАКТИКУМ

ЗАПУСК нейросети DEEPSEEK R1 ЛОКАЛЬНО НА СВОЕМ КОМПЬЮТЕРЕ

ЧТО БУДЕТ НА ОБУЧЕНИИ?

ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ нейросеть DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ

Участвовать бесплатно

Медиа о нейросетях,
зерокодинге и онлайн-образовании

Медиа о нейросетях,
зерокодинге и онлайн-образовании

Новая модель для кодирования от OpenAI — Codex Max

Codex Max — что это вообще такое

Главное отличие — умение думать долго