OpenAI o1: новые модели с улучшенной логикой и меньшими ошибками

Большие языковые модели имеют особенность — они способны генерировать разного рода решения с уверенностью профессора, работающего в своей области всю жизнь. Однако, в отличие от профессора, думать они не способны. Зато они могут лгать, или «галлюцинировать», как это называется в среде специалистов. От ошибки нейросети ничего не будет — она не рискует карьерой и уважением, а в диалоговом окне у самого популярного чат-бота даже есть пометка: «ChatGPT может ошибаться. Проверяйте важную информацию».

Такова особенность нейросетей. Но это не значит, что с ней ничего нельзя сделать — или, по крайней мере, попытаться. Именно это разработчики OpenAI и решили сделать в новом релизе большой языковой модели от, пожалуй, самого крупного игрока рынка нейросетей настоящего времени. Встречаем OpenAI o1!

О чем речь

OpenAI o1 — не одна большая языковая модель, а целая серия, которая состоит из непосредственно OpenAI o1, OpenAI o1-preview и OpenAI o1-mini. Первая модель из серии пока не открыта для публичного доступа, но желающие могут воспользоваться серией-превью — она доступна для подписчиков платной версии ChatGPT Plus. Мини-версия — все то же самое, просто более оптимизированная, чтобы результаты запросов быстрее загружались.

Может возникнуть вопрос, почему OpenAI o1, если финальная версия до релиза новой серии была четвертой? Все просто — разработчики официально сбрасывают счет до единицы, потому что новинка, по их словам, настолько отличается от всех предыдущих версий, что определенно этого заслуживает. И самое главное в ней то, что она способна решать более сложные задачи, для которых требуются логика и здравый смысл.

ОБЗОРНЫЙ ПРАКТИКУМ ПО НАШУМЕВШИМ НЕЙРОСЕТЯМ

Нейросети DEEPSEEK И QWEN За 2 часа сделаем полный обзор новых мощных ИИ-моделей, которые бросают вызов нейросети ChatGPT

ТОП-подарки всем участникам лекции:

Возможность получить Доступ в Нейроклуб на целый месяц
Как ИИ ускоряет работу и приносит деньги
За 2 часа вы получите четкий план, как начать работать с ИИ прямо сейчас!

Участвовать бесплатно

Поэтому GPT-5 пока не будет. При этом полностью отказываться от GPT-4o в OpenAI не собираются.

ОНЛАЙН-ПРАКТИКУМ

ЗАПУСК нейросети DEEPSEEK R1 ЛОКАЛЬНО НА СВОЕМ КОМПЬЮТЕРЕ

ЧТО БУДЕТ НА ОБУЧЕНИИ?

ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ нейросети DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ
Где и как применять? Потестируем модель после установки на разных задачах
Как дообучить модель под себя?

Участвовать бесплатно

Что умеет новая модель

Разработчики научили нейросеть «думать», прежде чем выдавать результат. Для этого они использовали такой алгоритм промпт-инжиниринга как Chain of Thought (CoT) — или «цепочка мыслей». Мы уже писали об этом и о других подходах к составлению промптов.

Работает это так: получив запрос от пользователя, нейросеть не генерирует результат моментально, а сначала как бы «разбивает» его на более простые шаги. После этого искусственный интеллект решает каждую «подзадачу», и только затем складывает их в финальный ответ.

В примерах, предложенных в презентации OpenAI, нейросеть декодирует шифр с использованием подсказки, разгадывает кроссворд, отвечает на вопросы по математике, химии и английскому языку.

При этом нейросеть демонстрирует цепочку мыслей — можно посмотреть, как именно она «думает».

Исследования показали, что CoT действительно улучшает точность генерации и помогает избавиться от галлюцинаций. Поэтому нет ничего странного в том, что разработчики OpenAI решили «встроить» этот метод промпт-инжиниринга в свою модель.

Другая особенность OpenAI o1 заключается в том, что она натренирована использовать несколько подходов, затем анализировать, который из них оказался эффективнее, и опираться именно на него. Все те методики и техники для улучшения качества генерации, которые раньше приходилось «прикручивать», теперь есть в модели по умолчанию. Правда, пока только в превью-версии и в платном режиме.

О промптах и методах их составления мы рассказываем на открытом вебинаре. Записывайтесь, чтобы лучше понять, как именно работают GPT и другие большие языковые модели! Это бесплатно.

В остальном OpenAI o1 работает так же, как все предыдущие версии. Публично никакой информации об архитектурных и технических нововведениях OpenAI не распространили.

OpenAI o1 против GPT-4o

По сравнению с GPT-4o новая модель показала очень хорошие результаты применительно ко всему, что связано с логикой. Это при том, что GPT-4o тоже продемонстрировал неплохие логические результаты при проверках на классических бенчмарках, таких как MMLU.

При этом с задачами более высокого уровня, как оказалось, GPT-4o справляется из рук вон плохо. Разработчики протестировали обе модели на 2024 USA Math Olympiad (AIME) — это материал олимпиады по математике в США. GPT-4o справился с двумя заданиями из пятнадцати, тогда как OpenAI o1 удалось решить тринадцать. Таким образом, это поставило новую модель в топ-500 учащихся-олимпиадников.

Похожая ситуация произошла и с задачами на платформе для соревновательного программирования Codeforces. GPT-4o набрала 11%, тогда как o1 — 89%.

Однако и у отличников порой бывают предметы, по которым они не успевают. Для OpenAI o1 этими предметами оказалось личное письмо, когда от нейросети требуется написать историю о себе, и редактирование текста. В первом случае с задачей новая модель справилась хуже, чем GPT-4o, во втором случае их результаты оказались одинаковыми.

Так что можно сказать, что новая модель более специализированная, «заточенная» под предметы STEM — естественные науки, технологии, инженерию и математику, требующие логики и умения рассуждать. Она хороша и в генерации кода. А вот сравнительно «общие» задачи лучше оставить GPT-4o, правда, не забывая проверять их на галлюцинации, поскольку встроенной защиты от них у нейросети нет.

Пожалуй, вот и причина, по которой OpenAI не собираются лишать пользователей GPT-4o. У новой и старой моделей разные задачи и разные сферы использования, хотя попробовать полноценную версию OpenAI o1 все равно было бы интересно.

РОССИЙСКИЕ НЕЙРОСЕТИ ДЛЯ ЖИЗНИ И КАРЬЕРЫ В 2025

Присоединяйся к онлайн-вебинару.

В прямом эфире разберем и потестируем лучшие на сегодняшний день отечественные ИИ!

Вы узнаете о том:

Выполним базовые задачи на российских нейросетях и посмотрим на результаты!
Файл-инструкцию «Как сделать нейро-фотосессию из своего фото бесплатно, без иностранных карт и прочих сложностей»
Покажем 10+ способов улучшить свою жизнь с ИИ каждому — от ребенка и пенсионера до управленца и предпринимателя

Участвовать бесплатно

ОБЗОРНЫЙ ПРАКТИКУМ ПО НАШУМЕВШИМ НЕЙРОСЕТЯМ

Нейросети DEEPSEEK И QWEN

За 2 часа сделаем полный обзор новых мощных ИИ-моделей, которые бросают вызов нейросети ChatGPT

Вы узнаете:

Возможность получить Доступ в Нейроклуб на целый месяц
Как ИИ ускоряет работу и приносит деньги
За 2 часа вы получите четкий план, как начать работать с ИИ прямо сейчас!

Участвовать бесплатно

РОССИЙСКИЕ НЕЙРОСЕТИ ДЛЯ ЖИЗНИ И КАРЬЕРЫ В 2025

Присоединяйся к онлайн-вебинару.

В прямом эфире разберем и потестируем лучшие на сегодняшний день отечественные ИИ!

Вы узнаете о том:

Выполним базовые задачи на российских нейросетях и посмотрим на результаты!
Файл-инструкцию «Как сделать нейро-фотосессию из своего фото бесплатно, без иностранных карт и прочих сложностей»
Покажем 10+ способов улучшить свою жизнь с ИИ каждому — от ребенка и пенсионера до управленца и предпринимателя

Участвовать бесплатно

ОБЗОРНЫЙ ПРАКТИКУМ ПО НАШУМЕВШИМ НЕЙРОСЕТЯМ

Нейросети DEEPSEEK И QWEN

За 2 часа сделаем полный обзор новых мощных ИИ-моделей, которые бросают вызов нейросети ChatGPT

Вы узнаете:

Возможность получить Доступ в Нейроклуб на целый месяц
Как ИИ ускоряет работу и приносит деньги
За 2 часа вы получите четкий план, как начать работать с ИИ прямо сейчас!

Участвовать бесплатно

Медиа о нейросетях,
зерокодинге и онлайн-образовании

Медиа о нейросетях,
зерокодинге и онлайн-образовании

Новая серия больших языковых моделей OpenAI o1: больше логики, меньше ошибок

О чем речь

Что умеет новая модель

OpenAI o1 против GPT-4o

Новая серия больших языковых моделей OpenAI o1: больше логики, меньше ошибок

О чем речь

Что умеет новая модель

OpenAI o1 против GPT-4o

Вам точно понравится