Большие языковые модели имеют особенность — они способны генерировать разного рода решения с уверенностью профессора, работающего в своей области всю жизнь. Однако, в отличие от профессора, думать они не способны. Зато они могут лгать, или «галлюцинировать», как это называется в среде специалистов. От ошибки нейросети ничего не будет — она не рискует карьерой и уважением, а в диалоговом окне у самого популярного чат-бота даже есть пометка: «ChatGPT может ошибаться. Проверяйте важную информацию».
Такова особенность нейросетей. Но это не значит, что с ней ничего нельзя сделать — или, по крайней мере, попытаться. Именно это разработчики OpenAI и решили сделать в новом релизе большой языковой модели от, пожалуй, самого крупного игрока рынка нейросетей настоящего времени. Встречаем OpenAI o1!
О чем речь
OpenAI o1 — не одна большая языковая модель, а целая серия, которая состоит из непосредственно OpenAI o1, OpenAI o1-preview и OpenAI o1-mini. Первая модель из серии пока не открыта для публичного доступа, но желающие могут воспользоваться серией-превью — она доступна для подписчиков платной версии ChatGPT Plus. Мини-версия — все то же самое, просто более оптимизированная, чтобы результаты запросов быстрее загружались.
Может возникнуть вопрос, почему OpenAI o1, если финальная версия до релиза новой серии была четвертой? Все просто — разработчики официально сбрасывают счет до единицы, потому что новинка, по их словам, настолько отличается от всех предыдущих версий, что определенно этого заслуживает. И самое главное в ней то, что она способна решать более сложные задачи, для которых требуются логика и здравый смысл.
- ТОП-подарки всем участникам лекции:Открытая лекция РЕГИСТРАЦИЯ пошаговая PDF-инструкция “Как сделать нейрофотосессию из своего фото бесплатно
- подборка из 3800+ нейросетей
- доступ в бот с безлимитным доступом к ChatGPT
- ТОП-подарки всем участникам лекции:Открытая лекция РЕГИСТРАЦИЯ пошаговая PDF-инструкция “Как сделать нейрофотосессию из своего фото бесплатно
- подборка из 3800+ нейросетей
- доступ в бот с безлимитным доступом к ChatGPT
Поэтому GPT-5 пока не будет. При этом полностью отказываться от GPT-4o в OpenAI не собираются.
Что умеет новая модель
Разработчики научили нейросеть «думать», прежде чем выдавать результат. Для этого они использовали такой алгоритм промпт-инжиниринга как Chain of Thought (CoT) — или «цепочка мыслей». Мы уже писали об этом и о других подходах к составлению промптов.
Работает это так: получив запрос от пользователя, нейросеть не генерирует результат моментально, а сначала как бы «разбивает» его на более простые шаги. После этого искусственный интеллект решает каждую «подзадачу», и только затем складывает их в финальный ответ.
В примерах, предложенных в презентации OpenAI, нейросеть декодирует шифр с использованием подсказки, разгадывает кроссворд, отвечает на вопросы по математике, химии и английскому языку.
При этом нейросеть демонстрирует цепочку мыслей — можно посмотреть, как именно она «думает».
Исследования показали, что CoT действительно улучшает точность генерации и помогает избавиться от галлюцинаций. Поэтому нет ничего странного в том, что разработчики OpenAI решили «встроить» этот метод промпт-инжиниринга в свою модель.
Другая особенность OpenAI o1 заключается в том, что она натренирована использовать несколько подходов, затем анализировать, который из них оказался эффективнее, и опираться именно на него. Все те методики и техники для улучшения качества генерации, которые раньше приходилось «прикручивать», теперь есть в модели по умолчанию. Правда, пока только в превью-версии и в платном режиме.
О промптах и методах их составления мы рассказываем на открытом вебинаре. Записывайтесь, чтобы лучше понять, как именно работают GPT и другие большие языковые модели! Это бесплатно.
В остальном OpenAI o1 работает так же, как все предыдущие версии. Публично никакой информации об архитектурных и технических нововведениях OpenAI не распространили.
OpenAI o1 против GPT-4o
По сравнению с GPT-4o новая модель показала очень хорошие результаты применительно ко всему, что связано с логикой. Это при том, что GPT-4o тоже продемонстрировал неплохие логические результаты при проверках на классических бенчмарках, таких как MMLU.
При этом с задачами более высокого уровня, как оказалось, GPT-4o справляется из рук вон плохо. Разработчики протестировали обе модели на 2024 USA Math Olympiad (AIME) — это материал олимпиады по математике в США. GPT-4o справился с двумя заданиями из пятнадцати, тогда как OpenAI o1 удалось решить тринадцать. Таким образом, это поставило новую модель в топ-500 учащихся-олимпиадников.
Похожая ситуация произошла и с задачами на платформе для соревновательного программирования Codeforces. GPT-4o набрала 11%, тогда как o1 — 89%.
Однако и у отличников порой бывают предметы, по которым они не успевают. Для OpenAI o1 этими предметами оказалось личное письмо, когда от нейросети требуется написать историю о себе, и редактирование текста. В первом случае с задачей новая модель справилась хуже, чем GPT-4o, во втором случае их результаты оказались одинаковыми.
Так что можно сказать, что новая модель более специализированная, «заточенная» под предметы STEM — естественные науки, технологии, инженерию и математику, требующие логики и умения рассуждать. Она хороша и в генерации кода. А вот сравнительно «общие» задачи лучше оставить GPT-4o, правда, не забывая проверять их на галлюцинации, поскольку встроенной защиты от них у нейросети нет.
Пожалуй, вот и причина, по которой OpenAI не собираются лишать пользователей GPT-4o. У новой и старой моделей разные задачи и разные сферы использования, хотя попробовать полноценную версию OpenAI o1 все равно было бы интересно.
- Пошаговая PDF-инструкция “Как сделать нейрофотосессию из своего фото бесплатно
- Подборка из 3800+ нейросетей
- Гайд “Как использовать ChatGPT для изучения любого из 50 языков
- Доступ в бот с безлимитным доступом к ChatGPT
- Как внедрение ИИ в бизнес-процессы помогает улучшить финансовые результаты компаний в 2025 году.
- Мы расскажем, кто такой промпт-инженер, чем он занимается и какие результаты можно ожидать от его работы.
- Также обсудим, где найти промпт-инженера, сколько стоят его услуги в России и за рубежом, и кто может стать промпт-инженером.