Обзор DeepSeek-R1: бесплатной нейросети, которая превосходит модель o1 от OpenAI

20 января китайская компания DeepSeek объявила о релизе DeepSeek-R1 — это большая языковая модель, которая относится к модели рассуждений, как и o1 от OpenAI. Она распространяется по лицензии MIT и может использоваться бесплатно в том числе в коммерческих целях. И по словам разработчиков, их детище превосходит конкурента от OpenAI по нескольким параметрам. Давайте рассмотрим, что такое DeepSeek-R1, что означает «модель рассуждений» и по каким параметрам новинка лучше тех нейросетей, к которым мы успели привыкнуть.

Узнай, как использовать нейросети в жизни и карьере — инструменты, кейсы, пошаговые примеры. Подробнее в курсе

Рассуждает как человек

На официальном сайте DeepSeek разработчики пишут: «unravel the mystery of AGI», что переводится как «раскрой загадку AGI». AGI — это аббревиатура от Artificial General Intelligence, или «общий искусственный интеллект». Считается, что это следующий шаг после «слабого искусственного интеллекта», к которому относятся все привычные нам нейросети. Слабый он не потому что бесполезный или плохой, а потому что заточен, как правило, на решение одной задачи. Например, так CoPilot от GitHub создан для помощи программистам в написании кода. Или так обученный чат-бот на сайте может консультировать клиентов по ассортименту. У них есть четкие задачи, которые они хорошо решают, а в остальном показывают или средненький результат, или вовсе не выполняют промпты.

AGI — другое дело. Причем настолько другое, что считается практически фантастикой. По идее, он должен быть способен поддерживать дискуссию на человеческом уровне, быстро соображать и обладать способностью к творчеству.

Общий искусственный интеллект — он как естественный, только искусственный. Почти человек.

В 2024 году компания OpenAI выпустила OpenAI o1 — модель рассуждений, которая, по словам разработчиков, «тратит больше времени на размышления». Она не просто запоминает факты и выдает их в ответ на промпт, но и устанавливает закономерности, логические связи и контекст, что позволяет нейросети меньше «галлюцинировать» и давать более точные результаты. На фоне этого сотрудник OpenAI Вахид Каземи объявил, что их разработка уже достигла уровня AGI, при этом уточнив, что пусть нейросеть и не лучше людей по всем вопросам, она все равно лучше справляется с большинством задач, чем большая часть людей.

А что умеет DeepSeek — читай подробно у нас на сайте.

Поэтому, по мнению некоторых специалистов, AGI уже существует. И судя по фразе на официальном сайте DeepSeek, китайские разработчики согласны с Каземи. Свою нейросеть они позиционируют не только как AGI, но и как активного конкурента OpenAI o1.

РОССИЙСКИЕ НЕЙРОСЕТИ ДЛЯ ЖИЗНИ И КАРЬЕРЫ В 2025

Присоединяйся к онлайн-вебинару. В прямом эфире разберем и потестируем лучшие на сегодняшний день отечественные ИИ!

Вебинар включает:

Выполним базовые задачи на российских нейросетях и посмотрим на результаты!
Файл-инструкцию «Как сделать нейро-фотосессию из своего фото бесплатно, без иностранных карт и прочих сложностей»
10 способов заработать на нейросетях: Посмотрим рынок вакансий и поймем, где навыки ИИ дадут наибольший профит

Участвовать бесплатно

ОБЗОРНЫЙ ПРАКТИКУМ ПО НАШУМЕВШИМ НЕЙРОСЕТЯМ

Нейросети DEEPSEEK И QWEN За 2 часа сделаем полный обзор новых мощных ИИ-моделей, которые бросают вызов нейросети ChatGPT

ТОП-подарки всем участникам лекции:

Возможность получить Доступ в Нейроклуб на целый месяц
Как ИИ ускоряет работу и приносит деньги
За 2 часа вы получите четкий план, как начать работать с ИИ прямо сейчас!

Участвовать бесплатно

Думает, считает и кодит

У DeepSeek несколько интересных фич. Во-первых, обещанные 671 миллиард параметров в полной версии. Это настолько много, что для запуска подобной нейросети потребуется специализированное мощное оборудование. Поэтому для условных ПК и ноутбуков компания запустила «облегченные» версии DeepSeek, у которых есть от 1,5 до 70 миллиардов параметров. Это все еще очень много. Чем больше параметров, тем «умнее» нейросеть, а для модели рассуждений, которой является китайская новинка, это очень важно. Ведь каждый факт ей приходится перепроверять.

Бесплатный вебинар: как заработать с нуля на нейросетях. Простые шаги, реальные кейсы, старт без опыта. Присоединиться

Во-вторых, DeepSeek стоит копейки — точнее, центры. Стоимость API буквально ничтожная:

При этом чат-ботом можно пользоваться бесплатно. При желании к нему подключается версия DeepThink — та самая новейшая модель DeepSeek-R1. Она будет работать 50 сообщений, после чего нейросеть вернется к своей более старой версии. Словом, как у OpenAI.

Вот так чат-бот работает без фичи DeepThink:

А вот так — с ней:

Как можно увидеть, на протяжении пяти секунд нейросеть генерирует рассуждение на тему запроса. Если перевести английскую речь (на русском она тоже прекрасно излагает, просто иногда рассуждает на английском), то станет понятно, что модель обращается к истории запросов, потом рассуждает о том, чем может быть DeepSeek-R1.

Забавный момент — она использует технологию DeepSeek-R1, но не знает, что это такое, потому что информация о новом релизе пока не попала в базу данных нейросети.

Однако в чат-боте можно воспользоваться функцией поиска по интернету Search — нужно просто нажать на кнопку под непосредственным чатом. Проверим, как работает она:

Вот и ответ на вопрос! Нейросеть умеет рассуждать и искать в интернете, а ещё у неё есть функция загрузки файлов — скрепочка в правом нижнем углу. Модель имеет возможность работы с документами, например, если их нужно дописать или проанализировать, чтобы на их основе сгенерировать текст. Функция работы с документами подразумевает только извлечение текста, в том числе из картинок. Скажем, если нужно обработать какую-нибудь инструкцию.

В-третьих, DeepSeek — модель open source. Любой желающий может изучить и даже доработать открытый исходный код, а также развернуть его на своем сервере абсолютно бесплатно.

В-четвертых, нейросеть доступна без всяких программ-посредников, которые нужны для использования продуктов OpenAI.

Кстати, российские нейросети тоже не требуют вспомогательных инструментов. Они доступны в России, их, при желании, можно оплатить банковской картой. Что это за нейросети рассказываем на бесплатном вебинаре — записывайтесь, пока есть места!

И наконец, о полезном функционале

DeepSeek действительно хороша в программировании, математике и логике, что подтверждают испытания на бенчмарках.

Бенчмарки — это своего рода линейки для нейросети. С их помощью сравниваются разные модели, и в сопроводительной документации к DeepSeek-R1 она как раз сопоставлялась как с предыдущими моделями, так и с главным конкурентом — OpenAI o1.

Что такое бенчмарк? Читайте здесь!

Для математики использовались бенчмарки AIME 2024 и MATH-500. Результаты показали, что по AIME 2024 DeepSeek-R1 набрала 79,8%, тогда как OpenAI o1 — 79,2%. По бенчмарку MATH-500, «гоняющей» нейросети по математике школьного уровня с повышенными требованиями к рассуждениям, героиня статьи получила впечатляющий результат в 97,3%, тогда как конкурентка — всего 96,4%.

Codeforces и SWE-bench Verified — бенчмарки для проверки уровня кодинга, где первая оценивает программирование и понимание алгоритмов, сравнивая нейросети с людьми, а вторая — оценивает способность модели выполнять задачи программиста, самые обычные повседневные таски. По Codeforces DeepSeek-R1 набрала 96,3%, тогда как OpenAI o1 96,6% (больше!), а по SWE-bench Verified китайская нейросеть смогла получить 49,2%, тогда как ее конкурентка — 48,9% (меньше!).

Наконец, GPQA Diamond и MMLU — бенчмарки для проверки общих знаний. Первый определяет способность нейросети отвечать на общие вопросы, второй тестирует модель по разным дисциплинам, а также оценивает понимание языка. По бенчмарку GPQA Diamond DeepSeek-R1 набрала 71,5%, уступив OpenAI o1 с показателем в 75,7%. По MMLU героиня статьи получила 90,8%, а OpenAI o1 — 91,8%.

Что сказать в заключении?

DeepSeek — мощный конкурент OpenAI, который показал хорошие результаты во время тестирования с использованием бенчмарков. И у нее определенно есть преимущества: низкая стоимость интеграции, доступность в России, открытый исходный код. Можно сказать наверняка, что китайская модель разрабатывалась скорее для исследовательских целей, без упора на коммерциализацию продукта. И пока возможность есть, ей стоит воспользоваться.

РОССИЙСКИЕ НЕЙРОСЕТИ ДЛЯ ЖИЗНИ И КАРЬЕРЫ В 2025

Присоединяйся к онлайн-вебинару.

В прямом эфире разберем и потестируем лучшие на сегодняшний день отечественные ИИ!

Вы узнаете о том:

Выполним базовые задачи на российских нейросетях и посмотрим на результаты!
Файл-инструкцию «Как сделать нейро-фотосессию из своего фото бесплатно, без иностранных карт и прочих сложностей»
Покажем 10+ способов улучшить свою жизнь с ИИ каждому — от ребенка и пенсионера до управленца и предпринимателя

Участвовать бесплатно

ОБЗОРНЫЙ ПРАКТИКУМ ПО НАШУМЕВШИМ НЕЙРОСЕТЯМ

Нейросети DEEPSEEK И QWEN

За 2 часа сделаем полный обзор новых мощных ИИ-моделей, которые бросают вызов нейросети ChatGPT

Вы узнаете:

Возможность получить Доступ в Нейроклуб на целый месяц
Как ИИ ускоряет работу и приносит деньги
За 2 часа вы получите четкий план, как начать работать с ИИ прямо сейчас!

Участвовать бесплатно

РОССИЙСКИЕ НЕЙРОСЕТИ ДЛЯ ЖИЗНИ И КАРЬЕРЫ В 2025

Присоединяйся к онлайн-вебинару.

В прямом эфире разберем и потестируем лучшие на сегодняшний день отечественные ИИ!

Вы узнаете о том:

Выполним базовые задачи на российских нейросетях и посмотрим на результаты!
Файл-инструкцию «Как сделать нейро-фотосессию из своего фото бесплатно, без иностранных карт и прочих сложностей»
Покажем 10+ способов улучшить свою жизнь с ИИ каждому — от ребенка и пенсионера до управленца и предпринимателя

Участвовать бесплатно

ОБЗОРНЫЙ ПРАКТИКУМ ПО НАШУМЕВШИМ НЕЙРОСЕТЯМ

Нейросети DEEPSEEK И QWEN

За 2 часа сделаем полный обзор новых мощных ИИ-моделей, которые бросают вызов нейросети ChatGPT

Вы узнаете:

Возможность получить Доступ в Нейроклуб на целый месяц
Как ИИ ускоряет работу и приносит деньги
За 2 часа вы получите четкий план, как начать работать с ИИ прямо сейчас!

Участвовать бесплатно

Медиа о нейросетях,
зерокодинге и онлайн-образовании

Медиа о нейросетях,
зерокодинге и онлайн-образовании

Обзор DeepSeek-R1: бесплатной нейросети, которая превосходит модель o1 от OpenAI

Рассуждает как человек

Думает, считает и кодит

И наконец, о полезном функционале

Что сказать в заключении?

Обзор DeepSeek-R1: бесплатной нейросети, которая превосходит модель o1 от OpenAI

Рассуждает как человек

Думает, считает и кодит

И наконец, о полезном функционале

Что сказать в заключении?

Вам точно понравится