20 января китайская компания DeepSeek объявила о релизе DeepSeek-R1 — это большая языковая модель, которая относится к модели рассуждений, как и o1 от OpenAI. Она распространяется по лицензии MIT и может использоваться бесплатно в том числе в коммерческих целях. И по словам разработчиков, их детище превосходит конкурента от OpenAI по нескольким параметрам. Давайте рассмотрим, что такое DeepSeek-R1, что означает «модель рассуждений» и по каким параметрам новинка лучше тех нейросетей, к которым мы успели привыкнуть.
Рассуждает как человек
На официальном сайте DeepSeek разработчики пишут: «unravel the mystery of AGI», что переводится как «раскрой загадку AGI». AGI — это аббревиатура от Artificial General Intelligence, или «общий искусственный интеллект». Считается, что это следующий шаг после «слабого искусственного интеллекта», к которому относятся все привычные нам нейросети. Слабый он не потому что бесполезный или плохой, а потому что заточен, как правило, на решение одной задачи. Например, так CoPilot от GitHub создан для помощи программистам в написании кода. Или так обученный чат-бот на сайте может консультировать клиентов по ассортименту. У них есть четкие задачи, которые они хорошо решают, а в остальном показывают или средненький результат, или вовсе не выполняют промпты.
AGI — другое дело. Причем настолько другое, что считается практически фантастикой. По идее, он должен быть способен поддерживать дискуссию на человеческом уровне, быстро соображать и обладать способностью к творчеству.
Общий искусственный интеллект — он как естественный, только искусственный. Почти человек.
В 2024 году компания OpenAI выпустила OpenAI o1 — модель рассуждений, которая, по словам разработчиков, «тратит больше времени на размышления». Она не просто запоминает факты и выдает их в ответ на промпт, но и устанавливает закономерности, логические связи и контекст, что позволяет нейросети меньше «галлюцинировать» и давать более точные результаты. На фоне этого сотрудник OpenAI Вахид Каземи объявил, что их разработка уже достигла уровня AGI, при этом уточнив, что пусть нейросеть и не лучше людей по всем вопросам, она все равно лучше справляется с большинством задач, чем большая часть людей.
Поэтому, по мнению некоторых специалистов, AGI уже существует. И судя по фразе на официальном сайте DeepSeek, китайские разработчики согласны с Каземи. Свою нейросеть они позиционируют не только как AGI, но и как активного конкурента OpenAI o1.

- Гайд «Как зарабатывать удалённо : лучшие биржи фриланса».
- Безлимитный доступ к ChatGPT из РФ прямо в твоём Телеграм.
- Подборка из 3800 нейросетей для разных сфер жизни. Не упусти шанс получить знания и сразу начать зарабатывать!

Думает, считает и кодит
У DeepSeek несколько интересных фич. Во-первых, обещанные 671 миллиард параметров в полной версии. Это настолько много, что для запуска подобной нейросети потребуется специализированное мощное оборудование. Поэтому для условных ПК и ноутбуков компания запустила «облегченные» версии DeepSeek, у которых есть от 1,5 до 70 миллиардов параметров. Это все еще очень много. Чем больше параметров, тем «умнее» нейросеть, а для модели рассуждений, которой является китайская новинка, это очень важно. Ведь каждый факт ей приходится перепроверять.
Во-вторых, DeepSeek стоит копейки — точнее, центры. Стоимость API буквально ничтожная:
При этом чат-ботом можно пользоваться бесплатно. При желании к нему подключается версия DeepThink — та самая новейшая модель DeepSeek-R1. Она будет работать 50 сообщений, после чего нейросеть вернется к своей более старой версии. Словом, как у OpenAI.
Вот так чат-бот работает без фичи DeepThink:
А вот так — с ней:
Как можно увидеть, на протяжении пяти секунд нейросеть генерирует рассуждение на тему запроса. Если перевести английскую речь (на русском она тоже прекрасно излагает, просто иногда рассуждает на английском), то станет понятно, что модель обращается к истории запросов, потом рассуждает о том, чем может быть DeepSeek-R1.
Забавный момент — она использует технологию DeepSeek-R1, но не знает, что это такое, потому что информация о новом релизе пока не попала в базу данных нейросети.
Однако в чат-боте можно воспользоваться функцией поиска по интернету Search — нужно просто нажать на кнопку под непосредственным чатом. Проверим, как работает она:
Вот и ответ на вопрос! Нейросеть умеет рассуждать и искать в интернете, а ещё у неё есть функция загрузки файлов — скрепочка в правом нижнем углу. Модель имеет возможность работы с документами, например, если их нужно дописать или проанализировать, чтобы на их основе сгенерировать текст. Функция работы с документами подразумевает только извлечение текста, в том числе из картинок. Скажем, если нужно обработать какую-нибудь инструкцию.
В-третьих, DeepSeek — модель open source. Любой желающий может изучить и даже доработать открытый исходный код, а также развернуть его на своем сервере абсолютно бесплатно.
В-четвертых, нейросеть доступна без всяких программ-посредников, которые нужны для использования продуктов OpenAI.
Кстати, российские нейросети тоже не требуют вспомогательных инструментов. Они доступны в России, их, при желании, можно оплатить банковской картой. Что это за нейросети рассказываем на бесплатном вебинаре — записывайтесь, пока есть места!
И наконец, о полезном функционале
DeepSeek действительно хороша в программировании, математике и логике, что подтверждают испытания на бенчмарках.
Бенчмарки — это своего рода линейки для нейросети. С их помощью сравниваются разные модели, и в сопроводительной документации к DeepSeek-R1 она как раз сопоставлялась как с предыдущими моделями, так и с главным конкурентом — OpenAI o1.
Что такое бенчмарк? Читайте здесь!
Для математики использовались бенчмарки AIME 2024 и MATH-500. Результаты показали, что по AIME 2024 DeepSeek-R1 набрала 79,8%, тогда как OpenAI o1 — 79,2%. По бенчмарку MATH-500, «гоняющей» нейросети по математике школьного уровня с повышенными требованиями к рассуждениям, героиня статьи получила впечатляющий результат в 97,3%, тогда как конкурентка — всего 96,4%.
Codeforces и SWE-bench Verified — бенчмарки для проверки уровня кодинга, где первая оценивает программирование и понимание алгоритмов, сравнивая нейросети с людьми, а вторая — оценивает способность модели выполнять задачи программиста, самые обычные повседневные таски. По Codeforces DeepSeek-R1 набрала 96,3%, тогда как OpenAI o1 96,6% (больше!), а по SWE-bench Verified китайская нейросеть смогла получить 49,2%, тогда как ее конкурентка — 48,9% (меньше!).
Наконец, GPQA Diamond и MMLU — бенчмарки для проверки общих знаний. Первый определяет способность нейросети отвечать на общие вопросы, второй тестирует модель по разным дисциплинам, а также оценивает понимание языка. По бенчмарку GPQA Diamond DeepSeek-R1 набрала 71,5%, уступив OpenAI o1 с показателем в 75,7%. По MMLU героиня статьи получила 90,8%, а OpenAI o1 — 91,8%.
Что сказать в заключении?
DeepSeek — мощный конкурент OpenAI, который показал хорошие результаты во время тестирования с использованием бенчмарков. И у нее определенно есть преимущества: низкая стоимость интеграции, доступность в России, открытый исходный код. Можно сказать наверняка, что китайская модель разрабатывалась скорее для исследовательских целей, без упора на коммерциализацию продукта. И пока возможность есть, ей стоит воспользоваться.
- Как нейросети могут изменить вашу деятельность, от фриланса до управления бизнесом.
- Как использовать GPT-агентов, цифровые двойники и другие ИИ-решения.
- Важность безопасности в эпоху нейросетей.
- Какие нейросети помогут вам и как на них зарабатывать.
- 10 способов применения ИИ для бизнеса.
- Как внедрение ИИ в бизнес-процессы помогает улучшить финансовые результаты компаний в 2025 году.
- Мы асскажем, кто такой промпт-инжинер, чем он занимается и какие результаты можно ожидать от его работы.
- Также обсудим, где найти промт-инжинера, сколько стоят его услуги в России и за рубежем, и кто может стать промпт-инженером.