Пока все наблюдают за тем, как китайская нейросеть Deep Seek обрушивает акции Nvidia, Broadcom, AMD и других западных компаний, Alibaba выпустила новое семейство нейросети Qwen под литерой 2.5. И судя по результатам испытаний на бенчмарках, она грозит стать достойным конкурентом DeepSeek-R1 — которая, в свою очередь, составила не менее достойную конкуренцию OpenAI o1-1217. Про западные нейросети все ненадолго забыли, потому что сейчас на горизонте разворачивается битва двух азиатских драконов.
Что за Qwen?
Нейросеть Qwen появилась отнюдь не вчера — этой модели уже несколько лет. Китайский гигант Alibaba (ему принадлежит, например, маркетплейс Aliexpress) выпустил свою нейросеть еще в 2023 году. Она была разработана на основе принадлежащей Meta (признана экстремистской и запрещена в России) Llama и модифицирована. В августе 2024 года модель Qwen 7B была открыта — то есть, как и Deep Seek, она стала open source.
Модель Qwen 2 появилась в июне 2024 года, а в ноябре была выпущена QwQ-32B-Preview — нейросеть, которая фокусируется на логике и рассуждениях, как и, например, o1 от OpenAI. Также Alibaba представили семейство визуальных языковых моделей Qwen-Vl, в которых визуальные трансформеры сочетаются с большими языковыми моделями. Иными словами, нейросети обучаются как на картинках, так и на текстах.
Помимо перечисленного, Alibaba выпустили модели Qwen-Audio и Qwen2-Math. И более сотни из разработанных компанией нейросетей были представлены с открытым исходным кодом. На их основе были созданы отдельные модели, в том числе лишенные китайских ограничений по контексту.
И теперь появилось семейство языковых моделей Qwen 2.5 — новейшие версии нейросети от Alibaba. Это:
- Qwen2.5-Max — самая мощная модель из семейства;
- Qwen2.5-VL — визуально-языковая вариация, умеющая распознавать картинки и видео;
- Qwen2.5-14B-Instruct-1M — эта вариация способна распознавать длинный контекст;
- Qwen2.5-Coder-32B-Instruct — нейросеть для программирования;
- QwQ-32B-Preview — умеет «думать» и приводить логические доводы.
Остановимся на первых двух как на самых интересных.
Тем временем, у «Зерокодера» появилась новейшая версия открытой лекции «Нейросети для жизни и карьеры» — самая свежая информация о том, как взаимодействовать с нейросетями для удобства и выгоды. Количество мест ограничено — записывайтесь!
Что умеет новое семейство нейросетей?
Qwen2.5-VL — визуально-языковая модель. У неё есть несколько интересных функций. В первую очередь, это умение распознавать изображения, причем не только условных «птичек» на картинке, но также графики, инвойсы и чарты — то есть, картинки уровнем посложнее. Соответственно, модель лучше анализирует документы: она понимает не только сам текст, но и визуальную часть.
Нейросеть воспринимает видео, в том числе длиной в несколько часов, может считывать информацию из инвойсов и графиков, а еще она умеет управлять персональным компьютером так же, как это делает инструмент Operator от OpenAI.

- ТОП-подарки всем участникам лекции:Открытая лекция РЕГИСТРАЦИЯ пошаговая PDF-инструкция “Как сделать нейрофотосессию из своего фото бесплатно
- подборка из 3800+ нейросетей
- доступ в бот с безлимитным доступом к ChatGPT
Модель также умеет взаимодействовать с мобильными устройствами. Например, на сайте X (бывший Twitter, заблокирован в России) показано, как технический лид платформы Hugging Face Филипп Шмид запускает с помощью Qwen2.5-VL букинговый сервис Booking.com и бронирует себе место на самолете из Чунцина в Пекин.
Выглядит круто, но смотреть стоит глубже, а именно на опубликованные Alibaba результаты испытаний на бенчмарках — специальных инструментах для оценки «знаний» нейросетей.
И результаты у Qwen2.5-VL очень даже впечатляющие:
Сначала идут бенчмарки, отвечающие за категорию общих знаний уровня университета (колледжа), следом — распознавание документов и умение читать диаграммы, далее визуальные вопросы, математика, понимание видео и визуальные агенты. Как можно увидеть на картинке, по многим пунктам Qwen2.5-VL уверенно обходит конкурентов: Gemini-2 Flash, GPT-4o, Claude3.5 Sonnet и других.
Qwen2.5-Max сами же разработчики называют самой мощной моделью. В ней используется техника машинного обучения под названием смешение экспертов, или Mixture of experts (MoE), за счет которой модель можно масштабировать. Она была обучена более чем на 20 триллионах токенов, прошла файн-тюнинг Supervised Fine-Tuning (SFT) для более точного выполнения задач, а также обучение с подкреплением на основе отзывов людей (Reinforcement Learning from Human Feedback (RLHF)) — именно поэтому она должна хорошо откликаться на предпочтения конкретного пользователя.
И результаты испытаний на бенчмарках у нее очень интересные:
На ней Qwen2.5-Max сравнивается с DeepSeek-V3. Но пока не с DeepSeek-R1 — новейшей версией нейросети, которая совсем недавно была выпущена с открытым исходным кодом.
Работает Qwen2.5 так же, как DeepSeek или OpenAI — через чат-бот на сайте. Там же можно подключать разные фичи, в том числе веб-поиск и генерацию картинок, а ещё выбрать конкретную модель из семейства для использования.
При желании можно скачать модель с сайта Hugging Face.
Модель действительно интересная и стоящая. В интернете ее называют «убийцей DeepSeek», но так ли это — покажет только время. Сравнений по бенчмаркам между разными версиями Qwen2.5 и DeepSeek-R1 пока нет. И все же интересно наблюдать за тем, как в нейрогонке в канун азиатского Нового года схлестнулись два китайских дракона — и все это происходит, пока китайская нейросеть продолжает обрушать американский рынок.
- Как нейросети могут изменить вашу деятельность, от фриланса до управления бизнесом.
- Как использовать GPT-агентов, цифровые двойники и другие ИИ-решения.
- Важность безопасности в эпоху нейросетей.
- Какие нейросети помогут вам и как на них зарабатывать.
- 10 способов применения ИИ для бизнеса.
- Как внедрение ИИ в бизнес-процессы помогает улучшить финансовые результаты компаний в 2025 году.
- Мы асскажем, кто такой промпт-инжинер, чем он занимается и какие результаты можно ожидать от его работы.
- Также обсудим, где найти промт-инжинера, сколько стоят его услуги в России и за рубежем, и кто может стать промпт-инженером.