Весна 2025 года оказалась жаркой в мире LLM: Google представил Gemma 3, компактную, но очень мощную модель, а китайский DeepSeek продолжал доминировать с флагманской версией R1. Но если одна меньше и работает на одном GPU, а другая — гигант с сотнями миллиардов параметров, кого считать умнее? Давайте разбирать.

Что такое Gemma 3

Google выпустил Gemma 3 в нескольких размерах — 1B, 4B, 12B и 27B параметров. Ключевые особенности:

  • поддержка мультимодальности: кроме текста, 4B и выше умеют работать с изображениями и короткими видео;
  • огромное окно контекста — до 128 000 токенов, что позволяет одновременно анализировать длинные документы, большие таблицы или цифровые презентации;
  • работа на одном GPU/TPU (например, H100), а не в суперкомпьютерных кластерах;
  • поддержка более 140 языков и встроенная возможность вызывать функции.

Это делает Gemma 3 как домашней, так и корпоративной моделью с отличным балансом возможностей и эффективности.

ОНЛАЙН-ПРАКТИКУМ
ЗАПУСК DEEPSEEK R1 ЛОКАЛЬНО НА СВОЕМ КОМПЬЮТЕРЕ
ЧТО БУДЕТ НА ОБУЧЕНИИ?
  • ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ
  • Где и как применять? Потестируем модель после установки на разных задачах
  • Как дообучить модель под себя?

Что такое DeepSeek R1

DeepSeek R1 — это крупная китайская модель LLM:

  • общий размер — 671 млрд параметров, с ~37 млрд активных на вход;
  • архитектура Mixture‑of‑Experts, что позволяет модели выбирать подмодели для конкретной задачи;
  • доминирует в тестах GAIA и MCQ, с точностными показателями более 86 %, включая медицинские и прочие сложные задачи;
  • стоимость предобучения — всего 5,6 млн USD (GPU H800 за 55 дней). Это на порядок дешевле западных аналогов.

DeepSeek R1 показывает впечатляющие результаты в математике, логике и общем reasoning, но требует крупных вычислительных мощностей — кластера с десятками GPU. Если вы хотите узнать больше о том, как применять DeepSeek в различных задачах — рекомендуем бесплатный обзорный практикум от Зерокодера. Это отличный способ начать с AI-интеграции и перейти к более сложным решениям.

Сравнение результатов

Результаты в LMSYS Chatbot Arena

  • Gemma 3 27B — Elo примерно 1338, входит в топ-10 открытых моделей;
  • DeepSeek R1 — Elo 1363, сохраняет небольшое, но стабильное превосходство.

Разница в 25 пунктов незначительна на таком уровне, но DeepSeek лидирует.

Другие метрики

Gemma 3 на LLM-Arena достигает ~98 % качества от уровня DeepSeek в общих задачах. В специализированных тестах DeepSeek превосходит всех конкурентов: точность 0,862 по MCQ, 0,808 на английских тестах, особенно заметна в задачах офтальмологии и STEM.

Gemma демонстрирует высокие показатели по MMLU-Pro (~67.5), LiveCodeBench, MATH и др.

Устройство моделей

Gemma 3 — это оптимальный AI-инструмент. Он легкий, запускается на одном GPU, подходит для desktop/mobile. Поддерживает изображения, видео, имеет функцию function calling.

Благодаря 128K токенам его можно использовать для анализа длинных документов, например, для summarization или Q&A по PDF-документам.

DeepSeek R1 — мощный LLM с серьезным запасом производительности. Он выделяется в reasoning, математике, кодировании. Да — требует кучу GPU, но мощен в специализированных задачах, является лидером семейств моделей GPT‑4 и Gemini‑1.5 Pro по точности.

Когда использовать

Gemma 3 может одновременно анализировать документ, изображение и аудиофрагмент, извлечь ключевые insights, встроить это в функцию автоматизации — и всё это на ноутбуке.

DeepSeek R1 станет незаменимым помощником, если вам нужна надежная математика, сложное логическое мышление или генерация кода для крупных проектов.

Вывод

Gemma 3 — это не просто уменьшенная копия гигантов. Она — пример инженерной элегантности, демонстрирующей, что мощь LLM можно уместить в одном GPU без сильной потери интеллекта.

DeepSeek R1, в свою очередь, остаётся непревзойдённым в классическом test-bench reasoning. Это основной выбор для серьезных аналитических и научных задач.

Так кто умнее? Ответ зависит от ваших амбиций и ресурсов:

  • Для универсальности, мультимодальности и экономии — Gemma 3 превосходный выбор.
  • Для глубины мышления, точности и reasoning — выбирайте DeepSeek R1.
РОССИЙСКИЕ НЕЙРОСЕТИ ДЛЯ ЖИЗНИ И КАРЬЕРЫ В 2025
Присоединяйся к онлайн-вебинару.
В прямом эфире разберем и потестируем лучшие на сегодняшний день отечественные ИИ!
Вы узнаете о том:
  • Выполним базовые задачи на российских нейросетях и посмотрим на результаты!
  • PDF-инструкцию «Как сделать нейрофотосессию из своего фото бесплатно, без иностранных карт и прочих сложностей»
  • Покажем 10+ способов улучшить свою жизнь с ИИ каждому — от ребенка и пенсионера до управленца и предпринимателя
Участвовать бесплатно
ОБЗОРНЫЙ ПРАКТИКУМ ПО НАШУМЕВШИМ НЕЙРОСЕТЯМ
DEEPSEEK И QWEN
За 2 часа сделаем полный обзор новых мощных AI-моделей, которые бросают вызов ChatGPT
Вы узнаете:
  • Возможность получить Доступ в Нейроклуб на целый месяц
  • Как AI ускоряет работу и приносит деньги
  • За 2 часа вы получите четкий план, как начать работать с AI прямо сейчас!
Участвовать бесплатно