GPTmag GPTmag
Новости

Открытые vs закрытые модели в мае 2026: расклад сил

DeepSeek V3.2/V4, Llama 4, Mistral Large 3, Qwen 3 догнали GPT-5 и Claude. Что это значит для бизнеса, какую модель выбрать в проде, как считать стоимость владения.

Михаил Соколов Михаил Соколов 7 минут

В январе 2024 разрыв между открытыми и закрытыми моделями был в год: лучший open-source отставал от GPT-4 на ~1 поколение. В мае 2026 разрыв сократился до 3–6 месяцев, а в некоторых задачах открытые модели обходят закрытые. DeepSeek (V3.2 / V4), Llama 4, Mistral Large 3, Qwen 3 — это не «бесплатные альтернативы для энтузиастов», а реальные конкуренты для production-нагрузок. Этот материал — про то, как изменился расклад сил и какую модель брать в бизнес-проект в мае 2026.

Что такое «открытые» модели в 2026

Уточним терминологию:

  • Open-weights — веса модели опубликованы, можно скачать и запускать (Llama, DeepSeek, Mistral, Qwen).
  • Open-source — веса + код тренировки + данные. Полностью открытых моделей высокого уровня в 2026 — единицы (OLMo от AI2).
  • Закрытые — доступны только через API провайдера (GPT, Claude, Gemini).

«Open-source» в обиходе часто означает open-weights — это и подразумеваем здесь.

Ландшафт мая 2026

Топ закрытых моделей

МодельПроизводительAPI цена/1M output (ориентир)
GPT-5.5OpenAIот ~$2
Claude Opus 4.7Anthropicот ~$75–90
Claude Sonnet (актуальная версия)Anthropicоколо $5
Gemini 2.5 ProGoogleоколо $1.25
YandexGPT (Pro-уровень)Яндекспо тарифам Yandex Cloud
GigaChat (старший тариф)Сберпо тарифам Сбер AI

Топ открытых моделей

МодельПроизводительРазмерЧерез API
Llama 4 (Scout / Maverick / Behemoth)Metaот десятков до сотен B (MoE)через Together AI, Fireworks, AWS Bedrock
DeepSeek V3.2 / V4DeepSeekсотни B (MoE, десятки B активных)через DeepSeek API
Qwen 3 235B (A22B)Alibaba235B MoEAlibaba Cloud
Mistral Large 3Mistral675B MoE (~41B активных)Mistral API
DBRX 2Databricks132Bчерез AWS Bedrock

Бенчмарки: кто реально на каком уровне

Точные цифры по MMLU, HumanEval, GPQA, MATH стоит сверять в model card каждого вендора и независимых рейтингах (LMSYS Chatbot Arena, Artificial Analysis). Сводная картина по итогам 2025–2026 устойчивая:

  • На общих знаниях (MMLU) и базовом кодинге (HumanEval) лучшие open-weights отстают от GPT-5.5 и Claude Opus на единицы процентных пунктов.
  • На сложной науке и математике (GPQA Diamond, MATH-Hard) разрыв заметнее — обычно двузначный.
  • По скорости генерации MoE-модели (DeepSeek, Mistral Large 3) часто опережают плотные модели OpenAI и Anthropic.

В практических задачах для бизнеса (поддержка клиентов, генерация контента, анализ документов) разрыв чаще всего незаметен.

Когда брать открытую модель

1. Чувствительные данные

Открытую модель можно запустить локально — на своих серверах в РФ. Никакие данные не уходят к провайдеру.

Кейс: банки, медорганизации, госкомпании, предприятия с гостайной.

2. Большие объёмы

API-цена закрытых моделей — за токен. На объёмах от 100M токенов в месяц open-source через own deployment окупается.

Расчёт: GPT-5.5 на 500M токенов — порядка $1 000/мес по публичным тарифам. Локальный DeepSeek на 4× H100 (несколько миллионов рублей за серверы или порядка $5 000/мес аренды у российских облаков) обрабатывает аналогичный объём за неделю.

3. Кастомизация

Open-weights можно дообучать (fine-tune, LoRA) под ваши данные. Закрытые модели предлагают fine-tuning, но дороже и менее гибко.

Кейс: AI-агент с экспертизой в вашей нише, бренд-голос, специфический жаргон.

4. Гарантия доступности

Open-weights нельзя «закрыть», как могут закрыть API. Это страховка от санкционных рисков.

5. Низкая задержка

Локальная модель отвечает за 50–200 мс. Облачный API — 500–2 000 мс. Для real-time приложений (голос, чаты) разница критична.

Когда брать закрытую модель

1. Топовое качество в сложных задачах

Если ваша задача — сложный reasoning, научный анализ, юридическая работа — Claude Opus 4.7 пока лучше всех открытых.

2. Без инфраструктуры

Open-weights требуют GPU, DevOps, мониторинга. Малому бизнесу проще платить $20/мес за API.

3. Готовые экосистемы

Voice mode, Canvas, Code Interpreter, Agents — это готовые фичи у OpenAI, Anthropic, Google. С open-source собирать самому — недели работы.

4. Мультимодальность high-end

Sora 2, Veo 3, Gemini Multimodal — пока никто из open-source не догнал по качеству видео и аудио.

Стоимость владения (TCO) — оценка по порядку величины

Сценарий: B2B SaaS, 10M запросов в месяц, средняя длина запроса 2 000 токенов input + 500 output (итого ~25B токенов).

Закрытый API (GPT-5.5):

  • При типичных публичных тарифах ($1–2 за 1M input, $5–10 за 1M output) суммарный счёт легко выходит на пять знаков в долларах в месяц.

Открытый Llama 4 / Mistral Large 3 через managed-провайдеры (Together AI, Fireworks):

  • Цены за 1M токенов кратно ниже, чем у топовых закрытых моделей. На сопоставимом объёме экономия обычно 40–60%.

Открытый DeepSeek V3.2 / V4 на собственном железе:

  • Серверы (4× H100): аренда у российских облаков — несколько тысяч долларов в месяц, амортизация при покупке — ниже.
  • DevOps + мониторинг: ещё около $1–2 тыс/мес.
  • На объёмах в десятки миллиардов токенов в месяц итоговый TCO обычно в 2–4 раза ниже, чем у закрытого API.

Минусы локального деплоя: нужна команда, риск простоя, отсутствие готовых фич, 1–2 месяца на запуск.

Российская специфика

Доступность

МодельДоступ из РФОплата
GPT-5.5через VPN + проксипрокси-сервисы
Claudeчерез VPN + проксипрокси-сервисы
Llama 4прямой (HuggingFace)бесплатно (open-weights)
DeepSeek (V3.2 / V4)прямой через DeepSeek APIроссийские карты часто работают
Qwen 3через Alibaba Cloudнепросто
YandexGPT / GigaChatпрямойроссийские карты

152-ФЗ

Локально развёрнутая open-source модель — самый безопасный вариант. Все данные в вашем периметре, ничего не уходит за границу.

Подробнее — в статье про безопасность данных при работе с ИИ.

Кто что использует на российском рынке

  • Сбер: GigaChat в проде + Llama для тонкой настройки.
  • Яндекс: YandexGPT + Qwen для специфики.
  • Тинькофф: GPT через прокси + DeepSeek для дешёвых задач.
  • Малый и средний бизнес: микс GigaChat + Llama локально + ChatGPT для разовых задач.

Главные мифы

  1. «Открытое = бесплатно». Веса бесплатны, инфраструктура — нет. На больших объёмах open-source окупается, на маленьких — дороже.

  2. «Закрытое всегда лучше». На многих задачах разрыв 3–5 п.п. — для бизнеса несущественно.

  3. «Open-source небезопасны». Открытость не делает модель уязвимее. Наоборот, можно проверить, что внутри.

  4. «Только разработчики могут использовать». В 2026 есть managed-сервисы (Together AI, Fireworks, Replicate) — open-source доступен через API без своей инфраструктуры.

  5. «Open-source быстро устаревает». Темпы релизов сравнимы. DeepSeek и Llama обновляются 2–3 раза в год.

Прогноз: что будет дальше

До конца 2026:

  • Следующее поколение Llama — может ещё ближе подойти к GPT-5.5 по большинству бенчмарков.
  • DeepSeek (V4 и далее) — продолжит давление снизу по цене.
  • OpenAI / Anthropic — сосредоточатся на агентских функциях и интеграциях, не только на «голой» производительности модели.

К 2027–2028:

  • Гибридные стратегии станут нормой: разные модели под разные задачи.
  • Корпоративный AI = микс из 3–5 моделей.
  • Open-source модели для большинства production-нагрузок, закрытые — для топовых задач.

FAQ

Стоит ли переходить с GPT-5 на актуальный DeepSeek? Если у вас расходы $5 000+/мес на API — стоит протестировать. Часто экономия 60–80% без потери качества для типовых задач.

Можно ли запустить Llama 4 на ноутбуке? Старшие конфигурации (Maverick, Behemoth) — нет, нужен серверный кластер. Младшие версии Llama (8B / 70B класса) — на 1 RTX 4090 / 5090 запустить можно.

Что выбрать малому бизнесу в РФ? Для разовых задач — GigaChat / YandexGPT. Для production — DeepSeek через API (одна из самых дешёвых моделей по тарифу) или local Llama.

Безопасно ли использовать DeepSeek (китайскую) для корпоративного? Локально — да (данные не уходят в Китай). Через DeepSeek API — данные идут в Китай, для компаний с РФ-compliance — лучше прокси или локальный деплой.

Поддерживается ли русский язык в Llama 4? Да, заметно лучше Llama 3. Но Mistral Large 3 и Qwen 3 могут быть качественнее на русском.

Что с лицензиями? Llama 4 — Meta Custom License (коммерческое использование разрешено для большинства). DeepSeek, Qwen — Apache 2.0 / MIT (полная свобода). Mistral — собственная.

Что делать прямо сейчас

  1. Сегодня: оцените свои AI-расходы за апрель. Если 50 тыс ₽+ на API — протестируйте open-source альтернативу.
  2. Эту неделю: запустите актуальный DeepSeek (V3.2 / V4) через прокси и сравните качество ответов с вашей текущей моделью.
  3. Этот месяц: проведите proof of concept локального Llama 4 для чувствительных задач.

Связанные материалы:

Расклад мая 2026: open-source перестали быть «второй лигой» AI. На многих задачах они равны или лучше. Это меняет экономику AI-проектов: правильный выбор модели экономит компании 50–80% бюджета без потери качества для конечного пользователя.

Михаил Соколов

Михаил Соколов

AI-инженер с 10 годами в продакшене. Разрабатывает агентные сценарии и автоматизации на стеке OpenAI / Anthropic / YandexGPT.

Все материалы автора →

Похожие статьи

Дискуссия

Что вы думаете?

Поделитесь опытом, расскажите, как у вас решается похожая задача, или задайте вопрос — я лично читаю все комментарии и отвечаю.