Открытые vs закрытые модели в мае 2026: расклад сил
DeepSeek V3.2/V4, Llama 4, Mistral Large 3, Qwen 3 догнали GPT-5 и Claude. Что это значит для бизнеса, какую модель выбрать в проде, как считать стоимость владения.
В январе 2024 разрыв между открытыми и закрытыми моделями был в год: лучший open-source отставал от GPT-4 на ~1 поколение. В мае 2026 разрыв сократился до 3–6 месяцев, а в некоторых задачах открытые модели обходят закрытые. DeepSeek (V3.2 / V4), Llama 4, Mistral Large 3, Qwen 3 — это не «бесплатные альтернативы для энтузиастов», а реальные конкуренты для production-нагрузок. Этот материал — про то, как изменился расклад сил и какую модель брать в бизнес-проект в мае 2026.
Что такое «открытые» модели в 2026
Уточним терминологию:
- Open-weights — веса модели опубликованы, можно скачать и запускать (Llama, DeepSeek, Mistral, Qwen).
- Open-source — веса + код тренировки + данные. Полностью открытых моделей высокого уровня в 2026 — единицы (OLMo от AI2).
- Закрытые — доступны только через API провайдера (GPT, Claude, Gemini).
«Open-source» в обиходе часто означает open-weights — это и подразумеваем здесь.
Ландшафт мая 2026
Топ закрытых моделей
| Модель | Производитель | API цена/1M output (ориентир) |
|---|---|---|
| GPT-5.5 | OpenAI | от ~$2 |
| Claude Opus 4.7 | Anthropic | от ~$75–90 |
| Claude Sonnet (актуальная версия) | Anthropic | около $5 |
| Gemini 2.5 Pro | около $1.25 | |
| YandexGPT (Pro-уровень) | Яндекс | по тарифам Yandex Cloud |
| GigaChat (старший тариф) | Сбер | по тарифам Сбер AI |
Топ открытых моделей
| Модель | Производитель | Размер | Через API |
|---|---|---|---|
| Llama 4 (Scout / Maverick / Behemoth) | Meta | от десятков до сотен B (MoE) | через Together AI, Fireworks, AWS Bedrock |
| DeepSeek V3.2 / V4 | DeepSeek | сотни B (MoE, десятки B активных) | через DeepSeek API |
| Qwen 3 235B (A22B) | Alibaba | 235B MoE | Alibaba Cloud |
| Mistral Large 3 | Mistral | 675B MoE (~41B активных) | Mistral API |
| DBRX 2 | Databricks | 132B | через AWS Bedrock |
Бенчмарки: кто реально на каком уровне
Точные цифры по MMLU, HumanEval, GPQA, MATH стоит сверять в model card каждого вендора и независимых рейтингах (LMSYS Chatbot Arena, Artificial Analysis). Сводная картина по итогам 2025–2026 устойчивая:
- На общих знаниях (MMLU) и базовом кодинге (HumanEval) лучшие open-weights отстают от GPT-5.5 и Claude Opus на единицы процентных пунктов.
- На сложной науке и математике (GPQA Diamond, MATH-Hard) разрыв заметнее — обычно двузначный.
- По скорости генерации MoE-модели (DeepSeek, Mistral Large 3) часто опережают плотные модели OpenAI и Anthropic.
В практических задачах для бизнеса (поддержка клиентов, генерация контента, анализ документов) разрыв чаще всего незаметен.
Когда брать открытую модель
1. Чувствительные данные
Открытую модель можно запустить локально — на своих серверах в РФ. Никакие данные не уходят к провайдеру.
Кейс: банки, медорганизации, госкомпании, предприятия с гостайной.
2. Большие объёмы
API-цена закрытых моделей — за токен. На объёмах от 100M токенов в месяц open-source через own deployment окупается.
Расчёт: GPT-5.5 на 500M токенов — порядка $1 000/мес по публичным тарифам. Локальный DeepSeek на 4× H100 (несколько миллионов рублей за серверы или порядка $5 000/мес аренды у российских облаков) обрабатывает аналогичный объём за неделю.
3. Кастомизация
Open-weights можно дообучать (fine-tune, LoRA) под ваши данные. Закрытые модели предлагают fine-tuning, но дороже и менее гибко.
Кейс: AI-агент с экспертизой в вашей нише, бренд-голос, специфический жаргон.
4. Гарантия доступности
Open-weights нельзя «закрыть», как могут закрыть API. Это страховка от санкционных рисков.
5. Низкая задержка
Локальная модель отвечает за 50–200 мс. Облачный API — 500–2 000 мс. Для real-time приложений (голос, чаты) разница критична.
Когда брать закрытую модель
1. Топовое качество в сложных задачах
Если ваша задача — сложный reasoning, научный анализ, юридическая работа — Claude Opus 4.7 пока лучше всех открытых.
2. Без инфраструктуры
Open-weights требуют GPU, DevOps, мониторинга. Малому бизнесу проще платить $20/мес за API.
3. Готовые экосистемы
Voice mode, Canvas, Code Interpreter, Agents — это готовые фичи у OpenAI, Anthropic, Google. С open-source собирать самому — недели работы.
4. Мультимодальность high-end
Sora 2, Veo 3, Gemini Multimodal — пока никто из open-source не догнал по качеству видео и аудио.
Стоимость владения (TCO) — оценка по порядку величины
Сценарий: B2B SaaS, 10M запросов в месяц, средняя длина запроса 2 000 токенов input + 500 output (итого ~25B токенов).
Закрытый API (GPT-5.5):
- При типичных публичных тарифах ($1–2 за 1M input, $5–10 за 1M output) суммарный счёт легко выходит на пять знаков в долларах в месяц.
Открытый Llama 4 / Mistral Large 3 через managed-провайдеры (Together AI, Fireworks):
- Цены за 1M токенов кратно ниже, чем у топовых закрытых моделей. На сопоставимом объёме экономия обычно 40–60%.
Открытый DeepSeek V3.2 / V4 на собственном железе:
- Серверы (4× H100): аренда у российских облаков — несколько тысяч долларов в месяц, амортизация при покупке — ниже.
- DevOps + мониторинг: ещё около $1–2 тыс/мес.
- На объёмах в десятки миллиардов токенов в месяц итоговый TCO обычно в 2–4 раза ниже, чем у закрытого API.
Минусы локального деплоя: нужна команда, риск простоя, отсутствие готовых фич, 1–2 месяца на запуск.
Российская специфика
Доступность
| Модель | Доступ из РФ | Оплата |
|---|---|---|
| GPT-5.5 | через VPN + прокси | прокси-сервисы |
| Claude | через VPN + прокси | прокси-сервисы |
| Llama 4 | прямой (HuggingFace) | бесплатно (open-weights) |
| DeepSeek (V3.2 / V4) | прямой через DeepSeek API | российские карты часто работают |
| Qwen 3 | через Alibaba Cloud | непросто |
| YandexGPT / GigaChat | прямой | российские карты |
152-ФЗ
Локально развёрнутая open-source модель — самый безопасный вариант. Все данные в вашем периметре, ничего не уходит за границу.
Подробнее — в статье про безопасность данных при работе с ИИ.
Кто что использует на российском рынке
- Сбер: GigaChat в проде + Llama для тонкой настройки.
- Яндекс: YandexGPT + Qwen для специфики.
- Тинькофф: GPT через прокси + DeepSeek для дешёвых задач.
- Малый и средний бизнес: микс GigaChat + Llama локально + ChatGPT для разовых задач.
Главные мифы
-
«Открытое = бесплатно». Веса бесплатны, инфраструктура — нет. На больших объёмах open-source окупается, на маленьких — дороже.
-
«Закрытое всегда лучше». На многих задачах разрыв 3–5 п.п. — для бизнеса несущественно.
-
«Open-source небезопасны». Открытость не делает модель уязвимее. Наоборот, можно проверить, что внутри.
-
«Только разработчики могут использовать». В 2026 есть managed-сервисы (Together AI, Fireworks, Replicate) — open-source доступен через API без своей инфраструктуры.
-
«Open-source быстро устаревает». Темпы релизов сравнимы. DeepSeek и Llama обновляются 2–3 раза в год.
Прогноз: что будет дальше
До конца 2026:
- Следующее поколение Llama — может ещё ближе подойти к GPT-5.5 по большинству бенчмарков.
- DeepSeek (V4 и далее) — продолжит давление снизу по цене.
- OpenAI / Anthropic — сосредоточатся на агентских функциях и интеграциях, не только на «голой» производительности модели.
К 2027–2028:
- Гибридные стратегии станут нормой: разные модели под разные задачи.
- Корпоративный AI = микс из 3–5 моделей.
- Open-source модели для большинства production-нагрузок, закрытые — для топовых задач.
FAQ
Стоит ли переходить с GPT-5 на актуальный DeepSeek? Если у вас расходы $5 000+/мес на API — стоит протестировать. Часто экономия 60–80% без потери качества для типовых задач.
Можно ли запустить Llama 4 на ноутбуке? Старшие конфигурации (Maverick, Behemoth) — нет, нужен серверный кластер. Младшие версии Llama (8B / 70B класса) — на 1 RTX 4090 / 5090 запустить можно.
Что выбрать малому бизнесу в РФ? Для разовых задач — GigaChat / YandexGPT. Для production — DeepSeek через API (одна из самых дешёвых моделей по тарифу) или local Llama.
Безопасно ли использовать DeepSeek (китайскую) для корпоративного? Локально — да (данные не уходят в Китай). Через DeepSeek API — данные идут в Китай, для компаний с РФ-compliance — лучше прокси или локальный деплой.
Поддерживается ли русский язык в Llama 4? Да, заметно лучше Llama 3. Но Mistral Large 3 и Qwen 3 могут быть качественнее на русском.
Что с лицензиями? Llama 4 — Meta Custom License (коммерческое использование разрешено для большинства). DeepSeek, Qwen — Apache 2.0 / MIT (полная свобода). Mistral — собственная.
Что делать прямо сейчас
- Сегодня: оцените свои AI-расходы за апрель. Если 50 тыс ₽+ на API — протестируйте open-source альтернативу.
- Эту неделю: запустите актуальный DeepSeek (V3.2 / V4) через прокси и сравните качество ответов с вашей текущей моделью.
- Этот месяц: проведите proof of concept локального Llama 4 для чувствительных задач.
Связанные материалы:
- Open-source AI: DeepSeek, Mistral, Llama
- Claude vs ChatGPT в 2026
- YandexGPT и GigaChat: разбор российских нейросетей
Расклад мая 2026: open-source перестали быть «второй лигой» AI. На многих задачах они равны или лучше. Это меняет экономику AI-проектов: правильный выбор модели экономит компании 50–80% бюджета без потери качества для конечного пользователя.
Михаил Соколов
AI-инженер с 10 годами в продакшене. Разрабатывает агентные сценарии и автоматизации на стеке OpenAI / Anthropic / YandexGPT.
Все материалы автора →
Дискуссия
Что вы думаете?
Поделитесь опытом, расскажите, как у вас решается похожая задача, или задайте вопрос — я лично читаю все комментарии и отвечаю.