GigaChat 3.1 Ultra от Сбера: MoE 702B, контекст 256K и MIT-лицензия
Сбер в марте 2026 выпустил GigaChat 3.1 Ultra — первую крупную российскую MoE-модель: 702B/36B активных, контекст 256K, открытые веса под MIT. Разбираем характеристики и где применять.
Сбер 24 марта 2026 представил GigaChat 3.1 Ultra (вместе с более лёгкой версией GigaChat 3.1 Lightning) — первую крупную российскую MoE-модель с контекстом 256 тысяч токенов и встроенным reasoning-режимом. Веса опубликованы под лицензией MIT — это первый случай, когда отечественный фронтирный LLM выкладывается в open source. Разбираем, что внутри и кому в бизнесе это реально нужно.
Что нового в GigaChat 3.1 Ultra
Релиз состоит из трёх частей: новые веса (Ultra и Lightning), обновлённый API и публикация моделей на Hugging Face под открытой лицензией. Главные характеристики Ultra:
- MoE-архитектура — по карточке модели на Hugging Face (
ai-sage/GigaChat3.1-702B-A36B), общий объём ~702 миллиардов параметров, на запрос активны ~36B. Это первая такая реализация в РФ — аналог по подходу к DeepSeek V3 и Mistral Mixtral. - Контекст 256K токенов — против 128K у GigaChat Pro. На длинных документах и больших кодовых базах разница ощутимая.
- Reasoning-режим в стиле o1 / DeepSeek reasoning-вариантов. Увеличивает время ответа, но заметно поднимает качество на математике и логике.
- OpenAI-совместимый API — миграция существующих интеграций сводится к замене base_url и ключа.
- MIT-лицензия — веса можно скачать, запускать локально, дообучать, использовать коммерчески. Это резко меняет позиционирование GigaChat относительно закрытых GPT-5.5 и Claude Opus 4.7.
- Контроль на 152-ФЗ. Облачный доступ — через SberCloud (вычисления на серверах в РФ). Для финансового сектора с пометкой «банковская тайна» есть приватный режим.
Доступ и лицензирование
Главная особенность релиза — лицензия MIT. Это значит:
- Веса можно скачать с Hugging Face (карточка
ai-sage/GigaChat3.1-702B-A36B), запускать локально, дообучать, использовать в коммерческих продуктах. - Облачный доступ — через SberCloud / developers.sber.ru, по тарифам платформы.
- Существует веб-чат на giga.chat и подписка для физлиц.
Конкретные API-тарифы у Сбера публикуются в личном кабинете SberCloud и могут меняться. Корпоративные клиенты получают объёмные скидки от крупных объёмов токенов.
Бенчмарки и реальное качество
Сбер заявляет лидирующие результаты на русскоязычных бенчмарках, включая MERA. Конкретные значения публикуются на Hugging Face и в карточке модели — там же лежит подробный технический отчёт. Точные цифры быстро устаревают, поэтому ориентируйтесь на свежие результаты на странице модели и в обзорах (Habr Сбербанк, BotHub).
Общая картина по обзорам марта 2026:
- На русском языке и в задачах, специфичных для российской предметной области (юриспруденция, госуслуги, региональные реалии), GigaChat 3.1 Ultra держится в верхней группе.
- На универсальных англоязычных задачах (код, абстрактные рассуждения, наука) лидеры по-прежнему GPT-5.5 и Claude Opus 4.7, но разрыв сократился.
- Reasoning-режим даёт заметный прирост на математике и логике — за счёт большего числа выходных токенов.
Сравнение с GigaChat Pro и YandexGPT 5
| Параметр | GigaChat Pro | GigaChat 3.1 Ultra | YandexGPT 5 |
|---|---|---|---|
| Архитектура | Dense | MoE 702B/36B активных | Dense |
| Контекст | 128K | 256K | 128K+ |
| Лицензия | Закрытая | MIT (open source) | Закрытая |
| Reasoning-режим | Нет | Да | Да |
| Серверы | РФ (СберКлауд) | РФ (СберКлауд) + self-host | РФ (Yandex Cloud) |
| OpenAI-совместимый API | Да | Да | Да |
GigaChat Pro остаётся актуален для типовых задач — генерации текстов, чат-ботов, документов. Ultra оправдан там, где нужна работа с длинными контекстами (юридический документооборот, аналитика, разбор больших дашбордов) или Reasoning для математики и логики. Открытая лицензия дополнительно делает Ultra привлекательным там, где критичен self-hosting и контроль над весами.
YandexGPT 5 ближе по позиционированию к Ultra, но проигрывает по доступности весов: лицензия закрыта, self-host невозможен. С другой стороны, YandexGPT сильнее в голосовых сценариях за счёт интеграции с Алисой.
Сценарии для бизнеса
Где Ultra реально приносит ценность:
- Документооборот. Загрузка договора на 100 страниц + вопросы по нему. Раньше для этого приходилось дробить документ; теперь — один запрос.
- Финансовая аналитика. CSV с тысячами транзакций + вопросы в стиле «найди аномалии в продажах региона Центр за апрель» — Reasoning-режим вытягивает.
- Корпоративные ассистенты. Большая контекстная база (политики, регламенты, истории клиентов) укладывается в одно окно.
- Юридическая работа. Сильное знание российского права из обучения.
- B2B-боты для госсектора. Серверы в РФ, комплаенс под 152-ФЗ и 187-ФЗ. С MIT-лицензией возможен полностью изолированный on-premise-сетап.
Где смысла мало:
- Простой чат-бот для FAQ — GigaChat Lightning или Pro дешевле и работают так же.
- Английский контент, программирование на новых стеках — DeepSeek и Claude сильнее.
- Креативное письмо и редактура художественных текстов — Claude Opus 4.7 по-прежнему вне конкуренции.
Как подключиться
Два пути:
- Облачно — через SberCloud (developers.sber.ru). Регистрация по СберBusiness ID, выпуск ключа, OpenAI-совместимый эндпоинт упрощает миграцию существующих интеграций — достаточно поменять base_url и ключ. Это полезный жест в сторону разработчиков, привыкших к инструментам уровня Cursor и Continue.
- Self-hosted — скачать веса с Hugging Face (
ai-sage/GigaChat3.1-702B-A36B) под MIT-лицензией и поднять на собственной инфраструктуре. Подходит для контуров с жёсткими требованиями к данным.
Веб-интерфейс giga.chat для физлиц включает доступ к Ultra в платной подписке Сбера; точные тарифы и лимиты — в личном кабинете.
Частые вопросы
Чем GigaChat 3.1 Ultra отличается от GigaChat Pro?
Ultra — топовая версия с MoE-архитектурой (702B общих / 36B активных), контекстом 256K и Reasoning-режимом, опубликованная под MIT. Pro — массовая dense-модель, дешевле и быстрее на типовых задачах, но без длинного контекста и продвинутого рассуждения и без открытой лицензии.
Можно ли использовать GigaChat 3.1 Ultra бесплатно?
Веса — да, под лицензией MIT можно скачать и запускать на своём железе. Облачный API через SberCloud — платный, обычно с бесплатным пробником.
Подходит ли GigaChat 3.1 Ultra для финансового сектора?
Да, есть приватный режим с пометкой «банковская тайна», вычисления на серверах СберКлауд в РФ. Для самых жёстких контуров возможен on-premise благодаря открытой лицензии.
Поддерживает ли Ultra код?
Поддерживает основные языки (Python, JavaScript, Go, Java, C#, Kotlin). На англоязычных бенчмарках по коду флагманы вроде DeepSeek V4 и GPT-5.5 пока сильнее; для серьёзной разработки лучше использовать специализированные модели.
Где взять документацию по API?
developers.sber.ru/portal/products/gigachat-api. Документация на русском, OpenAI-совместимый эндпоинт документирован отдельно. Карточка модели и техотчёт — на Hugging Face (ai-sage/GigaChat3.1-702B-A36B).
Будет ли Ultra доступен через SberDevices в умных колонках?
Сбер обещает развивать интеграцию с устройствами SberPortal и SberBox. Точные сроки появления в умных колонках — за официальными анонсами.
Итог
- GigaChat 3.1 Ultra — первая крупная российская MoE-модель в массовом доступе, реально конкурирующая с GPT-5.5 на русскоязычных задачах.
- 702B общих / 36B активных параметров, контекст 256K, встроенный reasoning-режим.
- Открытая MIT-лицензия — главное отличие от закрытых GPT-5.5 и Claude Opus 4.7 и от YandexGPT.
- Контекст 256K и приватный режим под 152-ФЗ закрывают сценарии, где облачные западные модели использовать нельзя.
- Для типовых задач остаются актуальными GigaChat Pro и YandexGPT 5; Ultra оправдан там, где нужна длина контекста, reasoning или open-source-стек.
Кирилл Пшинник
Сооснователь и CEO «Зерокодера», эксперт Forbes по EdTech и AI, лектор МФТИ и Иннополиса. Главный редактор GPTmag.
Все материалы автора →
Дискуссия
Что вы думаете?
Поделитесь опытом, расскажите, как у вас решается похожая задача, или задайте вопрос — я лично читаю все комментарии и отвечаю.