GPTmag GPTmag
Новости

GigaChat 3.1 Ultra от Сбера: MoE 702B, контекст 256K и MIT-лицензия

Сбер в марте 2026 выпустил GigaChat 3.1 Ultra — первую крупную российскую MoE-модель: 702B/36B активных, контекст 256K, открытые веса под MIT. Разбираем характеристики и где применять.

Кирилл Пшинник Кирилл Пшинник 5 минут

Сбер 24 марта 2026 представил GigaChat 3.1 Ultra (вместе с более лёгкой версией GigaChat 3.1 Lightning) — первую крупную российскую MoE-модель с контекстом 256 тысяч токенов и встроенным reasoning-режимом. Веса опубликованы под лицензией MIT — это первый случай, когда отечественный фронтирный LLM выкладывается в open source. Разбираем, что внутри и кому в бизнесе это реально нужно.

Что нового в GigaChat 3.1 Ultra

Релиз состоит из трёх частей: новые веса (Ultra и Lightning), обновлённый API и публикация моделей на Hugging Face под открытой лицензией. Главные характеристики Ultra:

  • MoE-архитектура — по карточке модели на Hugging Face (ai-sage/GigaChat3.1-702B-A36B), общий объём ~702 миллиардов параметров, на запрос активны ~36B. Это первая такая реализация в РФ — аналог по подходу к DeepSeek V3 и Mistral Mixtral.
  • Контекст 256K токенов — против 128K у GigaChat Pro. На длинных документах и больших кодовых базах разница ощутимая.
  • Reasoning-режим в стиле o1 / DeepSeek reasoning-вариантов. Увеличивает время ответа, но заметно поднимает качество на математике и логике.
  • OpenAI-совместимый API — миграция существующих интеграций сводится к замене base_url и ключа.
  • MIT-лицензия — веса можно скачать, запускать локально, дообучать, использовать коммерчески. Это резко меняет позиционирование GigaChat относительно закрытых GPT-5.5 и Claude Opus 4.7.
  • Контроль на 152-ФЗ. Облачный доступ — через SberCloud (вычисления на серверах в РФ). Для финансового сектора с пометкой «банковская тайна» есть приватный режим.

Доступ и лицензирование

Главная особенность релиза — лицензия MIT. Это значит:

  • Веса можно скачать с Hugging Face (карточка ai-sage/GigaChat3.1-702B-A36B), запускать локально, дообучать, использовать в коммерческих продуктах.
  • Облачный доступ — через SberCloud / developers.sber.ru, по тарифам платформы.
  • Существует веб-чат на giga.chat и подписка для физлиц.

Конкретные API-тарифы у Сбера публикуются в личном кабинете SberCloud и могут меняться. Корпоративные клиенты получают объёмные скидки от крупных объёмов токенов.

Бенчмарки и реальное качество

Сбер заявляет лидирующие результаты на русскоязычных бенчмарках, включая MERA. Конкретные значения публикуются на Hugging Face и в карточке модели — там же лежит подробный технический отчёт. Точные цифры быстро устаревают, поэтому ориентируйтесь на свежие результаты на странице модели и в обзорах (Habr Сбербанк, BotHub).

Общая картина по обзорам марта 2026:

  • На русском языке и в задачах, специфичных для российской предметной области (юриспруденция, госуслуги, региональные реалии), GigaChat 3.1 Ultra держится в верхней группе.
  • На универсальных англоязычных задачах (код, абстрактные рассуждения, наука) лидеры по-прежнему GPT-5.5 и Claude Opus 4.7, но разрыв сократился.
  • Reasoning-режим даёт заметный прирост на математике и логике — за счёт большего числа выходных токенов.

Сравнение с GigaChat Pro и YandexGPT 5

ПараметрGigaChat ProGigaChat 3.1 UltraYandexGPT 5
АрхитектураDenseMoE 702B/36B активныхDense
Контекст128K256K128K+
ЛицензияЗакрытаяMIT (open source)Закрытая
Reasoning-режимНетДаДа
СерверыРФ (СберКлауд)РФ (СберКлауд) + self-hostРФ (Yandex Cloud)
OpenAI-совместимый APIДаДаДа

GigaChat Pro остаётся актуален для типовых задач — генерации текстов, чат-ботов, документов. Ultra оправдан там, где нужна работа с длинными контекстами (юридический документооборот, аналитика, разбор больших дашбордов) или Reasoning для математики и логики. Открытая лицензия дополнительно делает Ultra привлекательным там, где критичен self-hosting и контроль над весами.

YandexGPT 5 ближе по позиционированию к Ultra, но проигрывает по доступности весов: лицензия закрыта, self-host невозможен. С другой стороны, YandexGPT сильнее в голосовых сценариях за счёт интеграции с Алисой.

Сценарии для бизнеса

Где Ultra реально приносит ценность:

  • Документооборот. Загрузка договора на 100 страниц + вопросы по нему. Раньше для этого приходилось дробить документ; теперь — один запрос.
  • Финансовая аналитика. CSV с тысячами транзакций + вопросы в стиле «найди аномалии в продажах региона Центр за апрель» — Reasoning-режим вытягивает.
  • Корпоративные ассистенты. Большая контекстная база (политики, регламенты, истории клиентов) укладывается в одно окно.
  • Юридическая работа. Сильное знание российского права из обучения.
  • B2B-боты для госсектора. Серверы в РФ, комплаенс под 152-ФЗ и 187-ФЗ. С MIT-лицензией возможен полностью изолированный on-premise-сетап.

Где смысла мало:

  • Простой чат-бот для FAQ — GigaChat Lightning или Pro дешевле и работают так же.
  • Английский контент, программирование на новых стеках — DeepSeek и Claude сильнее.
  • Креативное письмо и редактура художественных текстов — Claude Opus 4.7 по-прежнему вне конкуренции.

Как подключиться

Два пути:

  1. Облачно — через SberCloud (developers.sber.ru). Регистрация по СберBusiness ID, выпуск ключа, OpenAI-совместимый эндпоинт упрощает миграцию существующих интеграций — достаточно поменять base_url и ключ. Это полезный жест в сторону разработчиков, привыкших к инструментам уровня Cursor и Continue.
  2. Self-hosted — скачать веса с Hugging Face (ai-sage/GigaChat3.1-702B-A36B) под MIT-лицензией и поднять на собственной инфраструктуре. Подходит для контуров с жёсткими требованиями к данным.

Веб-интерфейс giga.chat для физлиц включает доступ к Ultra в платной подписке Сбера; точные тарифы и лимиты — в личном кабинете.

Частые вопросы

Чем GigaChat 3.1 Ultra отличается от GigaChat Pro?

Ultra — топовая версия с MoE-архитектурой (702B общих / 36B активных), контекстом 256K и Reasoning-режимом, опубликованная под MIT. Pro — массовая dense-модель, дешевле и быстрее на типовых задачах, но без длинного контекста и продвинутого рассуждения и без открытой лицензии.

Можно ли использовать GigaChat 3.1 Ultra бесплатно?

Веса — да, под лицензией MIT можно скачать и запускать на своём железе. Облачный API через SberCloud — платный, обычно с бесплатным пробником.

Подходит ли GigaChat 3.1 Ultra для финансового сектора?

Да, есть приватный режим с пометкой «банковская тайна», вычисления на серверах СберКлауд в РФ. Для самых жёстких контуров возможен on-premise благодаря открытой лицензии.

Поддерживает ли Ultra код?

Поддерживает основные языки (Python, JavaScript, Go, Java, C#, Kotlin). На англоязычных бенчмарках по коду флагманы вроде DeepSeek V4 и GPT-5.5 пока сильнее; для серьёзной разработки лучше использовать специализированные модели.

Где взять документацию по API?

developers.sber.ru/portal/products/gigachat-api. Документация на русском, OpenAI-совместимый эндпоинт документирован отдельно. Карточка модели и техотчёт — на Hugging Face (ai-sage/GigaChat3.1-702B-A36B).

Будет ли Ultra доступен через SberDevices в умных колонках?

Сбер обещает развивать интеграцию с устройствами SberPortal и SberBox. Точные сроки появления в умных колонках — за официальными анонсами.

Итог

  • GigaChat 3.1 Ultra — первая крупная российская MoE-модель в массовом доступе, реально конкурирующая с GPT-5.5 на русскоязычных задачах.
  • 702B общих / 36B активных параметров, контекст 256K, встроенный reasoning-режим.
  • Открытая MIT-лицензия — главное отличие от закрытых GPT-5.5 и Claude Opus 4.7 и от YandexGPT.
  • Контекст 256K и приватный режим под 152-ФЗ закрывают сценарии, где облачные западные модели использовать нельзя.
  • Для типовых задач остаются актуальными GigaChat Pro и YandexGPT 5; Ultra оправдан там, где нужна длина контекста, reasoning или open-source-стек.
Кирилл Пшинник

Кирилл Пшинник

Сооснователь и CEO «Зерокодера», эксперт Forbes по EdTech и AI, лектор МФТИ и Иннополиса. Главный редактор GPTmag.

Все материалы автора →

Похожие статьи

AI-инструменты для предпринимателя 2026: каталог сервисов

Полный список AI-инструментов для предпринимателя в 2026: 60+ сервисов с разбором

Каталог AI-инструментов 2026 года для бизнеса: чат-ассистенты, генерация контента, голос, аналитика, автоматизация. С ценами, ограничениями и рекомендациями для разных сценариев.

К Кирилл Пшинник 8 минут

Дискуссия

Что вы думаете?

Поделитесь опытом, расскажите, как у вас решается похожая задача, или задайте вопрос — я лично читаю все комментарии и отвечаю.