Hugging Face в России в 2026: нестабильный доступ и чем заменить
Состояние Hugging Face в РФ на май 2026: что работает, что нет, как загружать модели через прокси в Yandex Cloud и чем заменить — ModelScope от Alibaba и GitHub Models.
Hugging Face — американская компания (HQ в Нью-Йорке), и подпадает под санкционное законодательство США. Официально полной геоблокировки для российских IP компания не вводила, но по сообщениям пользователей доступ к платформе из РФ к 2026 году нестабилен: часть запросов проходит, часть отбивается, скачивание крупных моделей через huggingface-cli часто срывается. Для команд, которые строят open-source pipeline в России, это означает простое правило — рассчитывать на стабильный прямой доступ нельзя, нужны прокси и альтернативные источники моделей.
Что заблокировано, а что работает
На май 2026 ориентир по реальной доступности у российских ML-команд складывается такой.
| Сервис Hugging Face | Доступ из РФ | Комментарий |
|---|---|---|
| huggingface.co (карточки) | Частично | HTML обычно отдаётся, но запросы нестабильны |
Загрузка весов через huggingface_hub | Нестабильно | Часть скачиваний срывается на CDN |
| Hugging Face Spaces (Gradio/Streamlit) | Нестабильно | Часть Spaces недоступна без обхода |
| Inference Endpoints | Затруднён | Оплата зарубежной картой и нестабильный сетевой доступ |
| Datasets | Частично | Публичные мелкие — обычно работают, крупные — таймаут |
| Hub-search через API | Нестабильно | Запросы с дефолтным User-Agent отбиваются чаще |
В типичном случае скачать крупную модель напрямую командой huggingface-cli download без обхода не получится — нужен либо прокси, либо альтернативный источник.
Чем заменить и обойти
Базовый набор рабочих опций для российских команд на 2026 год:
- Прокси в облаке. Поднять виртуалку в Yandex Cloud или у российского провайдера с outbound IP, через которую идёт
huggingface-cli. Самый предсказуемый путь для команд, которые активно скачивают веса. - ModelScope (modelscope.cn) — китайский аналог HF, владелец Alibaba. Содержит зеркала популярных open-source моделей, собственные модели Alibaba (Qwen, Wan, CosyVoice). Регистрация через китайский номер или WeChat.
- GitHub Models — каталог моделей от Microsoft, существующий с 2024 года. Доступен из РФ без VPN, авторизация через GitHub PAT, бесплатный тир для тестирования.
- Корпоративный VPN — стабильнее, чем бытовые сервисы, но требует юридического оформления для коммерческой эксплуатации.
- Локальное хранилище весов. Скачать модели один раз через любой рабочий канал и хранить во внутреннем S3/MinIO — снижает зависимость от внешних сервисов в проде.
Как загрузить модель через Yandex Cloud
Самый стабильный способ для команд, которые не готовы возиться с VPN, — поднять прокси в Yandex Cloud. Базовая схема такая:
- Создаём виртуалку в Yandex Cloud
compute-vmс публичным IPv4 и Ubuntu LTS. - Ставим
squidилиtinyproxyна 3128, открываем порт только для своего IP. - На рабочей машине прописываем
HTTP_PROXYиHTTPS_PROXY, далееhuggingface-cli login,huggingface-cli download <model>.
Минусы: трафик платится по тарифу Yandex Cloud (порядок цены — единицы рублей за гигабайт исходящего), и при первом подключении HF иногда выдаёт капчу. Капчу обходят через ротацию IP в той же зоне доступности.
Альтернатива — российские провайдеры с AWS-совместимым API (Selectel, MWS, VK Cloud). Они часто дороже Yandex Cloud, но дают больше геолокаций и не требуют отдельной верификации.
ModelScope как полноценная замена
ModelScope — самый интересный вариант для тех, кто работает с китайскими и популярными open-source моделями. Платформа предлагает:
- зеркала большой части популярных моделей с HF (синхронизация обычно занимает считанные часы после релиза);
- собственные модели Alibaba: Qwen, Wan (видео), CosyVoice (голос);
- бесплатный inference для большинства моделей в рамках разумных лимитов;
- Spaces-аналог под названием Studios — можно деплоить Gradio-приложения.
Минус один и крупный: интерфейс по большей части на китайском, английская версия урезана. Часть документации читается только через машинный перевод. Для команды без китаиста это серьёзный барьер, но transformers и diffusers совместимы с ModelScope из коробки — достаточно поменять repo_id.
GitHub Models: тёмная лошадка
GitHub Models — каталог моделей от Microsoft, существующий с 2024 года. К 2026-му его развили в полноценный inference-каталог, в нём собраны популярные open-source модели и часть проприетарных (включая модели Azure OpenAI и партнёрские варианты).
Для российских разработчиков ключевые плюсы:
- доступ без VPN (GitHub из РФ работает);
- авторизация через PAT, не нужны зарубежные карты;
- бесплатный тир для тестирования;
- интеграция с привычными CI/CD-флоу через GitHub Actions.
Минусы: лимиты для прода ограничены, нет хостинга Spaces, не все open-source модели представлены. Но как зеркало для тестов и инференса — рабочая опция.
Что значит для российских команд
С практической точки зрения у российских ML-разработчиков остаётся три рабочие стратегии:
- Гибрид — основная разработка через прокси в Yandex Cloud, инференс продакшна через GitHub Models или ModelScope.
- Только локально — скачать веса один раз (через прокси или VPN), хранить в локальном S3/MinIO, запускать через
vllmилиtext-generation-inference. - Российский стек — отказаться от HF, перейти на YandexGPT 5 и GigaChat 3.1 Ultra для коммерческих задач, на ModelScope — для open-source.
Третий вариант — самый дешёвый по операционным расходам, но он сужает выбор. Когда нужны последние open-source модели вроде DeepSeek и Mistral, без зеркал не обойтись.
Полная статистика доступности западных AI-сервисов в РФ за второй квартал — в итогах AI в России Q2 2026. Там же сравнение цен на инференс через прокси против локального запуска.
Частые вопросы
Почему доступ к Hugging Face из России нестабилен?
Hugging Face — американская компания (HQ в Нью-Йорке), подпадает под санкционное законодательство США. Полной официальной геоблокировки нет, но фактический доступ из РФ нестабилен — это касается и обычной выдачи карточек моделей, и инференс-эндпоинтов. Для коммерческих сценариев лучше закладывать прокси и резервные источники моделей.
Можно ли использовать VPN для скачивания моделей?
Технически да, но через бытовые VPN скорость падает до 1–3 МБ/с, и HF часто блокирует диапазоны популярных VPN-провайдеров (NordVPN, Mullvad). Корпоративный VPN с outbound IP в Германии или Нидерландах работает стабильнее.
ModelScope — это законно для российских компаний?
Да, ограничений нет. Alibaba Cloud работает в РФ через российских реселлеров, ModelScope формально — продукт Alibaba DAMO Academy, под санкции не попадает.
Что делать, если выбранный канал доступа упал?
В сообществе ML-разработчиков на Хабре и в Telegram периодически появляются короткоживущие зеркала. Альтернатива — скачать веса через GitHub Models или ModelScope (если модель там есть) или попросить коллегу с зарубежным IP залить на S3.
GitHub Models достаточно для прода?
Для пилотов и MVP — да. Для прода с нагрузкой выше 50 RPS лимиты не подходят, нужен self-hosted inference. Сравнение производительности и стоимости — в обзоре open-source vs closed AI.
Сколько стоит поднять прокси в Yandex Cloud?
Минимальная конфигурация (1 vCPU, 2 ГБ RAM, 20 ГБ SSD) — порядок цены 1000–1500 ₽ в месяц. Плюс исходящий трафик при скачивании весов. Для небольшой команды суммарные расходы укладываются в несколько тысяч рублей в месяц.
Итог
- Прямой доступ к Hugging Face из РФ работает нестабильно — закладывайте прокси или альтернативный источник.
- Прокси в Yandex Cloud — самый предсказуемый путь для команд, которые активно скачивают веса.
- ModelScope (Alibaba) и GitHub Models (Microsoft) постепенно превращаются в полноценную замену HF для российских команд — особенно для тех, кому достаточно популярных моделей без узкоспециализированных fine-tune.
- Имеет смысл держать локальный кэш весов (S3/MinIO), чтобы не зависеть от внешних сервисов в проде.
- Полная замена HF на российский стек — YandexGPT и GigaChat для коммерческих задач плюс ModelScope для open-source — снижает операционные риски, но сужает выбор моделей.
Михаил Соколов
AI-инженер с 10 годами в продакшене. Разрабатывает агентные сценарии и автоматизации на стеке OpenAI / Anthropic / YandexGPT.
Все материалы автора →
Дискуссия
Что вы думаете?
Поделитесь опытом, расскажите, как у вас решается похожая задача, или задайте вопрос — я лично читаю все комментарии и отвечаю.