Кейс: SaaS снизил churn на 35% с AI-онбордингом за 3 месяца
Российский SaaS для агентств внедрил AI-онбординг на Claude и GigaChat. За квартал: churn -35%, time-to-value сократился вдвое, NPS +21. Разбор архитектуры, бюджет, ошибки.
Российский SaaS для управления маркетинговыми агентствами (заявки, тайминги, биллинг) — назовём его условно AgencyDesk — четыре года жил с одним и тем же показателем: 38% новых клиентов уходили в первые 60 дней. Фаундер пробовал всё: видео-туторы, обязательные онбординг-звонки, документацию на 800 страниц, бесплатных консультантов. Ничего не сдвигало churn ниже 35%. В марте 2025 они запустили AI-онбординг на связке Claude Sonnet + GigaChat. За три месяца churn упал до 25%. История — про архитектуру, бюджет, ошибки и почему классический онбординг сломался в 2026.
Контекст
Продукт: B2B SaaS для агентств от 10 до 200 человек. Управление проектами, биллинг, ресурсное планирование, отчёты для клиентов.
Цена: от 18 000 ₽/мес.
Аудитория: owner / operations director агентств. Не разработчики, не «технари».
Ситуация до AI-онбординга:
- 38% churn в первые 60 дней.
- Time-to-value (первая ценность от продукта) — 21 день.
- NPS — 6.4 из 10.
- Самый частый отзыв: «слишком сложно, не успели разобраться».
- 4 customer success менеджера на 600 активных клиентов — каждому хватало времени на 2 онбординг-звонка по 30 минут, после чего клиент оставался один.
Главный инсайт фаундера: «Мы не продали клиенту проблему. Он купил ожидание, что станет проще, а получил инструмент, в котором ещё сложнее, чем в Excel первые две недели».
Что внедрили
Архитектура AI-онбординга
Система состоит из 4 компонентов:
1. AI-аватар «Алина» — персонажный AI-помощник, появляющийся в правом нижнем углу с момента регистрации. Не виджет «как помочь», а активный участник: «Я провожу тебя за первый час. Готова?»
2. Контекстная память клиента. Алина «помнит» всё, что клиент уже сделал в системе — какие проекты завёл, кого пригласил, какой тариф купил. Промпт каждого взаимодействия включает контекст.
3. Действия (function calling). Алина может реально делать что-то в продукте: создать тестовый проект с шаблонными задачами, импортировать клиентов из CSV, настроить интеграцию с amoCRM.
4. Эскалация на человека. Если клиент 2 раза подряд расстроен или просит человека — мгновенная переключение на customer success.
Стек
- Backend: Python (FastAPI), PostgreSQL, Redis.
- LLM: Claude Sonnet 4.6 для основной логики (через Anthropic API + российский прокси), GigaChat для финальных текстов с ПДн клиентов.
- RAG: ChromaDB с базой знаний — 240 статей документации, 80 видео-расшифровок.
- Аналитика: PostHog для product analytics + кастомный дашборд по AI-диалогам.
Сценарии Алины
Сценарий 1: первый час после регистрации
- Приветствие, понимание роли (owner / ops / pm).
- Помощь в импорте 1 реального клиента из CRM.
- Создание первого проекта с реальными данными.
- Назначение задачи реальному коллеге.
- Финал: «Поздравляю, теперь ты создал свой первый проект с командой. Если хочешь — приглашу твоего операционника, он завтра увидит уведомление.»
Сценарий 2: день 3 — биллинг Алина пишет: «Привет, я заметила, ты ещё не настроил биллинг. У вас уже 4 проекта. Хочешь, помогу выставить первый счёт клиенту? Расскажи, как ты обычно считаешь — почасово или фикс».
Сценарий 3: день 7 — checkpoint Алина: «Прошла неделя. У тебя 7 проектов и 4 коллеги в команде — отличный темп. Что показалось сложным? Я могу записать в обратную связь продукту или сразу решить.»
Сценарий 4: день 30 — value reminder Алина: «Месяц с нами. За это время ты обработал 31 проект и 1.2 млн ₽ выручки прошло через систему. Сэкономлено около 14 часов на отчётах. Подпишемся на годовой тариф со скидкой 20%?»
Что было самое сложное
Промпт-инжиниринг
Первая версия Алины в А/B-тесте дала +5% конверсии и ноль улучшения по churn. Проанализировали 200 диалогов — оказалось, она «вежливая, но бесполезная». Слишком много «давайте посмотрим документацию» и слишком мало «я только что сделала это за вас, проверьте».
Переписали системный промпт, ключевая правка:
Ты — не справочник, ты — стажёр-помощник.
Когда клиент спрашивает "как сделать X" — ты не объясняешь.
Ты делаешь X через function call и показываешь результат:
"Готово, X создан. Хочешь посмотреть?"
Объяснять только если клиент явно просит "расскажи как".
Документацию давать ТОЛЬКО как ссылку в конце,
не вместо действия.
После этого +18% к completion rate сценариев.
RAG: качество данных
Вторая боль — Алина галлюцинировала на устаревших статьях документации. В базе было 240 материалов, 60 из них устарели (старый интерфейс, отменённые фичи).
Проект на 2 недели: вычистили базу, добавили теги «версия документа», научили RAG приоритизировать свежее. Hallucination rate упал с 4.8% до 0.6%.
152-ФЗ для российских клиентов
Claude Sonnet — зарубежная модель. ПДн клиентов нельзя передавать. Решение:
- В промпт Claude передавали обезличенные ID и метаданные.
- Текст с ПДн (имена клиентов, контакты) генерировал GigaChat внутри РФ.
- Финальный ответ собирал backend, склеивая части.
Подробнее про эти требования — в статье про регулирование ИИ и безопасность данных при работе с ИИ.
Хронология
| Месяц | Этап |
|---|---|
| Март 2025 | Аудит онбординга, А/B первой версии |
| Апрель 2025 | Переписали промпт, добавили действия |
| Май 2025 | Раскатка на 100% новых клиентов |
| Июнь 2025 | Расширили на existing-клиентов (re-engagement) |
Цифры
| Метрика | Февраль 2025 | Июнь 2025 | Изменение |
|---|---|---|---|
| Churn первых 60 дней | 38% | 25% | −34% |
| Time-to-value | 21 день | 9 дней | −57% |
| Активация (5+ задач) | 42% | 71% | +69% |
| NPS | 6.4 | 7.7 | +20% |
| Onboarding-звонков на CSM | 4/день | 1.5/день | −63% |
| MRR на нового клиента (90 дней) | 31 000 ₽ | 47 000 ₽ | +52% |
| LTV (год) | 168 000 ₽ | 254 000 ₽ | +51% |
Главный сюрприз — рост MRR на нового клиента. Алина проактивно предлагала переход на годовой тариф со скидкой 20%, и 33% клиентов соглашались. До этого годовой брали 9%.
Бюджет
- Разработка: 2.4 млн ₽ за 3 месяца (1 senior backend, 1 продуктовый дизайнер, 1 промпт-инженер на полставки, 1 customer success на интервью).
- API LLM: 78 000 ₽/мес на Claude API + 12 000 ₽/мес на GigaChat (на 600 активных клиентов).
- Окупаемость: при росте LTV на 86 000 ₽ × 40 новых клиентов в месяц → +3.4 млн ₽ дополнительной годовой выручки. CAPEX окупился за 22 дня после полной раскатки.
Что не сработало
Анти-churn email от AI
Параллельно тестировали AI-генерацию реактивирующих писем для клиентов, которые перестали логиниться. ChatGPT-4o писал «слишком корпоративно», open-rate 12% — против 24% у писем, написанных CSM руками. Свернули. Подробнее про email с AI — гид по email-автоматизации с AI.
Голосовой онбординг
Хотели сделать голосовой звонок «Алины» для тех, кто не активен в чате. На тесте 80% клиентов заканчивали разговор за 30 секунд: «спасибо, я лучше прочитаю». Голос как канал онбординга для B2B SaaS не сработал.
AI-помощник для CSM
Идея: AI готовит CSM брифинг перед звонком. Реализовали, но CSM не пользовались — ленились открывать. Через 6 недель закрыли.
Чему научились
- AI-онбординг ≠ AI-чат. Бот, который объясняет, не работает. Бот, который ДЕЛАЕТ за клиента — работает.
- RAG критичен для долгой жизни. Без процесса актуализации документации галлюцинации съедают эффект.
- Не пытайтесь заменить CSM. Алина забрала рутину (импорт, базовая настройка), CSM стали глубже — стратегия использования продукта, апселл, расширение в команде.
- Промпт — это код, требует ревизий. Раз в 2 недели — анализ 200 диалогов и правка промптов под повторяющиеся проблемы.
- 152-ФЗ обходится разделением ролей моделей. Можно сочетать зарубежные мощные LLM и российские для финального текста с ПДн.
Что планируют дальше
- AI-предиктор churn для существующих клиентов (флаг «риск ухода»).
- Алина для customer success — помощник CSM в подготовке к QBR.
- AI-генерация шаблонов договоров под клиентов агентства (продукт-extension).
FAQ
Сколько стоил пилот? 2.4 млн ₽ разработка + 90 000 ₽/мес операционки.
За сколько окупилось? 22 дня после полной раскатки. Главный драйвер — снижение churn и рост LTV.
Какая команда нужна? Минимум: 1 backend-разработчик, 1 продакт-менеджер с пониманием AI, 1 промпт-инженер (можно на части ставки), 1 designer для UX «AI-аватара».
Что важнее — мощная модель или хороший промпт? Промпт. На GPT-4o-mini с хорошим промптом получается лучше, чем на Claude Opus с плохим.
Можно ли использовать только GigaChat без Claude? Можно, если 152-ФЗ критично. Качество диалога будет на 15–20% ниже, но компенсируется промпт-инжинирингом.
Сколько времени уходит на ежемесячную поддержку? 8–12 часов промпт-инженера в неделю + 4 часа дата-аналитика. Поддержка не требует постоянной разработки.
Можно ли так же делать без своей разработки? Сложно. Готовые конструкторы (Intercom Fin, Salebot) дают 60% эффекта. Полный кастом — 100%.
Что если SaaS меньше 100 клиентов? Окупаемость хуже из-за высокого CAPEX. Лучше начать с готового решения (Intercom, Salebot) или подождать роста до 200+ клиентов.
Что делать прямо сейчас
- Сегодня: посчитайте свой churn первых 30/60/90 дней. Где главные «обрывы»?
- Эту неделю: проанализируйте 50 случайных диалогов с CSM, найдите 5 повторяющихся вопросов — это база для AI.
- Этот месяц: запустите MVP AI-помощника на готовом конструкторе, прогоните 100 пользователей и замерьте activation rate.
Связанные материалы:
В B2B SaaS 2026 года onboarding — это уже не «отдать клиенту видео и документацию», а активный AI-помощник, который снимает первый барьер. Те, кто этого не делает, проигрывают по churn 30–50% против тех, кто внедрил. И разрыв расширяется.
Михаил Соколов
AI-инженер с 10 годами в продакшене. Разрабатывает агентные сценарии и автоматизации на стеке OpenAI / Anthropic / YandexGPT.
Все материалы автора →
Дискуссия
Что вы думаете?
Поделитесь опытом, расскажите, как у вас решается похожая задача, или задайте вопрос — я лично читаю все комментарии и отвечаю.