Михаил Соколов
AI-инженер с 10 годами в продакшене. Разрабатывает агентные сценарии и автоматизации на стеке OpenAI / Anthropic / YandexGPT.
- Город
- Москва (родом из Новосибирска)
- Год рождения
- 1988
- Экспертиза
- AI-инженерияLLM-агентыRAGfunction callingMLOpsавтоматизация процессов
Об авторе
Я тот человек, к которому идут, когда нужно «сделать чтобы AI наконец заработал в продакшене» — не на демо в Notion, а на реальных потоках с реальными пользователями. За 10 лет я работал в Яндексе и в Тинькоффе, теперь помогаю продуктовым командам строить AI-сценарии без хайпа: чтобы стабильно работало, чтобы можно было дебажить, чтобы экономика сходилась.
В GPTmag пишу про техническую сторону AI для бизнеса: автоматизации, агенты, голос, инструменты разработчика. Если у вас в проекте AI «иногда галлюцинирует» — напишите в комментариях, разберём.
Воспоминания · детство
Откуда я пришёл
- 01
Я родился и вырос в новосибирском Академгородке — это место, где соседями могли быть академики, и где школа № 130 считалась нормой. Лето я проводил у деда в институте автоматики, бегая между лабораториями и просясь нажать большую красную кнопку на каком-нибудь пульте.
- 02
В 8 классе папа подарил мне старый IBM PC и книжку «Pascal для школьников». Я три месяца писал программу для сложения двух чисел — потому что путал `:=` и `=`. Когда наконец заработало, я полночи сидел и набирал «1 + 1 = 2», как будто открыл закон природы.
- 03
В 14 лет я попал в кружок робототехники при НГУ — и впервые увидел, как ребята старших курсов программируют поведение робота-сумо. Мне досталась роль того, кто паяет провода. Зато у меня до сих пор стабильная рука.
Воспоминания · студенчество
Что меня сделало мной
- 01
Первый курс НГТУ, факультет автоматики и вычислительной техники — и стажировка в Yandex на третьем семестре, потому что меня случайно увидел в кружке кто-то из их рекрутеров. До сих пор не понимаю, как это произошло, но это определило всю мою карьеру.
- 02
ICPC в 2010 — мы с командой летели в Стокгольм на полуфинал и проиграли в первый же раунд польской команде, потому что неправильно прочитали условие задачи. Тогда я выучил главное правило инженера: пять минут на чтение спасают пять часов отладки.
- 03
На четвёртом курсе я три месяца провёл в Carnegie Mellon по программе обмена. Жил в общежитии Pittsburgh, ел овсянку три раза в день и понял две вещи: что американские профессоры круче пишут код, а русские — лучше доказывают теоремы. С тех пор я за гибридный подход.
Образование
- НГТУ, факультет автоматики и вычислительной техники (2005–2011), магистр
- Carnegie Mellon University, программа обмена по computer science (2009)
- Постдипломные курсы по deep learning (DeepLearning.ai, fast.ai)
Карьера
- Яндекс — ML-инженер в команде поиска (2011–2016)
- Тинькофф — старший AI-инженер, направление persona/recommendation (2016–2021)
- Самозанятый AI-инженер: помогаю продуктовым командам внедрять LLM-агентов и RAG (2021 — настоящее время)
- Соавтор открытых модулей RAG-инфраструктуры на GitHub
Архив
Все материалы автора
AI для product-менеджеров: roadmap, спецификации, аналитика
Семь сценариев работы продакт-менеджера с AI в 2026: дизайн roadmap, PRD, user stories, RICE-приоритизация, анализ фидбэка, SQL и конкурентный анализ. Промпты, кейс.
Microsoft Copilot в мае 2026: GPT-5.5, Power Query, DAX и Plan mode
Microsoft 365 Copilot перешёл на GPT-5.5: Excel понимает Power Query и DAX, появился Plan mode, длинные документы в Word и презентации по brief. Цены, фичи, доступ из РФ.
OpenAI GPT-5 Mini: бюджетная модель для стартапов в 2026
Разбираем GPT-5 Mini от OpenAI: цена $0.25/$2.00 за 1M токенов, экономия против GPT-5.5, use cases и доступ из России.
OpenAI Operator в России: как настроить браузерного агента через прокси
OpenAI Operator в РФ официально недоступен. Разбираем рабочие способы через прокси-провайдеров, цены, безопасность и альтернативы вроде Browser-Use.
GigaIDE и GigaCode: российский ответ Cursor от Сбера в 2026
Сбер развивает связку GigaIDE Pro (форк IntelliJ IDEA) и плагина GigaCode на GigaChat MAX: автокомплит, чат, агентный режим. Кому подходит и как сравнивается с Cursor.
AI-ассистенты от VK в 2026: что умеют VK WorkSpace AI и GigaChat в MAX
Как устроены AI-ассистенты в экосистеме VK в 2026: VK WorkSpace AI, GigaChat в мессенджере MAX. Что умеют, как сравниваются с Telegram и WhatsApp, что с приватностью.
Hugging Face в России в 2026: нестабильный доступ и чем заменить
Состояние Hugging Face в РФ на май 2026: что работает, что нет, как загружать модели через прокси в Yandex Cloud и чем заменить — ModelScope от Alibaba и GitHub Models.
Нейросеть для регламентов и SOP: пошаговое создание процессов
Как создать SOP с AI за час вместо двух недель: структура с входами и выходами, промпты для HR, sales и тех. процессов, шаблон Notion и чек-лист качества.
AI для бухгалтеров: автоматизация 1С и отчётности в 2026
Шесть рабочих сценариев нейросетей для бухгалтерии в 2026 году: AI-OCR первички, проверка проводок, ответы ФНС, плагин 1С. Промпт и кейс на 200 сотрудников.
AI для FP&A: финансовое планирование и аналитика в 2026
Как нейросети меняют работу финансового директора и FP&A-команды: прогнозы, бюджетирование, отчётность, сценарное моделирование. Стек инструментов, рабочие промпты, ошибки.
AI для расшифровки совещаний и протоколов: топ-7 инструментов
Сравнение 7 AI-сервисов для автозаписи и расшифровки Zoom, Teams и Google Meet: цены, точность, интеграции с Asana и Trello, российские альтернативы.
ИИ для стоматологии 2026: запись, документы, маркетинг, диагностика
Как стоматологическая клиника использует нейросети: AI-запись пациентов через WhatsApp, расшифровка снимков, автогенерация выписок, маркетинг. Бесплатные сервисы, кейсы, compliance.
AI для технических писателей: документация, инструкции и API
Шесть рабочих сценариев AI для технических писателей: API-документация из OpenAPI, changelog, перевод EN→RU. Сравнение Claude, ChatGPT и Confluence AI. Промпт внутри.
AI-evaluation 2026: как мерить качество AI-системы в проде
Как оценивать AI-системы: метрики, инструменты, методология. RAGAS, LLM-as-judge, A/B-тесты, мониторинг галлюцинаций. Практический гайд для команд, запускающих AI в производство.
ChatGPT для технических переводов: как сделать перевод документации без ошибок
Воркфлоу технического перевода через ChatGPT и Claude: системный промпт, словарь терминов, проверка через Smartcat и DeepL, human-in-the-loop ревью.
DeepSeek догнал GPT-5 в коде и математике: что это для бизнеса
Открытая китайская модель DeepSeek V4 (Pro и Flash) приблизилась к GPT-5.5 и Claude Opus 4.7 по качеству при кратно меньшей цене. Бесплатный веб-чат, self-hosting, как использовать в российском бизнесе.
Думающие модели — главный тренд AI 2026: что это и зачем
Reasoning-модели (думающие модели) — главный тренд 2026. ChatGPT, Claude, Gemini тратят время на рассуждение перед ответом. Что это технически, как использовать, какие задачи решают лучше.
Кейс: автосервис на 6 точек поднял загрузку на 32% с AI
Как региональная сеть автосервисов внедрила AI-запись, диагностику фото-снимков, прогноз нагрузки и автоматическое формирование заказ-нарядов. Бюджет 1.4 млн ₽, окупаемость 5 месяцев.
Нейросеть для бухгалтера 2026: ИИ-ассистенты, курсы, бесплатные сервисы
Какие нейросети реально помогают бухгалтеру: первичка, проверки, отчётность, налоговые консультации. Бесплатные сервисы, курсы по AI для бухгалтеров, готовые промпты под 1С.
n8n для бизнеса в 2026: с чего начать, ноды, шаблоны, ИИ
Что такое n8n, для чего нужен, как развернуть на своём сервере, какие готовые шаблоны брать. Интеграция с ChatGPT, GigaChat, 1С, Telegram. Пошаговый старт без программирования.
Нейросеть для расшифровки аудио и видео в 2026: гид и сервисы
Как расшифровать аудио и видео в текст за 5 минут: лучшие нейросети, бесплатные сервисы, точность для русского, защита данных. Подборка под интервью, лекции, встречи, подкасты.
RAG vs Fine-tuning: что выбрать для AI-проекта в 2026
Полное сравнение: когда нужен RAG, когда fine-tuning, когда их комбинация. Стоимость, сроки, точность, обновляемость данных. Практические кейсы и ошибки выбора архитектуры.
Векторные базы данных для бизнеса 2026: Pinecone, Weaviate, FAISS
Что такое векторные БД, зачем они нужны для AI-поиска и RAG. Сравнение Pinecone, Weaviate, ChromaDB, Qdrant, Milvus. Цены, выбор, типичные ошибки внедрения для среднего бизнеса.
AI в медицине и клиниках 2026: диагностика, документы, поток
Что AI реально делает в российской медицине: AI-помощник врача, обработка анализов, голосовая запись пациентов, документы и счёт. Регуляторные ограничения, безопасность ПДн, российские решения.
AI на производстве: контроль качества, прогноз, MES в 2026
Как российская промышленность использует AI: компьютерное зрение для дефектов, predictive maintenance, оптимизация производственных линий, AI в MES. Кейсы и инструменты для среднего бизнеса.
Microsoft Copilot Studio: автоматизация бизнеса без кода в 2026
Что такое Copilot Studio, как работает в России в 2026, какие сценарии реализует. Сравнение с Power Platform, n8n, Zapier. Цены, ограничения, типичные ошибки внедрения.
Как изменились цены на AI-инструменты в 2026: что подешевело
API LLM подешевели на 50–80% за 18 месяцев. Подписки на AI-сервисы выросли в 1.5–2 раза. Что это значит для бизнеса и как пересчитать AI-бюджет в 2026 году.
Кастомные GPTs для бизнеса в 2026: своя нейросеть за час
Как создать свой AI-ассистент без программирования: Custom GPTs в ChatGPT, Claude Projects, GigaChat-агенты. Пошаговая инструкция, готовые шаблоны под бизнес, безопасность данных.
Кейс: логистика и AI — снижение издержек на 28% за 8 месяцев
Транспортная компания на 60 машин внедрила AI для маршрутизации, прогноза заказов и обработки документов. Вложения 2.1 млн ₽, годовая экономия 24 млн ₽. Подробный разбор кейса.
Открытые vs закрытые модели в мае 2026: расклад сил
DeepSeek V3.2/V4, Llama 4, Mistral Large 3, Qwen 3 догнали GPT-5 и Claude. Что это значит для бизнеса, какую модель выбрать в проде, как считать стоимость владения.
AI для архитекторов и проектировщиков: чертежи, сметы, концепции
Как архитекторам и проектировщикам использовать ArchiCAD AI, Revit AI, Midjourney v7 и Claude для концептов, BIM, смет и проверки СНиП. Промпт и кейс из Казани.
AI-поддержка клиентов в 2026: тикеты, чаты, база знаний без рутины
Полный гид по AI в customer service: чат-боты, AI-классификация тикетов, авто-ответы по базе знаний, аналитика обращений. Стек инструментов, цены, метрики и российская специфика.
AI в Яндекс.Директе в 2026: автостратегии, объявления, креативы
Как нейросети меняют контекстную рекламу: автостратегии Яндекс.Директа, AI-генерация объявлений, креативов и видео для РСЯ. Стек, рабочие промпты, типичные ошибки и кейсы.
Кейс: как мы автоматизировали обработку лидов на OpenAI API и сократили время ответа в 8 раз
Подробный кейс автоматизации воронки лидов: архитектура, промпты, метрики «до и после», стоимость и неочевидные грабли. Снизили время первого ответа с 4 часов до 30 минут.
Кейс: SaaS снизил churn на 35% с AI-онбордингом за 3 месяца
Российский SaaS для агентств внедрил AI-онбординг на Claude и GigaChat. За квартал: churn -35%, time-to-value сократился вдвое, NPS +21. Разбор архитектуры, бюджет, ошибки.
Нейросети в страховании: андеррайтинг, выплаты, антифрод в 2026
Как AI меняет страховую индустрию: автоматический андеррайтинг, обработка убытков за 4 минуты, обнаружение мошенничества, AI-чатбот в продажах. Кейсы Сбер, Альфа, Ренессанс.
AI чат-боты на сайт в 2026: какой выбрать и как настроить
Гид по AI-чатботам на сайт: сравнение JivoSite, Chat2Desk, Intercom Fin, Salebot, кастомных решений на GPT. Цены, интеграции, типичные ошибки и пошаговая настройка.
AI-агенты: следующая волна автоматизации после ChatGPT
Что такое AI-агенты, чем они отличаются от чат-ботов, какие задачи решают и как готовиться к их массовому внедрению. Архитектура, кейсы, риски, готовые продукты и стек для 2026 года.
Кейс: строительная компания сократила смету на 22% с AI-проектированием
Как московская строительная компания внедрила AI для проверки смет, генерации документации и анализа чертежей. Вложения — 1.8 млн ₽, годовая экономия — 6.4 млн ₽. Детальный разбор.
Видеогенерация через AI: Sora 2, Runway, Kling, Pika в 2026
Сравниваем AI-видеогенераторы 2026 года: Sora 2, Runway Gen-4, Kling 2, Pika 2.0, Veo 3, Luma Ray 2. Что подходит маркетологу, продакту, продюсеру — с примерами и ценами.
Голосовые AI-ассистенты для бизнеса: как настроить колл-центр на ИИ
Как построить голосовой AI-ассистент для бизнеса: технологический стек, архитектура, бюджет, метрики качества и кейсы. С разбором SaluteSpeech, Yandex SpeechKit и OpenAI Realtime.
n8n и ChatGPT: 12 рецептов автоматизации рутины без программирования
Готовые сценарии автоматизации с n8n и ChatGPT API: классификация писем, парсинг счетов, отчёты, бот для Telegram. С пошаговыми инструкциями и шаблонами.
AI для OCR и распознавания документов в 2026: Vision-модели, точность, стек
Подробный обзор AI-инструментов для OCR в 2026: GPT-4.1 Vision, GigaChat Vision, Yandex VLM. Точность на типах документов, цены, интеграция с 1С/CRM. С практическими промптами.
Интеграция AI с 1С и amoCRM: рабочие сценарии и архитектура 2026
Как подключить нейросети к 1С, amoCRM, Битрикс24: распознавание первички, AI-карточка лида, автоматическая квалификация, чат-бот в воронке. С примерами кода и стеком.
Open-source AI: DeepSeek vs Mistral vs Llama 4 для бизнеса в 2026
Подробное сравнение открытых AI-моделей: DeepSeek, Mistral, Llama 4. Качество, цены on-prem, лицензии. Когда переходить с OpenAI/Claude на open-source — экономика и риски.
Cursor vs GitHub Copilot vs Claude Code: лучший AI-копилот для разработчика в 2026
Подробное сравнение Cursor, GitHub Copilot и Claude Code: цена, агентность, качество кода, поддержка длинного контекста. Что выбрать команде разработчиков в 2026.
Make.com vs Zapier vs n8n в 2026: какой no-code выбрать для бизнеса
Подробное сравнение Make.com, Zapier и n8n: цены, лимиты, интеграции, поддержка AI, российские реалии. Выбираем платформу под конкретный сценарий и бюджет.