В этом кейсе мы рассказываем, как заменили устные договорённости и хаотичные заметки на автоматические протоколы с выделением задач. Мы построили гибридную систему: все файлы хранятся у клиента, а нейросети для расшифровки и анализа мы предоставляем в аренду. Никакой утечки данных в облако, никакой покупки дорогих серверов с видеокартами.
Кому будет полезен этот кейс:
- Руководителям, которые устали тратить часы на расшифровку совещаний и поиск принятых решений;
- ИТ-директорам, которые ищут способ внедрить современный ИИ, но не готовы рисковать конфиденциальными данными;
- Компаниям, где на встречах обсуждаются финансы, стратегия или иная чувствительная информация;
- Тем, кто хочет получить готовое решение без покупки дорогого «железа» и без привязки к облачным серверам.
Содержание:
Исходная ситуация: запись есть, а протокола нет
Наш заказчик — крупный автодилер. Компания занимается продажей и выкупом легковых автомобилей, а также сервисным обслуживанием. В штате — несколько отделов, регулярно проходят внутренние совещания: планерки, обсуждение финансовых показателей, встречи с руководством.
Проблема была в том, как фиксировать итоги этих встреч. Сотрудники либо делали заметки «от руки» (и упускали важное), либо записывали разговор на диктофон, но потом никто не расшифровывал запись. В результате:
- Задачи терялись, поручения не исполнялись;
- При спорах «кто что сказал» не было объективного источника;
- Совещания затягивались, потому что участники переспрашивали и уточняли.
Клиент попробовал пользоваться обычными облачными сервисами расшифровки, но быстро отказался. На встречах регулярно обсуждаются конфиденциальные финансовые вопросы, а также стратегические решения. Отправлять такие записи в незащищенное облако — прямой риск утечки. Внутренняя политика безопасности компании это запрещала.
Задача: полная расшифровка с сохранением конфиденциальности данных
Нам нужно было создать систему, которая:
- Расшифровывает любые аудио и видеозаписи (онлайн или офлайн, в любом качестве);
- Автоматически выделяет из текста самое важное и делает выводы по каждому совещанию;
- Делает это без передачи данных наружу — все записи должны храниться только у клиента;
- Не требует от клиента покупки сверхдорогого серверного оборудования.
Особенность задачи: самая точная расшифровка сегодня делается при помощи нейросетей, а для этого нужны мощные видеокарты. Покупать такой сервер ради одного сервиса — дорого. Арендовать готовое облачное решение — небезопасно (данные уходят третьей стороне). Нужен был новый путь.
Реализация: гибридная схема «клиентский сервер + арендованный ИИ»
Мы предложили и внедрили архитектуру из двух частей, которые работают как единый сервис.
Часть 1. Клиентский фронт-сервер (развёрнут у заказчика)
Первый блок представляет собой клиентский веб-интерфейс. Его развернули на виртуальной машине внутри сети заказчика. Через него сотрудники:
- Загружают аудио- и видеозаписи совещаний;
- Просматривают готовые расшифровки и результаты анализа;
- Управляют историей записей (можно скачать текст или оригинал, а потом удалить).
Почему это безопасно. Все исходные записи и вся история хранятся на сервере клиента. Клиент сам настраивает глубину хранения (например, хранить только 30 дней, потом автоматически чистить). Может удалить любую запись вручную сразу после того, как получил протокол.
Часть 2. Арендованный инструмент
Второй блок — это вычислительное ядро. Оно включает серверную часть с LLM для распознавания речи и анализа текста. Эту часть мы предоставили как арендуемый сервис.
Взаимодействие построено максимально просто:
- Сотрудник загружает файл в свой локальный сервис.
- Сервис создаёт задание и отправляет файл к нам на обработку (по защищённому каналу).
- Нейросеть расшифровывает файл и анализирует текст, выделяет задачи и формулирует выводы.
- Результат поступает обратно на сервер клиента.
После передачи результата арендованный модуль полностью стирает следы обработки. Никакие исходные файлы у нас не остаются. Безопасность на высшем уровне.
Клиент платит только за минуты голоса и количество операций (расшифровок) — абонентская плата, а не покупка железа. В личном кабинете видно, кто из сотрудников сколько запросов сделал.
Что мы настроили дополнительно
- Доменная авторизация (единый вход). Сотрудники заходят в сервис под своими же рабочими паролями, не нужно запоминать новый логин.
- Возможность повторного анализа. Если нейросеть ошиблась, можно нажать кнопку и запустить анализ заново. Или дописать дополнительный промпт (уточнение для ИИ) — например, «выдели отдельно финансовые риски».
- Инструкция для сотрудников. Провели обучение, показали на примерах, как пользоваться.
- Список улучшений. Клиент запросил дополнительный функционал для пользовательской части фронт-сервера (идентификацию участников по голосу, формирование структурированного протокола с задачами, исполнителями и сроками, редактирование в веб-интерфейсе, полнотекстовый поиск, группировку по отделам, экспорт в .doc, email и Telegram-уведомления). Мы дали оценку по каждому пункту, и часть улучшений уже реализовали.
Тонкие моменты: баланс между мощностью ИИ и безопасностью
Этот проект интересен именно своей гибридной схемой. Почему же мы выбрали такой путь?
Основной вызов заключался в сочетании высокой производительности и строгих требований к защите данных. Полностью локальное размещение LLM потребовало бы закупки дорогого серверного оборудования и профессиональных видеокарт. Мы нашли оптимальное решение. Вычислительные ресурсы остались в нашем дата-центре, а данные и финальные результаты хранятся только у клиента. Такая схема сводит риск утечки к минимуму.
Ещё один нюанс касался универсальности обработки. Сервис должен одинаково стабильно работать с записями из любых платформ и условий. Мы также учли потребности бизнеса в развитии.
Ключевой принцип: вычислительные мощности арендуются, но конфиденциальные записи никогда не покидают периметр клиента на постоянной основе. Арендованное ядро не хранит исходные файлы — только потоковая обработка с немедленным удалением.
Результаты: порядок в совещаниях и спокойствие за данные
Проект успешно внедрён. Клиент пользуется сервисом в повседневной работе.
- Полные протоколы совещаний за минуты. Вместо часов ручной расшифровки — готовый текст с выделенными выводами и задачами.
- Конфиденциальность подтверждена. Все записи хранятся на сервере клиента. Наш арендный сервер не оставляет следов. Это соответствует внутренней политике безопасности.
- Экономия на оборудовании. Клиент не покупал дорогой GPU-сервер. Платит только за количество расшифровок по абонентской плате.
- Гибкость. Можно настроить глубину хранения, перегенерировать результат с новым промптом, добавить новых пользователей через доменную авторизацию.
- Готовность к развитию. У клиента есть список возможных улучшений с нашими оценками. Новый функционал внедряется по запросу.
Компания получила готовый инструмент для ежедневной работы с совещаниями. Сотрудники экономят часы на ручном оформлении документов. Руководство видит чёткие списки задач сразу после окончания встречи. Все данные остаются внутри корпоративного периметра.
Мы продолжаем сопровождать проект и постепенно расширяем функционал. Сервис работает стабильно и полностью закрывает изначальные задачи заказчика.
Компания «СТЕК» — ИТ-аутсорсер с 20-летним стажем. Мы помогаем бизнесу внедрять современные инструменты без потери контроля над данными и с сохранением привычных рабочих процессов.
Если вы тоже хотите автоматизировать оформление итогов совещаний, снизить нагрузку на сотрудников и гарантировать конфиденциальность внутренних обсуждений, обратитесь к нам. Наши инженеры предложат оптимальную архитектуру и запустят решение в согласованные сроки.
