Обычно кейсы звучат в духе «пришёл, увидел, победил». Но в реальном IT не бывает идеальных условий. Мы тоже ошибаемся, недооцениваем риски и сталкиваемся с проблемами, которых не было в ТЗ.
Эта история о том, как проект миграции инфраструктуры вышел за все сроки и стал убыточным из-за перерасхода часов, но дал бесценный опыт. Мы не бросили клиента, исправили свои ошибки и честно рассказываем, как это было.
Содержание кейса
- Предыстория и исходная ситуация
- Разделение ИТ-инфраструктуры — миграция в частное облако
- План работ по проекту миграции
- Вызов №1: внезапный срочный переезд в новый офис и Wi-Fi с нуля
- Вызов №2: инцидент в процессе переноса учетных записей пользователей
- Вызов №3: сбой при запуске почтового сервера Exchange
- Итог проекта и выводы
Предыстория и исходная ситуация
Сотрудничество с клиентом началось в конце 2024 года, в непростой для компании период: после ухода ИТ-директора единственный системный инженер не справлялся с управлением масштабной серверной инфраструктурой крупного производственного холдинга. Мы оперативно провели аудит ИТ-среды и взяли на себя обслуживание и развитие серверной инфраструктуры — от мониторинга и резервного копирования до безопасности и реконфигурации.
Работа велась стабильно, однако в начале 2025 года оказалось, что холдинг готовится к расформированию: учредители решили разделить бизнес на несколько юридических лиц. Но был один важный «хвост» — ИТ-инфраструктура до сих пор оставалась единой и базировалась на одном кластере серверов. Мы продолжили поддержку ИТ-системы, но готовили техническую документацию для её будущего разделения.
Часть компаний, вышедших из состава холдинга, просто прекратили сотрудничество с нами, однако руководство одного из юридических лиц запросило полное выделение своей ИТ-инфраструктуры и развёртывание IaaS в частном облаке.
Разделение ИТ-инфраструктуры — миграция в частное облако
Исходные данные по клиенту
Компания работает в двух офисах (Москва и Санкт-Петербург) и использует около 30 рабочих мест в рамках единой ИТ-инфраструктуры. На основании проведенного ранее аудита и последующей совместной работы, мы точно оценили требуемые вычислительные мощности, быстро подготовили и согласовали проект.
Опишем подробнее содержание проекта по разделению IT-инфраструктуры
Для обеспечения стабильной работы ИТ-инфраструктуры компании требовалось развертывание в облаке 10 серверов:
- Сервер контроллера домена (PDC);
- Сервер для работы с 1С и базой данных;
- Терминальный сервер для удалённого доступа;
- Файловый сервер для хранения и распределения данных;
- Почтовый сервер Exchange;
- Антиспам-сервер на базе решения PMG;
- Сервер телефонии;
- Касперский — антивирусный сервер;
- Сервер системы мониторинга и DLP Staffcop;
- Сервер корпоративного портала Bitrix24.
Для полноценной работы IT-систем СТЕК предоставляет услугу «Частное бизнес-облако».
План работ по проекту миграции
Несмотря на детально проработанный план, в ходе реализации возник ряд непредвиденных обстоятельств, требовавших гибкости, профессиональной экспертизы и точных технических решений.
Вызов №1: срочный переезд в новый офис и Wi-Fi с нуля
Компания клиента вела деятельность в двух офисах — в Москве и Санкт-Петербурге. Клиент сообщал о планах переехать в новый офис в Санкт-Петербурге, однако данный процесс не был обозначен точными датами. В самый разгар нашей работы над инфраструктурой, клиент сообщает: «Через два дня мы переезжаем в новый офис. Помещение уже выбрано и арендовано. Пожалуйста, посмотрите помещение и реализуйте там работы по настройке сети».
Перед нами встала задача, фактически равная полноценному развертыванию нового офиса с нуля: организовать локальную сеть, обеспечить надёжное Wi-Fi-покрытие и подготовить площадку для подключения серверных сервисов клиента. В условиях жёсткого дедлайна — всего 48 часов.
| Аспект | Детальное описание |
|---|---|
| Суть задачи | Обеспечение полной готовности IT-инфраструктуры в новом офисе: развертывание ЛВС, Wi-Fi и базовых серверных мощностей для старта работы сотрудников. |
| Проблема | Клиент уведомил о факте переезда всего за 48 часов до начала работы. Требовалось выполнить большой объем работ по монтажу и настройке в условиях критического дедлайна. |
| Наша ошибка |
Пассивный менеджмент и отсутствие контроля. Мы допустили управленческий провал: знали, что клиент ищет офис, но не управляли этим процессом.
|
| Антикризисное решение |
Мы организовали работу в формате антикризисного проекта и выполнили полный цикл задач под ключ:
|
| Результат |
Несмотря на сжатые сроки, нам удалось:
|
| Системный вывод |
Эта ситуация стала поводом для пересмотра регламентов согласования и контроля проектных этапов — в интересах укрепления системы менеджмента и снижения рисков выполнения срочных задач в перспективе.
|
Вызов №2: непредвиденный инцидент в процессе переноса учетных записей пользователей в домен облачной инфраструктуры
Перед началом технических работ был проведён этап организационной подготовки:
- Сформирован перечень сотрудников, относящихся к выделяемой компании;
- Выполнена привязка каждого сотрудника к используемым им активам (физическим и виртуальным);
- Проведена согласительная процедура с ответственными лицами всех сторон.
Только после финального утверждения перечней был инициирован процесс изоляции и переноса соответствующих ресурсов в новую инфраструктуру.
Так как ранее мы занимались обслуживанием всего кластера серверов, мы знали необходимые мощности для выделяемого сегмента, поэтому без труда спроектировали новую инфраструктуру. Согласовали план будущих работ с заказчиком, с нуля развернули ИТ-инфраструктуру в облаке и подготовили среду для миграции: новый домен, терминальный сервер, файловые сервисы, AD, резервное копирование и безопасность.
Техническое задание на первый взгляд не содержало критических сложностей: за выходные переносим данные и серверы, в понедельник запускаем пользователей. Но всё прошло не совсем гладко — в ходе переноса рабочих станций в новый домен возникла непредвиденная проблема.
| Аспект | Детальное описание |
|---|---|
| Суть задачи |
Миграция рабочих мест: вывод рабочих станций из устаревшего домена Active Directory и ввод в новый контур управления. Процедура включает смену политик безопасности, переназначение прав доступа и реконфигурацию пользовательских профилей. |
| Проблема |
Конфликт с подсистемой шифрования данных: в исходной инфраструктуре действовала политика полного шифрования дисков (Full Disk Encryption) средствами Kaspersky Endpoint Security. Технически миграция в новый домен невозможна без предварительной расшифровки носителей. |
| Наша ошибка |
Поверхностный предпроектный аудит. Мы допустили промах на этапе сбора данных: не провели глубокую инвентаризацию настроек безопасности конечных устройств. Наличие Full Disk Encryption не было выявлено до старта работ, поэтому тайминг миграции рассчитывался для «чистых» станций и не учитывал время на дешифровку. |
| Сложности реализации |
|
| Оперативное решение |
Обеспечение непрерывности бизнеса: Для минимизации простоя бизнес-процессов пользователям был оперативно предоставлен доступ к терминальному серверу в новой инфраструктуре. Это решение позволило не останавливать работу с критически важными сервисами (корпоративная почта, 1С, Битрикс24) в обход проблемных рабочих станций. |
| Системное решение |
Эскалация и устранение корневой причины: К инциденту были подключены технический директор и старшие системные инженеры. Экспертная группа диагностировала блокировку на уровне драйвера шифрования и реализовала метод обхода ограничений без использования утраченных административных прав старого домена, что позволило успешно завершить миграцию. |
| Результат |
Миграция была завершена, но фактические трудозатраты выросли: вместо плановых 30 минут на рабочее место настройка занимала от 1,5 часов. Общий срок работ увеличился до 3 рабочих дней. |
| Урок |
Миграцию нельзя планировать без полной инвентаризации рабочих станций. Проверка политик шифрования и средств защиты должна быть обязательным этапом предпроектного аудита и учитываться в сроках и рисках. |
Как избежать повтора проблемы? Всегда делайте тестовый перенос одного рабочего места, замеряйте эталонное время и только после этого формируйте план.
Мы столкнулись с проблемами по факту, решая их в авральном режиме, чтобы минимизировать простой бизнеса клиента.
Вызов №3: сбой при запуске почтового сервера Exchange
Важным этапом стала миграция Microsoft Exchange. Во время тестовой отработки процедуры переключения выявилась необходимость в дополнительной экспертизе для этапа импорта данных.
Более детальное описание ситуации, её причин и принятых мер приведено в следующей таблице:
| Аспект | Описание |
|---|---|
| Контекст |
Выполнялась миграция корпоративной почты Microsoft Exchange в новую инфраструктуру с целью переноса почтовых ящиков и данных пользователей. |
| Проблема |
После копирования базы данных, почтовый сервис в новой инфраструктуре не запустился. |
| Управленческая ошибка |
Корневая причина Менеджер проекта допустил критическую ошибку в распределении ресурсов: к миграции Exchange был допущен инженер без подтверждённой экспертизы по данному продукту. Навыки исполнителя не были проверены, риски этапа — не оценены. |
| Техническая ошибка |
Вследствие недостатка компетенций, младшим инженером был выбран некорректный метод миграции — прямое копирование файлов баз данных Exchange (.edb), как если бы это был обычный файловый архив. |
| Почему это не работает |
Microsoft Exchange — транзакционная система. Каждая база данных привязана к конкретному серверу и его GUID, конфигурации не являются переносимыми. Копирование .edb-файлов нарушает архитектуру системы и не позволяет смонтировать базы в новой среде. |
| Аварийное решение |
Мы признали выбранную тактику ошибочной и выполнили rollback: почтовые ящики были экстренно возвращены на исходный сервер, что позволило быстро восстановить доступ к почте и избежать длительного простоя бизнеса. |
| Системное решение |
В проект срочно был подключён профильный архитектор по Exchange. Был разработан и реализован штатный план миграции с использованием официальных инструментов Microsoft. |
| Подход к миграции / управление рисками |
Применена гибридная схема: новая почта сразу обрабатывалась в новой инфраструктуре, при этом исторические данные оставались доступными на старом сервере и мигрировали в фоновом режиме. |
| Результат |
Миграция была успешно завершена, целостность переписки (письма, контакты, календари) сохранена на 100%. Пользователи столкнулись с временными неудобствами, однако бизнес-процессы не были приостановлены. |
| Урок |
Причиной инцидента стал не технический сбой, а недостатки в планировании ресурсов. Недооценка сложности архитектуры проприетарной системы и привлечение исполнителя с несоответствующим профилем привели к увеличению сроков реализации. Для исключения подобных ситуаций мы актуализировали внутренние регламенты: теперь назначение инженеров на сложные инфраструктурные задачи происходит только после процедур дополнительной верификации их компетенций. |
Итог проекта
Несмотря на череду критических ситуаций, проект был успешно завершен. Клиент получил:
- Выделенную, отказоустойчивую IT-инфраструктуру в частном облаке, полностью независимую от бывшего холдинга.
- Стабильную работу во всех офисах.
- Профессиональную поддержку и управление своей новой IT-средой.
Выводы
Этот проект стал для нас суровым, но бесценным уроком. Мы признали и детально проанализировали допущенные ошибки, превратив их в фундамент нашей текущей экспертизы. На основе этого опыта мы пересмотрели внутренние стандарты и сформулировали правила для будущих миграций:
- «Никогда не проводить миграцию без полноценного пилотного переноса». Теперь это наш «золотой стандарт». Мы замеряем эталонное время и выявляем скрытые конфликты систем на одном узле, прежде чем масштабировать решение на весь бизнес.
- Обязательный глубокий аудит исходного состояния систем. Мы внедрили расширенные чек-листы предпроектного обследования. Теперь инвентаризация включает не только базовые параметры, но и проверку политик шифрования (FDE), скрытых коммуникаций и специфических настроек безопасности.
- Проактивное управление и контроль рисков. Мы внедрили обновлённые регламенты в систему управления проектами, усилив роль превентивного контроля. Были формализованы контрольные точки, процедуры управления ожиданиями и обязательная проработка сценариев «что, если» на ранних этапах.
- Мы отточили навыки развертывания антикризисных решений (терминальные серверы, гибридные схемы), которые позволяют сохранять работоспособность бизнеса клиента даже в процессе глубокой модернизации систем.
Важно отметить, что выявленные в ходе проекта сложности не оказали влияния на непрерывность бизнес-процессов клиента. Все риски были своевременно локализованы и компенсированы за счёт оперативного привлечения дополнительных инженерных ресурсов и профильных экспертов, что позволило сохранить стабильную работу сервисов и выполнить проектные задачи без негативных последствий для бизнеса заказчика.
