В очередной раз мы сталкиваемся с ситуацией, когда становится очевидным, что наличие резервного копирования данных и резервирования сервисов ИТ-инфраструктуры жизненно необходимы для ведения бизнеса.
Исходная ситуация
Запрос срочного решения последствий ИТ-инцидента пришел от руководителя IT-отдела нашего давнего клиента — крупной промышленной компании с основным офисом в Санкт-Петербурге и рядом филиалов в других городах. Суть возникшей проблемы — обрушение почтового сервера по причине допущения ошибки при попытке обновления ПО. 120 корпоративных почтовых адресов и огромная база писем стали мгновенно недоступны.
Ситуация произошла в пятницу, и в тот же день клиент обратился к нам, после чего в эктрастрочном режиме началась работа по разрешению проблемы.
Отказ почтового сервера является чрезвычайным происшествием, которое ставит под серьезный удар ведение бизнеса. Возникает ситуация, когда важнейшие корпоративные переписки с вложенными документами просто безвозвратно пропадают, а коммуникация с клиентами и партнерами останавливается на нескольких дней.
Задача
Оперативно восстановить работу почтового сервера и повысить уровень управления инцидентами.
Спасение почты: реализация проекта
Примерно за год до данного обращения, мы проводили для клиента ряд аудитов и помогали в настройке части сервисов ИТ-инфраструктуры, поэтому хоть компания и не находилась у нас на обслуживании, наши инженеры имели представление об архитектуре её ИТ-систем.
При выполнении предыдущих проектов для клиента было настроено резервное копирование контентной части почтового сервера, а также резервирование виртуальных машин. Именно поэтому, поняв суть проблемы, мы первым делом уточнили делаются ли сейчас бэкапы ВМ. Оказалось, что резервирование ВМ было отключено, поэтому сервер был потерян полностью и требовалось его повторная установка с нуля.
Отключение резервирования было сделано, возможно, из соображений перераспределения мощностей ИТ-системы на более приоритетные задачи. Для читателей мы хотим заметить, что подобное решение является стратегически неверным, а в случае нехватки серверных мощностей стоит рассматривать их увеличение, но ни в коем случае не отключение имеющегося резервирования сервисов.
От полной потери корпоративных переписок клиента спасло только наличие активного резервного копирования контентной базы почтового сервера.
Поднятие почтового сервера и восстановление переписок сотрудников
В субботу мы приступили к созданию нового почтового сервера для клиента. Первым этапом выполнения проекта стала очистка места на дисках гипервизора для создания ВМ и будущей установки ПО. Затем последовало создание копии виртуальной машины для почтового сервера, после чего был подключен её бэкап.
Архитектура развернутого нашими инженерами сервера была выполнена с учетом всех требований к уровню управления инцидентами. Под операционную систему и программу Zimbra был выделен отдельный виртуальный диск, также как и под контентную часть почты.
Данное решение позволяет в будущем, при возникновении инцидента, оперативно переустановить систему и подключить к ней весомую контентную базу данных без необходимости её импорта. Кроме того, подключенное резервирование виртуальной машины гарантировало бесперебойную работу почтового сервера.
В приоритетном порядке был произведен срочный запуск работы почтовых ящиков сотрудников, поэтому уже в понедельник сервер был запущен в эксплуатацию, но все почтовые ящики пользователей на данный момент были пустые. Наполнение контентом было реализовано в течение следующих нескольких дней, в рабочем режиме.
В процессе выполнения проекта наши инженеры удалили неиспользуемые аккаунты и прикрепленные за ними ненужные файлы.
Результаты
- 1В течение двух дней была восстановлена работа корпоративной почты крупного предприятия;
- 2Значительно повышена отказоустойчивость и безопасность почтового сервера;
- 3Используемое программное обеспечение обновлено до актуальной версии.
- 4Спасение электронной почты сотрудников крупного предприятия реализовано успешно.