В данном кейсе мы рассказываем, как в ходе аудита выявили ряд уязвимостей в ИТ-инфраструктуре клиента, благодаря чему смогли предупредить сбой серверов и разработать проект по модернизации.
Исходная ситуация
На момент обращения мы уже были знакомы с клиентом — ранее наша компания оказывала заказчику услуги по настройке Wi-Fi сети. В этот раз поступил запрос на абонентское обслуживание ИТ-инфраструктуры.
Заказчик — онлайн-магазин с огромным каталогом товаров (более 100 000 позиций), собственными складами и пунктами выдачи.
После согласования стоимости обслуживания и заключения договора, наши инженеры приступили к проведению «входного аудита» (предварительная проверка инфраструктуры). Исследование выполняется в первый месяц обслуживания и предназначено для углубленного знакомства с ИТ-инфраструктурой компании, выявления критических уязвимостей в ИТ-системах, проведения детальной инвентаризации серверов и используемого программного обеспечения.
Услуга входного аудита зачастую идет в зачет первого месяца обслуживания, при условии соразмерности стоимости.
Задача
Провести исследование ИТ-инфраструктуры клиента для дальнейшего IT-обслуживания
Реализация
На момент обращения ИТ-инфраструктура предприятия базировалась на 3-х физических серверах и двух системах хранения данных. На серверах было развернуто более 20 виртуальных машин под различные сервисы.
В ходе проведения исследования наши инженеры обнаружили следующие проблемы текущей конфигурации:
- Серверы работают на пределе своих возможностей, система перегружена;
- Частота одного из процессоров недостаточна для высокой производительности приложений 1С;
- Используется устаревшая и небезопасная система виртуализации;
- Требуется реорганизация хранения резервных копий;
- Неэффективное расположение планок оперативной памяти отрицательно сказывается на её частоте;
- Стратегически неверное расположение систем хранения данных (СХД расположены на складе) — низкие скорости обмена данными с ЦОД-ом препятствуют своевременному созданию бэкапов;
- Небольшая глубина резервных копий контента;
- Отсутствие мониторинга ряда важных показателей.
Главной проблемой ИТ-системы клиента является нехватка мощностей и постоянные высокие нагрузки на серверы. В текущей ситуации практически невозможно управление инцидентами. Базы данных неуклонно растут каждый месяц из-за масштабирования товарооборота, поэтому для дальнейшего корректного функционирования сервисов требуется срочная реконфигурация ИТ-инфраструктуры.
Серверы работают на пределе своих возможностей. В случае, когда нагрузка на любой из вычислительных машин перейдет «красный» рубеж — произойдет её отключение, а затем сработает «эффект домино»: нагрузка распределится на оставшиеся серверы, что незамедлительно приведет к их сбою. Данная ситуация весьма опасна для бизнеса и требует оперативного реагирования.
Без реконфигурации ИТ-системы, со временем придется сокращать выделяемые под каждую виртуальную машину мощности, а значит работа сервисов существенно замедлится и будет доставлять сотрудникам и клиентам компании значительные неудобства.
Еще одна серьезная уязвимость ИТ-инфраструктуры — неэффективная и небезопасная система хранения резервных копий данных. Под эту задачу системе требуется дополнительный сервер, а также увеличение скоростей сетевых каналов.
Составление дорожной карты решения имеющихся в ИТ-инфраструктуре проблем
Для клиента был подготовлен отчет по аудиту, в котором подробно описывались все слабые места ИТ-системы. Кроме того, наши инженеры подготовили план по устранению всех уязвимостей и приведению инфраструктуры к эталонным показателям отказоустойчивости.
Кратко перечислим некоторые из рекомендаций:
Организация эффективной системы создания резервных копий
Для корректного создания бэкапов необходимо настроить высокоскоростную сеть передачи данных между серверами в ЦОДе и системой хранения данных.
Повышение показателей быстродействия и отказоустойчивости системы
Требуется добавить в ИТ-инфраструктуру новый сервер, а также реализовать модернизацию имеющихся. Также необходимо обновление установленного ПО, так как данное действие не производилось с самого момента запуска вычислительных машин в эксплуатацию.
Подключение бэкап-мониторинга и аудит 1С
Во время аудита инфраструктуры наши инженеры заметили, что в работе систем присутствуют процессы, которые выбирают практически все мощности процессора 1С-сервера. Для определения природы данной проблемы необходимо провести аудит 1С, выявить неоптимизированные места и указать на них техническим специалистам соответствующего отдела компании заказчика.
Таким образом, проблема высоких нагрузок будет устранена сразу с двух направлений — оптимизации ПО и добавления серверных мощностей.
Результаты
- 1Клиенту предоставлен отчет с описанием проблемных мест системы;
- 2Составлена подробная техническая документация по всему имеющемуся оборудованию и установленному программному обеспечению;
- 3Кроме отчета клиенту на согласование предоставлена карта проекта по модернизации ИТ-инфраструктуры;
- 4Самый весомый результат проделанной работы:Следуя нашим рекомендациям, заказчик избежит приостановку бизнеса.