Инцидент

30.07.2018

Инцидент (IT Incident) — это любое явление, выходящее за рамки штатной работы ИТ-структуры, прямо, косвенно или потенциально, ведущее к остановке процессов системы или негативно отражающееся на качестве ее функционирования.

Комплекс мероприятий, направленный на максимально быстрое возобновление рабочего состояния системы после инцидента, называется Incident Management или IM —управление инцидентами.

Важной его частью считается SLA — соглашение об уровне сервиса, расписанное в детальной форме и служащее для эффективной нейтрализации последствий инцидентов и сбоев в любой информационной бизнес-структуре.

Библиотека ITIL дает самое полное и достаточно объемное руководство для управления инцидентами. Однако, при тщательном изучении материалов ITIL обнаруживается, что огромный информационный массив и множество рекомендаций можно свести всего к нескольким основополагающим пунктам.

  • 1Формирование и постоянное обновление базы данных всех инцидентов с непременной фиксацией всего пути процесса реакции;
  • 2Создание базы со всей доступной информацией о методах разрешения и нейтрализации инцидентов и сбоев. В структуре ITIL данный массив имеет обозначение CMDB;
  • 3Формирование и внедрение в структуру, созданную с целью реакции на инциденты, четкого протокола или свода правил для фиксации и обработки данных;
  • 4Определение с помощью инструкций SLA-механизмов, позволяющих в максимальной степени управлять влиянием инцидента на процессы в бизнес-структуре;
  • 5Создание и отработка на практике конкретной модели поведения всех участников информационного процесса, при возникновении так называемого главного инцидента — события, максимально критичного по масштабам и последствиям. Суть данного пункта, в определении глубины ресурсов, имеющих возможность быть задействованными в процессе реакции и нейтрализации инцидента;
  • 6Разработка и практическое применение механизмов своевременного информирования об этапах и статусе работ по нейтрализации инцидента всех заинтересованных субъектов. Клиенты, пользователи и персонал должны четко ориентироваться в процессе восстановительных работ и иметь четкое представление о его временных рамках.

Адаптация этих пунктов в конкретной системе может занять некоторое время. Однако полная реализация данного комплекса позволит создать крепкую базу для будущих надстроек, нужных для быстрого решения вновь возникающих, уникальных проблем.

У Вас похожая задача? Мы всегда готовы подсказать решение!
Задайте вопросы напрямую руководителю данного проекта (9.00–23.00):