Zarządzanie zdarzeniami (ITIL) Przekierowano ze strony: event management ang. event management

Zarządzanie zdarzeniami
proces
Eksploatacja Usług
ITIL
Logo ITIL


Zarządzanie zdarzeniami - proces w fazie Eksploatacji Usług (ang. ITIL Service Operation) odpowiedzialny za zarządzanie cyklem życia wszystkich zdarzeń. Zarządzanie zdarzeniami jest jednym z głównych obowiązków w fazie Eksploatacji Usług.[1]

Spis treści

Cele

Celami procesu zarządzania zdarzeniami są:
  • wykrycie wszystkich zmian stanu, które mają znaczący wpływ na elementy konfiguracji oraz usługi IT
  • determinowanie odpowiednich działań dla zdarzeń i zapewnienie komunikacji odpowiednim funkcjom
  • określenie wyzwalaczy dla wypełnienia wielu procesów oraz operacji z zakresu zarządzania
  • zapewnienie porównania między obecną wydajnością operacyjną, a ustalonymi standardami w SLA
  • zapewnienie podstaw dla pewności usług, ich raportowania oraz dla rozwoju usług


Zakres

Zarządzanie zdarzeniami może zostać wykorzystane w powiązaniu z wieloma innymi aspektami zarządzania usługami, które potrzebują odpowiedniej kontroli oraz zautomatyzowania. Proces obejmuje:
  • monitorowanie oraz kontrolowanie statusu elementów konfiguracji
  • warunki systemowe
  • sprawdzanie licencji oprogramowanie, w celu zapewnienia zgodnych z prawem licencji wykorzystania i podziału usług
  • bezpieczeństwo
  • zwykłe procedury


Znaczenie dla biznesu

Znaczenie procesu zarządzania zdarzeniami jest ogólnie pośrednie, niemniej jednak proces może zapewnić:
  • mechanizmy dla wcześniejszego wykrywania incydentów i automatyczne przydzielenie im grupy działań naprawczych
  • zautomatyzowany monitoring wyjątków w działaniu usług, co skraca wszelkie opóźnienia
  • integrację oraz rozwój wydajności innych procesów zarządzania usługami
  • podstawę pod zautomatyzowania wiodących operacji, w celu zwiększenia skuteczności
  • bezpośredni wpływ na dostarczanie usług i tym samym na satysfakcję klientów


Opis procesu

Zarządzenie zdarzeniami jest procesem będącym podstawą operacyjnego monitoringu kontroli usług. Jeśli zdarzenia są zaprogramowane tak by informacje o nich były odpowiednio przekazywane, podobnie jak ostrzeżenia oraz wyjątki, mogą tym samym stanowić podstawę pod zautomatyzowanie wielu rutynowych operacji z zakresu zarządzania.

Metody i techniki

Kluczowymi działaniami procesu zarządzania zdarzeniami są:
  • Pojawienie się zdarzenia i jego zgłoszenie - zarówno element konfiguracji może wygenerować zgłoszenie, jak i narzędzie zarządzania może wykryć zmianę statusu.
  • Wykrycie zdarzenia - dokonuje tego narzędzie procesu zarządzania.
  • Zapisanie zdarzenia - każde zdarzenie musi zostać zapisane wraz z podjętymi działaniami.
  • Korelacja i filtrowanie zdarzeń (I poziom) - proces eliminowanie duplikowanych lub niechcianych zdarzeń.
  • Znaczenie zdarzenia - kategoryzowanie zdarzeń.
  • Korelacja i filtrowanie zdarzeń (II poziom) - porównanie zdarzeń z zestawem kryteriów, którymi mogą być np. zasady rządzące firmą.
  • Selekcja odpowiedzi - gdy zdarzenie zostanie zapisane różne odpowiedzi mogą zostać uruchomione np. automatyczne przywrócenie usług lub ostrzeżenie wysłane do żywego personelu.
  • Działania przeglądowe - sprawdzenie, czy ważne zdarzenia zostały odpowiednio potraktowane.

Wyzwalacze

  • wszelkie wyjątki w wydajności elementów konfiguracji w porównaniu z tymi poziomami ustalonymi w specyfikacjach technicznych, OLA czy procedurach SOP
  • wyjątki w zautomatyzowanych procesach i procedurach
  • wyjątki w procesach biznesowych, zaobserwowanych przez procedur zarządzania zdarzeniami
  • ukończenie zautomatyzowanego zadania lub pracy
  • zmiana statusu na serwerze lub w bazie elementów konfiguracji
  • dostęp użytkownika do bazy danych lub aplikacji
  • predefiniowany próg usługi został osiągnięty np. aplikacje lub urządzenie

Wejścia

  • wymagania SLR powiązane ze zdarzeniami
  • alarmy, ostrzeżenia i progi rozpoznania zdarzeń
  • zasady i tabele korelacji zdarzeń oraz kody zdarzeń i zautomatyzowane formy odpowiedzi
  • role i obowiązki rozpoznawania i komunikowania incydentów
  • procedury operacyjne podejmowane w celu rozpoznania, zapisu, eskalowania zdarzeń

Wyjścia

  • komunikaty o zdarzeniach
  • zapisy zdarzeń
  • zdarzenia, które wskazują, że wystąpił incydent
  • zdarzenia wskazujące na potencjalne złamanie postanowień SLA lub OLA
  • zdarzenia oraz ostrzeżenia, które wskazują na zakończenie czynności operacyjnych, wdrożeniowych lub innych
  • system zarządzania wiedzą o usługach uzupełniony o pełna historię zdarzeń

Role

  • Menedżer ds. operacji IT (właściciel procesu) - jest on potrzebny do przejęcia pełnej odpowiedzialności za działania podejmowane na etapie Eksploatacji Usług.Ponadto zapewnia on, że ​​wszystkie działania operacyjne podejmowane każdego dnia prowadzone są w sposób terminowy i wiarygodny.
  • Operator IT - podejmują się oni codziennych rutynowych działań. Do typowych czynności należą m.in. tworzenie kopii zapasowych, zapewnienie, że zaplanowane zadania zostaną wykonywane, instalacja standardowego wyposażenia w centrum danych.

Odpowiedzialność

Macierz odpowiedzialności: Proces zarządzania zdarzeniami.

Rola ITIL/PodprocesMenedżer ds. operacji ITOperator ITSystem monitorowania zdarzeńInni menedżerowie
Opieka nad mechanizmami i zasadami monitorowania zdarzeńA RRR
Filtrowanie oraz korelacja zdarzeń (poziom I)AR
Korelacja II poziomu oraz selekcja rozwiązańARR
Przegląd zdarzeń i zamknięcie procesuA R


A: (ang. Accountable) Odpowiedzialność zarządcza - zgodnie z modelem RACI, osoba ostatecznie odpowiedzialna za prawidłowość i dokładne wypełnianie procesu zarządzania zdarzeniami w ITIL.

R: (ang. Responsible) Odpowiedzialność - zgodnie z modelem RACI, osoba odpowiedzialna za realizację zadań w procesie zarządzania zdarzeniami w ITIL.

Powiązania



Krytyczne czynniki sukcesu i Kluczowe wskaźniki wydajności

Tabela zawiera przykładowe krytyczne czynniki sukcesu dla procesu zarządzania zdarzeniami oraz przykłady odpowiednich dla danego czynnika sukcesu (CSF), kluczowych wskaźników wydajności. Należy monitorować spełnienie KPI i wykorzystać tą informację do identyfikacji okazji i do usprawnień oraz zapisywać ten fakt w rejestrze CSI w celu dalszej oceny i ewentualnej implementacji.

Krytyczny czynnik sukcesuKluczowy wskaźnik wydajności
Wykrywanie zmian stanu, które mogą mieć znaczący wpływ na zarządzanie elementami konfiguracji i usługami IT.Porównanie liczby zdarzeń i incydentów.
Liczba i wskaźnik procentowy każdego typu zdarzeń w ramach jednej aplikacji, w porównaniu z całkowitą liczbą narzędzi i aplikacji przywiązanych do usług IT.
Zapewnienie, że wszystkie zdarzenia są przekazywane do odpowiednich funkcji.Określona liczba zdarzeń, które wymagają ludzkiej interwencji.
Liczba zaistniałych incydentów, które miały miejsce bez powiązania z innymi.
Zapewnienie wyzwalacza lub punktu startowego dla wielu procesów na etapie eksploatacji usług.Określona liczba zdarzeń, które wymagają ludzkiej interwencji.
Zapewnienie wytycznych do porównania obecnej wydajności operacyjnej i zaprojektowanych standardów i ustaleń SLA.Określona liczba incydentów rozwiązanych bez wpływu na biznes.
Zdarzenia, z których powstały incydenty lub problemy.
Zdarzenia wywołane przez problemy i awarie.
Zdarzenia związane z zagadnieniami wydajnościowymi.
Zdarzenia związane z zagadnieniami dotyczącymi dostępności.
Zapewnienie podstawy dla pewności usług, raportowania i rozwoju usług.Określona liczba powtarzających się lub duplikowanych zdarzeń.
Określona liczba zdarzeń i ostrzeżeń, wygenerowanych bez aktualnej degradacji funkcjonalności usługi.


Wyzwania i ryzyka

Wyzwania
  • Uzyskanie funduszy na zakup odpowiednich narzędzi i wysiłku potrzebnego do instalacji i eksploatacji korzyści z owych narzędzi.
  • Uzyskanie poprawnego poziomi filtrowania zdarzeń.
  • Wdrażanie odpowiednich struktur monitorowania w całej firmie może być trudne i kosztowne.
  • Zautomatyzowane działania monitorujące mogą generować dodatkowy korek sieciowy, który może negatywnie wpłynąć na zaplanowaną wydajność i potencjał sieci.
  • Wdrażanie narzędzi zarządzania zdarzeniami bez określenia procesów wdrażania i działania.


Ryzyka
  • Nieuzyskanie odpowiednich funduszy.
  • Zapewnienie nieodpowiedniego poziomu filtrowania.
  • Niepowodzenie w utrzymaniu odpowiedniego rozmachu przy wdrażaniu systemów monitorowania we wszystkich elementach struktury IT.


Zasady i podstawowe pojęcia

  • Zdarzenie - zmiana istotna dla zarządzania usługą informatyczną lub innym elementem konfiguracji.
  • Ostrzeżenie - powiadomienie informujące o tym, że wartość progowa została osiągnięta, coś się zmieniło lub nastąpiła awaria.


Zobacz też

Pozostałe procesy Eksploatacji Usług:

Funkcje Eksploatacji Usług:

Bibliografia

  • OGC: ITIL® Foundation Handbook - Pocketbook from the Official Publisher of ITIL, TSO, ISBN: 9780113313495

Znaki towarowe

  • IT Infrastructure Library®, ITIL® are registered trade marks of the Cabinet Office;
ostatnia modyfikacja 20 sierpnia 2016 r.