Einsatz von KI für den Übergang vom reaktiven zum proaktiven Management schwerwiegender Vorfälle

Zuletzt aktualisiert am 09. Dezember 2019 – Experte für KI-basierte Analysen

 

Was die Vorhersage von Tornados und größere IT-Vorfälle gemeinsam haben

Wenn das Wetter schlecht wird, sind die Anzeichen dafür, dass sich ein Tornado am Horizont abzeichnet, immer bedrohlich – aber sie sind selten offensichtlich.

„Der Himmel nahm die seltsamste Graufarbe an, die ich je gesehen hatte“, sagte Mark Ausbrooks, Überlebender eines Tornados 2014 in Mayflower Arkansas. sagte NBC News. „Man hört immer, wie still es wird und sich kein Blatt bewegt.“

Eine durchschnittliche Person ohne meteorologische Kenntnisse kann diese Anomalien erkennen, aber sie wird Schwierigkeiten haben, diese Informationen in eine klare Botschaft umzuwandeln: „GEFAHR VORAUS!“ IN DECKUNG GEHEN."

Ebenso kann es überall verräterische Anzeichen für einen drohenden größeren IT-Vorfall geben, sie werden jedoch ignoriert, wenn sie nicht auf eine Art und Weise zusammengestellt werden, die Risiken anzeigen und vorhersehen kann.

Was die IT benötigt, um diese Vorfälle vorherzusagen und möglicherweise abzuwenden, ist ein System wie das, das der Nationale Wetterdienst verwendet, um mögliche Unwetteraktivitäten vorherzusagen und die Menschen darauf aufmerksam zu machen. Diese Systeme berücksichtigen nicht nur einen Faktor. Stattdessen stellen sie eine Reihe aller bekannten Risikofaktoren zusammen, um ein Gesamtbild der Risikowahrscheinlichkeit zu erstellen.

Meteorologen wissen, dass sie in ihren Tornado-Vorhersagemodellen die Geografie, die Jahreszeit, das Vorhandensein von Gewittern, den Luftdruck und -trend, den Feuchtigkeitsgehalt in niedrigen bis mittleren Höhen sowie das Vorhandensein von Aufwinden berücksichtigen müssen. Erreichen diese Elemente eine bestimmte Reichweite, schaffen sie günstige Bedingungen für einen Tornado.

Die Behörden schauen sich diese Risikoanalyse an und entscheiden, ob eine Wache oder eine Warnung und eventuelle Evakuierungsbefehle aktiviert werden sollen. Darüber hinaus ermöglicht das Modell den Behörden, das Risiko zu lokalisieren und gezielte Präventionsmaßnahmen durchzuführen.

Ein neues KI-gestütztes System, erstellt von Digital.ai stellt IT-Organisationen dieselben Funktionen zur Verfügung und ermöglicht es ihnen, auf potenziell drohende Katastrophen zu reagieren, bevor sie größere Störungen – und Schäden – verursachen können.

Einführung eines neuen KI-basierten Systems zur Risikovorhersage schwerer Vorfälle

Heute stellen wir offiziell unsere Engine zur Vorhersage des Risikos schwerer Vorfälle vor, um Organisationen dabei zu helfen, Dienstunterbrechungen vorherzusagen und zu verhindern. Dabei nutzen wir im Wesentlichen die gleichen Prinzipien, die der Nationale Wetterdienst zur Vorhersage von Tornados verwendet. Unsere Engine kombiniert bekannte Risikofaktoren für schwere Unfälle und fügt sie zu einem Modell zusammen, das günstige Bedingungen anzeigen kann. Darüber hinaus kann es unter diesen Bedingungen auch die lokalen Auswirkungen möglicher Vorfälle vorhersagen und eine entsprechende Empfehlung zur Risikominderung aussprechen.

Diese neue Funktion ist in unserem enthalten Optimierung von Service-Management-Prozessen Lösung. Es bietet IT-Führungskräften beispiellose Transparenz und umsetzbare Einblicke in ihre Service-Management-Prozesse. Dies geschieht durch die Einbeziehung derselben bewährten Prinzipien, die wir erstmals in eingeführt haben Change Risk Prediction-Lösung, das einer Reihe von Unternehmen aus allen Branchen bereits Einsparungen in Millionenhöhe gebracht hat.

Da sich IT-Organisationen zu einem schnelllebigen Unternehmen entwickeln DevOps Nach einem orientierten Modell besteht eine zentrale Herausforderung für sie darin, das Ausmaß und die Komplexität von Vorfällen zu bewältigen, die sich auf IT-Dienste und -Infrastruktur auswirken. Gartner schätzt das Die Kosten für Ausfallzeiten liegen bei weit über 300,000 US-Dollar pro Stunde. Darüber hinaus legt ein Forschungsbericht von Quocirca dies nahe Vorfälle duplizieren und wiederholen sind ein allgegenwärtiges und anhaltendes Problem.

Die meisten Organisationen verfolgen einen reaktiven Ansatz für das Management schwerwiegender Vorfälle. Das Ziel eines solchen Ansatzes besteht darin, Geschäftsdienste so schnell wie möglich wiederherzustellen, und basiert auf der Reduzierung der mittleren Zeit bis zur Erkennung (MTTD) und der mittleren Zeit bis zur Lösung (MTTR). Ein Post-Incident-Problemprozess wird verwendet, um die Grundursache zu identifizieren und dauerhaft zu beheben.

Allerdings müssen Organisationen die Hauptlast der negativen Folgen tragen, bevor sie mit der Reaktion beginnen können. Im Gegenzug erkennen IT-Führungskräfte zunehmend die Grenzen eines solchen Ansatzes. Untersuchungen von Quocirca deuten darauf hin, dass 80 % der Unternehmen der Meinung sind, dass ihr MTTD für Vorfälle verbessert werden könnte.

Ein proaktiver Ansatz für das Management schwerer Vorfälle ist viel vielversprechender und nutzt die jüngsten Fortschritte in der künstlichen Intelligenz (KI) und im maschinellen Lernen (ML). Das Hauptziel dieses Ansatzes ist die frühzeitige Erkennung potenzieller Risiken. Es basiert auf der Identifizierung bekannter Risikofaktoren für die Organisation auf der Grundlage historischer Ereignisse mithilfe von Modellen des maschinellen Lernens. Diese Modelle verbessern ihre Vorhersagefähigkeiten im Laufe der Zeit und stellen stärkere Korrelationen zwischen den Risikofaktoren her, die das größte Vorhersagepotenzial gezeigt haben.

Wie KI- und maschinelle Lernmodelle mögliche schwerwiegende Vorfälle vorhersagen können, bevor sie Auswirkungen haben

Unternehmen können KI nutzen, um das Vorhandensein problematischer Kombinationen bekannter Risikofaktoren zu überwachen. Unternehmen profitieren dann von einem Frühwarnsystem für das Risiko schwerwiegender Vorfälle, das es ihnen ermöglicht, bevorstehende Hochrisikoperioden proaktiv zu erkennen. Diese „Frühwarnung“ versetzt ihre Unternehmen in die Lage, Risiken zu minimieren oder zu eliminieren und auf Vorfälle schnell reagieren zu können.

Die Vorteile eines proaktiven Incident-Management-Prozesses sind zahlreich und messbar. Es kann:

  • Minimieren Sie die Auswirkungen auf den Geschäftsbetrieb und das Kundenerlebnis
  • Befähigen Sie die IT, neue Funktionen termingerecht bereitzustellen
  • Verbessern Sie den Ruf von IT und Unternehmen hinsichtlich der Zuverlässigkeit
  • Reduzieren Sie die gesamten Servicekosten

Jedes proaktive Risikovorhersagemodell sollte drei Kernfunktionen haben:

  1. Identifizieren Sie häufige Risikofaktoren mithilfe von maschinellem Lernen oder anderen fortschrittlichen Analysetechniken.
  2. Überwachen Sie diese Risikobedingungen mithilfe eines Modells der künstlichen Intelligenz und
  3. Visualisieren Sie Ergebnisse und benachrichtigen Sie wichtige Parteien über das potenzielle Risiko und die prognostizierten Auswirkungen, wenn ein Risikoschwellenwert erreicht wird oder Ereignisse mit hohem Risiko vorhergesagt werden.

Diese Funktionen sind nicht nur wichtig, um potenzielle Risiken zu erkennen, sondern auch, um IT-Teams in die Lage zu versetzen, präventiv Maßnahmen zu ergreifen, um mögliche schwerwiegende Vorfälle zu bekämpfen, bevor sie verheerende Auswirkungen haben.

Ein Risikovorhersagemodell für schwere Zwischenfälle berücksichtigt verschiedene Faktoren wie:

  • Umfang der vergangenen Großereignisse
  • Problemrückstand
  • Geplante Änderungsaktivität
  • Historischer Zeitverlauf zwischen größeren Vorfällen
  • Tage seit dem letzten größeren Vorfall
  • Zeitpunkt der Woche und des Monats, durchschnittliches Problemalter
  • Wachstumsrate bei geringfügigen Vorfällen

Das Modell lernt, welche Attribute die stärksten Indikatoren für das Risiko schwerer Zwischenfälle sind und kann daher das Risikoniveau sowie die Treiber hinter diesem Risikoniveau angeben.

Beispielsweise könnte das Modell lernen, dass das Risiko steigt, wenn die Zahl kleinerer Vorfälle um 15 % über die mittelfristige Trendlinie steigt. Dieses KI-basierte Analysemodell überwacht täglich die Risikofaktoren für alle Anwendungen und berechnet einen zusammengesetzten Risikoscore für jede Anwendung basierend auf den aktuellen Bedingungen.

Anwendungseigentümer können benachrichtigt werden, wenn ihre Anwendung günstige Bedingungen für das Auftreten eines schwerwiegenden Vorfalls erreicht. Anschließend können sie die spezifischen Risikofaktoren untersuchen, die ihren Gesamtrisikowert erhöhen, und Maßnahmen ergreifen, um das Risiko zu verstehen und zu mindern.

Durch das Verständnis der spezifischen Risikofaktoren können die Anwendungssupportteams zugrunde liegende Probleme untersuchen, die das aktuelle Risiko erhöhen. Die IT-Führung kann beschließen, für bestimmte gefährdete Anwendungen einen Änderungsstopp zu verhängen, bis Abhilfemaßnahmen ergriffen werden.

Ein notwendiger, proaktiver Ansatz zur Verhinderung katastrophaler Geschäftsunterbrechungen

Die Bedrohungen sowohl durch Tornados als auch durch große IT-Vorfälle sind zu real, als dass man einfach darauf reagieren könnte, wenn sie bereits begonnen haben, vor Ort Chaos anzurichten. IT-Teams können und müssen im Vorfeld vorbereitet werden. Systeme zur Vorhersage schwerwiegender Risiken sind die Werkzeuge, die sie benötigen, um Elemente von wesentlichem Geschäftswert zu schützen – anstatt die Reste aufzusammeln, die übrig bleiben, nachdem ein Vorfall bereits über ihr Unternehmen hereingebrochen ist.

IT-Betriebssysteme und -Prozesse generieren kontinuierlich umfangreiche Datenmengen, doch IT-Organisationen verfügen oft nicht über eine analytische Linse, um diese in umfassende Erkenntnisse umzuwandeln. IT-Führungskräfte können KI- und ML-Modelle nutzen, um die Stabilität von Geschäftsdiensten proaktiv sicherzustellen. Diese Modelle können relevante Daten analysieren, um Muster zu identifizieren, die aufzeigen, welche Anwendungen gefährdet sind, wenn eine unheilvolle Kombination von Bedingungen auftritt.

Modelle zur Vorhersage schwerwiegender Vorfälle und Änderungsrisiken stellen für die meisten IT-Organisationen gute Einstiegspunkte dar, um mit der Einführung von KI- und ML-Modellen zu beginnen, um Risiken und Kosten zu reduzieren und gleichzeitig ihren Geschäftsbeteiligten qualitativ hochwertige Dienste bereitzustellen.

Möchten Sie mehr erfahren? Sehen Sie sich unser aktuelles Webinar an, in dem diese Systeme erläutert werden: „So verbessern Sie das Management schwerwiegender Vorfälle mithilfe von Predictive Analytics und KI"

Auch interessant