Artificial Intelligence for IT Operations (AIOps)

KI und IT-Operations bilden ein starkes Team

von - 01.11.2019
Mensch und Maschine
Foto: Bild: Shutterstock / studiostoks
Ohne KI und Big Data ist das Management komplexer IT-Infrastrukturen kaum noch zu leisten. Deshalb kommen vermehrt Automatisierungen zum Einsatz
Komplexer IT-Betrieb
Unübersichtlichkeit: Fünf Faktoren steigern die Komplexität von IT-Infrastrukturen, allen voran Anzahl und Typ der Endgeräte.
(Quelle: Enterprise Strategy Grou, 2019 (n = 400) )
Manch ein IT- und Data-Center-Fachmann mag sich die Zeiten zurückwünschen, in denen die IT-Welt noch überschaubar war. Das Herz bildeten Großrechner, auf die Thin Clients oder Terminals zugriffen. Hinzu kamen Anwendungen, die über das hausinterne Netzwerk bereitgestellt wurden und die meist keine allzu hohen Anforderungen etwa an die Performance der IT-Infrastruktur stellten. Heute sieht sich die IT-Abteilung immer komplexeren IT-Umgebungen gegenüber. Dazu tragen viele Faktoren bei: Cloud-Services werden parallel zu traditionellen IT-Diensten genutzt,  Anzahl und Vielfalt der Endgeräte steigen, Multi-Cloud-Umgebungen werden zur Normalität, Firmen greifen auf Ansätze wie Software-defined Networking, Hyperkonvergenz und Software-defined Wide Area Networks (SD-WANs) zurück.
Laut einer Umfrage des Beratungshauses Enterprise Stra­tegy Group (ESG) sind für 31 Prozent der IT-Fachleute vor allem die Endgeräte dafür verantwortlich, dass Netzwerke und IT-Umgebungen immer aufwendiger zu verwalten sind. Fast gleichauf folgen anwachsende Datenmengen (30 Prozent), verursacht etwa durch IoT-Systeme, sowie die zunehmende Anzahl von Anwendungen (29 Prozent). Nicht zu unterschätzen sind zudem die Effekte der Digitalisierung (26 Prozent), die sich in steigenden Anforderungen an die IT niederschlagen.
Im „Market Guide for AIOps Platform“ führt das Beratungsunternehmen Gartner zwei weitere Faktoren an, die herkömmliche Tools für Monitoring, Application Performance Management und Network Operations an Grenzen stoßen lassen: die große Zahl unterschiedlicher Datentypen, die Maschinen und Menschen erzeugen, etwa Log-Daten, Metriken und Dokumente, sowie die immer höhere Geschwindigkeit, mit der Daten erzeugt werden.

Überfordertes Monitoring

Die Konsequenz dieser Entwicklung: „Da geschäftskritische Anwendungen immer verfügbar sein müssen, ist es notwendig, Probleme mit der Infrastruktur quasi in Echtzeit zu lösen, damit sie sich nicht negativ auf das Unternehmen und seine Kunden auswirken“, erklärt Bob Laliperte, Practice Director & Senior Analyst bei ESG. Das erfordert jedoch einen anderen Ansatz als den gebräuchlichen.
„Entscheidend ist heute, Fehler möglichst so schnell zu entdecken und zu beheben, dass der Anwender von ihnen überhaupt keine Notiz nimmt und es zu keinem negativen Einfluss auf das Geschäft kommt“, bestätigt Karsten Flott, CER Sales Engineer Manager bei AppDynamics, einem Unternehmensbereich von Cisco. „Diese Geschwindigkeit lässt sich nicht erreichen, wenn Log-Files von Hand durchsucht werden. Das Ziel muss sein, Fehler nicht reaktiv zu beseitigen, sondern sie proaktiv zu verhindern.“
Bob Laliperte
Bob Laliperte
Practice Director & Senior Analyst bei ESG
www.esg-global.com
Foto: ESG
„Da geschäftskritische Anwendungen immer verfügbar sein müssen, ist es notwendig, Prob­leme mit der Infrastruktur in Echtzeit zu lösen.“
Doch die Realität sieht anders aus. Heute kommen in einem Rechenzentrum typischerweise Dutzende von Monitoring- und Managementwerkzeugen zum Einsatz. Oft anzutreffen ist ein Zoo von Lösungen für Network Performance Monitoring (NPM) und Application Performance Management (APM). Hinzu kommen Tools zum Überwachen spezieller Infrastruktur-Komponenten wie virtualisierten Umgebungen, Software-defined Networks und Wide Area Networks.
Einen Ausweg erhoffen sich Anwender von „Artificial Intelligence for IT Operations“, kurz AIOps. Die Integration von KI und maschinellem Lernen in den Betrieb von IT-Infrastrukturen soll reaktive Muster durch einen proaktiven Ansatz ersetzen. Das Beratungshaus Gartner definiert AIOps-Plattformen als Software-Systeme, die Big Data mit KI- und Machine-Learning-Funktionen kombinieren, um einen Großteil der IT-Operations-Prozesse zu erweitern oder zu ersetzen.
Zu diesen Prozessen und Aufgaben zählen die Überwachung der Verfügbarkeit und Performance von IT-Systemen und Anwendungen sowie das Korrelieren und die Analyse von Vorkommnissen („Events“). Auch das IT-Servicemanagement (ITSM) und das Automatisieren von Aufgaben im Bereich IT Operations Management (ITOM) fallen darunter.
Verwandte Themen