KI und IT-Operations bilden ein starkes Team

AIOps-Elemente

von - 01.11.2019
AIOps-Struktur
ITOM: Laut Gartner ermöglichen AIOps-Plattformen ein lückenloses „IT Operations Management“.
(Quelle: Gartner)
Eine AIOps-Lösung umfasst mehrere zentrale Prozesse. Der erste ist das Sammeln von Daten aus unterschiedlichen Quellen, und dies unabhängig von IT und Netzwerk-Domains. Diese Informationen bereitet das AIOps-System auf und konsolidiert sie. „Technologisch ist die Datenbasis von entscheidender Bedeutung, weniger, dass diese Daten aus unterschiedlichen Quellen kommen“, betont Peter Jürß, Principal IT Architect - Platform Solutions bei Axians IT Solutions, einem weltweit aktiven Dienstleister im Bereich IT und Kommunikationstechnik. „Wenn die Daten unvollständig oder fehlerhaft sind, spielt es keine Rolle, ob ich eine Quelle oder hundert verwende, denn das Ergebnis wird immer fehlerhaft sein.“
Wichtig ist daher laut Jürß, dass Data Scientists und Operations-Mitarbeiter eng zusammenarbeiten, um die Qualität der Daten sicherzustellen. „Es geht nur gemeinsam, denn nur ein Data Scientist kann beurteilen, ob das neuronale Netz einer AIOps-Lösung richtig funktioniert, und nur ein Operations-Mitarbeiter kann beurteilen, ob die Empfehlung des Systems Sinn ergibt.“
Auf einen weiteren Aspekt weist Karsten Flott von AppDynamics hin: „Entscheidend ist, dass alle Informationen an einem Punkt zusammenlaufen. Nur so entsteht eine zentrale Übersicht über sämtliche Assets. Außerdem ist eine hohe Detailtiefe des Monitorings wichtig - bis hinunter auf die einzelne Codezeile.“ Viele Unternehmen scheitern Flott zufolge an dieser Herausforderung, weil sie nicht eine übergreifende Lösung im Einsatz haben, sondern in jedem Fachbereich ein separates Tool einsetzen. „Solche Insellösungen machen die Implementierung von AIOps praktisch unmöglich, da es keine einheitliche und ausreichend detailreiche Datenbasis gibt.“
Im zweiten Schritt der AIOps-Prozesse folgt die Analyse der Daten, die Anwendungen, IT-Systeme und Netzwerkkomponenten bereitstellen. Eine AIOps-Lösung sollte dabei die Daten in einen Kontext einordnen. Sie ermittelt beispielsweise, welche Fehler im Programmcode einer Lösung welche Nutzergruppen tangieren und welche negativen Effekte für deren Produktivität und die Geschäftstätigkeit dadurch entstehen.
Peter Jürß
Peter Jürß
Principal IT Architect - ­Platform Solutions bei Axians
www.axians.de
Foto: Axians
„Weil AIOps zahlreiche Datenquellen anzapft und korreliert, findet sie auch in sehr komplexen Umgebungen Zusammenhänge und Problemlösungen.“
Nutzerbezogene Datenmodelle und Analysemethoden, die den IT-Anwender und seine User Experience in den Mittelpunkt stellen, haben laut Riverbed, einem Anbieter von AIOps-Lösungen, einen weiteren Vorteil: Sie geben Aufschluss über eine komplette Transaktion, beispielsweise im Bereich E-Commerce. Ein Online-Anbieter kann nicht nur ermitteln, wie es um die Performance des Shop-Systems aus Sicht des Kunden bestellt ist. Er erhält zudem Informationen darüber, welche Waren der Kunde in seinen virtuellen Einkaufskorb packt und wie oft er den Shop besucht. Diese Daten sind hilfreich, um die Angebotspalette des Shops zu optimieren und um Stammkunden zu identifizieren.
Zu den wichtigsten Kernkomponenten von AIOps-Lösungen zählt eine Machine-Learning-Funktion. Sie erstellt auf Basis der Datenanalysen Handlungsoptionen, die sich automatisch umsetzen lassen. Ein Beispiel ist die Reaktion auf Anomalien wie eine Überlast­situation im Rechenzentrum: „Bei Lastspitzen ist es möglich, automatisch zusätzliche Instanzen bei einem Cloud-Service-Provider hinzuzubuchen und sie anschließend wieder abzustoßen“, berichtet Karsten Flott.
Künstliche Intelligenz und Machine Learning können zudem das IT-Sicherheitsniveau verbessern. „Wenn das Monitoring einen Fehler in einer Komponente entdeckt oder feststellt, dass gegen Compliance-Anforderungen verstoßen wird, gibt die KI-Instanz einer AIOps-Lösung Hilfestellung bei der Suche nach einer Antwort und kann, falls gewollt, automatisch Korrekturmaßnahmen in die Wege leiten“, erläutert Axians-Fachmann Peter Jürß.
Eine Befragung von Nutzern durch den amerikanischen AIOps-Spezialisten OpsRamp ergab, dass mehr als vier Fünftel der IT-Abteilungen (85 Prozent) AIOps dazu verwenden, um Routineaufgaben zu automatisieren. Dadurch, so die Nutzer, haben IT-Experten mehr Zeit, sich um anspruchsvollere Aufgaben zu kümmern. Fast ebenso viele Firmen (80 Prozent) benutzen die Technologie, um die Zahl der Alarme („Alerts“) zu reduzieren und die Ursachen solcher Meldungen zu ermitteln. Zu diesem Zweck setzt die AIOps-Software Alarmmeldungen unterschiedlicher Systeme miteinander in Beziehung und filtert Alerts aus, die mehrfach ausgelöst wurden. Eine solche Root-Cause-Analyse durch KI- und Machine-Learning-Algorithmen zählt zu den Haupteinsatzfeldern von AIOps-Lösungen.
Quasi ein Nebeneffekt ist, dass die Zahl der „Incidents“ (gemeldete Vorfälle) und der entsprechenden Incident Tickets sinkt. Ein Großteil dieser Incidents wird bislang manuell überprüft. Diese Handarbeit entfällt oder lässt sich auf wenige Vorgänge reduzieren. „Dadurch dass AIOps zahlreiche Datenquellen anzapft und korreliert, findet sie auch in komplexen Umgebungen, in denen Administratoren gar nicht alles im Blick haben können, Zusammenhänge und Problem­lösungen“, sagt Peter Jürß von Axians IT Solutions.
Checkliste AIOps-Auswahl
Bevor Unternehmen eine AIOps-Anwendung implementieren, ist es ratsam, diverse Dinge zu klären, so Lakeside Software, Anbieter von IT- und Anwendungsanalyse-Tools.
Zunächst gilt es zu prüfen, wie es um das hausinterne Know-how und um die vorhandenen Tools im Bereich Monitoring bestellt ist.
Fragen an die eigenen IT-Fachleute
  • Sind bereits Lösungen für Application Performance Management (APM), Network Performance Monitoring and Diagnostics (NPMD) sowie Digital Experience Monitoring (DEM) und IT Infra­structure Monitoring (ITIM) im Einsatz?
  • Sind Data Scientists beziehungsweise IT-Fachleute vorhanden, die eine AIOps-Lösung implementieren, anpassen und betreiben können?
  • Wurde geklärt, in welchen Bereichen AIOps zum Einsatz kommen soll (Use Cases) und welchen Nutzen sich das Unternehmen davon verspricht? Dies schließt auch eine Erfolgskontrolle mit ein, sprich eine Überprüfung, ob sich der angestrebte Nutzen eingestellt hat.
Fragen an den AIOps-Anbieter
  • Anschließend sollten die in Betracht kommenden AIOps-Lösungen analysiert werden. Hier sind vor allem folgende Aspekte von Interesse:
  • Handelt es sich um eine eigenständige AIOps-Lösung oder „nur“ um eine Monitoring-Plattform, die um AIOps-Funktionen erweitert wurde?
  • Mit welchen Arten von Daten lässt sich das AIOps-Tool füttern (Data Ingestion)?
  • Entsprechen die Breite und die Tiefe der Daten den Anforderungen des Anwenders?
  • Ist die Lösung in der Lage, hohe Datenvolumina von Quellen zu verarbeiten, die in unterschiedlichen IT-Domains vorhanden sind?
  • Welche Datenarten werden unterstützt, etwa Events, Metriken, Log-Informationen, Konfigurationseinstellungen, Key Performance Indicators (KPIs)?
  • Können vorhandene Monitoring-Tools eingebunden werden?
  • Ist die AIOps-Lösung auch für komplexe Umgebungen ausgelegt, etwa Hybrid- und Multi-Cloud-Infrastrukturen?
  • Erfolgt die Abrechnung der Nutzung auf Basis der Datenmengen, die dem AIOps-Tool zugeführt werden? Stehen in diesem Fall Funktionen bereit, mit denen sich unnötige Kosten vermeiden lassen, die etwa durch mehrfache Verarbeitung derselben Daten entstehen?
  • Welche Machine-Learning-Funktionen stellt die Software bereit? Welche Algorithmen verwendet sie und wie lassen sich diese an individuelle Anforderungen anpassen?
  • Welche weiteren Analysefunktionen sind verfügbar?
  • Welches Know-how ist nötig, um die Machine-Learning- und Analyse-Tools nutzbringend einzusetzen?
  • Sind die Analyse- und Visualisierungsfunktionen so ausgelegt, dass sie die Anforderungen der Mitarbeiter in der IT-Operations-Abteilung und im Service Desk erfüllen?
  • Für welche Anwendungsfälle ist die Plattform ausgelegt? Decken sich diese mit den Use Cases, die für den Anwender relevant sind?
  • Ist eine Cloud- und eine On-Premise-Version verfügbar? Dies ist vor allem für Unternehmen wichtig, die wegen Compliance-Regeln sensible Daten nicht in einem Public-Cloud-Rechenzentrum speichern und verarbeiten dürfen.
Verwandte Themen