Künstliche Intelligenz erobert die Datenbanken

Vorreiter Oracle

von - 17.06.2020
Neben IBM ist Oracle der zweite große Player, der seine Datenbank-Produkte früh mit KI-Features beworben hat. Ora­cle stellt dabei in allererster Linie die automatische Optimierung und Wartung seiner Datenbank in den Vordergrund. Die cloudbasierte Autonomous Database, die offiziell mit der Einführung eines Data-Warehouse-Service im März 2018 ihren Anfang nahm, soll die Tätigkeiten von Datenbank-Administratoren reduzieren und helfen, menschliche Fehler und Kosten zu verringern.
„Die Oracle Autonomous Database basiert auf einer Technologie, die so revolutionär wie das Internet ist“, verkündet Oracle-Chairman und CTO Larry Ellison vollmundig. „Sie patcht, tunt und aktualisiert sich selbst.“ Die Kombination aus Oracles Database mit maschinellen Lernalgorithmen und automatisierten Skripts kümmere sich um alle administrativen Abläufe. Auf diese Weise könne der Datenbank-Service ohne menschliches Zutun betrieben werden, verspricht Ellison. 
Mit ihren Machine-Learning-Funktionen ist die Oracle Autonomous Database in der Lage, die Informationen, die sie benötigt, selbstständig zu verwalten und zu besorgen. Aufgaben wie die Gewährleistung von Sicherheit, Lauf­zeitoptimierung oder Problembeseitigung werden von der Software übernommen. Die Datenbank erledigt zudem Upgrades, führt das Patchen und Tuning während des Betriebs aus und passt sich eigenständig an veränderte Workloads und Datenvolumina an. Datenbank-Indizes zur Verbesserung der Anwendungsleistung werden ebenfalls automatisch erstellt.
Larry Ellison
Larry Ellison
Gründer, Executive Chairman und CTO von Oracle
www.oracle.com
Foto: Oracle
„Die Oracle Autonomous Database basiert auf einer Technologie, die so revolutionär wie das Internet ist. Sie patcht, tunt und aktualisiert sich selbst.“
Durch die Selbstwiederherstellungsfunktion werden Korrekturmaßnahmen automatisch erkannt und angewendet. Dadurch kann ein unterbrechungsfreier Zugriff auf Daten gewährleistet werden. Insgesamt sollen Datenbanken damit weniger anfällig für menschliche Fehler sein, die zu Ausfällen, schlechter Performance und anderen kostspieligen Ereignissen führen.

Daten fürs Modell-Training

Die besseren Nutzungs- und Optimierungsmöglichkeiten von Databases sind aber nur ein Aspekt an der Schnittstelle KI und Datenbanken. Ein zweiter großer Bereich, bei dem sich KI und Datenbanken nahekommen, ist das Training von KI-Modellen. Die „Big Challenges“ bei Machine-Learning-Methoden wie Deep Learning sind die großen Datenmengen und hohen Performance-Anforderungen. Daten plus Performance werden benötigt, um ein neuronales Netz beispielsweise auf komplexe Mustererkennung in Bereichen wie Bildklassifikation oder der Verarbeitung natürlicher Sprache zu trainieren. Und KI-Algorithmen und Daten müssen gut interagieren.
Bei diesem Zusammenspiel von Daten und KI-Algorithmen gibt es erheblichen Optimierungsbedarf. „Eine Datenbank, die im KI-Umfeld eingesetzt wird, sollte natürlich mit sehr großen Datenmengen umgehen können“, betont IBM-Experte Andreas Weininger. „Und sie sollte vor allem die Daten effizient in die KI-Algorithmen integrieren.“  So müssen beispielsweise Daten und KI-Algorithmen näher zusammengebracht werden, um das Training schneller und effizienter zu gestalten. Die etablierten Datenbank-Anbieter integrieren deshalb zusätzlich zu den erwähnten Funktionen auch immer mehr Technologien, um den Lern- und Trainingsprozess der KI zu verbessern.
Joseph Sirosh, ehemaliger Vice President in Microsofts Data Group, nannte als zentrale Neuerungen schon bei der Einführung von SQL Server 2017 Fähigkeiten wie Bilderkennung, Sprachanalysen sowie andere KI-Aufgaben, die direkt in den Datenbank-Server integriert sind. Ziel sei es, Machine-Learning-Prozesse, die normalerweise außerhalb der Datenbank in einem separaten System abgearbeitet werden, zu vereinfachen und zu beschleunigen. „Der SQL Server ist jetzt nicht mehr nur ein Datenbank-Managementsystem“, resümierte Sirosh damals. Der SQL Server sei das erste relationale Database-Managementsystem, das Datenbank und KI in einem System verknüpfe, so der Microsoft-Manager.
Joseph Sirosh
Joseph Sirosh
Früherer Vice President von Microsofts Data Group
www.microsoft.com
Foto: Microsoft
„Der SQL Server ist das erste relationale Database-Managementsystem, das Datenbank und KI in einem System verknüpft.“
Inzwischen wurden die KI-Fähigkeiten mit dem SQL Server 2019 weiter ausgebaut. Vorläufig als Preview steht Azure SQL Database Machine Learning zur Verfügung. Der Service gibt Datenbank-Spezialisten Tools an die Hand, um große Datenmengen in SQL-Datenbanken direkt für Machine Learning zu nutzen, ohne die Daten bewegen zu müssen. 
„Big-Data-Cluster“ für SQL Server, eine andere Innovation, flexibilisiert die Interaktion mit riesigen Datenmengen. Datenexperten können damit externe Datenquellen abfragen oder Daten aus mehreren externen Datenquellen über den Cluster nutzen. Die Daten lassen sich dann für KI, Machine Learning und andere Analyseaufgaben verwenden. 
Ähnliche Ansätze gibt es bei IBM. „Wir positionieren IBM Db2 als die Datenbank der Wahl für KI-Anwendungsentwickler und Datenwissenschaftler“, heißt es in einer IBM-Mitteilung. So gibt es in Db2 etwa Stored Procedures, die Machine-Learning-Verfahren parallel in einem Cluster auf allen Datenbanken anwenden können. „Mit dieser Methode kann man mit großen Datenmengen speziell im KI-Umfeld gut arbeiten“, erklärt IBM-Fachmann Andreas Weininger.
Durch eine Reihe neu integrierter Treiber für datenwissenschaftliche Open-Source-Programmiersprachen und Frameworks wie Go, Ruby, Python, PHP, Java, Node.js, Sequelize und Jupyter Notebook wird es für Entwickler auch einfacher, maschinelle Lernmodelle mit Db2 zu analysieren und in Anwendungen einzubauen. KI-Experten und Datenwissenschaftler können auch kognitive Anwendungen innerhalb von Db2 unter Verwendung von IBM Watson Studio erstellen und Modelle trainieren - unabhängig davon, ob sich die Daten vor Ort mit Db2 oder in der Cloud mit Db2 on Cloud befinden. 
Verwandte Themen