Künstliche Intelligenz erobert die Datenbanken

GPUs als Turbo

von Klaus Manhart - 17.06.2020

Neben den Datensystemen der „alten Datenbankhasen“, die bereits jahrelang auf dem Markt sind und nun um KI-Features erweitert werden, entsteht in jüngster Zeit eine ganz neue Klasse von dedizierten „echten KI-Datenbanken“. Diese KI-Datenbanken sind speziell zur Beschleunigung des Machine-Learning-Modelltrainings und Inferencings konstruiert. Sie werben damit, KI-Anwendungen zu optimieren, indem sie Daten und Rechenoperationen für das Training und Inferencing von Deep-Learning-Modellen zusammenbringen und mit Hilfe von GPUs massiv parallelisieren.

Das Verlagern von KI-Workloads in eine GPU-beschleunigte KI-Datenbank bringt den Anbietern zufolge erhebliche Vorteile. Normalerweise werden die KI-Trainingsdaten in die spezialisierten GPU-Systeme transferiert, was mit Aufwand und Komplexität verbunden ist. Die extra angepassten KI-Datenbanken hingegen brächten die Algorithmen direkt zu den Daten. Das helfe, die Herausforderungen in Bezug auf die komplexe Datenverwaltung, die mit dem Machine-Learning-Training verbunden sind, besser in den Griff zu bekommen, und so Zeit zu sparen und Ressourcen zu optimieren.

Ein Beispiel für so einen Anbieter ist Kinetica. Das in San Francisco ansässige Start-up-Unternehmen hat eine verteilte SQL-Datenbank mit massiv paralleler Verarbeitung entwickelt, die für die schnelle Aufnahme und Analyse von Daten optimiert ist. Jeder Knoten verfügt dabei über Daten, CPU und GPU, die sich gemeinsam im Speicher befinden.

Über ein Funktions-Framework kann benutzerdefinierter Code direkt auf den Daten innerhalb der Datenbank ausgeführt werden. Dieser Code kann die Vorteile der parallelen Berechnung auf der GPU nutzen. Die Datenbank ist auch in der Lage, verteilte Berechnungen auf mehreren Rechnern durchzuführen. Algorithmen können in Sprachen wie Python geschrieben werden, die Datenwissenschaftlern vertraut sind und in Deep-Learning-Bibliotheken wie TensorFlow, Caffe und Torch aufgerufen werden.

Ob solche hochoptimierten, ausschließlich auf KI-Belange ausgerichteten KI-Datenbanken eine Zukunft haben, ist allerdings ungewiss. Die Vergangenheit zeigte, dass Datenbank-Technologien, die für einen bestimmten Bereich optimiert waren, oft in die klassischen Technologien integriert wurden. Ob und wie dies bei KI-Datenbanken mit massiv paralleler Verarbeitung möglich ist, muss abgewartet werden.

Datenbanken und Cloud

Unabhängig von KI ist der Datenbank-Markt gehörig in Bewegung. Laut Gartner ist Microsoft seit 2015 mit seinem SQL Server und der Azure-SQL-Lösung Marktführer und kämpft jährlich um den Vorsprung der Pole-Position gegen Oracle und IBM. Microsoft, Oracle und IBM erwirtschafteten noch vor wenigen Jahren 80 Prozent ihres Umsatzes mit Datenbank-Systemen. Inzwischen hat sich der Wind gedreht. Einen immer größeren Teil des Umsatzes nehmen nun cloudbasierte Produkte ein – ein Feld, in dem neue Mitbewerber wie AWS oder Google die etablierten Hersteller bedrängen. Sie profitieren von der wachsenden Verlagerung von Business-Anwendungen in die Cloud. „Unternehmen entwickeln und implementieren neue Anwendungen in der Cloud und verschieben bestehende Assets mit hoher Frequenz. Dies wird weiter zunehmen“, prognostiziert Donald Feinberg, Distinguished Research Vice President bei Gartner.

Der Analyst geht davon aus, dass diese Entwicklung mit Systemen beginnt, die das Datenmanagement für Analytics-Lösungen betreffen – wie Data Warehousing, Data Lakes und andere Anwendungsfälle mit Daten für Analytics, KI und maschinelles Lernen. Im Hinblick auf die wachsenden Herausforderungen im Bereich Analytics stellen viele Unternehmen auch ihre herkömmlichen Datenbanken auf den Prüfstand und spielen mit dem Gedanken einer Migration in die Cloud.

Seite

Künstliche Intelligenz erobert die Datenbanken

GPUs als Turbo

Mehr zum Thema