KI-Algorithmen im praktischen Einsatz

KI für den Alltag

von - 11.10.2018
Lange Zeit war KI also der Forschung vorbehalten beziehungsweise an das Vorhandensein von Ressourcen zur Entwicklung (Kenntnisse) und Bereitstellung (Rechentechnik) gebunden, weswegen KI im Alltag noch nicht oder nur vereinzelt genutzt werden konnte. Dieses Bild wandelt sich derzeit, weil Anbieter wie Amazon, IBM, Goo­gle oder Microsoft KI-Dienste bereitstellen – meist in Form von cloudbasierten Angeboten – und eine breite Nutzung möglich machen. Über definierte APIs kann man diese Dienste nutzen und für eigene Zwecke in eine App beziehungsweise Webseite einbauen.
Architektur einer cloudbasierten KI: Weniger kompliziert als gedacht – hier AutoML Vision von Google.
Und wie muss man sich die Architektur bei der Nutzung einer cloudbasierten KI-API vorstellen? Eigentlich recht einfach. Beispielsweise die KI für die automatische Bilderkennung von Google, Cloud AutoML Vision: Über das User-Interface des angebundenen Fotodienstes können Bilder in die Cloud geladen werden. Danach verschlagwortet der Nutzer sie manuell und trainiert damit automatisch das Modell. Nach der Trainingsphase erkennt AutoML Vision später verwandte Bildelemente selbstständig. Zur Nutzung in der eigenen App oder Webseite wird eine universelle Programmierschnittstelle (Rest API) zur Verfügung gestellt.
Um die Leistungspalette der KI-Anbieter näher kennenzulernen, dienen die einschlägigen Services von Microsoft: Bei den Microsoft Cognitive Services handelt es sich um ein recht breites Angebot unterschiedlicher Cloud-Dienste. Bevor man sich an die Verwendung dieser KI-Funktionen in einer eigenen App oder Webseite begeben kann, sollte man ihre Funktionsweise grundsätzlich verstehen.
Zunächst einmal teilen die Microsoft Cognitive Services ihr KI-Angebot in fünf Bereiche ein: Bildanalyse, Spracheingabe, Sprache, Einblicke/Wissen und Suche.
Die Beschäftigung mit einigen beispielhaften Funktionen aus diesen Bereichen verschafft einen Eindruck von der Funktionsweise und der Leistungsfähigkeit der Dienste. Und es wird ersichtlich, wie leicht die APIs für die Programmierpraxis nutzbar sind – das ist wichtig, damit man später über das bloße Experimentieren hinauskommt.

Bildanalyse – Maschinelles Sehen

Ein Bild wird dabei auf seine Inhalte untersucht und beispielsweise mit Schlagwörtern versehen. Oder man kann Bilder mit nicht jugendfreien Inhalten oder anzüglichen Elementen identifizieren sowie Eigenschaften wie Format, Größe oder die bestimmenden Vorder- und Hintergrundfarben.
Die API für Maschinelles Sehen kann man direkt auf der Webseite von Microsoft ausprobieren. Laden Sie ein Bild hoch oder geben Sie dessen Link über eine URL an.
Automatische Bildanalyse: Mit Hilfe der API Maschinelles Sehen wird das Bild einer Demonstration verschlagwortet.
Im Beispiel ist ein Bild von einer Demonstration zu sehen. Die identifizierten Tags – in englischer Sprache und ein Vorschlag für die Bildbeschreibung – sind im rechten Teil zu sehen. Wo könnte diese API angewendet werden? Überall dort, wo Bildanalyse als Massengeschäft durchgeführt werden muss. Sind unzählige Bilder in einer Datenbank mit Schlagwörtern zu versehen, kann dies mit Hilfe des Dienstes erfolgen.
Ein anderer Anwendungsfall: Der Betreiber eines Internetforums haftet dafür, dass sich die geposteten Inhalte an bestimmte Normen halten und beispielsweise nicht gegen die guten Sitten verstoßen. Eine Vorbewertung des Bildmaterials ist mit dem Maschinellen Sehen möglich. Bilder, die einen Schwellenwert hinsichtlich des Kriteriums „nicht jugendfreier Inhalt“ überschreiten, können gefiltert und vor der Veröffentlichung einer manuellen Prüfung unterzogen werden.
Verwandte Themen