Künstliche Intelligenz
Google erkennt und beschreibt Fotos & Bilder
von
Robert
Schanze - 19.11.2014
Google will seine Bildersuche verbessern und dazu Computersystemen das Sehen beibringen. Die Forscher schalten dazu zwei neurale Netze hintereinander, die Bildobjekte erkennen und beschreiben.
Menschen können ein Bild in einem einfachen Satz beschreiben. Das menschliche Gehirn erkennt dabei, was auf dem Bild zu sehen ist und was dort geschieht. Bei Google arbeiten nun Forscher daran, einem Computersystem das Sehen beizubringen.
Google-Sehen: Forscher kombinieren zwei neurale Netze (CNN und RNN), um Google Bilder erkennen und beschreiben zu lassen.
(Quelle: Google )
So funktioniert das Google-Sehen
Forscher greifen auf ein Convolutional Neural Network (CNN) zurück, das trainiert wurde, Objekte auf Bildern zu erkennen. Das Ergebnis wird an ein rückgekoppelte neurales Netzwerk (RNN) weitergeleitet, das schließlich die Beschreibung des Bildes erstellt. Das Endergebnis lautet dann etwa "Eine Katze liegt auf der Couch" oder "Zwei Hunde spielen im Gras", was als einfache Bildbeschreibung im Internet mehr als ausreichend ist.
Falls die Technologie marktreif wird, gibt es viele vorstellbare Einsatzmöglichkeiten, nicht nur für die Google-Webseite. Überwachungskameras etwa könnten auf einmal erkennen, was auf Aufnahmen passiert und bei bestimmten Wortphrasen wie "Mensch bedroht Angestellte mit Pistole" automatisch die Polizei benachrichtigen.