Deep-Learning - Weniger Neuronen, mehr Intelligenz

Die Aufgabe: Autonomes Spurhalten

von Bernhard Lauer - 16.10.2020

Um die neuen Ideen zu testen, wählte das Team eine besonders wichtige Testaufgabe: Das Spurhalten beim Autonomen Fahren. Das neuronale Netz bekommt als Input ein Kamerabild der Straße und soll daraus automatisch entscheiden, ob man nach rechts oder nach links lenken muss.

"Für Aufgaben wie Autonomes Fahren verwendet Deep Learning heute oft Modelle mit Millionen an Parametern", sagt Mathias Lechner, TU Wien Alumnus und PhD-Student am IST Austria. "Unser neuer Zugang macht es allerdings möglich, die Größe des Netzwerks um zwei Größenordnungen zu reduzieren. Unsere Systeme kommen mit 75.000 trainierbaren Parametern aus."

Alexander Amini, PhD-Student am CSAIL, MIT, erklärt, dass das neue System aus zwei Teilen besteht: Der Kamera-Input wird zunächst von einem sogenannten konvolutionalen Netzwerk verarbeitet, das die visuellen Daten nur wahrnimmt, um in den Pixeln strukturelle Bildeigenschaften zu erkennen. Das Netzwerk entscheidet, welche Teile des Kamerabilds interessant und wichtig sind und gibt dann Signale an den eigentlich entscheidenden Teil des Netzwerks weiter - an das Kontrollsystem, das dann das Fahrzeug lenkt.

Beide Teilsysteme werden zunächst gemeinsam trainiert. Viele Stunden an Verkehrs-Videos von menschgesteuerten Autofahren in der Gegend von Boston wurden gesammelt und in das Netzwerk gefüttert, gemeinsam mit der Information, wie das Auto in den jeweiligen Situationen gesteuert werden soll - so lange, bis das System die richtige Verknüpfung von Bild und Lenkrichtung gelernt hat und selbstständig auch mit neuen Situationen umgehen kann.

Das Kontrollsystem des neuronalen Netzwerks (genannt "neural circuit policy", oder NCP), das die Daten aus dem visuellen Netz in einen Steuerungsbefehl übersetzt, besteht nur aus 19 Zellen. Mathias Lechner: "Diese NCPs sind um drei Größenordnungen kleiner als es mit bisherigen State-of-the-art-Modellen möglich wäre."

Kausalität und Interpretierbarkeit

Das neue Deep-Learning-Modell wurde in einem echten autonomen Fahrzeug getestet. "Unser Modell erlaubt uns, genau zu untersuchen, worauf das Netzwerk beim Fahren seine Aufmerksamkeit richtet. Es konzentriert sich auf ganz bestimmte Bereiche des Kamerabildes: Auf den Straßenrand und den Horizont. Dieses Verhalten ist höchst erwünscht, und es ist einzigartig bei Systemen, die auf künstlicher Intelligenz beruhen", sagt Ramin Hasani. "Außerdem haben wir gesehen, dass sich die Rolle jeder einzelnen Zelle bei jeder einzelnen Entscheidung identifizieren lässt. Wir können die Funktion der Zellen verstehen und ihr Verhalten erklären. Dieses Maß an Interpretierbarkeit ist in größeren Deep Learning Modellen unmöglich."

Robustheit

"Um zu testen, wie robust unsere NCPs im Vergleich zu bisherigen Deep Learning Modellen sind, haben wir die Bilder künstlich verschlechtert und analysiert, wie gut das System mit Bildrauschen zurechtkommt", sagt Mathias Lechner. "Während das für andere Deep Learning Netzwerke zum unlösbaren Problem wurde, ist unser System sehr widerstandsfähig gegenüber Artefakten beim Input. Diese Eigenschaft ist eine direkte Folge des neuartigen Modells und seiner Architektur."

"Interpretierbarkeit und Robustheit sind die zwei entscheidenden Vorteile unseres neuen Modells", sagt Ramin Hasani. "Aber es gibt noch mehr: Durch unsere neuen Methoden können wir die Dauer des Trainings reduzieren und schaffen die Möglichkeit, künstliche Intelligenz in relativ einfachen Systemen zu implementieren. Unsere NCPs machen imitierendes Lernen in einem weiten Anwendungsbereich möglich, von automatisierter Arbeit in Lagerhallen bis hin zur Bewegungssteuerung von Robotern. Die neuen Ergebnisse eröffnen wichtige neue Perspektiven für die AI-Community: Die Grundlagen der Datenverarbeitung in biologischen Nervensystemen sind eine großartige Wissensressource um high-performance interpretierbare künstliche Intelligenz zu erzeugen - als Alternative zu den Black-Box-Machine-Learning Systemen, die wir bisher kannten."

Weitere Informationen sind im kostenpflichtigen Originalpublikation einsehbar. Das Code Repository mit dem Python-Code zu NCP steht auf GitHub bereit.

Seite

Deep-Learning - Weniger Neuronen, mehr Intelligenz

Die Aufgabe: Autonomes Spurhalten

Kausalität und Interpretierbarkeit

Robustheit

Mehr zum Thema