Lecture Translator

KI übertrifft Mensch bei Spracherkennung

Der Lecture Translator des KIT liefert bessere Ergebnisse mit minimaler Verzögerung
Quelle: Foto: KIT
26.10.2020
Ein alltägliches Gespräch zu verfolgen und genau wiederzugeben ist eine der größten Herausforderungen in der Forschung an Künstlicher Intelligenz (KI).
Forschern des Karlsruher Instituts für Technologie (KIT) ist es nun erstmals gelungen, mit einem Computersystem die Erkennungsgenauigkeit des Menschen beim Erkennen solcher spontan gesprochener Sprache zu übertreffen – und dies mit nur minimaler Verzögerung zum Sprechen. Ein Team aus KIT-Wissenschaftlern und Mitarbeitern der Firma KITES, einer Ausgründung aus dem KIT, hat nun weltweit erstmals ein Computersystem programmiert, das diese Aufgabe besser erledigt als Menschen und schneller als andere Systeme.
Alex Waibel, Professor für Informatik am KIT, hat bereits einen automatischen Live-Übersetzer entwickelt, der Universitätsvorlesungen aus dem Deutschen oder Englischen schritthaltend mit der Vorlesung in die Sprachen ausländischer Studierender überträgt. Der Lecture Translator ist seit 2012 in den Hörsälen des KIT im Einsatz. »Die Erkennung spontaner Sprache ist die wichtigste Komponente in diesem System«, erläutert Waibel, »da
Fehler und Verzögerungen bei der Erkennung die Übersetzung unverständlich machen. Die menschliche Fehlerrate liegt hier bei um die 5,5 Prozent. Unser System erreicht nun 5,0 Prozent.« Allerdings sei nicht nur die Genauigkeit ausschlaggebend, sondern auch, wie rasch das System das Ergebnis ausgibt, damit Studierende der Vorlesung live folgen können. Diese Verzögerung konnten die Forscher erstmalig auf eine Sekunde reduzieren. Das sei der niedrigste Wert in der sogenannten Latenz, den je ein Spracherkennungssystem dieser Qualität erreicht habe, betont Waibel.
Gemessen werden Fehlerrate und Verzögerung mit dem standardisierten und wissenschaftlich international anerkannten Switchboard-Benchmark-Test.

Autor(in)

Das könnte sie auch interessieren
Swisscom
Neue Cyberbedrohungen auf dem Radar
Künstliche Intelligenz
Memary - Langzeitgedächtnis für autonome Agenten
Cloud Infrastructure
Oracle mit neuen KI-Funktionen für Sales, Marketing und Kundenservice
Datenverfügbarkeit
Where EDGE Computing meets 5G
Mehr News?
Besuchen Sie unsere Seite ...
https://www.com-magazin.de
nach oben