Siri & Co.

Wie moderne Spracherkennung funktioniert

von - 27.10.2015
Smartphone mit Spracherkennung
Foto: Shutterstock/venimo
Spracherkennung gehört zu modernen Smartphones. Was früher im Gerät eingebaut wurde, funktioniert heute aber meist über externe Server-Lösungen.
Wenn jemand „OK Google“ oder „Hey Siri“ ruft, meint er meistens den Sprachassistenten seines Smartphones, den er durch diese Worte aktivieren will. Danach folgt meist eine Frage wie „Brauche ich heute einen Regenschirm?“, auf den das Smartphone prompt mit einem Wetterbericht antwortet. Das ist keine Magie, sondern das Ergebnis von Spracherkennung.
Spracherkennung per Computer
Spracherkennung: Zunächst erfolgte sie auf dem Smartphone selbst, jetzt meist auf einem Server im Internet.
(Quelle: Shutterstock/Viktorus )
Diese sehr anspruchsvolle Technologie ist eigentlich nicht neu und nicht auf Mobiltelefone beschränkt, sondern schon seit mehr als 15 Jahren verfügbar. Was damals auf PCs oder mit einfachen Befehlen zur Steuerung des Handys begann, ist heute ein komplexes System, das verschiedene Sprecher und sogar Zusammenhänge verstehen kann.
Bei den ersten Handy-Sprachsteuerungen, wie im Jahr 2000 im Philips Savvy, musste der Anwender noch einige bestimmte Befehle auswendig lernen und darüber hinaus sehr genau aus­sprechen, damit sie überhaupt verstanden wurden.
Bei manchen Modellen kam noch die Möglichkeit dazu, zum Anrufen einige wenige Namen aus dem internen Telefonbuch „anzulernen“, indem diese mehrmals hintereinander aufgesprochen und dann im Gerät gespeichert wurden.
Allerdings erkannte das System dann in der Regel auch nur diesen einen Sprecher, dessen Eingabe vom Chip im Handy intern mit dem gesprochenen Satz ganz genau übereinstimmen musste. All das erfolgte schließlich auf Handys, die wenig Speicher und Rechenkapazität für komplexe Vorgänge hatten.
Verwandte Themen