Common Voice

Mozilla startet freie Spracherkennung

von - 25.07.2017
Spracherkennung
Foto: A Aleksii / Shutterstock.com
Mozilla arbeitet an einer freien Spracherkennung: Die Open-Source-Lösung trägt den Namen Common Voice und soll Entwicklern den Zugriff zu Spracherkennungs-Technologie erweitern.
Mozilla Common Voice
Mozilla sammelt für seine freie Spracherkennung derzeit Sprechproben von freiwilligen Teilnehmern.
Mozilla arbeitet an einer freien Spracherkennungs-Software, um Entwicklern den Zugang zu dieser Art von Technologie zu erleichtern. Wie der Firefox-Entwickler auf der Webseite des Projekts "Common Voice" mitteilt, seien die verfügbaren Spracherkennungs-Technologien derzeit in der Hand von wenigen großen Unternehmen. Dies erschwere vielen Entwicklern das Arbeiten mit der Technologie, da schlichtweg die Datenbasis nicht erreichbar ist. Innovative Lösungen wie Echtzeit-Übersetzer oder alternative Sprachassistenten blieben dadurch auf der Strecke.
Für das Projekt ist Mozilla nun auf die Unterstützung der Community angewiesen. Bis zum Ende des Jahres sollen 10.000 Stunden Sprachmaterial von freiwilligen Teilnehmern gesammelt werden. Diese freie Datenbank soll dann als Grundlage für die Spracherkennungs-Software dienen.
Über die Projekt-Webseite können Unterstützer Sprachproben für Common Voice beisteuern. Hierzu müssen verschiedene vorgegebene Sätze vorgelesen werden. Für die Aufzeichnung muss dem Web-Browser lediglich die Zugriffsberechtigung für das angeschlossene beziehungsweise verbaute Mikrofon erteilt werden. Nach einem Klick auf den Aufnahme-Button kann dann Satz für Satz aufgezeichnet werden. Die eigenen Aufnahmen lassen sich zudem über demographische Daten ergänzen. Hierbei werden Angaben zu Akzent, Alter und Geschlecht abgefragt. Teilnehmer können außerdem die bereits aufgezeichneten Sätze von anderen Unterstützern des Projekts probehören und verifizieren. Aktuell beschränkt sich das Projekt auf die englische Sprache.

Praxisnahe Speech-to-Text-Engine

Um die Audio-Qualität der Aufnahmen müssen sich die Teilnehmer indessen keine Sorge machen. Mozilla möchte möglichst praxisnahe Daten sammeln. Daher spielen auch Hintergrundgeräusche wie Verkehrslärm und dergleichen keine Rolle. Dies erlaube der Speech-to-Text-Engine auch in schwierigen Situationen fehlerfrei zu arbeiten.
Mozilla stellt darüber hinaus in Aussicht, dass die Technologie auch in künftige Versionen des Firefox-Browsers integriert werden könne - das Potenzial hierzu solle die Lösung allemal bieten.
Verwandte Themen