Common Voice

Mozilla startet freie Spracherkennung

Quelle: Foto: A Aleksii / Shutterstock.com
25.07.2017
Mozilla arbeitet an einer freien Spracherkennung: Die Open-Source-Lösung trägt den Namen Common Voice und soll Entwicklern den Zugriff zu Spracherkennungs-Technologie erweitern.
Mozilla sammelt für seine freie Spracherkennung derzeit Sprechproben von freiwilligen Teilnehmern.
Mozilla arbeitet an einer freien Spracherkennungs-Software, um Entwicklern den Zugang zu dieser Art von Technologie zu erleichtern. Wie der Firefox-Entwickler auf der Webseite des Projekts "Common Voice" mitteilt, seien die verfügbaren Spracherkennungs-Technologien derzeit in der Hand von wenigen großen Unternehmen. Dies erschwere vielen Entwicklern das Arbeiten mit der Technologie, da schlichtweg die Datenbasis nicht erreichbar ist. Innovative Lösungen wie Echtzeit-Übersetzer oder alternative Sprachassistenten blieben dadurch auf der Strecke.
Für das Projekt ist Mozilla nun auf die Unterstützung der Community angewiesen. Bis zum Ende des Jahres sollen 10.000 Stunden Sprachmaterial von freiwilligen Teilnehmern gesammelt werden. Diese freie Datenbank soll dann als Grundlage für die Spracherkennungs-Software dienen.
Über die Projekt-Webseite können Unterstützer Sprachproben für Common Voice beisteuern. Hierzu müssen verschiedene vorgegebene Sätze vorgelesen werden. Für die Aufzeichnung muss dem Web-Browser lediglich die Zugriffsberechtigung für das angeschlossene beziehungsweise verbaute Mikrofon erteilt werden. Nach einem Klick auf den Aufnahme-Button kann dann Satz für Satz aufgezeichnet werden. Die eigenen Aufnahmen lassen sich zudem über demographische Daten ergänzen. Hierbei werden Angaben zu Akzent, Alter und Geschlecht abgefragt. Teilnehmer können außerdem die bereits aufgezeichneten Sätze von anderen Unterstützern des Projekts probehören und verifizieren. Aktuell beschränkt sich das Projekt auf die englische Sprache.

Praxisnahe Speech-to-Text-Engine

Um die Audio-Qualität der Aufnahmen müssen sich die Teilnehmer indessen keine Sorge machen. Mozilla möchte möglichst praxisnahe Daten sammeln. Daher spielen auch Hintergrundgeräusche wie Verkehrslärm und dergleichen keine Rolle. Dies erlaube der Speech-to-Text-Engine auch in schwierigen Situationen fehlerfrei zu arbeiten.
Mozilla stellt darüber hinaus in Aussicht, dass die Technologie auch in künftige Versionen des Firefox-Browsers integriert werden könne - das Potenzial hierzu solle die Lösung allemal bieten.

Autor(in)

Das könnte sie auch interessieren
Künstliche Intelligenz
Memary - Langzeitgedächtnis für autonome Agenten
Cloud Infrastructure
Oracle mit neuen KI-Funktionen für Sales, Marketing und Kundenservice
Reactive mit Signals
Neuer Vorschlag für Signals in JavaScript
Schellerer Ausbau
Hessen, OXG und Vodafone schließen Partnerschaft für Glasfaser
Mehr News?
Besuchen Sie unsere Seite ...
https://www.com-magazin.de
nach oben