com!-Academy-Banner
Wahr oder falsch

Uni will falsche Internet-News entlarven

von - 12.02.2014
Uni erforscht Wahrheitsgehalt von Netz-Infos
Foto: play.google.com
Ist eine Information im Internet vertrauenswürdig? Diese immer dringlichere Frage wollen Sprachforscher der Universität des Saarlandes künftig automatisch beantworten.
„Das Wahrzeichen Londons, das London Eye, brennt.“ Unwahrscheinlich, denn das derzeit höchste Riesenrad Europas ist aus Stahl.
„Das Wahrzeichen Londons, das London Eye, brennt.“ Unwahrscheinlich, denn das derzeit höchste Riesenrad Europas ist aus Stahl.
(Quelle: DAVID ILIFF - License: CC-BY-SA 3.0)
Sätze wie „Das Wahrzeichen Londons, das London Eye, brennt.“ verbreiten sich explosionsartig über Facebook, Twitter und Co. Aber stimmt das auch? Die Folgen solcher Falschmeldungen sind unberechenbar - je nach Brisanz des Inhalts ist von Gewaltexzessen bis hin zum Einbruch von Aktienmärkten alles möglich.
Die Frage der Vertrauenswürdigkeit von Informationen im Netz stellt sich daher immer dringlicher. Aber wie misst man den Wahrheitsgehalt von Online-Informationen? Und das schnell genug?
Gemeinsam mit seinen internationalen Forschungspartnern will der Sprachtechnologe Thierry Declerck hierfür Antworten finden. Die Wissenschaftler arbeiten an einer Methode, die zuverlässig angibt, wie vertrauenswürdig eine Information ist.
Eine der größten Herausforderungen ist dabei die Datenflut. „Mehrere tausend Textnachrichten werden jede Sekunde neu eingestellt. Daher wenden wir Methoden an, um große Datenmengen zu verarbeiten, so genannte Big Data-Analysen“, sagt Declerck, der an der Saar-Universität und am Deutschen Forschungszentrum für Künstliche Intelligenz forscht. „Wir verbinden statistische Methoden mit präzisen sprachwissenschaftlichen Analysen. Die Lösung liegt in der Kombination der verschiedenen Verfahren“, erläutert er.
„Wir konzentrieren uns auf vier Arten problematischer Informationen: die Spekulation, die kontroverse Diskussion, die Fehlinformation und die gezielte Verbreitung falscher oder irreführender Tatsachen“, erklärt Sprachtechnologe Thierry Declerck.
Computerlinguistische Sprachanalysen werden verknüpft mit Informationen aus sozialen Netzwerken, Inhalte werden mit zuverlässigen Datenbanken abgeglichen, statistisch geprüft und mittels Grafiken ausgewertet. Die Aussage wird gleichsam durch verschiedenste Filter geschickt; am Ende steht eine bestimmte Wahrscheinlichkeit, die für oder gegen die Wahrheit spricht.
Künftig will der Forscher dabei auch die Bedeutung einer Information und Besonderheiten im Satzbau erfassen. „Zum Beispiel wollen wir Satzstrukturen, die Zweifel am Wahrheitsgehalt einer Aussage ausdrücken, sowie bestimmte Schlüsselwörter wie ´scheinbar` oder ´nicht` automatisch erkennen“, sagt Declerck.
Im Ausgangsbeispiel mit dem London Eye würde das System die Häufung von Zweifel wie „Stahl brennt doch gar nicht“ oder „Ich bin am London Eye, hier brennt nichts“ in seine Wahrheits-Analyse einbeziehen.

Die Wahrheit ist unbeständig

Ein besonderer Knackpunkt für die Forscher ist auch die Unbeständigkeit der Wahrheit in unserer realen Welt. Was heute wahr ist, kann morgen schon falsch sein.
„Der Faktor Zeit spielt eine große Rolle. Zum Beispiel ist eine Aussage der Form ´X ist Präsident des Landes Y` nur so lange wahr, wie der genannte Präsident auch tatsächlich amtiert. Unser System muss sich also ständig anpassen können“, erklärt Declerck.
Daher verknüpft er die zu überprüfenden Informationen mit den entsprechenden Daten in zuverlässigen Quellen, etwa Online-Nachschlagewerken wie DBpedia.
„Hinter den Texten solcher Datenbanken liegen verschlüsselte, maschinenlesbare Informationen. Wir nutzen diese derzeit sozusagen als Spielwiese, um Gesetzmäßigkeiten zu finden und neue leistungsfähige Algorithmen zu entwickeln“, sagt der Sprachtechnologe.
Das Ziel der Forscher ist, langfristig ein automatisches Analyseverfahren zu entwickeln, das dem Internetnutzer schnell und verlässlich mitteilt, ob er einer gefundenen Information trauen kann oder eher nicht. Das Projekt ist zunächst auf drei Jahre angelegt, hat ein Gesamtvolumen von rund 4,3 Millionen Euro und wird von der EU mit rund drei Millionen Euro gefördert.
Verwandte Themen