#MergeConflict

F#-Lösung für die One Billion Row Challenge

von - 02.02.2024
Foto: https://github.com/gunnarmorling/
Eine Challenge in der Java-Welt fragt, wie schnell man eine Datei mit einer Milliarde Datenzeilen einlesen und parsen kann. Die Leute hinter dem Podcast #MergeConflict haben versucht eine Lösung mit F# und #dotNET zu implementieren.
Die Aufgabe hinter der One Billion Row Challenge sah eigentlich einfach aus: Schreiben Sie ein Java-Programm zum Abrufen von Temperaturmesswerten aus einer Textdatei und berechnen Sie die Mindest-, Mittel- und Höchsttemperatur pro Wetterstation. Einziger Haken bei der Sache: Die Datei hat 1.000.000.000 Zeilen (bei rund 13 GByte Größe)!
Schon am 12ten Tag der Challenge, die am 1. Januar startete, gab es mehr als 100 Teilnehmer und die Veranstalter forderten weitere Teilnehmer dazu auf, nur noch Beiträge einzusenden, von denen Sie sicher waren, dass Sie auf der Bewertungsmaschine in weniger als 10 Sekunden zu ihren Ergebnissen kommen. Wie die Java-Ergebnisse nach Ablauf der Challenge am 31. Januar aussehen, erfahren Sie auf GitHub beziehungsweise direkt bei Inititator Gunnar Morling.
Die Leute hinter dem Podcast #MergeConflict haben versucht eine Lösung mit F# und #dotNET zu implementieren und reden über ihren Ansatz und die Ergebnisse in diesem Podcast (Laufzeit, knapp 39 Minuten).
Verwandte Themen