Business-IT
Profi-Wissen - Komprimierung
von
com!
professional - 01.10.2009
Ganz gleich mit wie viel Speicherkapazität ein PC ausgestattet ist und wie schnell er die Daten übertragen kann — Datenkompression bleibt immer wichtig.
Grundsätzlich unterscheidet man zwei Methoden der Komprimierung. Immer dann, wenn Informationen verloren gehen, etwa bei MP3 und JPEG, wird von verlustbehafteter Komprimierung gesprochen. Bei ZIP oder TIFF können die Daten Bit für Bit wieder hergestellt werden — man spricht hier von verlustfreier Komprimierung.
1. Binärer Baum: Das ZIP-Format verwendet binäre Bäume. Hier ist das Wort Mississippi dargestellt. Der Buchstabe „i“ kommt viermal vor, ebenso das „s“. Je häufiger ein Zeichen vorkommt, desto weiter oben im Baum steht es. Dadurch wird die Adressierung kürzer: Für das „s“ genügt so der knappe Binärcode „10“.
2. Binärcode: Normalerweise benötigt jeder Buchstabe 8 Bit Speicherplatz: Das „s“ etwa wird mit den acht Bits „01110011“ gespeichert. Ein binärer Baum ist effektiver: Im Mississippi-Beispiel (siehe links) braucht das „s“ nur noch die zwei Bits „10“.
3. Lauflängenkodierung: Die Lauflängenkodierung wird etwa vom TIFF-Format genutzt. Dabei werden Pixel, die direkt nebeneinander stehen, durch eine Kurzform ersetzt. Anstatt zehnmal hintereinander dasselbe Pixel „A“ zu speichern, wird nur die Kurzform „10A“ gespeichert.
4. LZW: Die LZW-Komprimierung durchsucht eine Datei nach Mustern, die sich wiederholen. Hier steht das Muster A für vier weiße Pixel, das Muster B für zwei weiße und zwei schwarze. In der komprimierten Datei werden die Muster nur ein einziges Mal gespeichert. Anschließend wird nur noch auf sie verwiesen. Das GIF-Format nutzt dieses Verfahren zum Beispiel.
5. Verlustbehaftete Komprimierung
Die verlustbehaftete Komprimierung entfernt Inhalte, um die Datenmenge zu reduzieren. Bei MP3 sind das etwa nicht hörbare Audiosignale. Das JPEG-Format wandelt kleine Teilstücke eines Bildes in mathematische Formeln um. Dadurch gehen Details verloren.