Suche Tool das kleine Texte efficient komprimiert

20/04/2008 - 15:22 von Albert Hermeling | Report spam
Hallo,

wie der Betreff schon sagt suche ich ein Kommandozeilen Tool das besonders
gut kleine Texte komprimiert. Bei Gzip werden die Resultate mit abnehmender
Größe immer schlechter.

Vieleicht kennt jemand ja so etwas für Linux das solche kleinen Texte besser
komprimiert.

Albert
 

Lesen sie die antworten

#1 Malte J. Wetz
20/04/2008 - 16:16 | Warnen spam
Albert Hermeling wrote:

wie der Betreff schon sagt suche ich ein Kommandozeilen Tool das
besonders gut kleine Texte komprimiert. Bei Gzip werden die Resultate
mit abnehmender Größe immer schlechter.



Das ist nicht nur bei gzip so. Archivierungsprogramme arbeiten mit
Redundanzreduktion und je größer ein "normaler" Text ist, desto mehr
Redundanz enthàlt er und entsprechend besser làsst er sich (im
Verhàltnis) komprimieren.

Wobei schon die Frage, wie klein denn "klein" ist, offen bleibt.

Als Test habe ich den deutschen Wikipedia-Artikel über Linux per
Copy&Paste in eine reine Textdatei überführt (von hinter dem
Inhaltsverzeichnis bis vor das Literaturverzeichnis).

Diese Datei (Original: 32 KB) habe ich anschließend komprimiert mit:
* gzip -9
* bzip2 -9
* rar -m5 -md1024 -s
* 7z -t7z -m0=lzma -mx=9 -mfbd -md2m -ms=on
* zip -9

Ergebnis (nach Größe sortiert):
,-
| -rw-r--r-- 1 mjw mjw 32739 2008-04-20 16:04 test.txt
| -rw-r--r-- 1 mjw mjw 12773 2008-04-20 16:05 test.zip
| -rw-r--r-- 1 mjw mjw 12643 2008-04-20 16:04 test.gz
| -rw- 1 mjw mjw 12116 2008-04-20 16:04 test.7z
| -rw-r--r-- 1 mjw mjw 11256 2008-04-20 16:04 test.bz2
| -rw-r--r-- 1 mjw mjw 10054 2008-04-20 16:04 test.rar
`-

Wie man sieht, liegt das Testfeld dicht beieinander. rar hat mit 9,9K
leicht die Nase vorn, gefolgt von bzip2 mit 11K. An dritter Stelle
kommt 7z mit 12K und zuletzt gzip und zip mit 13K.

Fazit: Der Abstand zwischen kleinstem und größten sind gerade einmal 3K.
Je nach ausgewàhltem Text und Finetuning per Parameter könnte man evtl.
auch andere Programm gewinnen lassen. Viel nehmen sich die Programme
nicht.

Als bestes OpenSource-Programm geht aus meinem Test bzip2 hervor, nur
vom kommerziellen rar überboten.

http://www.malte-wetz.de (Linux: ISDN-Anrufbeantworter, Text-To-Speech,
ISDN-Inhaltsdatenkomprimierung, yapsrc für alle dt. Netze, Sondertasten
von Multimedia-Tastaturen; Allgemein: Rechnersicherheit)

Ähnliche fragen