unnötige Zeichen entfernen

19/01/2011 - 09:10 von Jan Novak | Report spam
Hallo,

ich scanne Dokumente vom Scanner mit Ocr in eine Ascii datei.
Dort sind neben dem erkannten Text natürlich auch viele "binàrzeichen".

Wie kann ich diese Zeichen in der Console entfernen, so dass nur der
Text, welcher in der Datei steht, übrig bleibt ?


Jan
 

Lesen sie die antworten

#1 Juergen Ilse
19/01/2011 - 09:55 | Warnen spam
Hallo,

Jan Novak wrote:
ich scanne Dokumente vom Scanner mit Ocr in eine Ascii datei.
Dort sind neben dem erkannten Text natürlich auch viele "binàrzeichen".

Wie kann ich diese Zeichen in der Console entfernen, so dass nur der
Text, welcher in der Datei steht, übrig bleibt ?



Ohne es jetzt getestet zu haben: tut es nicht vielleicht etwas wie:

tr -d '[:cntrl:][:graph:]' < input > output

Tschuess,
Juergen Ilse ()
Ein Domainname (auch wenn er Teil einer Mailadresse ist) ist nur ein Name,
nicht mehr und nicht weniger ...

Ähnliche fragen