recode Fehlermeldung

16/12/2008 - 20:04 von Ralph Stahl | Report spam
Moin,

da ich folgendes vergeblich in d.c.o.linux.misc gepostet habe, hier also
nochmal. Ist ja auch mehr ein app- statt ein Linux-Problem :).

Was ist gemeint, wenn bei

recode utf-8..iso-8859-1 adressen.csv

die Fehlermeldung

recode: adressen.csv failed: Ungültige Eingabe in step `UTF-8..ISO-8859-1'

auftaucht? Heißt das, daß Zeichen enthalten sind, die nicht utf-8 sind
und folglich nicht konvertiert werden können? Die Idee der Konvertierung
kam mir nur, weil sonst beim nachfolgenden Import in OpenOffice-Calc die
Ümlàute mit 2 kryptischen Byte dargestellt werden. Logisch ist das wegen
dem Folgenden eigentlich nicht:

Die Datei stammt aus einem Export von JPilot, bei dem von Haus aus die
merkwürdige Kodierung "UTF: Latin1, Western Europe (CP1252)" eingestellt
ist (was denn nun: utf oder latin1?). Die Daten stammen aus einem Palm
Pilot Z22.

Dazu am Rande noch die Frage: wie, außer durch trial+error, kann ich die
Kodierung einer Textdatei (ohne BOM) bestimmen, um sie passend
konvertieren zu können?

Ralph
 

Lesen sie die antworten

#1 Sven Joachim
16/12/2008 - 20:37 | Warnen spam
Am 16.12.2008 um 20:04 schrieb Ralph Stahl:

Was ist gemeint, wenn bei

recode utf-8..iso-8859-1 adressen.csv

die Fehlermeldung

recode: adressen.csv failed: Ungültige Eingabe in step `UTF-8..ISO-8859-1'

auftaucht? Heißt das, daß Zeichen enthalten sind, die nicht utf-8 sind
und folglich nicht konvertiert werden können?



So würde ich das interpretieren, ja. Was sagt iconv(1) zu der Datei?

Dazu am Rande noch die Frage: wie, außer durch trial+error, kann ich die
Kodierung einer Textdatei (ohne BOM) bestimmen, um sie passend
konvertieren zu können?



Das geht im allgemeinen nur mit Trial+Error, weil eine Textdatei gar
keine einheitliche Kodierung zu haben braucht, siehe etwa Mails im
mbox-Format.

Sven

Ähnliche fragen