Zeichencodierungssalat (ISO8859 vs. UTF-8) - wie verhindern?

19/05/2008 - 10:17 von Ansgar Strickerschmidt | Report spam
Hallo NG,

ich habe gerade einen Laptop einer Bekannten zur Pflege in meiner Obhut;
sie klagte insbesondere über Probleme beim CD-Brennen. Installiert ist ein
SuSE 10.2.
Jetzt habe ich gesehen, dass die Umlaute im Brennmaterial, also den
Dateinamen des lokalen Datenhaufens, überwiegend falsch kodiert waren, und
sich in der Folge K3B entsprechend beschwert, man solle doch "convmv"
benutzen, um das womöglich in Ordnung zu bringen. Gut, das habe ich dann
gemacht und das ging dann auch anschließend mit dem Brennen. Ich nehme an,
dass die Dateien per USB-Stick oder evtl. per CD hereingekommen sind und
eben von einem Rechner mit anderer Kodierung stammen, sei es ein àlteres
SuSE oder ein Windows-Rechner.
Als "Erste Hilfe" habe ich nun einen Einzeiler namens "umlaut" gebastelt,
das nur einen entsprechenden Aufruf von "convmv" enthàlt, so dass man sich
für den Hausgebrauch die Parameter-Tipperei sparen kann. Ist doch etwas
intuitiver, einmal "umlaut" oder "umlaut -r" zu schreiben, als "convmv -f
iso8859-15 -t utf-8 [-r] * --notest" :) . Aber das ist halt ein
Hintendranflicken.

Jetzt stellt sich die Frage: Wie kann man sicherstellen, dass Dateien, die
per Stick oder CD hereinkommen, beim Kopieren auf den lokalen Rechner die
richtige Codierung erhalten (UTF-8) und ggf. beim Zurückkopieren auf einen
USB-Stick wieder eine andere (also etwa ISO8859-15), falls der Stick für
Windows (FAT32) formatiert ist? Und all das möglichst transparent für den
Benutzer, d.h. er soll von der ganzen Umkodiererei nur auf Nachfrage etwas
zu sehen bekommen?

Zusàtzlich scheint Automount (zumindest bei CDs) nicht zu funktionieren;
das muss ich aber nochmal gesondert nachschauen. Da ist evtl. etwas zu
viel deaktiviert.

Ansgar

Mails an die angegebene Adresse errichen mich - oder auch nicht. Nützliche
Adresse gibt's bei Bedarf!
Mail to the given address may or may not reach me - useful address will be
given when required!
 

Lesen sie die antworten

#1 Jan Kandziora
19/05/2008 - 10:42 | Warnen spam
Ansgar Strickerschmidt schrieb:

Jetzt stellt sich die Frage: Wie kann man sicherstellen, dass Dateien, die
per Stick oder CD hereinkommen, beim Kopieren auf den lokalen Rechner die
richtige Codierung erhalten (UTF-8) und ggf. beim Zurückkopieren auf einen
USB-Stick wieder eine andere (also etwa ISO8859-15), falls der Stick für
Windows (FAT32) formatiert ist? Und all das möglichst transparent für den
Benutzer, d.h. er soll von der ganzen Umkodiererei nur auf Nachfrage etwas
zu sehen bekommen?



Was willst du denn umkodieren? Den Dateinamen oder den Inhalt? Ersteres
macht der Kernel üblicherweise *automatisch*, man muss bloß die NLS-Module
bei der Hand haben und die passende Mount-Option angeben.

Den Inhalt umzukodieren halte ich für riskant, da man ja gar nicht weiß, ob
es sich tatsàchlich um Text oder um Binàrdaten handeln soll.

Mit freundlichem Gruß

Jan

Ähnliche fragen