Encoding Frage

15/11/2009 - 13:35 von Richard Maurer | Report spam
Hallo Ng,

Ich ràtsel gerade herum, wie man die Codepage einer Datei ermittelt,
wenn man diese nicht weis.
Klar man kann die Datei mittels view ansehen und im Hexeditor
analysieren, aber wie erspart man sich das?

Ich stelle mir vor, dass man die Datei einliest und das System meldet
mir die Codepage in einer Textausgabe.
Nur stelle ich mir das auch relativ kompliziert vor.
Wenn ich 7Bit ASCII habe, dann ist das praktisch nicht zu ermitteln, es
könnte sich ja auch um 8Bit handeln aber ohne Sonderzeichen. hm

Das ist unter umstànden knifflig.

Aber Gsd habe ich das nicht vor.
Ich arbeite nur mit Win1252 und ibm850.
tja nun will ich also nur unterscheiden ob ich die richtige Codepage in
der Datei habe.

Theoretisch könnte ich ein HEX99 ibm850 oder ein HEXF6 Win1252, und
danach entscheiden.

Gibts eine Möglichkeit, mit der ich das wie bei GetEncoding(int)
auslesen zu lassen?

Ich Google mal weiter, aber vileicht hat ja jemand eine Idee.
Dankeschön

Liebe Gruesse Richie
http://bmss.homelinux.org/
Wenn du denkst, du denkst, dann denkst du nur du denkst, drum denke nie
gedacht zu haben, denn das Denken von Gedanken ist gedankenloses denken.
 

Lesen sie die antworten

#1 Kerem Gümrükcü
15/11/2009 - 14:22 | Warnen spam
Hallo Richard,

Ich ràtsel gerade herum, wie man die Codepage einer Datei ermittelt, wenn
man diese nicht weis.



das wird schierig, zumal es da einige Hürden gibt, die eigentlich kaum
zu nehmen sind, aber Du schausst Dir bitte mal diese Links an:

[How to Determine Text File Encoding]
http://codesnipers.com/?q=node/68

http://social.msdn.microsoft.com/Fo...2eed64f371
http://www.personalmicrocosms.com/P...ips.aspx?c&t#tip

Aus der Natur dieser Text-Dateien heraus, wirst Du erkennen,
das es sehr schwer ist, diese zu trennen,...

Grüße

Kerem

Beste Grüsse / Best regards / Votre bien devoue
Kerem Gümrükcü
Latest Project: http://www.pro-it-education.de/soft...iceremover
Latest Open-Source Projects: http://entwicklung.junetz.de

Ähnliche fragen