Text Encoding

08/03/2009 - 08:15 von Karsten Sosna | Report spam
Hallo NG,
kann mir jemand sagen, was die 2. und 3. Kodierungsart zu realisieren sind,
also die beiden mit UTF16:

0x00 : ISO8859-1 (latin1)
0x01 : UTF-16 (BEGIN with BOM and END with 0x0000)
0x02 : UTF-16BE (DO NOT BEGIN with BOM and END with 0x0000)
0x03 : UTF-8

Und was hat dieses "BOM" und "END" zu sagen?

Danke für jeden Tipp.
Gruß Scotty
 

Lesen sie die antworten

#1 Karsten Sosna
08/03/2009 - 09:07 | Warnen spam
kann mir jemand sagen, was die 2. und 3. Kodierungsart zu realisieren
sind, also die beiden mit UTF16:

0x01 : UTF-16 (BEGIN with BOM and END with 0x0000)
0x02 : UTF-16BE (DO NOT BEGIN with BOM and END with 0x0000)

Und was hat dieses "BOM" und "END" zu sagen?



OK, soviel habe ich schon rausbekommen. UTF16 ist wohl
System.Text.Encoding.Unicode. Und diese BE steht für Big-Endian, wobei BOM
U+FEFF Und END U+0000 entspricht.
Ich habe folgendes: Meinen "Text" erhalte als Byte-Array. Welche Kodierung
angewendet wurde weiß ich. Was passiert nun aber wenn ich einen "Text" mit
BOM und END habe und rufe System.Text.Encoding.Unicode.GetString auf.
Erhalte ich dann den "reinen Text"?
Und wie bekomme ich eine Byte-Array wieder zurück? Einmal mit BOM/ END und
einmal ohne BOM/ END.
Gruß Scotty

Ähnliche fragen