UTF-8 String "falsch" kodieren

05/09/2007 - 00:08 von Alexander Skwar | Report spam
Hallo.

Ich suche nach einer möglichst einfachen Art und Weise, wie
ich eine Zeichenkette "falsch" kodieren kann. Konkret möchte
ich gerne das Wort "Ausflüge" so kodieren, das schlussendlich
"Ausfl%C3%83%C2%BCge" heraus kommt, also "Ausflà¼ge". Ich glaube,
ich suche nur nach einer Möglichket, wie ich "Ausflüge" zu
"Ausflà¼ge" umwandeln könnte, denn "Ausflà¼ge" kann ich dann
ja einfach mit urllib.quote() zu "Ausfl%C3%83%C2%BCge" umwandeln.

Aber wie bekomme ich erstmal die Zeichenkette "falsch" interpretiert?

Vielen Dank,

Alexander Skwar
Professor: Good night, little angels.
 

Lesen sie die antworten

#1 Wolfgang Fellger
05/09/2007 - 00:20 | Warnen spam
Alexander Skwar schrieb:

Ich suche nach einer möglichst einfachen Art und Weise, wie
ich eine Zeichenkette "falsch" kodieren kann.



Du möchtest UTF-8 interpretiert als ISO-8859-1 und den resultierenden String
wieder kodiert als UTF-8. Also:

u"Ausflüge".encode('utf-8').decode('iso-8859-1').encode('utf-8')

Wolfgang Fellger

Ähnliche fragen