Forums Neueste Beiträge
 

Reguläre Ausdrücke und Unicode

12/05/2008 - 19:52 von Albert Hermeling | Report spam
Guten Abend,

das ein Unicode-Objekt nicht gleich ein utf8-String ist das weiß ich. Aber
sind folgende Beispiele àquivalent zu einander?

Beispiel 1; re.match[findall, sub, usw.](u"pattern", Unicode-Objekt, re.U)
Beispiel 2; re.match[findall, sub, usw.](u"pattern", UTF8-String, re.U)

Wenn die beiden Ausdrücke àquivalent sind, dann müsste doch bei 1 eine
Konvertierung in ein UTF8-String stattfinden, oder habe ich da was nicht
verstanden?

Mit freundlichen Grüßen

Albert
 

Lesen sie die antworten

#1 Marc Christiansen
12/05/2008 - 20:27 | Warnen spam
Albert Hermeling meinte:
das ein Unicode-Objekt nicht gleich ein utf8-String ist das weiß ich. Aber
sind folgende Beispiele àquivalent zu einander?

Beispiel 1; re.match[findall, sub, usw.](u"pattern", Unicode-Objekt, re.U)
Beispiel 2; re.match[findall, sub, usw.](u"pattern", UTF8-String, re.U)



Wie ein kurzer Test (`pattern`==à, `Unicode-Objekt`==u"bàr",
`UTF8-String`==u"bàr".encode("utf8")) ergab, nein.

HTH, Marc

Ähnliche fragen