diakritische Zeichen

07/11/2012 - 16:32 von Hermann Riemann | Report spam
Hat der string 'à', wenn à als als diakritisches Zeichen entstanden ist,
in Python 3 die Lànge 1 oder 2?

http://de.wikipedia.org/wiki/Unicod...he_Zeichen

Hermann
der beim Programm manchmal gerne die Spaltennummer hàtte.

http://www.Hermann-Riemann.de
 

Lesen sie die antworten

#1 Christian Heimes
07/11/2012 - 17:24 | Warnen spam
Am 07.11.2012 16:32, schrieb Hermann Riemann:
Hat der string 'à', wenn à als als diakritisches Zeichen entstanden ist,
in Python 3 die Lànge 1 oder 2?



Mit dem Module 'unicodedata' kann man Text zwischen NFC, NFKC, NFD und
NFKD-Form konvertierten:

len('à')






1
len(unicodedata.normalize('NFD', 'à'))






2


len('à'.encode("utf-8"))






2
len(unicodedata.normalize('NFD', 'à').encode("utf-8"))






3

NFC und NFK-Form sind auch ungleich:

unicodedata.normalize('NFD', 'à') == 'à'






False

Christian

Ähnliche fragen