Unicode-Sortierung

20/04/2011 - 16:54 von Stefan+Usenet | Report spam
Zum Sortieren mehrerer, voneinander getrennter Spalten mit strcmp() waren
in ASCII- bzw. ISO-8859-1 Zeiten chr(1) und chr(255) als Trennzeichen recht
praktisch:

$nachname . chr(1) . $vorname

sortiert mir beispielsweise Herrn Alfred Foobar hinter Herrn Gustav Foo, so
wie sich das gehoert.

Inzwischen gibt es Dinge wie strcoll() und UTF-8 (und das grosse Glueck,
dass das auf Linux dann auch tatsaechlich korrekt sortiert), und nun tut
wenigstens chr(255) naheliegenderweise nicht mehr das, wofuer es einmal
gedacht war (bei chr(1) rscheint es mir auch eher zufaellig zu sein).

Gibt es denn unter den zigtausend Codepunkten vielleicht auch einen, dessen
einzige Aufgabe lautet: sortiere Dich vor/nach allen anderen Zeichen?

Servus,
Stefan

http://kontaktinser.at/ - die kostenlose Kontaktboerse fuer Oesterreich
Offizieller Erstbesucher(TM) von mmeike

Stefan! Da steckt mehr drin, als man glaubt.
(Sloganizer)
 

Lesen sie die antworten

#1 Claus Reibenstein
20/04/2011 - 19:48 | Warnen spam
Stefan Froehlich schrieb:

Inzwischen gibt es Dinge wie strcoll() und UTF-8 (und das grosse Glueck,
dass das auf Linux dann auch tatsaechlich korrekt sortiert), und nun tut
wenigstens chr(255) naheliegenderweise nicht mehr das, wofuer es einmal
gedacht war (bei chr(1) rscheint es mir auch eher zufaellig zu sein).



UTF-8 enthàlt den kompletten ASCII-Zeichensatz einschließlich der
Steuerzeichen, also alle Codes von 0 bis 127 (dezimal). Sàmtliche
Zeichen, die darüber hinausgehen, werden ausschließlich mit Bytes von
128 bis 255 codiert.

chr(1) sollte also keine Probleme verursachen.

Gruß. Claus

Ähnliche fragen