UTF-8 in Grundbuchstaben umsetzen

10/01/2008 - 09:55 von Christoph Krempe | Report spam
Hallo,

um eine Auszug aus einer bibliographischen Datenbank in UTF-8 lexikalisch
richtig zu sortieren erstelle ich eine Sortierdatei, in der
sortierrelevante Teile des Satzes einen sog. Sortierkopf bilden. In
diesem Teil des Datensatzes sollen alle UTF-8-Zeichen auf den
Grundbuchstaben bzw. die Grundbuchstabenkombination (ö->oe) reduziert
werden. So kann die Datei anschließend über ein UNIX-sort sortiert werden.

Meine Frage: Gibt es in perl dazu eine vorgefertigte Funktion àhnlich dem
decode?



Christoph
 

Lesen sie die antworten

#1 Frank Seitz
10/01/2008 - 10:14 | Warnen spam
Christoph Krempe wrote:

um eine Auszug aus einer bibliographischen Datenbank in UTF-8 lexikalisch
richtig zu sortieren erstelle ich eine Sortierdatei, in der
sortierrelevante Teile des Satzes einen sog. Sortierkopf bilden. In
diesem Teil des Datensatzes sollen alle UTF-8-Zeichen auf den
Grundbuchstaben bzw. die Grundbuchstabenkombination (ö->oe) reduziert
werden. So kann die Datei anschließend über ein UNIX-sort sortiert werden.

Meine Frage: Gibt es in perl dazu eine vorgefertigte Funktion àhnlich dem
decode?



$str =~ s/à/oe/g;
$str =~ s/ö/oe/g;
...

Grüße
Frank
Dipl.-Inform. Frank Seitz; http://www.fseitz.de/
Anwendungen für Ihr Internet und Intranet
Tel: 04103/180301; Fax: -02; Industriestr. 31, 22880 Wedel

Ähnliche fragen