Regex Mindenstens 2 leerzeichen als Feldtrennzeichen

24/04/2013 - 11:00 von Karl Teuschler | Report spam
Hallo,

Ich habe folgende Textzeile:

ÛßÜÛ ÛÛÛ Û artist ... : 5th Ward Boyz ÛÛÛ Û ÛÛÛÛ

Ich möchte gerne die Artistbezeichnung "5th Ward Boyz" heraus filtern.
Wie mache ich das am Besten?

Vielen Dank im voraus!

Karl
 

Lesen sie die antworten

#1 Juergen Ilse
24/04/2013 - 11:57 | Warnen spam
Hallo,

Karl Teuschler wrote:
Ich habe folgende Textzeile:

ÛßÜÛ ÛÛÛ Û artist ... : 5th Ward Boyz ÛÛÛ Û ÛÛÛÛ

Ich möchte gerne die Artistbezeichnung "5th Ward Boyz" heraus filtern.
Wie mache ich das am Besten?



Ich gehe mal davon aus, dass es sich bei der Aufgabe nicht darum handelt,
ausschliesslich in dieser Zeile den Titel herauszufiltern ...
Was kann denn genau hinter dem titel stehen? Sind das immer whitespace gefolgt
von "000"? Das wegschneiden des Teils vor dem ":" ist sehr einfach mit "cut"
zu machen:

cut -d: -f2-

sollte bei dem, was es von Standardeingabe erhaelt, alles bis zum ersten ":"
(einschliesslich des ":") wegschneiden. Nun gilt es noch, das Ende des Titels
oder den Beginn der Zeichen hinter dem Titel zu erkennen und den Teil hinter
dem Titel wegzuschneiden. Wenn dabei noch ueberfluessiger whitespace stehen
bleibt, ist das nicht so schlimm, denn fuehrender whitespace hinter dem Ende
des Titels laesst sich anschliessend trivial entsorgen, z.B. mittels

sed -e 's/^[:space:]*//' -e 's/[:space:]*$//'

Es gaebe aber auch noch andere Methoden. Das Problem (das man allerdings
nicht loesen kann, sofern du kein exaktes Kriterium angeben kannst, um den
Teil hinter dem titel zu identifizieren) ist, das wegschneiden der "non
whitespace" Zeichen hinter dem Titel.

Tschuess,
Juergen Ilse ()
Ein Domainname ist nur ein Name, nicht mehr und nicht weniger.
Wer mehr hineininterpretiert, hat das Domain-Name-System nicht
verstanden.

Ähnliche fragen