RegEx

02/11/2009 - 21:59 von Tamara Mikes | Report spam
Salü alle zusammen

Ich habe ein String der schaut wie folgt aus:

href=(["'](?<url>.*?)["']|(?<url2>\S*?)\s)

Dann habe ich einen Quelltext:

Das ist ein <a href="local.htm">Link</a> auf lokale Seite mit Gànsefüsschen.
Das ist ein <a href=AuchLocal.htm>Link</a> auf lokale Seite ohne
Gànsefüsschen.
Ein <a href="http://www.daomain.ch">Link</a> auf Domain
Das ist ein <a href="Mein Produkt.htm">Link mit Leerzeichen</a> Leerzeichen.


Wenn ich im Tool Expresso (http://www.nettz.de/Service/regexp/index.cgi)
diesen String eingebe, bekomme ich wie ich es erwarte folgendes Resultat:

href="local.htm"
href=AuchLocal.htm>Link</a>
href="http://www.daomain.ch"
href="local.htm"

Wenn ich jedoch auf der Seite http://www.nettz.de/Service/regexp/index.cgi
das prüfe, bekomme ich ein Fehler in der Auswertung meines RegExp: Sequence
(?.*?)["']|(?\S*?)\s)/

Ebenso erhalte ich in C# eine falsche Antwort, nàmlich immer bis und mit
</a>.

Eigentlich würde ich als Ziel folgende Ausgabe haben wollen:

local.htm
AuchLocal.htm
http://www.daomain.ch
local.htm

Also immer nur der Domainname ohne was drum herum.
Was mache ich falsch?

Vielen Dank für Hinweise
Gruss Tamara
 

Lesen sie die antworten

#1 Werner Perplies
03/11/2009 - 06:25 | Warnen spam
Hallo Tamara,

Am Mon, 2 Nov 2009 21:59:38 +0100 schrieb Tamara Mikes:

Salü alle zusammen

Ich habe ein String der schaut wie folgt aus:

href=(["'](?<url>.*?)["']|(?<url2>\S*?)\s)

Dann habe ich einen Quelltext:

Das ist ein <a href="local.htm">Link</a> auf lokale Seite mit Gànsefüsschen.
Das ist ein <a href=AuchLocal.htm>Link</a> auf lokale Seite ohne
Gànsefüsschen.
Ein <a href="http://www.daomain.ch">Link</a> auf Domain
Das ist ein <a href="Mein Produkt.htm">Link mit Leerzeichen</a> Leerzeichen.


Wenn ich im Tool Expresso (http://www.nettz.de/Service/regexp/index.cgi)
diesen String eingebe, bekomme ich wie ich es erwarte folgendes Resultat:



Ohne auf Deinen Ausdruck nàher einzugehen, ich bekomme mit meinem Tool (C#)
auch diese Lösung.

href="local.htm"
href=AuchLocal.htm>Link</a> <
href="http://www.daomain.ch"
href="local.htm"




Vielleicht liegt's an den RegEx-Optionen?
-> IgnoreWhitespace?

...


local.htm
AuchLocal.htm
http://www.daomain.ch
local.htm

Also immer nur der Domainname ohne was drum herum.
Was mache ich falsch?

Vielen Dank für Hinweise
Gruss Tamara




Werner
Regulàre Ausdrücke testen?
http://www.weepee.de/de/wps_regex/wps_regex.html
www.weepee.eu

Ähnliche fragen