Regex

14/12/2007 - 00:55 von Roland | Report spam
Hallo

Ich versuche aus einem String Url's rauszufiltern. Dafür verwende ich
folgende Abfrage...

"href=\"[a-zA-z./:&\\d_-/?&=]+\""

Nun habe ich das Problem, dass Url's welche ein = oder ein ? beinhaltet
nicht rausgefilter werden. Ich habe die Abfrage folgend angepasst...

href=\"[a-zA-z./:&\\d_-/?&=\?\=]+\"

Leider ohne Erfolg. Kann mir da jemand helfen, damit auch diese Url's
rausgefiltert werden?

Danke und Gruss
Roland
 

Lesen sie die antworten

#1 Herfried K. Wagner [MVP]
14/12/2007 - 07:51 | Warnen spam
"Roland" schrieb:
Ich versuche aus einem String Url's rauszufiltern. Dafür verwende ich
folgende Abfrage...

"href=\"[a-zA-z./:&\\d_-/?&=]+\""

Nun habe ich das Problem, dass Url's welche ein = oder ein ? beinhaltet
nicht rausgefilter werden. Ich habe die Abfrage folgend angepasst...

href=\"[a-zA-z./:&\\d_-/?&=\?\=]+\"

Leider ohne Erfolg. Kann mir da jemand helfen, damit auch diese Url's
rausgefiltert werden?



Da es mir sehr nach HTML-Code aussieht, wàre ein echter HTML-Parser einer
Lösung mit regulàren Ausdrücken vorzuziehen (Stichwörter: MSHTML, HTML
Agility Pack, SgmlReader etc.).

M S Herfried K. Wagner
M V P <URL:http://dotnet.mvps.org/>
V B <URL:http://dotnet.mvps.org/dotnet/faqs/>

Ähnliche fragen