Website parsen

23/11/2009 - 14:25 von Thomas Kehl | Report spam
Hallo zusammen.

Ich suche einen Ansatz um folgendes zu bewerkstelligen:

Ich habe eine Webseite. Nun hat es auf dieser pro Zeile einen Namen
und einen Link. Ich sollte nun pro Zeile den Namen auslesen und dann
über den Link (d.h. auf der Website die über den Link erreichbar ist)
eine weitere Information dazu auslesen und das Ganze in eine Textdatei
abspeichern. Kann mir jemand einen Tipp geben, wie ich so was
bewerkstelligen könnte? - Vielen Dank!

Herzliche Grüsse
Thomas
 

Lesen sie die antworten

#1 Andreas Peterschofsky
23/11/2009 - 14:54 | Warnen spam
Thomas Kehl wrote:
Hallo zusammen.

Ich suche einen Ansatz um folgendes zu bewerkstelligen:

Ich habe eine Webseite. Nun hat es auf dieser pro Zeile einen Namen
und einen Link. Ich sollte nun pro Zeile den Namen auslesen und dann
über den Link (d.h. auf der Website die über den Link erreichbar ist)
eine weitere Information dazu auslesen und das Ganze in eine Textdatei
abspeichern. Kann mir jemand einen Tipp geben, wie ich so was
bewerkstelligen könnte? - Vielen Dank!

Herzliche Grüsse
Thomas




Naja eigentlich via HTTP die Seite abholen.
In einen Stream, String oder Datei speichern und mit einem regulàren
Ausdruck parsen. - sodaß halt nur Zeilen mit Links übrigbleiben also
evtl. "[.]*http://[.]*" oder so àhnlich...
und dann wieder alle Seiten mit HTTP abholen.

lg
Andreas

Ähnliche fragen