Text aus HTML extrahieren

05/05/2015 - 15:59 von Arno Schuh | Report spam
Hi,

dunkel kann ich mich noch erinnern, dass ich unter DOS einmal ein Tool
hatte, womit man reinen Text aus einer HTML-Datei extrahieren konnte.
Vielleicht kann mir hier ja einer auf die Sprünge helfen.

Freundliche Grüße

Arno
 

Lesen sie die antworten

#1 Stefan Reuther
05/05/2015 - 18:37 | Warnen spam
Arno Schuh wrote:
dunkel kann ich mich noch erinnern, dass ich unter DOS einmal ein Tool
hatte, womit man reinen Text aus einer HTML-Datei extrahieren konnte.
Vielleicht kann mir hier ja einer auf die Sprünge helfen.



Welches Tool du hast, weiß ich natürlich nicht, aber mein erster
Anlaufpunkt für DOS-Software (neben "selbst in Perl was hacken") wàre
Garbo. Einer der ersten Suchtreffer:
ftp://ftp.lyx.org/pub/pc/garbo/pc/hypertext/
Hierin
ftp://ftp.lyx.org/pub/pc/garbo/pc/h...tmlcon.zip
schaut zumindest der Überschrift nach passend aus.
HTMLCon Version 2.2 (September, 1995)
An HTM(L) to ASCII Document Converter
...ansonsten vielleicht eins der anderen Tools dort.


Stefan

Ähnliche fragen