Seiten mit best. Inhalt aus PDF extrahieren

15/02/2010 - 11:35 von Sven Schmieder | Report spam
Guten Morgen,

aus einer Tageszeitung im PDF-Format möchte ich nur den Lokalteil
extrahieren und wieder als PDF zusammenfügen. Leider hat der Lokalteil keine
festen Seiten, manchmal Seite 4+8, manchmal 5+6 usw..
Was ich suche, müsste also nach dem Wort "Lokalteil" und "Lokalsport" in der
Überschrift der Seite suchen und diese Seiten dann extrahieren. Aber als
PDF, nicht als Text. Das Zusammenfügen schaffe ich dann allein, denke ich.

Gibts da was für die Konsole?

Gruß
 

Lesen sie die antworten

#1 Heiko Schlenker
15/02/2010 - 13:30 | Warnen spam
* Sven Schmieder schrieb:

aus einer Tageszeitung im PDF-Format möchte ich nur den Lokalteil
extrahieren und wieder als PDF zusammenfügen.


[...]
Gibts da was für die Konsole?



Beispielsweise pdftk <http://de.wikipedia.org/wiki/IText#...rungen>
und pdfnup.

Übrigens, die Newsgroup de.comp.text.pdf existiert. ;-)

Gruß, Heiko
Neu im Usenet? -> http://www.kirchwitz.de/~amk/dni/
Linux-Anfànger(in)? -> http://www.dcoul.de/infos/
Fragen zu KDE/GNOME? -> de.comp.os.unix.apps.{kde,gnome}
Passende Newsgroup gesucht? -> http://groups.google.com/search?as_umsgid=

Ähnliche fragen