OCR-PDF mit hinterlegtem Text

02/10/2012 - 09:08 von Klaus Gawol | Report spam
Mit Texterkennungsprogrammen wie FineReader oder Omnipage kann man Text aus
Buchseiten im JPEG-Format erkennen und dann PDFs erstellen lassen, in denen
der erkannte Text "hinter" dem spàter angezeigten Bild gespeichert ist, so
daß die PDFs dadurch durchsuchbar sind.

Kann mir jemand erklàren, wie diese Zusammenfassung von Bild und Text in
eine PDF-Datei technisch gemacht wird?

Und kann man das auch ohne OCR-Programm aus vorhandenem Bild und Text selbst
machen, d.h. daß man keine PDF-Datei aus dem Text erstellt, sondern das Bild
angezeigt wird, der "dahinterliegende" Text aber durchsucht werden kann?

Gruß Klaus
 

Lesen sie die antworten

#1 Thomas Krenzel
05/10/2012 - 21:42 | Warnen spam
Am 02.10.2012 09:08, schrieb Klaus Gawol:

Und kann man das auch ohne OCR-Programm aus vorhandenem Bild und Text
selbst
machen, d.h. daß man keine PDF-Datei aus dem Text erstellt, sondern das
Bild
angezeigt wird, der "dahinterliegende" Text aber durchsucht werden kann?



Hallo,

jau das geht, im Grunde genau so. Text schreiben, Bild darüber, dann auf
keinen Fall die schriften rendern lassen sondern dafür sorgen, das
Schriften mit eingebettet werden bzw. auf dem Zielsystem vorhanden sind.

Dann sollte das mit einem PDF-Reader durchsucht werden können. Kannste
ja mal mit OpenOffice oder Word versuchen.

In der OCR-Software dient das ja der Qualitàtssicherung, das man nochmal
das OCR-Ergebnis am Original prüfen kann.

Warum sollte man das denn mit einer selbst erstellten PDF-datei machen?
Da ist der Text eben als Text drin. Da brauchts kein Bild.

Oder?

Thomas

Ähnliche fragen