OCR bei schon gescannten Dokumenten

04/09/2009 - 12:41 von Ralf Wenzel | Report spam
Moin moin,

ich will einen ganzen Stapel Dokumente einscannen und eine OCR
drüberlaufen lassen, um sie platzsparend zu archivieren (und die
Originale wegzuwerfen). Das Scanergebnis wàren PDFs. Als Datenquelle
würden gedruckte Dokumente (Rechnungen, Anschreiben, etc.), Ziel ist
es, die Dateien so zurückzubekommen, dass die Volltextsuche von
Spotlight die Scans findet.

Wichtig ist halt, dass nicht BEIM Scannen, sondern im Nachgang die OCR
laufen soll, weil eine Menge Seiten en bloc gescannt werden sollen
(Scanner mit Duplexeinrichtung und Einzug, Kyocera DC2051)

Was bietet sich da an? Gegeben wàre ein Schneeleopard, auf dem auch
Windows installiert ist (via Parallels). Kosten darf es ruhig was, ich
will aber kein Profipaket für 1000 EUR kaufen. Nennen wir es
"ambitionierte Privatanwendung".


Ralf *für jeden tipp dankbar
 

Lesen sie die antworten

#1 Martin Trautmann
04/09/2009 - 12:48 | Warnen spam
On Fri, 4 Sep 2009 03:41:13 -0700 (PDT), Ralf Wenzel wrote:
Moin moin,

ich will einen ganzen Stapel Dokumente einscannen und eine OCR
drüberlaufen lassen, um sie platzsparend zu archivieren (und die
Originale wegzuwerfen). Das Scanergebnis wàren PDFs. Als Datenquelle
würden gedruckte Dokumente (Rechnungen, Anschreiben, etc.), Ziel ist
es, die Dateien so zurückzubekommen, dass die Volltextsuche von
Spotlight die Scans findet.

Wichtig ist halt, dass nicht BEIM Scannen, sondern im Nachgang die OCR
laufen soll, weil eine Menge Seiten en bloc gescannt werden sollen
(Scanner mit Duplexeinrichtung und Einzug, Kyocera DC2051)

Was bietet sich da an? Gegeben wàre ein Schneeleopard, auf dem auch
Windows installiert ist (via Parallels). Kosten darf es ruhig was, ich
will aber kein Profipaket für 1000 EUR kaufen. Nennen wir es
"ambitionierte Privatanwendung".



Gibt es dafuer keine Dienstleister?

Sowas waere natuerlich optimal zu zentralisieren und automatisieren.
Probe-OCR: Erste Seite kostenlos, gleicher Inhalt in unterschiedlichen
Scan-Varianten ebenfalls kostenlos, bis fuenf Seiten ueber Anmeldung
kostenlos,

dann je Seite einen Dollar oder Euro faende ich auch noch ok - mit
zunehmender Progression, die bei 1000 Seiten nur noch 10 Cents kostet.

Mit zunehmender Akzeptanz kann das Preisgefuege auch auf ein Zehntel
zusammenschnurren und noch immer fuer die Kunden interessant sein.

Schoenen Gruss
Martin

Ähnliche fragen