HP Photosmart Premium C309g - Texterkennung verschwunden oder nie da gewesen

24/05/2010 - 01:59 von Daniela Duerbeck | Report spam
Hi!

Mein Veter besitzt diesen Drucker. Nun mag der irgendwie keine Texte
erkennen. Als Scanziel gibt es scannen an Email, an Bild, an Datei (dort
entstehen aber dann auch nur Bilder) oder an pdf.
Laut Bedienungsanleitung müßte er aber Texte erkennen können und z.B.
als .rtf oder eben .txt abspeichern können.
Neue Scanziele hinzufügen konnte ich nicht, Neuinstallation des Treibers
brachte auch nix.

Wie bringt man das Teil dazu, Texte zu erkennen?

Viele Grüße von Dani
 

Lesen sie die antworten

#1 Jens Fittig
24/05/2010 - 10:13 | Warnen spam
Daniela Duerbeck schrieb:

Hi!

Mein Veter besitzt diesen Drucker. Nun mag der irgendwie keine Texte
erkennen. Als Scanziel gibt es scannen an Email, an Bild, an Datei (dort
entstehen aber dann auch nur Bilder) oder an pdf.
Laut Bedienungsanleitung müßte er aber Texte erkennen können und z.B.
als .rtf oder eben .txt abspeichern können.
Neue Scanziele hinzufügen konnte ich nicht, Neuinstallation des Treibers
brachte auch nix.

Wie bringt man das Teil dazu, Texte zu erkennen?



Gar nicht. Ein Scanner kann nur Pixel erkennen. Was du meinst, ist OCR
(Wikipedia). Das gibt es als separate Software vom Druckerhersteller
mitgeliefert oder von separaten Lieferanten.

So eine OCR-Software versucht(!) in Pixeln nach bestimmten Regeln Text
zu erkennen. Das klappt aber nur sehr bedingt. Nàmlich von glatt
geschriebenen Schreibmaschinenseiten, gedruckten Büchern etc.

Also Fliesstext ohne besondere Umbrüche.

Eventuell auch aus Zeitungen. Die sind aber vom Druck meist zu
schlecht und die Fehlerrate entsprechend hoch.

Alles was Bilder oder gar Farbhintergründe hat ist so gut wie nicht
sauber als Text zu erkennen. Bzw. mit einer so hohen Fehlerrate, dass
Abschreiben schneller geht als den ganzen Müll zu korrigieren.

Versuche mal z.B. einen Lieferschein mit all den üblichen
Informationen im Kopf und Fussteil sowie den Lieferinfos zu scannen
und als Text nach Word zu bringen. Bis das auch nur einigermaßen so
aussieht wie es aussehen soll bis du alt und grau. Da geht neu
gestalten und schreiben 10 mal schneller.

Große Probleme gibt es mit Buchstaben und Ziffern wie:

oO0 1li mrn QGÖ und vielen anderen für einen Scanner àhnlich
aussehenden Zeichen. Sowie mit der Positionierung von Texten die nicht
im Fliesstext sind. Also z.B. tabellenartig strukturierte Texte.
Womöglich noch mit Liniengerüsten

Die Hersteller geben für Fliesstext AFAIR eine Fehlerrate von 2-3
Prozent an. Bei optimaler Vorlage. Das wàren dann 1 bis 2 faksche
Zeichen pro DINA4-Zeile. Wenn die Vorlage optimal ist.

Ich mach(t)e das mit OCR schon seit CP/M-Zeiten bzw. seit dem ersten
PC. Damals war ein Scanner noch ein Standgeràt so groß wie ein
Kühlschrank. Es gibt nur wirklich wenige Fàlle, wo es einen Sinn
hat(te). Eine gute Schreibkraft schreibt eine A4-Seite schneller neu
als 200 und mehr Einzelfehler zu beheben. Ok - làsst sich teilweise
hete ja auch per Software machen (S&R).

Früher habe ich z.B. oft Bedienungsanleitungen gescannt, die markanten
Teile rausgeschnitten und geOCRt. Dann als "Memo" in entsprechender
Dateiablage gespeichert. Nachdem heute ja fast jede Anleitung auch als
PDF im Netzt zu finden ist, extrahiere ich mir die Sachen daraus.

Oder speichere die Anleitung bzw. die relevanten Teile als Grafik.
Festplattenplatz ist heute ja kein Thema mehr. Im Gegensatz zu früher,
wo mit dem Scan von 50 Seiten eine Festplatte voll war.

Schau also mal bei der installierten Software nach einem OCR-Programm.
Bei mir ist das im HP-Solution-Center unter "Dokument-Scannen"
Die Software ist gar nicht so schlecht wie der Rest von HP <g>

Aber bekomme keinen Schreck über das was rauskommt.

Ähnliche fragen