Mobilen Scanner in Bibliotheken

06/10/2010 - 22:41 von Ralf . K u s m i e r z | Report spam
X-No-Archive: Yes

begin Thread


Moin!

Ich hàtte da gern mal folgendes Problem:

Dieser EDV-Krempel ist ja nun historisch gerade mal ein halbes
Jahrhundert alt, und an die davor ggf. vorhandenen
Hollerithkartenkisten kommt man üblicherweise nicht ran (meistens auch
entsorgt oder sonstwie verschüttgegangen), also hat man sich für
davorliegende Zeiten mit toten Bàumen zu beschàftigen.

Die werden in "Bibliotheken" genannten Lagern aufbewahrt, und solche,
bei Behörden angesiedelt, werde ich in der nàchsten Zeit abzuklappern
haben, um Daten zu sammeln. Diese haben sogar eine technische
Infrastruktur, bestehend aus: "Da steht der Kopierer, eine Kopie
kostet xx Cents...".

Was nun ein bißchen blöd ist, denn diese nutzend hat man dann wieder
tote Bàume zum Mitnehmen in geringfügig verringerter Qualitàt, und
potentiell sind die dann mit einer gràßlichen Tàtigkeit namens
"Abtippen" verknüpft. Und das geht gar nicht.

Also muß eine alternative Technologie namens "Scannen" her. Da stelle
ich mir folgende Features vor: $Geràte wiegen zusammen bis ca. 10 kg,
man zückt sie elegant aus der Tragetasche, und dann knippst man damit
flott und freundlich (mindestens mit Kopierergeschwindigkeit) Seite
für Seite in sehr ordentlicher Qualitàt (ca. 600 dpi) ab und speichert
die weg, und daheim wird die Ausbeute dann durch eine schnelle,
konfortable und zuverlàssige OCR geschoben und ein wenig
nachbearbeitet, und fertig ist die Arbeit der Abteilung
"Information-Wiederbeschaffung" (es geht um Statistik-Tabellen
amtlicher Statistiken in der üblichen Erscheinungsform, die in
Datenbanken hüpfen wollen).

Ja, was kann man denn dafür so verwenden, ggf. auch noch in
"bezahlbar" (notfalls ausleihbar)?

Die möglicherweise schnellere Alternative zu Scannen wàre evtl.
Abfotographieren, aber wenn der Chip 2100 x 2800 Pixel (als
Hausnummer) groß ist, dann sind das bei 600 dpi knapp 9 x 12 cm große
Bildausschnitte, also pro DIN-A4-Seite ungefàhr 6-8 Einzelaufnahmen,
die dann auch noch zusammengesetzt werden wollen, und das ist auch
nicht so der Hit. (Bei 300 dpi kriegt man evtl. jeweils eine Tabelle
auf eine Aufnahme, eine zweite Aufnahme mit 150 dpi dürfte dann die
komplette Seite mit Text humanlesbar erfassen, aber 300 dpi sind für
OCR oft schon grenzwertig.)

Was raten mir die Fachleute, auch hinsichtlich OCR? (Es können an die
zehntausend Kopien werden, und sowohl Zeit als auch Geld sind knapp.)


Gruß aus Bremen
Ralf
R60: Substantive werden groß geschrieben. Grammatische Schreibweisen:
adressiert Appell asynchron Atmosphàre Autor bißchen Ellipse Emission
gesamt hàltst Immission interessiert korreliert korrigiert Laie
nàmlich offiziell parallel reell Satellit Standard Stegreif voraus
 

Lesen sie die antworten

#1 Hergen Lehmann
06/10/2010 - 23:17 | Warnen spam
Am 06.10.2010 22:41, schrieb Ralf . K u s m i e r z:

Also muß eine alternative Technologie namens "Scannen" her. Da stelle
ich mir folgende Features vor: $Geràte wiegen zusammen bis ca. 10 kg,



Notebook und USB-Scanner.

man zückt sie elegant aus der Tragetasche, und dann knippst man damit
flott und freundlich (mindestens mit Kopierergeschwindigkeit) Seite



Elegant und flott ist o.g. Ansatz allerdings weniger.

für Seite in sehr ordentlicher Qualitàt (ca. 600 dpi) ab und speichert



600dpi sind maßlos übertrieben und mit Zielrichtung OCR unter Umstànden
sogar schàdlich, weil jeder Krümel abgebildet wird und hinterher die
Erkennung erschwert.
Für Text reichen 150dpi völlig.

die weg, und daheim wird die Ausbeute dann durch eine schnelle,
konfortable und zuverlàssige OCR geschoben und ein wenig
nachbearbeitet, und fertig ist die Arbeit der Abteilung
"Information-Wiederbeschaffung" (es geht um Statistik-Tabellen



Die Anforderungen komfortabel und zuverlàssig passen bei OCR nicht
unbedingt zusammen, vor allem, wenn es sich nicht um Fließtext handelt.
Ich vermute mal, es wird zweckmàssig sein, die Daten als Grafik zu
archivieren, und nur bei Bedarf durch eine OCR zu jagen und manuell
nachzubearbeiten.

Was raten mir die Fachleute, auch hinsichtlich OCR? (Es können an die
zehntausend Kopien werden, und sowohl Zeit als auch Geld sind knapp.)



Leih' die Vorlagen aus und geh damit in den Copyshop oder zu einer
befreundeten Firma, die einen modernen Digitalkopierer hat. Die Dinger
können heute fast immer die Scans in PDF/TIFF/o.à. ablegen, statt sie
sofort auszudrucken. Komfortabler als ein SOHO-Scanner ist das auf jeden
Fall.

OCR, die auch mit Tabellen klarkommt - keine Ahnung.

Hergen

Ähnliche fragen