SearARep

Programm zum
Suchen und Ersetzen in Dateien
mit eigener Scriptsprache

Wps RegEx

Kostenloses Programm zum lokalen Testen und Verwalten von Regulären Ausdrücken

Schriftzug Werner Perplies

Home

Adobe InDesign

SearARep

Wps RegEx

Corel Ventura Informationen und Skripte

Anwenderforum zur CA Visual Objects Programmierung

OCR

OCR, Standardprogramm

OCR, Automatische Textaufbereitung (Kurzfassung)

OCR, Automatische Textaufbereitung (ausführlich)

automatische Textaufbereitung

Datenkonvertierung

Crossmedia Publishing

Database-Publishing

zur Person

Werner Perplies
Gramanstr. 56
84518 Garching a. d. Alz
Telefon: 0049-8634-3291020
Telefax: 0049-8634-32910209

E-Mail:
werner.perplies@weepee.de

Umsatzsteuer-
Identifikationsnummer
gemäß § 27 a Umsatzsteuergesetz:
DE 173599862

Haftungshinweis:
Trotz sorgfältiger inhaltlicher Kontrolle übernehme ich keine Haftung für die Inhalte externer Links.

Für den Inhalt der verlinkten Seiten sind ausschließlich deren Betreiber verantwortlich.

Alle Warenbezeichnungen dienen lediglich der Beschreibung meiner Dienstleistung.

Sie werden ohne Gewährleistung der freien Verwendbarkeit benutzt und sind möglicherweise eingetragene Warenzeichen.

© 2002-2010 Werner Perplies, Garching


Stand:
Montag, den 31. Mai 2010
08:59 Uhr

[Sitemap]

OCR-Optical Character Recognation
Optisches Texteinlesen

OCR? - Das geht völlig problemlos!

Das machen wir mit dem zum Scanner mitgelieferten OCR-Programm schnell und preiswert selber.

OCR? - Bloß nicht!

Ich erkenne jeden eingelesenen Text auf den ersten Blick

Das ist doch alles viel zu fehleranfällig.

Diese zwei, doch sehr gegensätzlichen Aussagen, enthalten beide einen wahren Kern.

Ist dabei ein Dienstleistungsangebot zum optischen Texteinlesen nicht ein Eulen-nach-Athen-tragen-Angebot?

Ich möchte Ihnen an dieser Stelle allgemeine Hinweise zum optischen Texteinlesen, den damit verbundenen Problemen, Lösungsansätzen und meinen ganz persönlichen Weg erläutern.

Die dann folgenden Ausführungen zur automatische Textaufbereitung, Datenkonvertierung und Database-Publishing sollen Ihnen zeigen, dass die Arbeit mit dem Texteinlesen nicht getan ist.

OCR - völlig problemlos?

Richtig ist sicherlich, dass die heute gelieferten OCR-Programme ausgereift sind und qualitativ einen hohen Standard haben.

Tests in Fachzeitschriften zeigen, dass die Fehlerrate sehr gering ist.

Es werden einige Seiten Text eingelesen und oft finden sich nur ein oder zwei Fehler.

Zwei Fehler, auf, sagen wir mal, zehn Textseiten mit ca. 1.500 Zeichen bedeuten aber immerhin eine Fehlerquote von 0,133 %, ein Fehler alle fünf Seiten und bei einem Roman von fünfhundert Seiten 100 Fehler.

Und dies wäre schon eine optimistische Annahme, und diese Aussage gilt für eine gute Vorlage, d. h.:

Folgt daraus

OCR? - bloß nicht!

Ganz sicher nicht!

Wenn die Vorlage auch nur halbwegs akzeptabel ist, kann durch intelligente Nacharbeit ein fehlerhaft eingelesener Text so effektiv aufbereitet werden, dass sich dieser Weg jederzeit mit der preiswertesten Neuerfassung messen lassen kann.

OCR kann also nur der erste Schritt sein. Danach muss eine möglichst sorgfältige Bearbeitung erfolgen.

Es muss darum gehen, Fehler beim Einlesen möglichst zu vermeiden und anschließend die doch noch vorhandenen Fehler effektiv und kostengünstig zu beseitigen.

Dies kann weitgehend manuell durch die im OCR-Programm angebotenen Werkzeuge geschehen, oder auf dem fast automatischen Weg mit Hilfe meines Programmes zur Textkorrektur und Textaufbereitung.

Wann ist der Einsatz von OCR sinnvoll?

Diese Frage ist eigentlich sehr einfach zu beantworten:

OCR lohnt sich immer dann, wenn diese Lösung bei vergleichbarer Qualität preiswerter oder vielleicht auch nur schneller ist.

Weiter sollten Sie einen eventuellen Zusatznutzen in den Vergleich mit einbeziehen.

Als Vergleichsbasis bietet sich also zuerst einmal der Preis für eine Neuerfassung an. Da es sich hier um ein Dienstleistungsangebot handelt, sollten Sie dies bei der Preisbildung berücksichtigen.

Hieraus ergibt sich, dass eine gewisse Mindestmenge zur Verarbeitung vorliegen sollte. Dabei sollte sich der Begriff Menge nicht nur auf die Anzahl der Zeichen beziehen.

OCR und automatische Textaufbereitung erweisen sich oft dann als besonders konkurrenzfähig, wenn

OCR sollte immer dann in Erwägung gezogen werden, wenn

Die OCR-Verarbeitung eines Textes erfolgt in mehreren Verarbeitungsschritten.

Lesen Sie bitte hierzu:

Die Anwendung eines Standardprogrammes zur OCR-Verarbeitung.

Die kombinierte Verarbeitung von Standardprogramm und automatischer Textaufbereitung.


Anzeigen
Software (Adobe Photoshop Creative Suite 5):

Adobe Photoshop Creative Suite 5 deutsch Adobe Photoshop Creative Suite 5 deutsch

Adobe Photoshop Creative Suite 5 Upgrade deutsch Adobe Photoshop Creative Suite 5 Upgrade deutsch

Anzeigen
InDesign Bücher (Auswahl):

Hans Peter Schneeberger (Autor), Robert Feix (Autor) Adobe InDesign CS4: Das umfassende Handbuch (Gebundene Ausgabe) Hans Peter Schneeberger (Autor), Robert Feix (Autor) Adobe InDesign CS4: Das umfassende Handbuch (Gebundene Ausgabe)

Gerald Singelmann: Adobe InDesign CS3 - Das Nachschlagewerk für Fortgeschrittene: FAQ: Antworten auf Ihre häufigsten Probleme (Gebundene Ausgabe) Gerald Singelmann: Adobe InDesign CS3 - Das Nachschlagewerk für Fortgeschrittene: FAQ: Antworten auf Ihre häufigsten Probleme (Gebundene Ausgabe)

Galileo Press: Adobe InDesign CS4. Layouts entwerfen und gestalten. Das Video-Training auf DVD Galileo Press: Adobe InDesign CS4. Layouts entwerfen und gestalten. Das Video-Training auf DVD

Karsten Geisler (Autor) Einstieg in Adobe InDesign CS4: Werkzeuge und Funktionen verständlich erklärt (Broschiert) Karsten Geisler (Autor) Einstieg in Adobe InDesign CS4: Werkzeuge und Funktionen verständlich erklärt (Broschiert)

Andrea Forst: (Autor) Adobe InDesign CS4: Die Workshops für Einsteiger (Gebundene Ausgabe) Andrea Forst: (Autor) Adobe InDesign CS4: Die Workshops für Einsteiger (Gebundene Ausgabe)

Isolde Kommer (Autor), Tilly Mersin (Autor): InDesign CS4 - Professionelles Publishing: für Print und Web (Gebundene Ausgabe) Isolde Kommer (Autor), Tilly Mersin (Autor): InDesign CS4 - Professionelles Publishing: für Print und Web (Gebundene Ausgabe)

Winfried Seimert (Autor): Adobe InDesign CS4. Das Einsteigerseminar (Broschiert) Winfried Seimert (Autor): Adobe InDesign CS4. Das Einsteigerseminar (Broschiert)

Katharina Frerichs (Autor), Marc Oliver Thoma (Autor), Astrid Warkus (Autor): Das grosse Buch Indesign CS4: im Praxiseinsatz (Gebundene Ausgabe) Katharina Frerichs (Autor), Marc Oliver Thoma (Autor), Astrid Warkus (Autor): Das grosse Buch Indesign CS4: im Praxiseinsatz (Gebundene Ausgabe)

Christoph Grüder: InDesign CS4 - Praxis für Profis: Neue Wege, Methoden und Workflows Christoph Grüder: InDesign CS4 - Praxis für Profis: Neue Wege, Methoden und Workflows

Anzeigen
Adobe Photoshop CS5 (Auswahl):

Sibylle Mühlke: Adobe Photoshop CS5: Das Praxisbuch zum Lernen und Nachschlagen (Galileo Design) Sibylle Mühlke: Adobe Photoshop CS5: Das Praxisbuch zum Lernen und Nachschlagen (Galileo Design)

Markus Wäger: Adobe Photoshop CS5: Schritt für Schritt zum Profi (Galileo Design) Markus Wäger: Adobe Photoshop CS5: Schritt für Schritt zum Profi (Galileo Design)

Robert Klaßen: Der professionelle Einstieg (Galileo Design) (Taschenbuch) Robert Klaßen: Der professionelle Einstieg (Galileo Design) (Taschenbuch)