SearARep

Programm zum
Suchen und Ersetzen in Dateien
mit eigener Scriptsprache

Wps RegEx

Kostenloses Programm zum lokalen Testen und Verwalten von Regulären Ausdrücken

Schriftzug Werner Perplies

Home

Adobe InDesign

SearARep

Wps RegEx

Corel Ventura Informationen und Skripte

Anwenderforum zur CA Visual Objects Programmierung

OCR

OCR, Standardprogramm

OCR, Automatische Textaufbereitung (Kurzfassung)

OCR, Automatische Textaufbereitung (ausführlich)

automatische Textaufbereitung

Datenkonvertierung

Crossmedia Publishing

Database-Publishing

zur Person

Werner Perplies
Gramanstr. 56
84518 Garching a. d. Alz
Telefon: 0049-8634-3291020
Telefax: 0049-8634-32910209

E-Mail:
werner.perplies@weepee.de

Umsatzsteuer-
Identifikationsnummer
gemäß § 27 a Umsatzsteuergesetz:
DE 173599862

Haftungshinweis:
Trotz sorgfältiger inhaltlicher Kontrolle übernehme ich keine Haftung für die Inhalte externer Links.

Für den Inhalt der verlinkten Seiten sind ausschließlich deren Betreiber verantwortlich.

Alle Warenbezeichnungen dienen lediglich der Beschreibung meiner Dienstleistung.

Sie werden ohne Gewährleistung der freien Verwendbarkeit benutzt und sind möglicherweise eingetragene Warenzeichen.

© 2002-2010 Werner Perplies, Garching


Stand:
Montag, den 31. Mai 2010
08:59 Uhr

[Sitemap]

Texteinlesen mit einem OCR-Standardprogramm

Der typische Arbeitsablauf besteht aus den Schritten:

  1. Einscannen einer oder mehrerer Testseiten. Dabei sollten Helligkeit und Kontrast so angepasst werden, dass der Text auf dem eingescannten Bild gut lesbar ist.

  2. Starten Sie dann den Erkennungsvorgang für diese Seiten.
    Prüfen Sie die Anzahl der Fehler.

    Versuchen Sie das Ergebnis durch Veränderung von Helligkeit, Kontrast und dem Einsatz eines eventuell vorhandenen Verschmutzungskorrekturwerkzeuges zu verbessern.

    Achten Sie besonders auf die richtige Erkennung von Satzzeichen, Akzenten und Umlauten.

  3. Sollte das Ergebnis auch jetzt noch nicht akzeptabel sein, können Sie bei einigen Programmen den Erkennungsvorgang trainieren.

  4. Scannen Sie jetzt alle Seiten ein. Je nach Scanner, Programm und Vorlage sind hierfür unterschiedliche Verarbeitungsschritte notwendig.

  5. Prüfen Sie nach, ob alle Seiten vollständig und in der richtigen Reihenfolge eingescannt wurden.

  6. Markieren Sie jetzt die Erkennungsbereiche und löschen Sie nicht benötigte Bereiche (z. B. Kopf−, Fuß− und Randbereiche).

    Oder überlassen Sie diesen Vorgang dem OCR−Programm. Prüfen Sie in diesem Fall, ob die automatische Erkennung korrekt ist. Lassen Sie jetzt den Erkennungsvorgang ablaufen.

  7. Das OCR-Prgramm wird Ihnen einen Text liefern, der nach meiner Erfahrung verschiedene Markierungen enthält:
    • nicht erkannte Buchstaben und Buchstabenkombinationen
    • unsicher erkannte Buchstaben und Buchstabenkombinationen
    • unbekannte Wörter

  8. Wenn möglich, sollten Sie den Text vor Beginn der Korrektur sichern.

  9. Prüfen Sie den erhaltenen Text und korrigrieren Sie die Fehler. Denken Sie dabei daran, Trennungen durch Trennvorschläge zu ersetzen oder sie zu löschen, wenn Sie den Text später in einem anderen Format wieder ausgeben wollen.
    • Achten Sie besonders auf Satzzeichen, Akzente, Umlaute, Gedankenstriche, Klammern und Anführungszeichen.
    • Prüfen Sie den erhaltenen Text auf Vollständigkeit.
    • Setzen Sie eventuell vorhandene Suchen- und Ersetzenfunktionen vorsichtig ein. Eine fehlerhafte, nicht sofort erkannte automatische Ersetzung ist oft nur durch mühsame manuelle Arbeit wieder rückgängig zu machen.
    • Sie können diesen Korrekturvorgang auch mit Ihrem Textverarbeitungsprogramm erledigen, verzichten dabei aber in der Regel auf die synchrone Darstellung der Bilddaten.

  10. Legen Sie den fertig korrigierten Text in dem gewünschten Ausgabeformat ab.
  11. Lesen Sie die erhaltene Datei in Ihrem Zielprogramm ein, gestalten und strukturieren Sie sie.
  12. Anschließend sollten Sie das erhaltene Produkt unbedingt noch einmal Korrektur lesen lassen.

Sie werden bei der Nachbearbeitung in vielen Fällen feststellen, dass

Viele Anwender kommen deshalb zum Ergebnis, dass der Gesamtaufwand für die Datenerfassung mit OCR-Programmen so aufwändig ist, dass die Neuerfassung dem OCR-Vorgang vorzuziehen ist.

Ich dagegen bin der Meinung, dass eine intelligentere Nachbearbeitung der Daten den Aufwand so verringert, dass die OCR-Verarbeitung absolut konkurrenzfähig ist.

Es geht also darum:

Lesen Sie hierzu bitte auch:

OCR mit automatischer Textaufbereitung:

Kurzfassung

Ausführliche Beschreibung


Anzeigen
Software (Adobe Photoshop Creative Suite 5):

Adobe Photoshop Creative Suite 5 deutsch Adobe Photoshop Creative Suite 5 deutsch

Adobe Photoshop Creative Suite 5 Upgrade deutsch Adobe Photoshop Creative Suite 5 Upgrade deutsch

Anzeigen
InDesign Bücher (Auswahl):

Hans Peter Schneeberger (Autor), Robert Feix (Autor) Adobe InDesign CS4: Das umfassende Handbuch (Gebundene Ausgabe) Hans Peter Schneeberger (Autor), Robert Feix (Autor) Adobe InDesign CS4: Das umfassende Handbuch (Gebundene Ausgabe)

Gerald Singelmann: Adobe InDesign CS3 - Das Nachschlagewerk für Fortgeschrittene: FAQ: Antworten auf Ihre häufigsten Probleme (Gebundene Ausgabe) Gerald Singelmann: Adobe InDesign CS3 - Das Nachschlagewerk für Fortgeschrittene: FAQ: Antworten auf Ihre häufigsten Probleme (Gebundene Ausgabe)

Galileo Press: Adobe InDesign CS4. Layouts entwerfen und gestalten. Das Video-Training auf DVD Galileo Press: Adobe InDesign CS4. Layouts entwerfen und gestalten. Das Video-Training auf DVD

Karsten Geisler (Autor) Einstieg in Adobe InDesign CS4: Werkzeuge und Funktionen verständlich erklärt (Broschiert) Karsten Geisler (Autor) Einstieg in Adobe InDesign CS4: Werkzeuge und Funktionen verständlich erklärt (Broschiert)

Andrea Forst: (Autor) Adobe InDesign CS4: Die Workshops für Einsteiger (Gebundene Ausgabe) Andrea Forst: (Autor) Adobe InDesign CS4: Die Workshops für Einsteiger (Gebundene Ausgabe)

Isolde Kommer (Autor), Tilly Mersin (Autor): InDesign CS4 - Professionelles Publishing: für Print und Web (Gebundene Ausgabe) Isolde Kommer (Autor), Tilly Mersin (Autor): InDesign CS4 - Professionelles Publishing: für Print und Web (Gebundene Ausgabe)

Winfried Seimert (Autor): Adobe InDesign CS4. Das Einsteigerseminar (Broschiert) Winfried Seimert (Autor): Adobe InDesign CS4. Das Einsteigerseminar (Broschiert)

Katharina Frerichs (Autor), Marc Oliver Thoma (Autor), Astrid Warkus (Autor): Das grosse Buch Indesign CS4: im Praxiseinsatz (Gebundene Ausgabe) Katharina Frerichs (Autor), Marc Oliver Thoma (Autor), Astrid Warkus (Autor): Das grosse Buch Indesign CS4: im Praxiseinsatz (Gebundene Ausgabe)

Christoph Grüder: InDesign CS4 - Praxis für Profis: Neue Wege, Methoden und Workflows Christoph Grüder: InDesign CS4 - Praxis für Profis: Neue Wege, Methoden und Workflows

Anzeigen
Adobe Photoshop CS5 (Auswahl):

Sibylle Mühlke: Adobe Photoshop CS5: Das Praxisbuch zum Lernen und Nachschlagen (Galileo Design) Sibylle Mühlke: Adobe Photoshop CS5: Das Praxisbuch zum Lernen und Nachschlagen (Galileo Design)

Markus Wäger: Adobe Photoshop CS5: Schritt für Schritt zum Profi (Galileo Design) Markus Wäger: Adobe Photoshop CS5: Schritt für Schritt zum Profi (Galileo Design)

Robert Klaßen: Der professionelle Einstieg (Galileo Design) (Taschenbuch) Robert Klaßen: Der professionelle Einstieg (Galileo Design) (Taschenbuch)