Ausdruck nicht OCR "lesbar" machen ?

Von Ausgaben mit der Gra-Engine über Generatoren bis zum Export in diversen Formaten

Moderator: Moderatoren

Antworten
Benutzeravatar
AUGE_OHR
Marvin
Marvin
Beiträge: 12906
Registriert: Do, 16. Mär 2006 7:55
Wohnort: Hamburg
Hat sich bedankt: 19 Mal
Danksagung erhalten: 45 Mal

Ausdruck nicht OCR "lesbar" machen ?

Beitrag von AUGE_OHR »

hi,

... wenn ich was "ausdrucke" so könnte ich per OCR es ja "lesen"

wenn ich nun bei jedem Buchstaben den Font wechseln würde ... könnte das ein OCR Programm dann
noch "lesen" ?
oder sonst eine Idee, wie man es für Menschen "lesbar" drucken kann, aber nicht für OCR ?
gruss by OHR
Jimmy
Benutzeravatar
Tom
Der Entwickler von "Deep Thought"
Der Entwickler von "Deep Thought"
Beiträge: 9357
Registriert: Do, 22. Sep 2005 23:11
Wohnort: Berlin
Hat sich bedankt: 101 Mal
Danksagung erhalten: 361 Mal
Kontaktdaten:

Re: Ausdruck nicht OCR "lesbar" machen ?

Beitrag von Tom »

Hallo, Jimmy.
wenn ich nun bei jedem Buchstaben den Font wechseln würde ... könnte das ein OCR Programm dann
noch "lesen" ?
Ja. Aktuelle OCR-Systeme können das.
oder sonst eine Idee, wie man es für Menschen "lesbar" drucken kann, aber nicht für OCR ?
Wenn man die Texte mit Linien hinterlegt oder die Farbgestaltung Vordergrund/Hintergrund extrem kontrastarm anlegt, dürften die meisten Erkennungssysteme in Schwierigkeiten geraten. Ansonsten dürften die Verzerrungstechniken, die für Captchas verwendet werden, die meisten OCR-Systeme in die Knie zwingen - genau dafür wurden sie nämlich erdacht.
Herzlich,
Tom
Benutzeravatar
Martin Altmann
Foren-Administrator
Foren-Administrator
Beiträge: 16508
Registriert: Fr, 23. Sep 2005 4:58
Wohnort: Berlin
Hat sich bedankt: 111 Mal
Danksagung erhalten: 48 Mal
Kontaktdaten:

Re: Ausdruck nicht OCR "lesbar" machen ?

Beitrag von Martin Altmann »

Hallo Jimmy,
es reicht sicherlich, hinter den Text lauter waagerechte Linien im geringen Abstand zu drucken, die einen bestimmten Grauwert besitzen (gibt es einige Tipps zu, einfach mal googeln). Macht man z.B. auch bei WinWord-Dokumenten - dort legt man ein diagonales Wasserzeichen hinter die Seite. Wenn man sie ausdruckt, sieht man nur den Text. Sobald die Seite kopiert wird (schwarz-weiß), erscheint das Wasserzeichen.
Bei einer Farbkopie (bzw, Farb-OCR) kann ich Dir das nicht sagen - habe ich nicht probiert!

Viele Grüße,
Martin
:grommit:
Webseite mit XB2.NET und ausschließlich statischem Content in Form von HTML-Dateien: https://www.altem.de/
Webseite mit XB2.NET und ausschließlich dynamischem Content in Form von in-memory-HTML: https://meldungen.altem.de/

Mitglied der XUG Osnabrück
Vorsitzender des Deutschsprachige Xbase-Entwickler e. V.
Benutzeravatar
AUGE_OHR
Marvin
Marvin
Beiträge: 12906
Registriert: Do, 16. Mär 2006 7:55
Wohnort: Hamburg
Hat sich bedankt: 19 Mal
Danksagung erhalten: 45 Mal

Re: Ausdruck nicht OCR "lesbar" machen ?

Beitrag von AUGE_OHR »

Martin Altmann hat geschrieben:es reicht sicherlich, hinter den Text lauter waagerechte Linien im geringen Abstand zu drucken, die einen bestimmten Grauwert besitzen (gibt es einige Tipps zu, einfach mal googeln).
kann man das mit List & Label machen ?
gruss by OHR
Jimmy
Benutzeravatar
Martin Altmann
Foren-Administrator
Foren-Administrator
Beiträge: 16508
Registriert: Fr, 23. Sep 2005 4:58
Wohnort: Berlin
Hat sich bedankt: 111 Mal
Danksagung erhalten: 48 Mal
Kontaktdaten:

Re: Ausdruck nicht OCR "lesbar" machen ?

Beitrag von Martin Altmann »

Bestimm - warum nicht?
Versuche doch mal - bei dem Beispiel wurde das Wort Kopie diagonal hinter den Text gelegt (über die ganze Seite). Der Grauwert war recht gering (ich glaube, unter 5%) und das ganze war nicht flächig gefüllt, sondern mit einem Punktmuster (Nebel).
Probiere mal das angehängte Worddokument zu drucken und den Ausdruck zu scannen - ich habe jetzt hier nicht die Möglichkeiten dazu.

Viele Grüße,
Martin
Dateianhänge
Dies ist ein Beispieltext.zip
(2.66 KiB) 250-mal heruntergeladen
:grommit:
Webseite mit XB2.NET und ausschließlich statischem Content in Form von HTML-Dateien: https://www.altem.de/
Webseite mit XB2.NET und ausschließlich dynamischem Content in Form von in-memory-HTML: https://meldungen.altem.de/

Mitglied der XUG Osnabrück
Vorsitzender des Deutschsprachige Xbase-Entwickler e. V.
Benutzeravatar
brandelh
Foren-Moderator
Foren-Moderator
Beiträge: 15695
Registriert: Mo, 23. Jan 2006 20:54
Wohnort: Germersheim
Hat sich bedankt: 65 Mal
Danksagung erhalten: 33 Mal
Kontaktdaten:

Re: Ausdruck nicht OCR "lesbar" machen ?

Beitrag von brandelh »

Hallo Martin,

also der Ausdruck sieht wunderbar aus (Brother MFC)
die Kopie vom Ausdruck hat wie eine leicht Holzmaserung im Hintergrund.
Abbyy Finereader 7.0 (nicht mehr ganz frisch, aber bezahlt ;-) ) macht aus beiden Vorlagen fehlerfreien Text !

Ich denke, dass man die Schrift wirklich auf kaum noch leserliche Art verstümmeln müsste, dass ein
modernes OCR System damit nicht mehr zurecht kommt. Eventuell hat man mehr Fehler, aber ein Mensch
als Korrektor kann das immer bereinigen. Abschreiben geht zur Not ja auch noch ...
Gruß
Hubert
Benutzeravatar
Martin Altmann
Foren-Administrator
Foren-Administrator
Beiträge: 16508
Registriert: Fr, 23. Sep 2005 4:58
Wohnort: Berlin
Hat sich bedankt: 111 Mal
Danksagung erhalten: 48 Mal
Kontaktdaten:

Re: Ausdruck nicht OCR "lesbar" machen ?

Beitrag von Martin Altmann »

Hallo Hubert,
danke für den Test! Ich habe den Hintergrund (Ansicht - Kopf- und Fußzeile) mit 1% Transparenz versehen - muss man mal mehr probieren.
Ich muss mal wühlen, vielleicht finde ich das noch...
Ich hatte mal ein Worddokument bekommen, das konnte man ganz normal ausdrucken. Hat man den Ausdruck dann kopiert, stand diagonal in hellgrau das Wort Kopie hinter dem Text über die ganze Seite gehend.
Aber das Problem hier wird sein, dass man den Text beim Kopieren ja nicht mehr lesen können soll - also müsste man die Transparenz sicher hoch schrauben auf Werte jenseits von 10%, so dass man den Ausdruck noch einigermaßen lesen kann...

Viele Grüße,
Martin
:grommit:
Webseite mit XB2.NET und ausschließlich statischem Content in Form von HTML-Dateien: https://www.altem.de/
Webseite mit XB2.NET und ausschließlich dynamischem Content in Form von in-memory-HTML: https://meldungen.altem.de/

Mitglied der XUG Osnabrück
Vorsitzender des Deutschsprachige Xbase-Entwickler e. V.
Benutzeravatar
brandelh
Foren-Moderator
Foren-Moderator
Beiträge: 15695
Registriert: Mo, 23. Jan 2006 20:54
Wohnort: Germersheim
Hat sich bedankt: 65 Mal
Danksagung erhalten: 33 Mal
Kontaktdaten:

Re: Ausdruck nicht OCR "lesbar" machen ?

Beitrag von brandelh »

Hallo Martin,

ich gebe zu, dass ich noch nie versucht habe ein Dokument "nicht kopierbar" zu machen und bin schon erstaunt,
dass die Kopie einer für mich weißen Seite das seltsame - wenn auch kaum sichtbare - Muster erzeugt hat.
Wie kann das PAPIER diese Infos aufnehmen, ohne dass wir sie sehen, aber der Kopierer davon gestört wird ... :?:
Ich bin wirklich erstaunt ... :shock:
Gruß
Hubert
Benutzeravatar
Martin Altmann
Foren-Administrator
Foren-Administrator
Beiträge: 16508
Registriert: Fr, 23. Sep 2005 4:58
Wohnort: Berlin
Hat sich bedankt: 111 Mal
Danksagung erhalten: 48 Mal
Kontaktdaten:

Re: Ausdruck nicht OCR "lesbar" machen ?

Beitrag von Martin Altmann »

Ganz einfach, das menschliche Auge ist zu sehr mit den offensichtlichen Dingen befasst :D
Das Auge des Menschen hat andere "Grenzen", als so eine Optik. Du könntest die Erkennung ja auch Anpassen (den Schwellwert beim Scannen bei Scharz/Weiß auf 120 setzen - und Du hättest keinen Hintergrund mehr).

Viele Grüße,
Martin
:grommit:
Webseite mit XB2.NET und ausschließlich statischem Content in Form von HTML-Dateien: https://www.altem.de/
Webseite mit XB2.NET und ausschließlich dynamischem Content in Form von in-memory-HTML: https://meldungen.altem.de/

Mitglied der XUG Osnabrück
Vorsitzender des Deutschsprachige Xbase-Entwickler e. V.
Antworten