Ausdruck nicht OCR "lesbar" machen ?
Moderator: Moderatoren
- AUGE_OHR
- Marvin
- Beiträge: 12913
- Registriert: Do, 16. Mär 2006 7:55
- Wohnort: Hamburg
- Hat sich bedankt: 19 Mal
- Danksagung erhalten: 46 Mal
Ausdruck nicht OCR "lesbar" machen ?
hi,
... wenn ich was "ausdrucke" so könnte ich per OCR es ja "lesen"
wenn ich nun bei jedem Buchstaben den Font wechseln würde ... könnte das ein OCR Programm dann
noch "lesen" ?
oder sonst eine Idee, wie man es für Menschen "lesbar" drucken kann, aber nicht für OCR ?
... wenn ich was "ausdrucke" so könnte ich per OCR es ja "lesen"
wenn ich nun bei jedem Buchstaben den Font wechseln würde ... könnte das ein OCR Programm dann
noch "lesen" ?
oder sonst eine Idee, wie man es für Menschen "lesbar" drucken kann, aber nicht für OCR ?
gruss by OHR
Jimmy
Jimmy
- Tom
- Der Entwickler von "Deep Thought"
- Beiträge: 9394
- Registriert: Do, 22. Sep 2005 23:11
- Wohnort: Berlin
- Hat sich bedankt: 104 Mal
- Danksagung erhalten: 364 Mal
- Kontaktdaten:
Re: Ausdruck nicht OCR "lesbar" machen ?
Hallo, Jimmy.
Ja. Aktuelle OCR-Systeme können das.wenn ich nun bei jedem Buchstaben den Font wechseln würde ... könnte das ein OCR Programm dann
noch "lesen" ?
Wenn man die Texte mit Linien hinterlegt oder die Farbgestaltung Vordergrund/Hintergrund extrem kontrastarm anlegt, dürften die meisten Erkennungssysteme in Schwierigkeiten geraten. Ansonsten dürften die Verzerrungstechniken, die für Captchas verwendet werden, die meisten OCR-Systeme in die Knie zwingen - genau dafür wurden sie nämlich erdacht.oder sonst eine Idee, wie man es für Menschen "lesbar" drucken kann, aber nicht für OCR ?
Herzlich,
Tom
Tom
- Martin Altmann
- Foren-Administrator
- Beiträge: 16555
- Registriert: Fr, 23. Sep 2005 4:58
- Wohnort: Berlin
- Hat sich bedankt: 116 Mal
- Danksagung erhalten: 48 Mal
- Kontaktdaten:
Re: Ausdruck nicht OCR "lesbar" machen ?
Hallo Jimmy,
es reicht sicherlich, hinter den Text lauter waagerechte Linien im geringen Abstand zu drucken, die einen bestimmten Grauwert besitzen (gibt es einige Tipps zu, einfach mal googeln). Macht man z.B. auch bei WinWord-Dokumenten - dort legt man ein diagonales Wasserzeichen hinter die Seite. Wenn man sie ausdruckt, sieht man nur den Text. Sobald die Seite kopiert wird (schwarz-weiß), erscheint das Wasserzeichen.
Bei einer Farbkopie (bzw, Farb-OCR) kann ich Dir das nicht sagen - habe ich nicht probiert!
Viele Grüße,
Martin
es reicht sicherlich, hinter den Text lauter waagerechte Linien im geringen Abstand zu drucken, die einen bestimmten Grauwert besitzen (gibt es einige Tipps zu, einfach mal googeln). Macht man z.B. auch bei WinWord-Dokumenten - dort legt man ein diagonales Wasserzeichen hinter die Seite. Wenn man sie ausdruckt, sieht man nur den Text. Sobald die Seite kopiert wird (schwarz-weiß), erscheint das Wasserzeichen.
Bei einer Farbkopie (bzw, Farb-OCR) kann ich Dir das nicht sagen - habe ich nicht probiert!
Viele Grüße,
Martin
Webseite mit XB2.NET und ausschließlich statischem Content in Form von HTML-Dateien: https://www.altem.de/
Webseite mit XB2.NET und ausschließlich dynamischem Content in Form von in-memory-HTML: https://meldungen.altem.de/
Mitglied der XUG Osnabrück
Vorsitzender des Deutschsprachige Xbase-Entwickler e. V.
- AUGE_OHR
- Marvin
- Beiträge: 12913
- Registriert: Do, 16. Mär 2006 7:55
- Wohnort: Hamburg
- Hat sich bedankt: 19 Mal
- Danksagung erhalten: 46 Mal
Re: Ausdruck nicht OCR "lesbar" machen ?
kann man das mit List & Label machen ?Martin Altmann hat geschrieben:es reicht sicherlich, hinter den Text lauter waagerechte Linien im geringen Abstand zu drucken, die einen bestimmten Grauwert besitzen (gibt es einige Tipps zu, einfach mal googeln).
gruss by OHR
Jimmy
Jimmy
- Martin Altmann
- Foren-Administrator
- Beiträge: 16555
- Registriert: Fr, 23. Sep 2005 4:58
- Wohnort: Berlin
- Hat sich bedankt: 116 Mal
- Danksagung erhalten: 48 Mal
- Kontaktdaten:
Re: Ausdruck nicht OCR "lesbar" machen ?
Bestimm - warum nicht?
Versuche doch mal - bei dem Beispiel wurde das Wort Kopie diagonal hinter den Text gelegt (über die ganze Seite). Der Grauwert war recht gering (ich glaube, unter 5%) und das ganze war nicht flächig gefüllt, sondern mit einem Punktmuster (Nebel).
Probiere mal das angehängte Worddokument zu drucken und den Ausdruck zu scannen - ich habe jetzt hier nicht die Möglichkeiten dazu.
Viele Grüße,
Martin
Versuche doch mal - bei dem Beispiel wurde das Wort Kopie diagonal hinter den Text gelegt (über die ganze Seite). Der Grauwert war recht gering (ich glaube, unter 5%) und das ganze war nicht flächig gefüllt, sondern mit einem Punktmuster (Nebel).
Probiere mal das angehängte Worddokument zu drucken und den Ausdruck zu scannen - ich habe jetzt hier nicht die Möglichkeiten dazu.
Viele Grüße,
Martin
- Dateianhänge
-
- Dies ist ein Beispieltext.zip
- (2.66 KiB) 252-mal heruntergeladen
Webseite mit XB2.NET und ausschließlich statischem Content in Form von HTML-Dateien: https://www.altem.de/
Webseite mit XB2.NET und ausschließlich dynamischem Content in Form von in-memory-HTML: https://meldungen.altem.de/
Mitglied der XUG Osnabrück
Vorsitzender des Deutschsprachige Xbase-Entwickler e. V.
- brandelh
- Foren-Moderator
- Beiträge: 15707
- Registriert: Mo, 23. Jan 2006 20:54
- Wohnort: Germersheim
- Hat sich bedankt: 71 Mal
- Danksagung erhalten: 38 Mal
- Kontaktdaten:
Re: Ausdruck nicht OCR "lesbar" machen ?
Hallo Martin,
also der Ausdruck sieht wunderbar aus (Brother MFC)
die Kopie vom Ausdruck hat wie eine leicht Holzmaserung im Hintergrund.
Abbyy Finereader 7.0 (nicht mehr ganz frisch, aber bezahlt ) macht aus beiden Vorlagen fehlerfreien Text !
Ich denke, dass man die Schrift wirklich auf kaum noch leserliche Art verstümmeln müsste, dass ein
modernes OCR System damit nicht mehr zurecht kommt. Eventuell hat man mehr Fehler, aber ein Mensch
als Korrektor kann das immer bereinigen. Abschreiben geht zur Not ja auch noch ...
also der Ausdruck sieht wunderbar aus (Brother MFC)
die Kopie vom Ausdruck hat wie eine leicht Holzmaserung im Hintergrund.
Abbyy Finereader 7.0 (nicht mehr ganz frisch, aber bezahlt ) macht aus beiden Vorlagen fehlerfreien Text !
Ich denke, dass man die Schrift wirklich auf kaum noch leserliche Art verstümmeln müsste, dass ein
modernes OCR System damit nicht mehr zurecht kommt. Eventuell hat man mehr Fehler, aber ein Mensch
als Korrektor kann das immer bereinigen. Abschreiben geht zur Not ja auch noch ...
Gruß
Hubert
Hubert
- Martin Altmann
- Foren-Administrator
- Beiträge: 16555
- Registriert: Fr, 23. Sep 2005 4:58
- Wohnort: Berlin
- Hat sich bedankt: 116 Mal
- Danksagung erhalten: 48 Mal
- Kontaktdaten:
Re: Ausdruck nicht OCR "lesbar" machen ?
Hallo Hubert,
danke für den Test! Ich habe den Hintergrund (Ansicht - Kopf- und Fußzeile) mit 1% Transparenz versehen - muss man mal mehr probieren.
Ich muss mal wühlen, vielleicht finde ich das noch...
Ich hatte mal ein Worddokument bekommen, das konnte man ganz normal ausdrucken. Hat man den Ausdruck dann kopiert, stand diagonal in hellgrau das Wort Kopie hinter dem Text über die ganze Seite gehend.
Aber das Problem hier wird sein, dass man den Text beim Kopieren ja nicht mehr lesen können soll - also müsste man die Transparenz sicher hoch schrauben auf Werte jenseits von 10%, so dass man den Ausdruck noch einigermaßen lesen kann...
Viele Grüße,
Martin
danke für den Test! Ich habe den Hintergrund (Ansicht - Kopf- und Fußzeile) mit 1% Transparenz versehen - muss man mal mehr probieren.
Ich muss mal wühlen, vielleicht finde ich das noch...
Ich hatte mal ein Worddokument bekommen, das konnte man ganz normal ausdrucken. Hat man den Ausdruck dann kopiert, stand diagonal in hellgrau das Wort Kopie hinter dem Text über die ganze Seite gehend.
Aber das Problem hier wird sein, dass man den Text beim Kopieren ja nicht mehr lesen können soll - also müsste man die Transparenz sicher hoch schrauben auf Werte jenseits von 10%, so dass man den Ausdruck noch einigermaßen lesen kann...
Viele Grüße,
Martin
Webseite mit XB2.NET und ausschließlich statischem Content in Form von HTML-Dateien: https://www.altem.de/
Webseite mit XB2.NET und ausschließlich dynamischem Content in Form von in-memory-HTML: https://meldungen.altem.de/
Mitglied der XUG Osnabrück
Vorsitzender des Deutschsprachige Xbase-Entwickler e. V.
- brandelh
- Foren-Moderator
- Beiträge: 15707
- Registriert: Mo, 23. Jan 2006 20:54
- Wohnort: Germersheim
- Hat sich bedankt: 71 Mal
- Danksagung erhalten: 38 Mal
- Kontaktdaten:
Re: Ausdruck nicht OCR "lesbar" machen ?
Hallo Martin,
ich gebe zu, dass ich noch nie versucht habe ein Dokument "nicht kopierbar" zu machen und bin schon erstaunt,
dass die Kopie einer für mich weißen Seite das seltsame - wenn auch kaum sichtbare - Muster erzeugt hat.
Wie kann das PAPIER diese Infos aufnehmen, ohne dass wir sie sehen, aber der Kopierer davon gestört wird ...
Ich bin wirklich erstaunt ...
ich gebe zu, dass ich noch nie versucht habe ein Dokument "nicht kopierbar" zu machen und bin schon erstaunt,
dass die Kopie einer für mich weißen Seite das seltsame - wenn auch kaum sichtbare - Muster erzeugt hat.
Wie kann das PAPIER diese Infos aufnehmen, ohne dass wir sie sehen, aber der Kopierer davon gestört wird ...
Ich bin wirklich erstaunt ...
Gruß
Hubert
Hubert
- Martin Altmann
- Foren-Administrator
- Beiträge: 16555
- Registriert: Fr, 23. Sep 2005 4:58
- Wohnort: Berlin
- Hat sich bedankt: 116 Mal
- Danksagung erhalten: 48 Mal
- Kontaktdaten:
Re: Ausdruck nicht OCR "lesbar" machen ?
Ganz einfach, das menschliche Auge ist zu sehr mit den offensichtlichen Dingen befasst
Das Auge des Menschen hat andere "Grenzen", als so eine Optik. Du könntest die Erkennung ja auch Anpassen (den Schwellwert beim Scannen bei Scharz/Weiß auf 120 setzen - und Du hättest keinen Hintergrund mehr).
Viele Grüße,
Martin
Das Auge des Menschen hat andere "Grenzen", als so eine Optik. Du könntest die Erkennung ja auch Anpassen (den Schwellwert beim Scannen bei Scharz/Weiß auf 120 setzen - und Du hättest keinen Hintergrund mehr).
Viele Grüße,
Martin
Webseite mit XB2.NET und ausschließlich statischem Content in Form von HTML-Dateien: https://www.altem.de/
Webseite mit XB2.NET und ausschließlich dynamischem Content in Form von in-memory-HTML: https://meldungen.altem.de/
Mitglied der XUG Osnabrück
Vorsitzender des Deutschsprachige Xbase-Entwickler e. V.