Text oder Barcodes aus eingescannter Pdf-Datei lesen

Nutzung, Komponenten, .NET

Moderator: Moderatoren

Antworten
Dieter
Rekursionen-Architekt
Rekursionen-Architekt
Beiträge: 237
Registriert: Do, 14. Aug 2008 14:59
Wohnort: Straelen
Hat sich bedankt: 2 Mal
Danksagung erhalten: 3 Mal

Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von Dieter »

Hallo,

welche Software kann Text oder Barcodes von eingescannten Pdf-Dateien auslesen? Ist Quickpdf dafür geeignet?
Viele Grüße

Dieter

Was man nicht versteht, besitzt man nicht.
Benutzeravatar
brandelh
Foren-Moderator
Foren-Moderator
Beiträge: 15688
Registriert: Mo, 23. Jan 2006 20:54
Wohnort: Germersheim
Hat sich bedankt: 65 Mal
Danksagung erhalten: 33 Mal
Kontaktdaten:

Re: Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von brandelh »

Um Bildinfos zu "lesen" brauchst du OCR Software, QuickPDF kann nur welche erstellen oder manipulieren, solange es Text ist.

"Eingescannt" ... wurde die PDF aus einem BILD erstellt ist sie weder durchsuchbar noch kann man Text darin markieren ?

dann kann auch QuickPDF damit nichts machen ...

Wenn der Text in der PDF markierbar ist und eindeutig erkennbar, dann könnte man mit QuickPDF (über meine HBPrintPDF-Klasse) nach Textinhalten suchen.
Gruß
Hubert
Dieter
Rekursionen-Architekt
Rekursionen-Architekt
Beiträge: 237
Registriert: Do, 14. Aug 2008 14:59
Wohnort: Straelen
Hat sich bedankt: 2 Mal
Danksagung erhalten: 3 Mal

Re: Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von Dieter »

Hallo Hubert,

ich danke dir für deine Ausführungen!

Vielleicht komme ich auch ohne Barcode-Erkennung aus, indem ich vorab ein PDF-Scanformular in einem Eingangsordner erzeuge. Die Daten hieraus können mit QuickPDF immer ausgelesen werden. Anschließend müsste das Belegdokument in den Eingangsordner als PDF gescannt werden. Wenn alle Scanformulare und die zugehörigen Belegdokumente vorliegen, dann wird als Abschluss eine Routine gestartet, um Scanformular und Belegdokument (gemerged) mit einer Datenbank zu verknüpfen. Nach Abschluss der Erfassung ( zum Beispiel 100 Eingangsrechnungen) wird alles dokumentiert und der Eingangsordner ist wieder leer. Um das hier umzusetzten brauche ich auf jeden Fall QuickPDF und deine LIB.
Viele Grüße

Dieter

Was man nicht versteht, besitzt man nicht.
Benutzeravatar
AUGE_OHR
Marvin
Marvin
Beiträge: 12903
Registriert: Do, 16. Mär 2006 7:55
Wohnort: Hamburg
Hat sich bedankt: 19 Mal
Danksagung erhalten: 44 Mal

Re: Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von AUGE_OHR »

Dieter hat geschrieben:Vielleicht komme ich auch ohne Barcode-Erkennung aus ...
was nützt die ein Barcode wenn du ihn nicht "liest" ... :?:

p.s. Barcode ist "out" , dafür gibt es QR-Code mit mehr Möglichkeiten.
gruss by OHR
Jimmy
Benutzeravatar
Jan
Marvin
Marvin
Beiträge: 14641
Registriert: Fr, 23. Sep 2005 18:23
Wohnort: 49328 Melle
Hat sich bedankt: 21 Mal
Danksagung erhalten: 87 Mal
Kontaktdaten:

Re: Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von Jan »

Jimmy,

Barcode ist überhaupt nicht "out". Der ist immer noch verbreiteter als QR-Code. Stimmt, im QR kann man wesentlich mehr Infos unterbringen, aber der Barcode reicht für sehr sehr viele Dinge vollkommen aus.

Abgesehen davon muß DIeter mit dem klar kommen,w as ihm gegeben wird. Und wenn die PDF nun einmal Barcodes drin hat, dann muß er die irgendwie auslesen können.

Jan
Mitglied der XUG Osnabrück
Mitglied der XUG Berlin/Brandenburg
Mitglied des Deutschsprachige Xbase-Entwickler e. V.
Benutzeravatar
AUGE_OHR
Marvin
Marvin
Beiträge: 12903
Registriert: Do, 16. Mär 2006 7:55
Wohnort: Hamburg
Hat sich bedankt: 19 Mal
Danksagung erhalten: 44 Mal

Re: Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von AUGE_OHR »

Dieter hat geschrieben:welche Software kann Text oder Barcodes von eingescannten Pdf-Dateien auslesen?
bekommst du ein "fertiges" PDF mit Barcode ?
wenn ja : ausdrucken und mit einem Barcode Scanner (und entsprechender Software ) scannen ... ;)

wenn eine Software ein "Bild" lesen soll wäre das mit der API GetPixel() möglich.
angenommen du würde tatsächlich die Pixel richtig "lesen" dann müsstest du es immer noch "decodieren"
Dieter hat geschrieben:Ist Quickpdf dafür geeignet
IMHO kann Quickpdf nur "codieren"
gruss by OHR
Jimmy
Benutzeravatar
brandelh
Foren-Moderator
Foren-Moderator
Beiträge: 15688
Registriert: Mo, 23. Jan 2006 20:54
Wohnort: Germersheim
Hat sich bedankt: 65 Mal
Danksagung erhalten: 33 Mal
Kontaktdaten:

Re: Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von brandelh »

QuickPDF kann neben der Erzeugung, alle Objekte manipulieren die in der PDF enthalten sind.
Falls dort also eine Bitmap enthalten ist, kann man diese per Quickpfd in den RAM holen.
Wie man dann von dieser Bitmap einen Barcode "liest" weiß ich nicht.

Wenn das Dokument auf einen normalen Scanner gelegt und daraus ein PDF "gescannt" wird, dann ist alles eine große Bitmap.
Große Firmen haben scanner die beim "einscannen" die Barcodes oder andere IDs lesen und Dokument mit Datensatz verknüpfen.

In QuickPDF sind die Barcodes zur Erzeugung hinterlegt, daher sieht man dort keinen Code wie ein Barcode erzeugt wird.
Für EAN13 habe ich mal so eine "Druckroutine" geschrieben, grundsätzlich könnte man hingehen und nach Definition WO der Barcode liegt
dort die Pixel untersuchen ... eventuell bekommt man das auch als DLL von OCR Software, nicht ganz trivial, sollte aber machbar sein.

Manuell ginge es auch so, dass dein Programm das PDF anzeigt, ein Mensch am Monitor dann den mit Barcodescanner einliest und dein Programm beide Infos verknüpft.
Gruß
Hubert
Dieter
Rekursionen-Architekt
Rekursionen-Architekt
Beiträge: 237
Registriert: Do, 14. Aug 2008 14:59
Wohnort: Straelen
Hat sich bedankt: 2 Mal
Danksagung erhalten: 3 Mal

Re: Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von Dieter »

Hallo,

mit gdpicture könnte man auch Barcodes lesen. Hier müsste ich mich jedoch erst noch in diese Software einarbeiten und ähnlich wie es Hubert gemacht hat, mit ot4xb einen xbase-Wrapper entwickeln oder das Programm in Visual C# oder Visual Basic schreiben. Meine erste Idee war den Barcode mit allen wichtigen Informationen selbst zu erzeugen und mit dem gescannten Dokument zusammenzuführen. Wie ich aber schon ausgeführt habe, will ich die automatisierte Verknüpfung mit der Datenbank erstmal ohne Barcodes angehen, indem ich ein "intelligentes"-PDF mit einem "dummen"-PDF zusammenführe und dann in einem Rutsch alle eingescannten Dokumente mit der Datenbank verknüpfe.
Vielen Dank für eure Hinweise.
Viele Grüße

Dieter

Was man nicht versteht, besitzt man nicht.
Benutzeravatar
Wolfgang Ciriack
Der Entwickler von "Deep Thought"
Der Entwickler von "Deep Thought"
Beiträge: 2932
Registriert: Sa, 24. Sep 2005 9:37
Wohnort: Berlin
Hat sich bedankt: 13 Mal
Danksagung erhalten: 34 Mal
Kontaktdaten:

Re: Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von Wolfgang Ciriack »

Die Einbindung von GdPicture per ActiveX ist relativ simpel, bei Bedarf einfach melden.
Viele Grüße
Wolfgang
Benutzeravatar
Rudolf
Programmier-Gott
Programmier-Gott
Beiträge: 1418
Registriert: Mo, 02. Jan 2006 23:03
Wohnort: Salzburg/Österreich
Kontaktdaten:

Re: Text oder Barcodes aus eingescannter Pdf-Datei lesen

Beitrag von Rudolf »

Hallo,
http://bytescout.com/?q=/products/devel ... ersdk.html
kann ziemlich alles was Barcodes betrifft
Grüße
Rudolf
Antworten