Das Forentreffen 2018 findet am 20./21. April in Dresden statt. Weitere Infos hier
Zur Homepage des Deutschsprachige Xbase-Entwickler e. V.
Xbase++-Wiki des Deutschsprachige Xbase-Entwickler e. V.

Tabellen-Daten aus PDF extrahieren

Alles rund um die Acrobat-Ansteuerung und Nutzung von PDF-Dokumenten per AX

Moderator: Moderatoren

Antworten
Benutzeravatar
Werner_Bayern
Programmier-Gott
Programmier-Gott
Beiträge: 1280
Registriert: Sa, 30. Jan 2010 22:58
Wohnort: Niederbayern

Tabellen-Daten aus PDF extrahieren

Beitrag von Werner_Bayern » So, 23. Jun 2013 23:23

Hat das schon mal jemand gemacht, oder kennt einer eine Lösung?

Muss nicht unbedingt in Xbase++ gelöst sein:

Zuerst geht es darum, zu unterscheiden, was normaler Text und was Tabelleninhalte sind. Danach geht es darum, die Tabelle als solche zu identifizieren, d.h. Zeilen, Spalten und Zellen zu identifizieren und zu bestimmen, welche davon zu welcher Tabelle gehören.
Anschließend müssen die Daten weiterverarbeitet werden, also entweder als Excel abspeichern oder irgendwie anders, das wäre aber nicht das Problem, das weiß ich, wie es geht.
es grüßt euch

Werner

Antworten