Hat das schon mal jemand gemacht, oder kennt einer eine Lösung?
Muss nicht unbedingt in Xbase++ gelöst sein:
Zuerst geht es darum, zu unterscheiden, was normaler Text und was Tabelleninhalte sind. Danach geht es darum, die Tabelle als solche zu identifizieren, d.h. Zeilen, Spalten und Zellen zu identifizieren und zu bestimmen, welche davon zu welcher Tabelle gehören.
Anschließend müssen die Daten weiterverarbeitet werden, also entweder als Excel abspeichern oder irgendwie anders, das wäre aber nicht das Problem, das weiß ich, wie es geht.
Tabellen-Daten aus PDF extrahieren
Moderator: Moderatoren
- Werner_Bayern
- Der Entwickler von "Deep Thought"
- Beiträge: 2126
- Registriert: Sa, 30. Jan 2010 22:58
- Wohnort: Niederbayern
- Hat sich bedankt: 30 Mal
- Danksagung erhalten: 75 Mal