Hallo zusammen,
ich weiß nicht, ob ich in diesem Forum richtig bin und ob mir hier jemand weiterhelfen kann, aber ein Versuch ist es wert.
Folgendes möchte ich gerne umsetzen:
Ich erhalte eine PDF Datei (Fax-Scan) per Mail. Aus diesem PDF möchte ich gerne bestimmte Textstellen wie Adresse und Name heraussuchen und komprimiert ausgeben lassen.
Meine Idee war, über einen PDF2Text (mittels OCR) ein Text-File zu erstellen, jedoch weiß ich nicht, wie ich die ständig wechselnden Inhalte (Straßennamen etc.) herausfiltern kann. Es wird zwar immer mit "Straße:" angekündigt, aber der Doppelpunkt wird von meinem OCR als "3" erkannt
Könnt Ihr mir bei diesem Problem helfen? Falls ihr mehr Infos brauchen solltet, fragt einfach, ich versuche schnellstmöglich zu antworten
Danke schonmal vorab
Gruß tafty
Seite 1 von 1
Batch Skript (Daten aus PDF auslesen) Aus PDF (Fax-Scan) soll ein wechselnder Text ausgeben werden
Anzeige
#2 _d4rkn3ss4ev3r_
geschrieben 04. April 2018 - 22:36
Batch selbst kann keine PDFs lesen. Dazu brauchst du ein extra Programm was Commandline-Befehle beherscht.
Wegen dem "Straße:" Problem: das ließe sich dann mittels einer for Schleife lösen
Wegen dem "Straße:" Problem: das ließe sich dann mittels einer for Schleife lösen
#3
geschrieben 05. April 2018 - 00:10
Je nach Größenordnung und je nachdem wie wichtig die Richtigkeit der Daten ist, dauern allerdings einscannen, kontrollieren und gegebenenfalls korrigieren oft länger als gleich abtippen.
Bauernregel: Regnets mächtig im April, passiert irgendwas, was sich auf April reimt.
#4
geschrieben 05. April 2018 - 06:09
Zitat (d4rkn3ss4ev3r: 04. April 2018 - 22:36)
Batch selbst kann keine PDFs lesen. Dazu brauchst du ein extra Programm was Commandline-Befehle beherscht.
Wegen dem "Straße:" Problem: das ließe sich dann mittels einer for Schleife lösen
Wegen dem "Straße:" Problem: das ließe sich dann mittels einer for Schleife lösen
Das ich ein Extra Programm benötige ist mir bewusst, habe hier auch bereits etwas gefunden, aber wie gesagt, das Programm erkennt die Doppelpunkte als die Zahl 3 und gibt sie auch so aus.
Zitat (Holger_N: 05. April 2018 - 00:10)
Je nach Größenordnung und je nachdem wie wichtig die Richtigkeit der Daten ist, dauern allerdings einscannen, kontrollieren und gegebenenfalls korrigieren oft länger als gleich abtippen.
Kann gut sein, dass es mit einfach abtippen schneller wäre, jedoch bekomme ich die Mail vollautomatisch und möchte auch dementsprechend die Umwandlung und Ausgabe automatisieren. Bin dafür allerdings nicht an Batch gebunden. Wenn andere Möglichkeiten besser umsetzbar sind, bin ich dafür offen
Gruß tafty
- ← alle Leerzeichen in Variable finden und ersetzen
- Programmierung
- Baby Programieren Tabelle Google ( Exel ) →
Thema verteilen:
Seite 1 von 1