WinFuture-Forum.de: Batch Skript (Daten aus PDF auslesen) - WinFuture-Forum.de

Zum Inhalt wechseln

Nachrichten zum Thema: Entwicklung
Seite 1 von 1

Batch Skript (Daten aus PDF auslesen) Aus PDF (Fax-Scan) soll ein wechselnder Text ausgeben werden


#1 Mitglied ist offline   tafty 

  • Gruppe: Mitglieder
  • Beiträge: 2
  • Beigetreten: 04. April 18
  • Reputation: 0

  geschrieben 04. April 2018 - 22:20

Hallo zusammen,

ich weiß nicht, ob ich in diesem Forum richtig bin und ob mir hier jemand weiterhelfen kann, aber ein Versuch ist es wert.

Folgendes möchte ich gerne umsetzen:
Ich erhalte eine PDF Datei (Fax-Scan) per Mail. Aus diesem PDF möchte ich gerne bestimmte Textstellen wie Adresse und Name heraussuchen und komprimiert ausgeben lassen.

Meine Idee war, über einen PDF2Text (mittels OCR) ein Text-File zu erstellen, jedoch weiß ich nicht, wie ich die ständig wechselnden Inhalte (Straßennamen etc.) herausfiltern kann. Es wird zwar immer mit "Straße:" angekündigt, aber der Doppelpunkt wird von meinem OCR als "3" erkannt :rolleyes:

Könnt Ihr mir bei diesem Problem helfen? Falls ihr mehr Infos brauchen solltet, fragt einfach, ich versuche schnellstmöglich zu antworten :wink:


Danke schonmal vorab

Gruß tafty
0

Anzeige



#2 _d4rkn3ss4ev3r_

  • Gruppe: Gäste

geschrieben 04. April 2018 - 22:36

Batch selbst kann keine PDFs lesen. Dazu brauchst du ein extra Programm was Commandline-Befehle beherscht.

Wegen dem "Straße:" Problem: das ließe sich dann mittels einer for Schleife lösen
0

#3 Mitglied ist offline   Holger_N 

  • Gruppe: aktive Mitglieder
  • Beiträge: 5.111
  • Beigetreten: 11. September 10
  • Reputation: 458
  • Geschlecht:Männlich

geschrieben 05. April 2018 - 00:10

Je nach Größenordnung und je nachdem wie wichtig die Richtigkeit der Daten ist, dauern allerdings einscannen, kontrollieren und gegebenenfalls korrigieren oft länger als gleich abtippen.
Bauernregel: Regnets mächtig im April, passiert irgendwas, was sich auf April reimt.
0

#4 Mitglied ist offline   tafty 

  • Gruppe: Mitglieder
  • Beiträge: 2
  • Beigetreten: 04. April 18
  • Reputation: 0

geschrieben 05. April 2018 - 06:09

Beitrag anzeigenZitat (d4rkn3ss4ev3r: 04. April 2018 - 22:36)

Batch selbst kann keine PDFs lesen. Dazu brauchst du ein extra Programm was Commandline-Befehle beherscht.

Wegen dem "Straße:" Problem: das ließe sich dann mittels einer for Schleife lösen


Das ich ein Extra Programm benötige ist mir bewusst, habe hier auch bereits etwas gefunden, aber wie gesagt, das Programm erkennt die Doppelpunkte als die Zahl 3 und gibt sie auch so aus.


Beitrag anzeigenZitat (Holger_N: 05. April 2018 - 00:10)

Je nach Größenordnung und je nachdem wie wichtig die Richtigkeit der Daten ist, dauern allerdings einscannen, kontrollieren und gegebenenfalls korrigieren oft länger als gleich abtippen.


Kann gut sein, dass es mit einfach abtippen schneller wäre, jedoch bekomme ich die Mail vollautomatisch und möchte auch dementsprechend die Umwandlung und Ausgabe automatisieren. Bin dafür allerdings nicht an Batch gebunden. Wenn andere Möglichkeiten besser umsetzbar sind, bin ich dafür offen ;)


Gruß tafty
0

Thema verteilen:


Seite 1 von 1

1 Besucher lesen dieses Thema
Mitglieder: 0, Gäste: 1, unsichtbare Mitglieder: 0