WinFuture-Forum.de: Batch Skript (Daten aus PDF auslesen) - WinFuture-Forum.de

Zum Inhalt wechseln

Nachrichten zum Thema: Entwicklung
Seite 1 von 1

Batch Skript (Daten aus PDF auslesen) Aus PDF (Fax-Scan) soll ein wechselnder Text ausgeben werden


#1 Mitglied ist offline   tafty 

  • Gruppe: Mitglieder
  • Beiträge: 2
  • Beigetreten: 04. April 18
  • Reputation: 0

  geschrieben 04. April 2018 - 22:20

Hallo zusammen,

ich weiß nicht, ob ich in diesem Forum richtig bin und ob mir hier jemand weiterhelfen kann, aber ein Versuch ist es wert.

Folgendes möchte ich gerne umsetzen:
Ich erhalte eine PDF Datei (Fax-Scan) per Mail. Aus diesem PDF möchte ich gerne bestimmte Textstellen wie Adresse und Name heraussuchen und komprimiert ausgeben lassen.

Meine Idee war, über einen PDF2Text (mittels OCR) ein Text-File zu erstellen, jedoch weiß ich nicht, wie ich die ständig wechselnden Inhalte (Straßennamen etc.) herausfiltern kann. Es wird zwar immer mit "Straße:" angekündigt, aber der Doppelpunkt wird von meinem OCR als "3" erkannt :rolleyes:

Könnt Ihr mir bei diesem Problem helfen? Falls ihr mehr Infos brauchen solltet, fragt einfach, ich versuche schnellstmöglich zu antworten :wink:


Danke schonmal vorab

Gruß tafty
0

Anzeige

#2 Mitglied ist offline   d4rkn3ss4ev3r 

  • Gruppe: aktive Mitglieder
  • Beiträge: 4.140
  • Beigetreten: 03. Januar 09
  • Reputation: 546

geschrieben 04. April 2018 - 22:36

Batch selbst kann keine PDFs lesen. Dazu brauchst du ein extra Programm was Commandline-Befehle beherscht.

Wegen dem "Straße:" Problem: das ließe sich dann mittels einer for Schleife lösen
"Jene, die grundlegende Freiheit aufgeben würden, um eine geringe vorübergehende Sicherheit zu erwerben,
verdienen weder Freiheit noch Sicherheit." (Benjamin Franklin)


ACTA] | IPRED | SOPA | PIPA | CISPA | INDECT | TPP | TAFTA | Stop CETA + Stop TTIP + Stop TiSA
> Mein Hells Toolbox CMD Script <
0

#3 Mitglied ist offline   Holger_N 

  • Gruppe: aktive Mitglieder
  • Beiträge: 4.413
  • Beigetreten: 11. September 10
  • Reputation: 272

geschrieben 05. April 2018 - 00:10

Je nach Größenordnung und je nachdem wie wichtig die Richtigkeit der Daten ist, dauern allerdings einscannen, kontrollieren und gegebenenfalls korrigieren oft länger als gleich abtippen.
Ich bin ein sehr ordentlicher, fleißiger und reinlicher Mensch, nur leider gefangen im Körper eines schmuddeligen Faulpelzes … tja, kann man nix machen …
0

#4 Mitglied ist offline   tafty 

  • Gruppe: Mitglieder
  • Beiträge: 2
  • Beigetreten: 04. April 18
  • Reputation: 0

geschrieben 05. April 2018 - 06:09

Beitrag anzeigenZitat (d4rkn3ss4ev3r: 04. April 2018 - 22:36)

Batch selbst kann keine PDFs lesen. Dazu brauchst du ein extra Programm was Commandline-Befehle beherscht.

Wegen dem "Straße:" Problem: das ließe sich dann mittels einer for Schleife lösen


Das ich ein Extra Programm benötige ist mir bewusst, habe hier auch bereits etwas gefunden, aber wie gesagt, das Programm erkennt die Doppelpunkte als die Zahl 3 und gibt sie auch so aus.


Beitrag anzeigenZitat (Holger_N: 05. April 2018 - 00:10)

Je nach Größenordnung und je nachdem wie wichtig die Richtigkeit der Daten ist, dauern allerdings einscannen, kontrollieren und gegebenenfalls korrigieren oft länger als gleich abtippen.


Kann gut sein, dass es mit einfach abtippen schneller wäre, jedoch bekomme ich die Mail vollautomatisch und möchte auch dementsprechend die Umwandlung und Ausgabe automatisieren. Bin dafür allerdings nicht an Batch gebunden. Wenn andere Möglichkeiten besser umsetzbar sind, bin ich dafür offen ;)


Gruß tafty
0

Thema verteilen:


Seite 1 von 1

1 Besucher lesen dieses Thema
Mitglieder: 0, Gäste: 1, unsichtbare Mitglieder: 0