ich weiß nicht, ob ich in diesem Forum richtig bin und ob mir hier jemand weiterhelfen kann, aber ein Versuch ist es wert.
Folgendes möchte ich gerne umsetzen:
Ich erhalte eine PDF Datei (Fax-Scan) per Mail. Aus diesem PDF möchte ich gerne bestimmte Textstellen wie Adresse und Name heraussuchen und komprimiert ausgeben lassen.
Meine Idee war, über einen PDF2Text (mittels OCR) ein Text-File zu erstellen, jedoch weiß ich nicht, wie ich die ständig wechselnden Inhalte (Straßennamen etc.) herausfiltern kann. Es wird zwar immer mit "Straße:" angekündigt, aber der Doppelpunkt wird von meinem OCR als "3" erkannt

Könnt Ihr mir bei diesem Problem helfen? Falls ihr mehr Infos brauchen solltet, fragt einfach, ich versuche schnellstmöglich zu antworten

Danke schonmal vorab
Gruß tafty