WinFuture-Forum.de: PDF lässt sich nicht in Text umwandeln - WinFuture-Forum.de

Zum Inhalt wechseln

  • 2 Seiten +
  • 1
  • 2

PDF lässt sich nicht in Text umwandeln


#1 Mitglied ist offline   landbastler 

  • Gruppe: aktive Mitglieder
  • Beiträge: 351
  • Beigetreten: 17. Dezember 08
  • Reputation: 11

geschrieben 16. Dezember 2022 - 19:09

Hallo,
ich habe vom Hersteller meines Traktors ein Handbuch für den Motor als PDF erhalten. Da diese Anleitung in englisch verfasst wurde wollte ich nun den Text extrahieren um ihn leichter übersetzen zu können. Ich habe verschiedene Programme und Onlinetools ausprobiert, aber es kommen immer nur kryptische Zeichenfolgen heraus.

Angehängtes Bild: Screenshot 2022-12-16 190734.jpg

Woran liegt das und kann man das ändern ? In den Eigenschaften sind keine Einschränkungen zu finden.

Gruß
landbastler

Dieser Beitrag wurde von landbastler bearbeitet: 16. Dezember 2022 - 19:10

PC1: CPU:AMD Ryzen 9-5900x; Board MSI B550-A Pro; RAM: 32GB; Grafik: Nvidia Geforce GT710/2GB;Festplatten: SSD Crucial 1TB, HDD WD Blue 2TB, HDD Toshiba 1TB; optisches Laufwerk: LG BD-RE BH16NS55; Fritz WLAN USB Stick AC860; Windows 11 Professional;

PC2: CPU: AMD Ryzen5 2600x; Board: ASUS Prime B350-Plus; RAM: 16GB; Grafik: Nvidia Geforce GT710/2GB; Festplatten: SSD WD SN570 1TB; HDD Seagate 2TB; optische Laufwerke: DVD-ROM DH16D2S, DVD-RAM GH24NSD1; Sonstiges: Fritz WLAN USB Stick AC430; Windows 11 Professional;
0

Anzeige



#2 Mitglied ist offline   Reteibeg 

  • Gruppe: aktive Mitglieder
  • Beiträge: 505
  • Beigetreten: 24. November 14
  • Reputation: 64

geschrieben 16. Dezember 2022 - 19:43

Versuche es mal mit PDF24. Das hat einmal "PDF umwandeln in....", z.B. Text. Oder "PDF OCR".
0

#3 Mitglied ist offline   landbastler 

  • Gruppe: aktive Mitglieder
  • Beiträge: 351
  • Beigetreten: 17. Dezember 08
  • Reputation: 11

geschrieben 17. Dezember 2022 - 10:34

Hallo Reteibeg,
danke für den Hinweis. Leider konnte auch PDF24 nicht das Problem lösen. Ach das Einlesen der PDF über OCR hat daran nichts geändert.

Gruß
landbastler
PC1: CPU:AMD Ryzen 9-5900x; Board MSI B550-A Pro; RAM: 32GB; Grafik: Nvidia Geforce GT710/2GB;Festplatten: SSD Crucial 1TB, HDD WD Blue 2TB, HDD Toshiba 1TB; optisches Laufwerk: LG BD-RE BH16NS55; Fritz WLAN USB Stick AC860; Windows 11 Professional;

PC2: CPU: AMD Ryzen5 2600x; Board: ASUS Prime B350-Plus; RAM: 16GB; Grafik: Nvidia Geforce GT710/2GB; Festplatten: SSD WD SN570 1TB; HDD Seagate 2TB; optische Laufwerke: DVD-ROM DH16D2S, DVD-RAM GH24NSD1; Sonstiges: Fritz WLAN USB Stick AC430; Windows 11 Professional;
0

#4 Mitglied ist offline   Dirk900 

  • Gruppe: aktive Mitglieder
  • Beiträge: 207
  • Beigetreten: 30. November 15
  • Reputation: 12
  • Geschlecht:Männlich

geschrieben 17. Dezember 2022 - 12:58

Wenn du den Text Maskieren kannst? dann mach dies und
füge ihn dann wieder in einem Text Programm wieder ein
ein wenig Ordnen und Fertig, :D ja ich weiß macht mehr
Arbeit aber wenn es nicht anders geht wäre dies ein
Weg. ;(
0

#5 Mitglied ist offline   Shannon 

  • Gruppe: aktive Mitglieder
  • Beiträge: 131
  • Beigetreten: 12. Februar 13
  • Reputation: 11
  • Geschlecht:unbekannt

geschrieben 17. Dezember 2022 - 14:55

Text-PDF's lassen sich auch mit einem Editor öffnen.
Wenn das nicht möglich ist, dürfte es sich um ein
Bild-PDF handeln. Dann kommst du nur mit einem guten
OCR Prog weiter. Wenn das auch nicht geht, dürfte sie
gesperrt sein.
0

#6 Mitglied ist offline   Doodle 

  • Gruppe: aktive Mitglieder
  • Beiträge: 4.773
  • Beigetreten: 09. Februar 12
  • Reputation: 867
  • Geschlecht:Männlich

geschrieben 17. Dezember 2022 - 15:45

Gibt es die PDF nicht online? Dann stell den Link hier doch mal rein.
0

#7 Mitglied ist offline   landbastler 

  • Gruppe: aktive Mitglieder
  • Beiträge: 351
  • Beigetreten: 17. Dezember 08
  • Reputation: 11

geschrieben 17. Dezember 2022 - 16:03

Hallo,
die PDF gibt es nicht online, da es ein Handbuch eines chinesischen Herstellers ist. Ich habe mit "PDF Pro 3" von Ashampoo versucht die Schriftzeichen zu ersetzen. Das Programm schien es auch zu machen.

Angehängtes Bild: pdf.jpg

Ich musste alle 157 Zeichen anklicken und umwandeln, aber zum Schluss sind es wieder nur Hieroglyphen. Das Handbuch kann man auf dem Bildschirm lesen, aber nach Copy & Paste kommen im Editor nur Hieroglyphen an.

Gruß
landbastler
PC1: CPU:AMD Ryzen 9-5900x; Board MSI B550-A Pro; RAM: 32GB; Grafik: Nvidia Geforce GT710/2GB;Festplatten: SSD Crucial 1TB, HDD WD Blue 2TB, HDD Toshiba 1TB; optisches Laufwerk: LG BD-RE BH16NS55; Fritz WLAN USB Stick AC860; Windows 11 Professional;

PC2: CPU: AMD Ryzen5 2600x; Board: ASUS Prime B350-Plus; RAM: 16GB; Grafik: Nvidia Geforce GT710/2GB; Festplatten: SSD WD SN570 1TB; HDD Seagate 2TB; optische Laufwerke: DVD-ROM DH16D2S, DVD-RAM GH24NSD1; Sonstiges: Fritz WLAN USB Stick AC430; Windows 11 Professional;
0

#8 Mitglied ist offline   Doodle 

  • Gruppe: aktive Mitglieder
  • Beiträge: 4.773
  • Beigetreten: 09. Februar 12
  • Reputation: 867
  • Geschlecht:Männlich

geschrieben 17. Dezember 2022 - 17:16

Du könntest es mit dem google-Übersetzer versuchen. Der akzeptiert auch pdf-Dateien. https://translate.go...e&op=docs&hl=de
0

#9 Mitglied ist offline   landbastler 

  • Gruppe: aktive Mitglieder
  • Beiträge: 351
  • Beigetreten: 17. Dezember 08
  • Reputation: 11

geschrieben 17. Dezember 2022 - 18:24

Hallo Doodle,
hat leider auch nicht funktioniert.

Angehängtes Bild: Google Übersetzer.jpg

Gruß
landbastler
PC1: CPU:AMD Ryzen 9-5900x; Board MSI B550-A Pro; RAM: 32GB; Grafik: Nvidia Geforce GT710/2GB;Festplatten: SSD Crucial 1TB, HDD WD Blue 2TB, HDD Toshiba 1TB; optisches Laufwerk: LG BD-RE BH16NS55; Fritz WLAN USB Stick AC860; Windows 11 Professional;

PC2: CPU: AMD Ryzen5 2600x; Board: ASUS Prime B350-Plus; RAM: 16GB; Grafik: Nvidia Geforce GT710/2GB; Festplatten: SSD WD SN570 1TB; HDD Seagate 2TB; optische Laufwerke: DVD-ROM DH16D2S, DVD-RAM GH24NSD1; Sonstiges: Fritz WLAN USB Stick AC430; Windows 11 Professional;
0

#10 Mitglied ist offline   Liftboy 

  • Gruppe: aktive Mitglieder
  • Beiträge: 291
  • Beigetreten: 31. Juli 15
  • Reputation: 52

geschrieben 17. Dezember 2022 - 19:37

Hallo,

wenn Du nur einen englischen Text im Umfang des abgebildeten kryptischen Textes übersetzen möchtest, also keine seitenlangen Texte, dann tippe den Text einfach ab und kopiere diesen im Textbearbeitungsprogramm.

Anschließend kannst Du diesen in einen Online-Übersetzer einfügen. Den übersetzten deutschen Text wieder kopieren und in Dein Textberarbeitungsprogramm einfügen, speichern und ggf. ausdrucken.

Dieser Beitrag wurde von Liftboy bearbeitet: 17. Dezember 2022 - 19:42

0

#11 Mitglied ist offline   landbastler 

  • Gruppe: aktive Mitglieder
  • Beiträge: 351
  • Beigetreten: 17. Dezember 08
  • Reputation: 11

geschrieben 17. Dezember 2022 - 19:53

Hallo Liftboy,
das Dokument hat 287 Seiten im A5 Format.

Gruß
landbastler
PC1: CPU:AMD Ryzen 9-5900x; Board MSI B550-A Pro; RAM: 32GB; Grafik: Nvidia Geforce GT710/2GB;Festplatten: SSD Crucial 1TB, HDD WD Blue 2TB, HDD Toshiba 1TB; optisches Laufwerk: LG BD-RE BH16NS55; Fritz WLAN USB Stick AC860; Windows 11 Professional;

PC2: CPU: AMD Ryzen5 2600x; Board: ASUS Prime B350-Plus; RAM: 16GB; Grafik: Nvidia Geforce GT710/2GB; Festplatten: SSD WD SN570 1TB; HDD Seagate 2TB; optische Laufwerke: DVD-ROM DH16D2S, DVD-RAM GH24NSD1; Sonstiges: Fritz WLAN USB Stick AC430; Windows 11 Professional;
0

#12 Mitglied ist offline   Liftboy 

  • Gruppe: aktive Mitglieder
  • Beiträge: 291
  • Beigetreten: 31. Juli 15
  • Reputation: 52

geschrieben 17. Dezember 2022 - 20:25

Hallo,

wie ich schon schrieb, für seitenlange Texte ist abtippen natürlich ungeeignet.

In einen Online Übersetzer kann man den Text auch über Sprache eingeben, aber ob englische Wörter von einer deutschsprachigen Person im Textfeld dann in der richtigen Rechtschreibung erscheinen, habe ich noch nie ausprobiert.

Ich habe dort nur immer kopierte kürzere Texte und Worte eingefügt oder eingetippt.
Natürlich wäre das auch ein Haufen Arbeit, insbesondere wenn man den Text oft händisch korrigieren muss.

Wenn es über die Spracheingabe zu anstrengend ist, wirst Du um ein gutes Texterkennungsprogramm (OCR) nicht herumkommen.

Dieser Beitrag wurde von Liftboy bearbeitet: 17. Dezember 2022 - 20:32

0

#13 Mitglied ist offline   Shannon 

  • Gruppe: aktive Mitglieder
  • Beiträge: 131
  • Beigetreten: 12. Februar 13
  • Reputation: 11
  • Geschlecht:unbekannt

geschrieben 17. Dezember 2022 - 20:26

kannst du es als ZIP,7z hier einstellen ?
0

#14 Mitglied ist offline   landbastler 

  • Gruppe: aktive Mitglieder
  • Beiträge: 351
  • Beigetreten: 17. Dezember 08
  • Reputation: 11

geschrieben 18. Dezember 2022 - 10:13

Hallo Shannon,
hier ein Link zum Download der Datei:

https://filehorst.de/d/ejwDDyzG

Gruß
landbastler
PC1: CPU:AMD Ryzen 9-5900x; Board MSI B550-A Pro; RAM: 32GB; Grafik: Nvidia Geforce GT710/2GB;Festplatten: SSD Crucial 1TB, HDD WD Blue 2TB, HDD Toshiba 1TB; optisches Laufwerk: LG BD-RE BH16NS55; Fritz WLAN USB Stick AC860; Windows 11 Professional;

PC2: CPU: AMD Ryzen5 2600x; Board: ASUS Prime B350-Plus; RAM: 16GB; Grafik: Nvidia Geforce GT710/2GB; Festplatten: SSD WD SN570 1TB; HDD Seagate 2TB; optische Laufwerke: DVD-ROM DH16D2S, DVD-RAM GH24NSD1; Sonstiges: Fritz WLAN USB Stick AC430; Windows 11 Professional;
0

#15 Mitglied ist offline   TheBigHello 

  • Gruppe: Mitglieder
  • Beiträge: 19
  • Beigetreten: 27. Dezember 19
  • Reputation: 5

geschrieben 18. Dezember 2022 - 12:56

Hallo landbastler,

Das Manual wurde wahrscheinlich mit irgendeinem windigen chinesischen OCR PDF coverter (text durchsuchbar) zusammengeschraubt. Ich habe es erstmal mit dem XPDF-Drucker wieder als Image PDF erzeugt und es dann durch den PDF24 online OCR zu PDF converter geschoben. Das Ergebnis kann sich sehen lassen:

https://filehorst.de/d/etyBlejp


Google Translate macht den Rest:

...Abschnitt IIT Motorstruktur und -montage
A. Zylinderblock
Der Block besteht aus hochfestem Gusseisen HT250 und ist von Tunnelstruktur und Zylinderlaufbuchse aus
Trockentyp wird verwendet.
Auf der Vorderseite Seite des Blocks ist Lüfter,
Wasserpumpe und Getriebegehäuse welche handelt als Antrieb
Mechanismus und auf der Rückseite sind eine Öldichtungsabdeckung und das Schwungradgehäuse montiert. Es gibt Abkühlung Wasserdurchgänge und Schmierölkanäle innerhalb des Blocks. Blick von vorne auf die linke Seite des Block ist montiert Kraftstoffpumpenregler Kraftstofffilter, Schmierölpumpe, Hydraulikpumpe,
Öldrucksensor und Ölfußgehäuse,und auf der rechten Seite montiert sind ein Generator,
ein Anlasser, Wasserablauf Ventil und Ölfilter. Unten ist die Ölwanne. Auf der Oberseite des Blocks, neben den Löchern für Zylinder und Gewindelöchern für Zylinderkopfschrauben,
Am Zylinderkopf sind Wasserlöcher. In der Nähe des vorderen Endes des Blocks,
dort ist auch Öllöcher mit den Ölbohrungen des Zylinderkopfes verbunden.
Das Hauptlager ist vom Volllagertyp. Die zweite Lagersitzbohrung zum Hauptlagersitz formen
...


VG

Dieser Beitrag wurde von TheBigHello bearbeitet: 18. Dezember 2022 - 13:06

Lenovo T420 i7-2860QM, 16GB RAM, 4TB SSD + 1 TB MSATA, Bluray-Brenner HL-DT-ST BD-RE_BU40N
1

Thema verteilen:


  • 2 Seiten +
  • 1
  • 2

1 Besucher lesen dieses Thema
Mitglieder: 0, Gäste: 1, unsichtbare Mitglieder: 0