WinFuture-Forum.de: Suche Ein Tool, Das Texte Von Html-dateien Extrahi - WinFuture-Forum.de

Zum Inhalt wechseln

Nachrichten zum Thema: Software
Seite 1 von 1

Suche Ein Tool, Das Texte Von Html-dateien Extrahi


#1 Mitglied ist offline   pfon2005 

  • Gruppe: Mitglieder
  • Beiträge: 2
  • Beigetreten: 09. Oktober 04
  • Reputation: 0

geschrieben 09. Oktober 2004 - 14:31

hallo,

ich will texte von html/php-seiten in eine word-datei extrahieren, um mit diesen texten zu arbeiten. alle anderen html-codes sollten NICHT mit extrahiert werden.

kennt ihr so ein programm und habt erfahrungen damit?

dank euch
0

Anzeige



#2 Mitglied ist offline   chiwou 

  • Gruppe: aktive Mitglieder
  • Beiträge: 233
  • Beigetreten: 18. Juni 04
  • Reputation: 0

geschrieben 09. Oktober 2004 - 14:41

soll das ein witz sein, nit böse gemeint
+++++++++++++++++++++++++

im browser öffnen, text markieren, und dann in word einfügen

fertig

gruß chiwou
0

#3 Mitglied ist offline   pfon2005 

  • Gruppe: Mitglieder
  • Beiträge: 2
  • Beigetreten: 09. Oktober 04
  • Reputation: 0

geschrieben 09. Oktober 2004 - 14:47

sicher, so gehts auch.
aber wenn es 50 html-dateien sind, wird es doch etwas mühsam. da wäre eine automatische lösung schon toll.

irgendwelche ideen?

danke
0

#4 Mitglied ist offline   ichbines 

  • Gruppe: aktive Mitglieder
  • Beiträge: 5.716
  • Beigetreten: 06. Oktober 02
  • Reputation: 0
  • Wohnort:Parndorf (Österreich)
  • Interessen:Computer, Linux

geschrieben 09. Oktober 2004 - 15:26

Brauchbare Ergebnisse macht z.B. schon dieser Befehl. Erweitern könnte man es noch mithilfe von sed, damit die Umlaute richtig übersetzt werden. Gebraucht wird natürlich Linux, z.B. Knoppix

cat *.html | cut -d ">" -f2 | cut -d "<" -f1 | html2text | pipefilt> Neuedatei.txt
0

Thema verteilen:


Seite 1 von 1

1 Besucher lesen dieses Thema
Mitglieder: 0, Gäste: 1, unsichtbare Mitglieder: 0