hallo,
ich will texte von html/php-seiten in eine word-datei extrahieren, um mit diesen texten zu arbeiten. alle anderen html-codes sollten NICHT mit extrahiert werden.
kennt ihr so ein programm und habt erfahrungen damit?
dank euch
Seite 1 von 1
Suche Ein Tool, Das Texte Von Html-dateien Extrahi
Anzeige
#2
geschrieben 09. Oktober 2004 - 14:41
soll das ein witz sein, nit böse gemeint
+++++++++++++++++++++++++
im browser öffnen, text markieren, und dann in word einfügen
fertig
gruß chiwou
+++++++++++++++++++++++++
im browser öffnen, text markieren, und dann in word einfügen
fertig
gruß chiwou
#3
geschrieben 09. Oktober 2004 - 14:47
sicher, so gehts auch.
aber wenn es 50 html-dateien sind, wird es doch etwas mühsam. da wäre eine automatische lösung schon toll.
irgendwelche ideen?
danke
aber wenn es 50 html-dateien sind, wird es doch etwas mühsam. da wäre eine automatische lösung schon toll.
irgendwelche ideen?
danke
#4
geschrieben 09. Oktober 2004 - 15:26
Brauchbare Ergebnisse macht z.B. schon dieser Befehl. Erweitern könnte man es noch mithilfe von sed, damit die Umlaute richtig übersetzt werden. Gebraucht wird natürlich Linux, z.B. Knoppix
cat *.html | cut -d ">" -f2 | cut -d "<" -f1 | html2text | pipefilt> Neuedatei.txt
cat *.html | cut -d ">" -f2 | cut -d "<" -f1 | html2text | pipefilt> Neuedatei.txt
Thema verteilen:
Seite 1 von 1

Hilfe
Neues Thema
Antworten
Nach oben


