WinFuture-Forum.de: [php] Volltextindizierung - WinFuture-Forum.de

Zum Inhalt wechseln

Nachrichten zum Thema: Entwicklung
Seite 1 von 1

[php] Volltextindizierung


#1 Mitglied ist offline   kiffw 

  • Gruppe: aktive Mitglieder
  • Beiträge: 223
  • Beigetreten: 13. April 05
  • Reputation: 0
  • Geschlecht:Männlich

geschrieben 02. Juli 2008 - 14:54

Hallo,

ich möchte PDFs mit PHP durchsuchen.

Ich habe bereits ein Script geschrieben das PDFs in Text umwandelt. Jetzt bräuchte ich eins das mir die Textdatei indiziert und datenbankfähig macht :)

Kennt jemand ein fertiges Script? Oder kann mir jemand einen Denkanstoß geben?

EDIT: Ist das evtl sinnvoll? Einfach den gesammten Text in die DB zu speichern und dann per MySQL Funktion auszulesen?

Dieser Beitrag wurde von kiffw bearbeitet: 02. Juli 2008 - 15:05

MfG KiffW

Eingefügtes Bild
0

Anzeige



#2 Mitglied ist offline   CHAOS.A.D 

  • Gruppe: aktive Mitglieder
  • Beiträge: 51
  • Beigetreten: 25. April 07
  • Reputation: 0
  • Wohnort:Neustadt Aisch
  • Interessen:Computer an sich, Webdesign, Musik selber machen, programmieren

geschrieben 30. Oktober 2009 - 10:52

Nun ja, also die komplette datei einfach wieder in ne datenbank speichern wäre keine indizierung, zumindest keine die sinn ergibt. So könnte man bei Suchmaschinen auf Webseiten auch einfach die Pages-Tabelle mit den Contents durchsuchen.
Indexierung ist hier sehr schön erklärt: http://de.wikipedia....iki/Indexierung
ich denke das sollte dir weiterhelfen.
Evtl solltest du dir auch mal ein paar Indexierungs-script durchlesen und den Algorhitmus nachvollziehen.

lg CHAOS.A.D
0

#3 Mitglied ist offline   kiffw 

  • Gruppe: aktive Mitglieder
  • Beiträge: 223
  • Beigetreten: 13. April 05
  • Reputation: 0
  • Geschlecht:Männlich

geschrieben 01. November 2009 - 22:30

Na da hast du aber eine Leiche aus dem Keller geholt ^^ Aber danke für die Antwort. Das Thema ist tatsächlich noch nicht aus der Welt ^^
MfG KiffW

Eingefügtes Bild
0

#4 Mitglied ist offline   Ludacris 

  • Gruppe: Moderation
  • Beiträge: 4.689
  • Beigetreten: 28. Mai 06
  • Reputation: 218
  • Geschlecht:Männlich

geschrieben 01. November 2009 - 23:34

das mit pdfs ist so eine sache. ich habe im sommer eine eienge suchmaschine für die webseite einer firma entwickelt, die sowohl volltext (txt, html, php daten) einliest als auch aus der datenbank artikel auslesen kann. (so nebenbei, hab da ein ganzes cms für die firma entwickelt) und bei den PDFs ist das problem, dass ich sie nicht auslesen / umwandeln kann, wenn du willst erkläre ich dir wie das alles funktioniert, vl kommen wir dann auf einen gemeinsamen nenner und können so uns beiden zum ziel helfen (da das auch noch eine nette funktion in der suche wäre)
0

Thema verteilen:


Seite 1 von 1

1 Besucher lesen dieses Thema
Mitglieder: 0, Gäste: 1, unsichtbare Mitglieder: 0