31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Informationsl<strong>in</strong>guistik<br />

N-Gramm-Retrieval bei HAIRCUT: (2.) Relevance Feedback<br />

– Recherche nach der Ähnlichkeitsformel<br />

– Auswahl der Top N (i.d.R. 20) Dokumente<br />

– Gewichtung der N-Gramme <strong>in</strong> <strong>die</strong>sen Dokumenten nach<br />

Formel<br />

– L i : relative Häufigkeit des N-Gramms i <strong>in</strong> den Dokumenten<br />

– C i : relative Häufigkeit des N-Gramms i <strong>in</strong> der gesamten<br />

Datenbank<br />

– IDF i = <strong>in</strong>verse Dokumenthäufigkeit von i: (ld N / n) + 1 (N:<br />

Anzahl der Dokumente <strong>in</strong> der Datenbank; n: Anzahl der<br />

Dokumente, <strong>in</strong> denen i vorkommt)<br />

– K: Konstante<br />

(L i –C i) * (IDF i) K<br />

– Selektion der Top M (i.d.R. 50) N-Gramme und neue Suche<br />

mittels <strong>die</strong>ser 50 N-Grammen<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 160

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!