31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Textstatistik<br />

Textstatistik: Zählbasis<br />

• Häufigkeit e<strong>in</strong>es Wortes (e<strong>in</strong>er Grundform/e<strong>in</strong>es<br />

Wortstammes, e<strong>in</strong>er Phrase zuzüglich der betreffenden<br />

Pronom<strong>in</strong>a).<br />

Wort i im Dokument j: Freq(i,j)<br />

• Position des Wortes im Dokument (P)<br />

– Wort und Ort<br />

– Wort <strong>in</strong> spezifischem Feld (bzw. Meta-Tag)<br />

• Anzahl aller Worte <strong>in</strong> e<strong>in</strong>em Dokument (L)<br />

• Anzahl aller Dokumente <strong>in</strong> e<strong>in</strong>er Datenbank, <strong>in</strong> denen e<strong>in</strong><br />

bestimmtes Wort (m<strong>in</strong>destens e<strong>in</strong>mal) vorkommt (n)<br />

• Gesamtanzahl der Dokumente <strong>in</strong> e<strong>in</strong>er Datenbank (N)<br />

Donna Harman: Rank<strong>in</strong>g algorithms. – In: William B. Frakes; Ricardo Baeza-Yates (Hrsg.): Information Retrieval.<br />

Data Structures & Algorithms. – Upper Saddle River, NJ: Prentice Hall PTR, 1992, 363-392.<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 238

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!