31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Textstatistik<br />

Textstatistik (Relevance Rank<strong>in</strong>g I). Fazit<br />

• Sortierung nach „e<strong>in</strong>facher“ Gewichtung: ODER-Variante (Beispiel:<br />

Freestyle von Lexis-Nexis) sowie UND-Variante (Beispiel:<br />

AlltheWeb)<br />

• Vektorraummodell von Gerard Salton: E<strong>in</strong> Dokument wird durch<br />

e<strong>in</strong>en Vektor repräsentiert; <strong>die</strong> Dimensionen s<strong>in</strong>d Wortstämme/<br />

Grundformen oder Phrasen; <strong>die</strong> Werte auf den Dimensionen<br />

entstammen der „e<strong>in</strong>fachen“ Gewichtung<br />

• Ähnlichkeit zwischen Anfragen und Dokumenten bzw. zwischen<br />

Dokumenten untere<strong>in</strong>ander: Cos<strong>in</strong>us<br />

• e<strong>in</strong>gesetzt bei SMART (Sonderbehandlung von Niedrig- und von<br />

Hochfrequenzworten)<br />

• Errechnung von Zentroid- und Superzentroid-Vektoren<br />

• Relevance Feedback<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 284

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!