31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Textstatistik<br />

E<strong>in</strong>satz des Vektorraummodells bei SMART<br />

– (6) bei Niedrigfrequenzworten: Bildung von Klassen von<br />

„Synonymen“ (oder zum<strong>in</strong>dest: von ähnlichen Worten)<br />

– Kriterium: Ähnlichkeit der Worte; Ziel: Verm<strong>in</strong>derung der<br />

Indexierungsspezifität selten vorkommender Worte<br />

– falls vorhanden: E<strong>in</strong>satz e<strong>in</strong>es Synonymwörterbuches oder<br />

e<strong>in</strong>es Thesaurus (daraus: Synonymie-Relation)<br />

– ansonsten: automatisch generieren<br />

– Problem: <strong>die</strong> seltenen Worte <strong>in</strong> e<strong>in</strong>em Dokument (um <strong>die</strong>se<br />

geht es hier) treten nicht oft geme<strong>in</strong>sam auf (weil sie halt<br />

selten s<strong>in</strong>d). Aus rhetorischen Gründen wird kaum jemand<br />

Synonyme häufig nebene<strong>in</strong>ander verwenden<br />

– Lösungsansatz: S<strong>in</strong>gle-L<strong>in</strong>kage-Klassifikation<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 266

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!