31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Textstatistik<br />

E<strong>in</strong>satz des Vektorraummodells bei SMART<br />

– (5) bei Hochfrequenzworten: Generierung von Phrasen<br />

– Arbeitsschritte:<br />

– (5.1) Übernahme aller Wortstämme/Grundformen aus<br />

allgeme<strong>in</strong>er SMART-Prozedur<br />

– (5.2) Paarbildung aller Wortstämme/Grundformen, <strong>die</strong> im<br />

Dokument <strong>in</strong>nerhalb von n Worten stehen (etwa: n=4); dabei<br />

Bed<strong>in</strong>gung: e<strong>in</strong>es der Worte ist Hochfrequenzwort<br />

– (5.3) Zusammenführen von Paaren mit gleichen Komponenten<br />

(A B – B A). Beispiel: [my] student[s‘] knowledge – [the]<br />

knowledge [of my] student[s]<br />

– (5.4) Betrachtung der entstandenen Phrase als e<strong>in</strong> Wort bzw.<br />

als e<strong>in</strong>e Dimension im n-dimensionalen Vektorraum (für <strong>die</strong><br />

Berechnung von WDF, IDF, Position)<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 264

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!