31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Textstatistik<br />

Sortierung nach Gewichtung. Variante 2: „UND“<br />

– Schritt 1: Suche (<strong>in</strong> <strong>in</strong>vertierter Datei) nach allen n<br />

Suchworten (bzw. Grundformen/Wortstämmen, Phrasen).<br />

Treffer ist, wenn das Dokument alle Suchworte enthält (analog<br />

e<strong>in</strong>er UND-Verknüpfung)<br />

• Schritt 1.1: Ermittlung des Gewichtes für jedes Suchwort <strong>in</strong> allen<br />

Dokumenten, <strong>die</strong> <strong>in</strong> Schritt 1 gefunden worden s<strong>in</strong>d<br />

• Schritt 1.2: Bildung der Summe der Gewichte aller Suchworte pro<br />

Dokument; Zuordnung der Summe zum Dokument<br />

• Schritt 1.3: Sortierung der Dokumente nach der Summe der<br />

Gewichtungswerte<br />

• hiernach: entweder (a) Abbruch des Verfahrens oder (b) weiter,<br />

wenn bei Schritt 1 nichts gefunden oder (c) stets weiter:<br />

– ggf. Schritt 2: Suche nach Dokumenten, <strong>die</strong> n-1 Suchworte<br />

enthalten<br />

• Schritt 2.1 bis 2.3: analog wie bei 1.<br />

– ggf. Schritt 3: Suche nach Dokumenten, <strong>die</strong> n-2 Suchworte<br />

enthalten (usw.)<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 251

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!