31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Textstatistik<br />

Das probabilistische Modell<br />

• Relevanz<strong>in</strong>formationen aus Stichprobe. Ableitung von<br />

Wahrsche<strong>in</strong>lichkeitswerten:<br />

• P 1 (Vorkommen von x mi ist wesentlich für <strong>die</strong> Relevanz des<br />

Dokuments) = k / K<br />

• P 2 (Nicht-Vorkommen von x mi ist wesentlich für <strong>die</strong> Relevanz des<br />

Dokuments) = (K - k) / K<br />

• P 3 (Vorkommen von x mi ist wesentlich für <strong>die</strong> Nicht-Relevanz des<br />

Dokuments) = (n - K) / N - K<br />

• P 4 (Nicht-Vorkommen von x mi ist wesentlich für <strong>die</strong> Nicht-Relevanz<br />

des Dokuments) = (N – K – n + k) / (N – K)<br />

• P2 = 1 - P1 P4 = 1 - P3 •<br />

•<br />

rel. Häufigkeit der Dokumente mit xmi <strong>in</strong> der Stichprobe: n / N<br />

Gewichtung (Dokument mit xmi ) = P1 / rel. Häufigkeit („e<strong>in</strong>fache<br />

Version“)<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 279

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!