31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

N-Gramme<br />

Informationsl<strong>in</strong>guistik<br />

• N-Gramm-Retrieval bei HAIRCUT: (1.) Berechnung e<strong>in</strong>es<br />

Ähnlichkeitswertes zwischen Such-N-Grammen und N-<br />

Grammen <strong>in</strong> Texten<br />

• P: Wahrsche<strong>in</strong>lichkeit für Relevanz (rechte Gleichungsseite:<br />

relative Häufigkeit)<br />

• D: Dokument (Text)<br />

• C: gesamte Datenbank (collection)<br />

• Q: Suchanfrage; q: N-Gramm aus Suchanfrage<br />

• α: Konstante (Glättungsparameter)<br />

P(D|Q) = [α*P(q 1|D) + (1- α)*P(q 1|C)] * ... * [α*P(q n|D) + (1- α)*P(q n|C)]<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 159

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!