Dokumenten-Clustering
Dokumenten-Clustering
Dokumenten-Clustering
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Dokumenten</strong>-<strong>Clustering</strong><br />
(<strong>Dokumenten</strong>-)Cluster: Menge von ähnlichen <strong>Dokumenten</strong><br />
Ausgangspunkt „Cluster-Hypothese“:<br />
die Ähnlichkeit der relevanten Dokumente untereinander und der<br />
irrelevanten Dokumente untereinander ist größer als die zwischen<br />
anderen (zufälligen) Teilmengen der <strong>Dokumenten</strong>kollektion<br />
(experimentell nachgewiesen von Rijsbergen und Sparck Jones<br />
1972)<br />
Ziel des <strong>Clustering</strong>:<br />
Bestimmung dieser Cluster unabhängig von Fragen (schon beim<br />
Aufbau der Kollektion)