Semantisches Clustering durch ein web-mining-basiertes Verfahren ...
Semantisches Clustering durch ein web-mining-basiertes Verfahren ...
Semantisches Clustering durch ein web-mining-basiertes Verfahren ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3 Das <strong>Verfahren</strong><br />
Wortassoziationen entstehen zwischen Wörtern die häufig in dichter zeitlicher<br />
Auf<strong>ein</strong>anderfolge auftreten.<br />
Beim Card-Sorting-Experiment, das unter anderen im »Usability Engineering« <strong>ein</strong>gesetzt<br />
wird, werden Begriffe <strong>durch</strong> Versuchspersonen nach ihrer semantischen<br />
Ähnlichkeit gruppiert, um da<strong>durch</strong> beispielsweise Menü<strong>ein</strong>träge auszuwählen und<br />
anzuordnen. Dabei spielen Assoziationen zwischen den Begriffen <strong>ein</strong>e wesentliche<br />
Rolle (siehe Kapitel 2.1). Mittels Assoziationsmaßen kann die Assoziationsstärke<br />
zwischen Begriffen, auf Grundlage von Worthäufigkeiten in Texten, berechnet<br />
werden (siehe Kapitel 2.2). Als Datengrundlage wird <strong>ein</strong> Textkorpus benötigt,<br />
um die Häufigkeiten der Wörter zu ermitteln. Hierbei kann das Web als Korpus<br />
verwendet werden, das <strong>ein</strong>e ausreichende Größe und <strong>ein</strong>en leichten Zugriff auf<br />
Worthäufigkeiten bietet. Nachteil bei der Nutzung des Webs sind zum <strong>ein</strong>en die<br />
Unbeständigkeit der Daten und die unbekannte Zusammensetzung des Webs, die<br />
k<strong>ein</strong>er Kontrolle unterliegt. Einen leichten Zugriff auf das Web bieten Suchmaschinen,<br />
die <strong>durch</strong> direkten Zugriff auf Trefferanzahlen Worthäufigkeiten liefern<br />
können (siehe Kapitel 2.4). Um das Ergebnis der Gruppierung zu verbessern, wird<br />
die Ähnlichkeit zwischen zwei Wörtern auf Basis der Assoziationsstärken berechnet<br />
(siehe Kapitel 2.3).<br />
11