24.12.2012 Aufrufe

Semantisches Clustering durch ein web-mining-basiertes Verfahren ...

Semantisches Clustering durch ein web-mining-basiertes Verfahren ...

Semantisches Clustering durch ein web-mining-basiertes Verfahren ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3 Das <strong>Verfahren</strong><br />

Wortassoziationen entstehen zwischen Wörtern die häufig in dichter zeitlicher<br />

Auf<strong>ein</strong>anderfolge auftreten.<br />

Beim Card-Sorting-Experiment, das unter anderen im »Usability Engineering« <strong>ein</strong>gesetzt<br />

wird, werden Begriffe <strong>durch</strong> Versuchspersonen nach ihrer semantischen<br />

Ähnlichkeit gruppiert, um da<strong>durch</strong> beispielsweise Menü<strong>ein</strong>träge auszuwählen und<br />

anzuordnen. Dabei spielen Assoziationen zwischen den Begriffen <strong>ein</strong>e wesentliche<br />

Rolle (siehe Kapitel 2.1). Mittels Assoziationsmaßen kann die Assoziationsstärke<br />

zwischen Begriffen, auf Grundlage von Worthäufigkeiten in Texten, berechnet<br />

werden (siehe Kapitel 2.2). Als Datengrundlage wird <strong>ein</strong> Textkorpus benötigt,<br />

um die Häufigkeiten der Wörter zu ermitteln. Hierbei kann das Web als Korpus<br />

verwendet werden, das <strong>ein</strong>e ausreichende Größe und <strong>ein</strong>en leichten Zugriff auf<br />

Worthäufigkeiten bietet. Nachteil bei der Nutzung des Webs sind zum <strong>ein</strong>en die<br />

Unbeständigkeit der Daten und die unbekannte Zusammensetzung des Webs, die<br />

k<strong>ein</strong>er Kontrolle unterliegt. Einen leichten Zugriff auf das Web bieten Suchmaschinen,<br />

die <strong>durch</strong> direkten Zugriff auf Trefferanzahlen Worthäufigkeiten liefern<br />

können (siehe Kapitel 2.4). Um das Ergebnis der Gruppierung zu verbessern, wird<br />

die Ähnlichkeit zwischen zwei Wörtern auf Basis der Assoziationsstärken berechnet<br />

(siehe Kapitel 2.3).<br />

11

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!