24.12.2012 Aufrufe

Semantisches Clustering durch ein web-mining-basiertes Verfahren ...

Semantisches Clustering durch ein web-mining-basiertes Verfahren ...

Semantisches Clustering durch ein web-mining-basiertes Verfahren ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

1 Einleitung<br />

In <strong>ein</strong>em Supermarkt werden ähnliche Produkte in die selben Regale <strong>ein</strong>sortiert: die<br />

Birnen liegen bei den Äpfeln, das Salz bei dem Pfeffer, das Brot bei den Brötchen.<br />

Diese Ordnung, die <strong>durch</strong> die Gruppierung von ähnlichen Produkten entsteht,<br />

erleichtert es dem Kunden sich intuitiv zurechtzufinden.<br />

Dieses gilt auch bei dem Entwurf von Navigationsmenüs (z.B. <strong>ein</strong>es Anwendungsprogramms).<br />

Eine Gruppierung ähnlicher Navigationselemente, erleichtert uns die<br />

Bedienung. Um <strong>ein</strong>e Gruppierung der Navigationselemente, die den Erwartungen<br />

der Nutzer entspricht, zu erhalten, wird zum Beispiel das Card-Sorting-Experiment<br />

<strong>ein</strong>gesetzt.<br />

[Marx, 2009] setzte diese Methode <strong>ein</strong>, um die Informationsfindung auf <strong>ein</strong>er<br />

»Social Bookmarking-Plattform« zu verbessern. Dazu gruppierte er Schlagworte –<br />

so genannte »Tags« – die zur Indexierung von Dokumenten dienen, mit Hilfe der<br />

Analysemethoden des Card-Sortings.<br />

Das Problem bei dem Card-Sorting-Experiment oder ähnlichen <strong>Verfahren</strong>, deren<br />

Ziel es ist <strong>ein</strong>e Gruppierung von Begriffen zu erhalten, ist die Notwendigkeit von<br />

Personen, die die Begriffe manuell in Gruppen <strong>ein</strong>sortieren. Zudem lässt sich <strong>ein</strong><br />

Ergebnis erst ableiten, wenn genügend Sortierungen vorgenommen wurden.<br />

In der vorliegenden Arbeit wird <strong>ein</strong> <strong>Verfahren</strong> vorgestellt, das Begriffe automatisch<br />

nach ihrer semantischen Ähnlichkeit in Gruppen <strong>ein</strong>teilt. Dabei sollen<br />

ähnliche Ergebnisse erzielt werden, wie die bei <strong>ein</strong>em Card-Sorting-Experiment.<br />

Um die Begriffe gruppieren zu können, muss das <strong>Verfahren</strong> die unterschiedlichen<br />

Beziehungsstärken zwischen den Begriffen berechnen. Es existieren verschiedene<br />

Berechnungsmethoden, deren Ergebnisse mit<strong>ein</strong>ander verglichen werden sollen.<br />

Bei der Berechnung entstehen Begriffsvektoren. Es soll gezeigt werden, dass<br />

<strong>durch</strong> die Berechnung der Ähnlichkeit der Begriffsvektoren, <strong>ein</strong> besseres Ergebnis<br />

erzielt werden kann. Die Berechnung der Beziehungsstärke findet auf Grundlage<br />

von statistischen Beziehungen zwischen Wörtern in Texten statt. Daher wird<br />

bei der Berechnung <strong>ein</strong>e Datengrundlage mit Texten benötigt. Hier soll gezeigt<br />

werden, dass der Abstand der Wörter innerhalb des Textes, bei der Gruppierung<br />

der Begriffe <strong>ein</strong>e wichtige Rolle spielt. Als Datengrundlage soll das Web dienen,<br />

welches genügend frei zur Verfügung stehende Texte für die Analyse bereitstellt.<br />

Durch Verwendung mehrerer Datengrundlagen soll überprüft werden, wie stark die<br />

Qualität der Gruppierung von der Datenbasis abhängt.<br />

1

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!