07.01.2013 Aufrufe

Konzeption und Implementierung eines ... - Stephan, Daniel

Konzeption und Implementierung eines ... - Stephan, Daniel

Konzeption und Implementierung eines ... - Stephan, Daniel

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

105 9.1. TECHNISCHE PERSPEKTIVE<br />

gen noch gut genug zu funktionieren. Ein (qualitativer) Vergleich mit dem EM-<br />

Algorithmus wäre für die Zukunft interessant.<br />

Ferner: Um die verwendeten Begriffe exakter spezifizieren zu können, wäre es<br />

denkbar, ein begriffliches Netz wie das WordNet [Mil95] zu integrieren. Damit<br />

könnten thematisch ähnliche Begriffe automatisch vor dem Clustering auf den<br />

selben Term reduziert werden. Die Hoffnung dabei ist natürlich, dass dadurch<br />

ein qualitativ hochwertigeres Ergebnis entsteht.<br />

Zuletzt sei die Anmerkung erlaubt, dass die aktuelle Entwicklung im Internet<br />

von den traditionellen Klassifikationsmechanismen weggeht. Hierzu sei [Shi05]<br />

als Lektüre genannt. Shirky erklärt hier sehr schön, welche Probleme bei fe-<br />

sten Klassifikationssysteme mit einem fest definierten Thesaurus auftreten. Er<br />

nennt aber auch Eigenschaften, die für ein solches festes Klassifikationssystem<br />

sprechen:<br />

• Geringer Umfang des Dokumentkorpus<br />

• Formelle Kategorien<br />

• Stabile Konzepte<br />

• Eingeschränkte Konzepte<br />

• Klare Domänengrenze<br />

• Katalogisierer ist Experte im Fachgebiet<br />

• Autoritative Quelle<br />

• Bestimmte Nutzergruppe<br />

• Nutzer sind Experten bzgl. der Kategorisierung<br />

Einige dieser Eigenschaften treffen für das ISL tatsächlich zu. Beispielswei-<br />

se ist der Umfang <strong>und</strong> die betrachtete Domäne begrenzt (verglichen mit den<br />

Datenmengen, die Google oder Yahoo verwalten). Die Domänengrenzen ändern<br />

sich so gut wie nie, denn das ISL hat sich auf Seeverkehrswirtschaft <strong>und</strong> Logi-<br />

kistik spezialisiert. Die Klassifikation wird von Fachleuten des ISL verfasst <strong>und</strong><br />

befindet sich in einer wohldefinierten, hierarchischen Struktur <strong>und</strong> kann somit<br />

als formell bezeichnet werden. Das ISL fungiert als autoritative Oberaufsicht<br />

auf die Klassifikation.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!