Konzeption und Implementierung eines ... - Stephan, Daniel
Konzeption und Implementierung eines ... - Stephan, Daniel
Konzeption und Implementierung eines ... - Stephan, Daniel
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
105 9.1. TECHNISCHE PERSPEKTIVE<br />
gen noch gut genug zu funktionieren. Ein (qualitativer) Vergleich mit dem EM-<br />
Algorithmus wäre für die Zukunft interessant.<br />
Ferner: Um die verwendeten Begriffe exakter spezifizieren zu können, wäre es<br />
denkbar, ein begriffliches Netz wie das WordNet [Mil95] zu integrieren. Damit<br />
könnten thematisch ähnliche Begriffe automatisch vor dem Clustering auf den<br />
selben Term reduziert werden. Die Hoffnung dabei ist natürlich, dass dadurch<br />
ein qualitativ hochwertigeres Ergebnis entsteht.<br />
Zuletzt sei die Anmerkung erlaubt, dass die aktuelle Entwicklung im Internet<br />
von den traditionellen Klassifikationsmechanismen weggeht. Hierzu sei [Shi05]<br />
als Lektüre genannt. Shirky erklärt hier sehr schön, welche Probleme bei fe-<br />
sten Klassifikationssysteme mit einem fest definierten Thesaurus auftreten. Er<br />
nennt aber auch Eigenschaften, die für ein solches festes Klassifikationssystem<br />
sprechen:<br />
• Geringer Umfang des Dokumentkorpus<br />
• Formelle Kategorien<br />
• Stabile Konzepte<br />
• Eingeschränkte Konzepte<br />
• Klare Domänengrenze<br />
• Katalogisierer ist Experte im Fachgebiet<br />
• Autoritative Quelle<br />
• Bestimmte Nutzergruppe<br />
• Nutzer sind Experten bzgl. der Kategorisierung<br />
Einige dieser Eigenschaften treffen für das ISL tatsächlich zu. Beispielswei-<br />
se ist der Umfang <strong>und</strong> die betrachtete Domäne begrenzt (verglichen mit den<br />
Datenmengen, die Google oder Yahoo verwalten). Die Domänengrenzen ändern<br />
sich so gut wie nie, denn das ISL hat sich auf Seeverkehrswirtschaft <strong>und</strong> Logi-<br />
kistik spezialisiert. Die Klassifikation wird von Fachleuten des ISL verfasst <strong>und</strong><br />
befindet sich in einer wohldefinierten, hierarchischen Struktur <strong>und</strong> kann somit<br />
als formell bezeichnet werden. Das ISL fungiert als autoritative Oberaufsicht<br />
auf die Klassifikation.