Journal of Applied Knowledge Management - Felix Moedritscher
Journal of Applied Knowledge Management - Felix Moedritscher
Journal of Applied Knowledge Management - Felix Moedritscher
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
6.4. AUFGABEN UND MODULE 81<br />
• Kontext: Wie bei der Abgrenzung ist auch dieses Feature schwierig umzusetzen, da die meisten<br />
Suchdienste nicht in der Lage sind, den Zusammenhang zu einem Thema zu verstehen.<br />
• Broken Links: Je nachdem wie <strong>of</strong>t Updates auf dem Dienst-Server stattfinden, kommt es mehr oder<br />
weniger häufig vor, dass Seiten, die nicht mehr vorhanden sind, dem User angezeigt werden.<br />
• Metadaten: Bei HTML können Sekundärinformationen über das Dokument eingebettet werden, diese<br />
sind zwar für den User nicht sichtbar, können jedoch als Zusatzinformation für die Suche verwendet<br />
werden. Bei Hyperwave werden zum Beispiel für Dokumente Attribute vergeben, die als<br />
Metadaten in das HTML-Dokument eingefügt werden.<br />
• Ranking: Durch diese Funktion werden die gefundenen Daten geordnet. Das Ranking erfolgt meistens<br />
aufgrund einer Berechnung der Trefferquote. Bei dieser Funktion fehlt auch <strong>of</strong>t die Spezifikation<br />
der Hersteller.<br />
• Retrieval: Dies ist die Methode zur Wissensauffindung im Suchindex. Dafür können boolsche Werte,<br />
Phrasen, Synonyme, etc. verwendet werden.<br />
• Spiders, Robots, Bots, Gatherer: Dies sind Begriffe für Suchmaschinen, die Server aufsuchen und<br />
Daten zusammentragen, die vom Informationssystem gebraucht wird. Die Indizierung kann in die<br />
Tiefe oder Breite erfolgen und ist je nach System sehr zeitaufwändig.<br />
• Stemming: Das ist eine Suche, die den Wortstamm des gesuchten Begriffes verwendet und nach<br />
allen Variationen von diesem sucht. Diese Methode funktioniert nur wenn die Wörter einer Sprache<br />
dem System bekannt sind und ist daher von der Sprachversion des Suchdienstes abhängig. Für die<br />
automatische Erkennung der Sprache eines Textes gibt es Language Guessing Algorithmen.<br />
Generell ist anzumerken, dass ein Suchdienst nur funktionieren kann, wenn die Einträge in den Datenbanken<br />
dieser Dienste aktuell gehalten werden. Dies muss in ständigen Intervallen wiederholt werden, wobei<br />
jeder Anbieter von Suchdiensten diese Update-Funktion in anderer Weise implementiert hat. Die Unterschiede<br />
können wie zuvor angeführt in Neudatenaufnahmen, in der Serverüberprüfung auf Neudaten udgl.<br />
liegen. Diese Daten werden jedoch meist nicht angegeben, es kann jedoch davon ausgegangen werden, dass<br />
je umfangreicher der Suchdienst ist, desto weniger Updates durchgeführt werden. Im System Hyperwave<br />
ist die Updatefunktion am Besten umgesetzt, dort erfolgen die Aktualisierungen s<strong>of</strong>ort bei einer Änderung<br />
vom Datenbestand.<br />
6.4 Aufgaben und Module<br />
Für die Datenaufbereitung in verteilten Systemen sind verschiedene Module erforderlich. Diese Module<br />
haben verschiedene Aufgaben: [Aichriedler et al. 2000]<br />
• Suche nach Änderungen in Dokumenten<br />
• Extrahierung von Informationen in komprimierten Dokumenten