03.02.2015 Aufrufe

Journal of Applied Knowledge Management - Felix Moedritscher

Journal of Applied Knowledge Management - Felix Moedritscher

Journal of Applied Knowledge Management - Felix Moedritscher

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

6.4. AUFGABEN UND MODULE 81<br />

• Kontext: Wie bei der Abgrenzung ist auch dieses Feature schwierig umzusetzen, da die meisten<br />

Suchdienste nicht in der Lage sind, den Zusammenhang zu einem Thema zu verstehen.<br />

• Broken Links: Je nachdem wie <strong>of</strong>t Updates auf dem Dienst-Server stattfinden, kommt es mehr oder<br />

weniger häufig vor, dass Seiten, die nicht mehr vorhanden sind, dem User angezeigt werden.<br />

• Metadaten: Bei HTML können Sekundärinformationen über das Dokument eingebettet werden, diese<br />

sind zwar für den User nicht sichtbar, können jedoch als Zusatzinformation für die Suche verwendet<br />

werden. Bei Hyperwave werden zum Beispiel für Dokumente Attribute vergeben, die als<br />

Metadaten in das HTML-Dokument eingefügt werden.<br />

• Ranking: Durch diese Funktion werden die gefundenen Daten geordnet. Das Ranking erfolgt meistens<br />

aufgrund einer Berechnung der Trefferquote. Bei dieser Funktion fehlt auch <strong>of</strong>t die Spezifikation<br />

der Hersteller.<br />

• Retrieval: Dies ist die Methode zur Wissensauffindung im Suchindex. Dafür können boolsche Werte,<br />

Phrasen, Synonyme, etc. verwendet werden.<br />

• Spiders, Robots, Bots, Gatherer: Dies sind Begriffe für Suchmaschinen, die Server aufsuchen und<br />

Daten zusammentragen, die vom Informationssystem gebraucht wird. Die Indizierung kann in die<br />

Tiefe oder Breite erfolgen und ist je nach System sehr zeitaufwändig.<br />

• Stemming: Das ist eine Suche, die den Wortstamm des gesuchten Begriffes verwendet und nach<br />

allen Variationen von diesem sucht. Diese Methode funktioniert nur wenn die Wörter einer Sprache<br />

dem System bekannt sind und ist daher von der Sprachversion des Suchdienstes abhängig. Für die<br />

automatische Erkennung der Sprache eines Textes gibt es Language Guessing Algorithmen.<br />

Generell ist anzumerken, dass ein Suchdienst nur funktionieren kann, wenn die Einträge in den Datenbanken<br />

dieser Dienste aktuell gehalten werden. Dies muss in ständigen Intervallen wiederholt werden, wobei<br />

jeder Anbieter von Suchdiensten diese Update-Funktion in anderer Weise implementiert hat. Die Unterschiede<br />

können wie zuvor angeführt in Neudatenaufnahmen, in der Serverüberprüfung auf Neudaten udgl.<br />

liegen. Diese Daten werden jedoch meist nicht angegeben, es kann jedoch davon ausgegangen werden, dass<br />

je umfangreicher der Suchdienst ist, desto weniger Updates durchgeführt werden. Im System Hyperwave<br />

ist die Updatefunktion am Besten umgesetzt, dort erfolgen die Aktualisierungen s<strong>of</strong>ort bei einer Änderung<br />

vom Datenbestand.<br />

6.4 Aufgaben und Module<br />

Für die Datenaufbereitung in verteilten Systemen sind verschiedene Module erforderlich. Diese Module<br />

haben verschiedene Aufgaben: [Aichriedler et al. 2000]<br />

• Suche nach Änderungen in Dokumenten<br />

• Extrahierung von Informationen in komprimierten Dokumenten

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!