Enterprise Search - Suchlösungen für Unternehmen - inter:gator

Empfehlungen

Info

2 Grundlagen 2 Grundlagen 2.1 Funktionsweisen einer Suchmaschine Enterprise Search – Engines funktionieren grundsätzlich nach dem selben Prinzip wie die allen bekannten Internetsuchmaschinen. Es wird unterschieden zwischen dem Frontend und dem Backend. Beim Frontend handelt es sich um den für den Nutzer sichtbaren Teil der Suchmaschine, also der Eingabemaske und der Ergebnisliste. Die Eingabemaske kann im allgemeinen über ein Webinterface angesteuert werden und orientiert sich vom Design her an gängigen Internetsuchmaschinen. Da die meisten Nutzer schon einmal „gegoogelt“ haben, ist die Eingewöhnungsphase bei Enterprise Search – Engines sehr kurz. Im Backend wird zwischen dem Index-Modul, dem Query-Modul und dem Ranking-Modul unterschieden. Abbildung 2: Wie funktioniert eine Enterprise Search Lösung? [4] Schauen wir uns zuerst das Herzstück, das Index-Modul, unserer Suchmaschine an. Im sogenannten Index werden sämtliche für die Suche relevanten Daten des Unternehmens gespeichert. Der Index enthält eine Schlagwortliste, die den Dokumenteninhalt widerspiegelt, Metadaten, wie den Autor oder das Erstellungsdatum des Dokumentes, Zugriffsrechte auf die Daten, einen Vorschautext sowie ein Vorschaubild für die Trefferliste, einen Spell-Index, der Schlagwörter für die „Meinten Sie?“ Suche bereithält und weitere Anmerkungen die für Suchvorschläge genutzt werden können. [5] Diese Informationen werden von einem sogenannten Crawler gesammelt. Dieser durchsucht das Dateisystem, das Intranet, Wikis, Email Programme und viele weitere Quellen nach Daten die er in den Index aufnehmen kann. Dabei braucht er für jede Informationsquelle und für jede Dateinamenserweiterung einen eigenen Konnektor der ihm das Lesen des Inhaltes ermöglicht. Bei Internetsuchmaschinen muss der Crawler sich an den Link Strukturen des Internets orientieren, diese Möglichkeit besteht bei Enteprise Search – Engines nur eingeschränkt, da Link Strukturen höchstens im Firmen eigenem Intranet anzutreffen sind. Diese können dann mit Hilfe eines HTTP- Crawlers indexiert werden. Nach der initialen Indexierung ist der gesamte Datenbestand der Firma im Index gespeichert. Bei den folgenden Indexierungen werden nur noch geänderte oder neue Daten in den Index aufgenommen beziehungsweise nicht mehr vorhandene Daten aus dem Index gelöscht. Dieses Verfahren, durch Checksummen unterstützt, ist viel schneller als eine immer wieder stattfindende komplette neu Indexierung. Eine weitere Möglichkeit um Ressourcen beim Crawlen Enterprise Search - Suchlösungen für Unternehmen 3
2 Grundlagen zu sparen ist, den Index in mehrere Teilindexe mit verschiedener Update-Häufigkeit zu gliedern. So muss zum Beispiel ein Index der eine große Altdokumenten Sammlung enthält sehr selten erneuert werden. Als nächstes schauen wir uns das Query-Modul an. „Das Query-Modul sorgt dafür, dass passende Treffer in Sekundenschnelle auffindbar sind. Es wandelt die Suchanfrage, die über den Browser eingegeben wird, in ein Format um, das der Index auch versteht. Der Anwender kann mit Booleschen Operatoren die Recherche nach den gewünschten Informationen noch exakter eingrenzen.“ [4] Des Weiteren liefert es Schlagworte für die unscharfe Suche. Dabei wird nicht nur nach den eingegebenen Wörtern gesucht, sondern auch nach Synonymen oder Wörtern deren Rechtschreibung korrigiert wurde, so wie nach Wörtern die dem Suchwort von der Schreibweise her ähnlich sind. Wörter die im Plural geschrieben sind werden in den Singular transformiert, da Suchmaschinen grundsätzlich nicht zwischen Singular und Plural unterscheiden. Als letzten Punkt im Backend betrachten wir das Ranking-Modul. Dieses sortiert die gefundenen Treffer nach Relevanz. Da die Relevanz je nach Aufgabengebiet des Mitarbeiters variieren kann ist es sehr wichtig, dass eben solche Anforderungen vom Ranking-Modul betrachtet werden. Internetsuchmaschinen benutzen meist die Anzahl der Backlinks auf eine Seite um ihre Relevanz zu ermitteln, Enterprise Search – Engines hingegen müssen dazu zum Beispiel auf die Suchwortdichte, die Art des Dokumentes oder auf Metadaten, wie das Erstellungsdatum, zurückgreifen. Versagt das Ranking-Modul und die relevanten Treffer sind nicht auf der ersten Seite der Trefferliste zu finden, versagt die ganze Suchlösung. Hat unsere Suchanfrage alle diese Schritte im Backend hinter sich, wird die Trefferliste für den Nutzer sichtbar angezeigt. 2.2 Was macht Enterprise Search aus? Damit Enterprise Search effektiv arbeiten kann, muss der Zugriff auf sämtlich Daten gewährleistet sein. Wenn die Mitarbeiter sich auf ihre Suchlösung verlassen, dürfen sie nicht zufällig das gesuchte Dokument auf einem Netzlaufwerk finden, obwohl es ihnen in der Trefferliste nicht angezeigt wurde. Ist dieses Kriterium erfüllt, bietet Enterprise Search allen Mitarbeitern einen einheitlich Einstiegspunkt zu allen Unternehmensinformationen. Dieser ist unabhängig von der Verwaltung der Ursprungsdaten. Die Daten, die die Suchmaschine im Index hält, liegen in einer homogenisierten Form vor, so dass die Daten auch unabhängig von der Repräsentation der Ursprungsdaten sind. Der Vorteil daran ist, dass alle Mitarbeiter immer auf dem selben Stand des Wissens sind. Eine gute Enterprise Search Lösung unterstützt den Nutzer bei der Suche auf vielfältige Weise, denn eine reine Volltextsuche ist selten zielführend. Ein Problem dabei können Synonyme und Homonyme sein. Ein Ansatz zur Problemlösung ist das Arbeiten mit Ontologien. „Sucht ein Nutzer beispielsweise nach dem Stichwort „Jaguar“, so kann damit unter anderem das Tier oder die Automarke gemeint sein. Die Folge ist, dass Treffer zu beiden Begriffen gefunden werden. Wird jetzt eine Ontologie eingesetzt, kann das System dieses Suchwort als Homonym erkennen und dem User die Möglichkeit geben, mit den Alternativen „Auto“ oder „Tier“ seine Anfrage zu präzisieren. Denn wenn dem System die Bedeutung der Suchanfrage in Form eines Konzepts (Tier->Jaguar oder Auto->Jaguar) bekannt ist, kann es je nach dem zur Verfügung stehenden Informationen die Suchanfrage anpassen.“ [6] Des Weiteren kann eine Enterprise Search Lösung die vorhandenen Metadaten viel besser als eine Internetsuchmaschine nutzen, da sie ihr Umfeld in der Unternehmenswelt besser kennt und versteht. Schauen wir uns nun an welche Features eine Suchmaschine anbieten kann, die keinen direkten Enterprise Search - Suchlösungen für Unternehmen 4
Seite 1 und 2: Betreuung: M.Sc. Marian Benner palu
Seite 3 und 4: Zusammenfassung Zusammenfassung Dur
Seite 5 und 6: Inhaltsverzeichnis Inhaltsverzeichn
Seite 7: 1 Einleitung und Motivation relevan
Seite 11 und 12: 2 Grundlagen 2.2.2 Konnektoren und
Seite 13 und 14: 2 Grundlagen Abbildung 5: Datenbank
Seite 15 und 16: 3 Bestandsaufnahme 3.2 Unterschiede
Seite 17 und 18: 4 Einordnung in den wissenschaftlic
Seite 19: Literaturverzeichnis Literaturverze

Enterprise Search - Suchlösungen für Unternehmen - inter:gator

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?