Kostenloser Download der gesamten Diplomarbeit - dotSource
Kostenloser Download der gesamten Diplomarbeit - dotSource
Kostenloser Download der gesamten Diplomarbeit - dotSource
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
KAPITEL 4. FACT-FINDER UND SOLR 33<br />
ein Web-Shop geladen ist, und erhält als Antwort eine Seite, auf <strong>der</strong> die Suchergebnisse<br />
dargestellt werden. Für die Ausführung <strong>der</strong> Suche findet zwischen dem Applikationsserver<br />
unddemFACT-Fin<strong>der</strong> Server <strong>der</strong>Datenaustausch übereine <strong>der</strong>vier Schnittstellen, welche<br />
im Abschnitt 4.1.4.2 vorgestellt werden, statt. Die Schnittstelle sorgt für den Export und<br />
Import von Daten sowie die Aufbereitung von Suchanfragen. Bei dem Export werden<br />
die Daten von <strong>der</strong> Applikation zum FACT-Fin<strong>der</strong> Server transportiert. Dieser Prozess<br />
wird von dem Administrator aus dem Backend <strong>der</strong> Anwendung angestoßen und sorgt für<br />
den Aufbau des Indexes, welcher im Abschnitt 4.1.4.1 vorgestellt wird. Die Suchanfragen<br />
werdenvon<strong>der</strong>Search-Engineverarbeitet unddieErgebnisseüberdieImport-Schnittstelle<br />
an die Applikation zurückgeliefert. Für die Generierung von Suchergebnissen nutzt die<br />
Search-Engine den Index und die Log-Dateien des Data Centers. Die Konfiguration <strong>der</strong><br />
IndizesunddesFACT-Fin<strong>der</strong> Servers wirdvon demAdministrator überdasBusiness User<br />
Cockpit vorgenommen.<br />
4.1.4.1 Index<br />
Der FACT-Fin<strong>der</strong> Index besteht aus drei Bestandteilen:<br />
1. eine Comma-Separated-Values (CSV)-Datei, welche für den Export von Daten <strong>der</strong><br />
Applikation zum FACT-Fin<strong>der</strong> Server verwendet wird,<br />
2. zwei Suchdatenbankdateien, von den eine für den regulären Index und eine für die<br />
Suggest-Funktion (vgl. Abschnitt 4.1.2) verwendet wird, und<br />
3. in XML-Format vorliegenden Konfigurationsdateien, welche für die Suchdatenbankdateien<br />
und für Kampagnen angelegt werden.<br />
Nach <strong>der</strong> Aussage eines Mitarbeiters <strong>der</strong> Firma Omikron Data Quality GmbH kann <strong>der</strong><br />
FACT-Fin<strong>der</strong> Index jedeArt von textuellen Daten speichern. Grundsätzlich wirdzwischen<br />
Zeichenketten undZahlen unterschieden, sodass z.B. eine Facette <strong>der</strong> ASN (vgl. Abschnitt<br />
4.1.2) je nach Datentyp alphabetisch o<strong>der</strong> numerisch sortiert wird.<br />
Bei <strong>der</strong> Indexerstellung wird die Standard-Konfiguration aus <strong>der</strong> Voreinstellung des Suchservers<br />
initial angelegt. Diese Konfiguration kann zu jedem weiteren Zeitpunkt manuell<br />
o<strong>der</strong> über das Business User Cockpit (vgl. Abschnitt 4.1.4) angepasst werden. Im nächsten<br />
Schritt muss für den Suchprozess die Suchdatenbankdatei erstellt werden. In dieser Phase<br />
wird von <strong>der</strong> Applikation eine CSV-Datei generiert und an den FACT-Fin<strong>der</strong> Server<br />
gesendet. In <strong>der</strong> CSV-Datei sind die zu indizierenden Attribute mit Namen und Werten<br />
erfasst. Diese Datei liefert die Datengrundlage für den FACT-Fin<strong>der</strong> Index. [Doc11]<br />
Die parallele Ausführung beim Anlegen mehrerer Indizes konnte bei <strong>der</strong> praktischen Anwendung<br />
von FACT-Fin<strong>der</strong> im Rahmen <strong>der</strong> vorliegenden Arbeit erfolgreich durchgeführt<br />
werden.<br />
Weiterhin ist <strong>der</strong> Prozess <strong>der</strong> Aktualisierung des Indexes ein wie<strong>der</strong>kehren<strong>der</strong> Prozess.<br />
Wird die Konfiguration verän<strong>der</strong>t o<strong>der</strong> kommen neue Daten hinzu, so muss <strong>der</strong> Index<br />
aktualisiert werden. Im ersten Fall ist die Vermittlung <strong>der</strong> Konfigurationsdateien an den<br />
FACT-Fin<strong>der</strong> Server ausreichend. Bei Erweiterung des zu indizierenden Datenbestandes<br />
ist dagegen eine Indexerstellung von Nöten. Neben dem kompletten Indexupdate, ist es<br />
möglich bei geringfügigen Verän<strong>der</strong>ungen eine Teilaktualisierung durchzuführen. [Doc11]