10.10.2013 Aufrufe

Kostenloser Download der gesamten Diplomarbeit - dotSource

Kostenloser Download der gesamten Diplomarbeit - dotSource

Kostenloser Download der gesamten Diplomarbeit - dotSource

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

KAPITEL 4. FACT-FINDER UND SOLR 33<br />

ein Web-Shop geladen ist, und erhält als Antwort eine Seite, auf <strong>der</strong> die Suchergebnisse<br />

dargestellt werden. Für die Ausführung <strong>der</strong> Suche findet zwischen dem Applikationsserver<br />

unddemFACT-Fin<strong>der</strong> Server <strong>der</strong>Datenaustausch übereine <strong>der</strong>vier Schnittstellen, welche<br />

im Abschnitt 4.1.4.2 vorgestellt werden, statt. Die Schnittstelle sorgt für den Export und<br />

Import von Daten sowie die Aufbereitung von Suchanfragen. Bei dem Export werden<br />

die Daten von <strong>der</strong> Applikation zum FACT-Fin<strong>der</strong> Server transportiert. Dieser Prozess<br />

wird von dem Administrator aus dem Backend <strong>der</strong> Anwendung angestoßen und sorgt für<br />

den Aufbau des Indexes, welcher im Abschnitt 4.1.4.1 vorgestellt wird. Die Suchanfragen<br />

werdenvon<strong>der</strong>Search-Engineverarbeitet unddieErgebnisseüberdieImport-Schnittstelle<br />

an die Applikation zurückgeliefert. Für die Generierung von Suchergebnissen nutzt die<br />

Search-Engine den Index und die Log-Dateien des Data Centers. Die Konfiguration <strong>der</strong><br />

IndizesunddesFACT-Fin<strong>der</strong> Servers wirdvon demAdministrator überdasBusiness User<br />

Cockpit vorgenommen.<br />

4.1.4.1 Index<br />

Der FACT-Fin<strong>der</strong> Index besteht aus drei Bestandteilen:<br />

1. eine Comma-Separated-Values (CSV)-Datei, welche für den Export von Daten <strong>der</strong><br />

Applikation zum FACT-Fin<strong>der</strong> Server verwendet wird,<br />

2. zwei Suchdatenbankdateien, von den eine für den regulären Index und eine für die<br />

Suggest-Funktion (vgl. Abschnitt 4.1.2) verwendet wird, und<br />

3. in XML-Format vorliegenden Konfigurationsdateien, welche für die Suchdatenbankdateien<br />

und für Kampagnen angelegt werden.<br />

Nach <strong>der</strong> Aussage eines Mitarbeiters <strong>der</strong> Firma Omikron Data Quality GmbH kann <strong>der</strong><br />

FACT-Fin<strong>der</strong> Index jedeArt von textuellen Daten speichern. Grundsätzlich wirdzwischen<br />

Zeichenketten undZahlen unterschieden, sodass z.B. eine Facette <strong>der</strong> ASN (vgl. Abschnitt<br />

4.1.2) je nach Datentyp alphabetisch o<strong>der</strong> numerisch sortiert wird.<br />

Bei <strong>der</strong> Indexerstellung wird die Standard-Konfiguration aus <strong>der</strong> Voreinstellung des Suchservers<br />

initial angelegt. Diese Konfiguration kann zu jedem weiteren Zeitpunkt manuell<br />

o<strong>der</strong> über das Business User Cockpit (vgl. Abschnitt 4.1.4) angepasst werden. Im nächsten<br />

Schritt muss für den Suchprozess die Suchdatenbankdatei erstellt werden. In dieser Phase<br />

wird von <strong>der</strong> Applikation eine CSV-Datei generiert und an den FACT-Fin<strong>der</strong> Server<br />

gesendet. In <strong>der</strong> CSV-Datei sind die zu indizierenden Attribute mit Namen und Werten<br />

erfasst. Diese Datei liefert die Datengrundlage für den FACT-Fin<strong>der</strong> Index. [Doc11]<br />

Die parallele Ausführung beim Anlegen mehrerer Indizes konnte bei <strong>der</strong> praktischen Anwendung<br />

von FACT-Fin<strong>der</strong> im Rahmen <strong>der</strong> vorliegenden Arbeit erfolgreich durchgeführt<br />

werden.<br />

Weiterhin ist <strong>der</strong> Prozess <strong>der</strong> Aktualisierung des Indexes ein wie<strong>der</strong>kehren<strong>der</strong> Prozess.<br />

Wird die Konfiguration verän<strong>der</strong>t o<strong>der</strong> kommen neue Daten hinzu, so muss <strong>der</strong> Index<br />

aktualisiert werden. Im ersten Fall ist die Vermittlung <strong>der</strong> Konfigurationsdateien an den<br />

FACT-Fin<strong>der</strong> Server ausreichend. Bei Erweiterung des zu indizierenden Datenbestandes<br />

ist dagegen eine Indexerstellung von Nöten. Neben dem kompletten Indexupdate, ist es<br />

möglich bei geringfügigen Verän<strong>der</strong>ungen eine Teilaktualisierung durchzuführen. [Doc11]

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!