Kostenloser Download der gesamten Diplomarbeit - dotSource
Kostenloser Download der gesamten Diplomarbeit - dotSource
Kostenloser Download der gesamten Diplomarbeit - dotSource
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
KAPITEL 4. FACT-FINDER UND SOLR 41<br />
Die Interaktion zwischen Applikations- und Suchserver wird genau wie im Abschnitt 4.1.4<br />
durch die Schnittstellen für den Export und Import von Daten sowie Übertragung <strong>der</strong><br />
Suchanfragen definiert. Die Schnittstellen des Solr Servers werden im Abschnitt 4.2.4.2<br />
erläutert. Die Dokumente werden als Lucene-Indexe, welche im Abschnitt 4.2.4.1 vorgestellt<br />
werden, gespeichert. Für jeden Index wird ein abgeschlossener Solr-Kern mit individuellen<br />
Definitionen <strong>der</strong> Konfiguration und des Schemas (vgl. Abschnitt 4.2.2) angelegt,<br />
wobei über das Admin Interface gleichzeitiger Zugriff auf alle Solr-Kerne möglich ist. Die<br />
Konfiguration von den Indizes erfolgt auf Dateiebene. Für den Export <strong>der</strong> Applikationsdaten<br />
wird intern je nach verwendeter Methode ein UpdateHandler verwendet. Für die<br />
Ausführung <strong>der</strong> Suche werden die Suchanfragen <strong>der</strong> Nutzer durch den Parser aufbereitet.<br />
Danach werden die Information analysiert und zum Index hinzugefügt bzw. mit dem<br />
Index verglichen. Das Suchergebnis wird durch den ResponseWriter formatiert und über<br />
den Import dem Applikationsserver bereitgestellt.<br />
4.2.4.1 Index<br />
Wie bereits in <strong>der</strong> Abbildung 4.6 verdeutlicht, werden in Solr die Dokumente als Lucene-<br />
Indexe verwaltet. In <strong>der</strong> Abbildung 4.7 ist <strong>der</strong> strukturelle Aufbau eines Lucene-Indexes<br />
schematisch dargestellt und wird im Folgenden gemäß [Ind11] erläutert.<br />
Segment ... Segment<br />
Index<br />
Term<br />
Term<br />
...<br />
...<br />
...<br />
...<br />
Term<br />
...<br />
Term<br />
Feld<br />
Feld<br />
Dokument<br />
Feld<br />
Feld<br />
Dokument<br />
Abbildung 4.7: Der strukturelle Aufbau eines Lucene-Indexes<br />
Index<br />
Der Index stellt die oberste Struktureinheit dar und wird als eine invertierte Liste (vgl.<br />
Abschnitt 2.2.2) gespeichert.<br />
Segment<br />
Ein Index ist i.d.R. in Subindizes, die sogenannten Segmente, unterteilt, die eigenständig<br />
durchsuchtwerdenkönnen.Diese UnterteilunginSegmentehatdenHintergrunddieÄn<strong>der</strong>ungsoperationenaufdemIndexalsTeilaktualisierungenumzusetzen.Gemäß[Ing07a]werden<br />
von Lucene folgende Än<strong>der</strong>ungsoperationen auf dem Index unterstützt, welche über<br />
die Export-Schnittstelle an den Solr Server kommuniziert werden.