10.10.2013 Aufrufe

Kostenloser Download der gesamten Diplomarbeit - dotSource

Kostenloser Download der gesamten Diplomarbeit - dotSource

Kostenloser Download der gesamten Diplomarbeit - dotSource

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

KAPITEL 4. FACT-FINDER UND SOLR 41<br />

Die Interaktion zwischen Applikations- und Suchserver wird genau wie im Abschnitt 4.1.4<br />

durch die Schnittstellen für den Export und Import von Daten sowie Übertragung <strong>der</strong><br />

Suchanfragen definiert. Die Schnittstellen des Solr Servers werden im Abschnitt 4.2.4.2<br />

erläutert. Die Dokumente werden als Lucene-Indexe, welche im Abschnitt 4.2.4.1 vorgestellt<br />

werden, gespeichert. Für jeden Index wird ein abgeschlossener Solr-Kern mit individuellen<br />

Definitionen <strong>der</strong> Konfiguration und des Schemas (vgl. Abschnitt 4.2.2) angelegt,<br />

wobei über das Admin Interface gleichzeitiger Zugriff auf alle Solr-Kerne möglich ist. Die<br />

Konfiguration von den Indizes erfolgt auf Dateiebene. Für den Export <strong>der</strong> Applikationsdaten<br />

wird intern je nach verwendeter Methode ein UpdateHandler verwendet. Für die<br />

Ausführung <strong>der</strong> Suche werden die Suchanfragen <strong>der</strong> Nutzer durch den Parser aufbereitet.<br />

Danach werden die Information analysiert und zum Index hinzugefügt bzw. mit dem<br />

Index verglichen. Das Suchergebnis wird durch den ResponseWriter formatiert und über<br />

den Import dem Applikationsserver bereitgestellt.<br />

4.2.4.1 Index<br />

Wie bereits in <strong>der</strong> Abbildung 4.6 verdeutlicht, werden in Solr die Dokumente als Lucene-<br />

Indexe verwaltet. In <strong>der</strong> Abbildung 4.7 ist <strong>der</strong> strukturelle Aufbau eines Lucene-Indexes<br />

schematisch dargestellt und wird im Folgenden gemäß [Ind11] erläutert.<br />

Segment ... Segment<br />

Index<br />

Term<br />

Term<br />

...<br />

...<br />

...<br />

...<br />

Term<br />

...<br />

Term<br />

Feld<br />

Feld<br />

Dokument<br />

Feld<br />

Feld<br />

Dokument<br />

Abbildung 4.7: Der strukturelle Aufbau eines Lucene-Indexes<br />

Index<br />

Der Index stellt die oberste Struktureinheit dar und wird als eine invertierte Liste (vgl.<br />

Abschnitt 2.2.2) gespeichert.<br />

Segment<br />

Ein Index ist i.d.R. in Subindizes, die sogenannten Segmente, unterteilt, die eigenständig<br />

durchsuchtwerdenkönnen.Diese UnterteilunginSegmentehatdenHintergrunddieÄn<strong>der</strong>ungsoperationenaufdemIndexalsTeilaktualisierungenumzusetzen.Gemäß[Ing07a]werden<br />

von Lucene folgende Än<strong>der</strong>ungsoperationen auf dem Index unterstützt, welche über<br />

die Export-Schnittstelle an den Solr Server kommuniziert werden.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!