Kostenloser Download der gesamten Diplomarbeit - dotSource
Kostenloser Download der gesamten Diplomarbeit - dotSource
Kostenloser Download der gesamten Diplomarbeit - dotSource
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
KAPITEL 5. INTEGRATION IN SCOOBOX 64<br />
Die Zeitangaben wurden bei diesen Tests ebenfalls in dem CMS-Konsole aus dem Pipelet<br />
QuerySearchIndex, welches die Suchanfragen auf dem Index <strong>der</strong> Suchplattform ausführt,<br />
abgelesen.<br />
Im Folgenden werden die Ergebnisse <strong>der</strong> Suche an sieben Beispielen erläutert und gegenübergestellt.<br />
Die Auswahl <strong>der</strong> Begriffe sollte möglichst breites Spektrum an unterschiedlichen<br />
Szenarien mit geringer Anzahl an Beispielen abdecken, wobei folgende Begriffe<br />
verwendet wurden: Schneekugel, Shnekugel, Machtkampf, Volltextsuche, GEZ-Gebühr,<br />
Blog-Verzeichnis und Intershop.<br />
Schneekugel: DieDatenbankgeneriertzweiSuchergebnisseimText,welchedasSuchwort<br />
komplett in <strong>der</strong> Form enthalten. Diese Ergebnisse sind ebenfalls bei Solr und FACT-<br />
Fin<strong>der</strong> mit phonetischen Suche erhalten. Wenn die Suche ohne Phonetik erfolgt, so<br />
liefert Solr erwartungsgemäß zwei exakte Ergebnisse zurück. Das Suchergebnis von<br />
FACT-Fin<strong>der</strong> enthält ebenfalls zwei Beiträge. Mit Phonetik enthält die Ergebnismenge<br />
von Solr ein weiteres Ergebnis. Der von Solr verwendete phonetische Filter<br />
berechnet für Schneekugel und Schwungkraft den selben phonetischen Code, so dass<br />
<strong>der</strong> Beitrag (in dem das Stichwort vorkommt) fälschlicherweise in das Suchergebnis<br />
aufgenommen wird.<br />
Solr und FACT-Fin<strong>der</strong> ordnen die zwei richtigen Ergebnisse unterschiedlich in ihren<br />
Ergebnissen an. Solr ordnet den Beitrag, wo <strong>der</strong> Begriff vier mal vorkommt, ganz<br />
oben ein. FACT-Fin<strong>der</strong> dagegen stuft den Beitrag, wo <strong>der</strong> Begriff einmal vorkommt,<br />
jedoch weiter vorne im Text steht als relevanter ein, was entwe<strong>der</strong> auf die Berücksichtigung<br />
<strong>der</strong> Position o<strong>der</strong> Ignorieren <strong>der</strong> weiteren Vorkommnisse hindeutet.<br />
Schnekugel: In <strong>der</strong> Datenbankanfrage wirddieser Begriff nicht gefunden. OhnePhonetik<br />
findet Solr keine Ergebnisse, FACT-Fin<strong>der</strong> kann dagegen einen Beitrag mit Schneekugel<br />
immer noch finden. Was auf die weiterhin vorhandene Fehlertoleranz bei <strong>der</strong><br />
Suche vermuten lässt. Mit Phonetik stimmen die Ergebnisse mit <strong>der</strong> Suche nach<br />
Schneekugel erwartungsgemäß überein.<br />
Machtkampf: Die SQL-Abfrage liefert drei Suchergebnisse, wo <strong>der</strong> Begriff in exakter<br />
Form vorhanden ist und in jedem Post genau einmal im Attribut Text vorkommt.<br />
Bei<strong>der</strong>SucheohnePhonetikenthält dasSuchergebnisvonSolrundFACT-Fin<strong>der</strong>die<br />
exakten Ergebnisse. Das Ergebnis mit Phonetik stimmt bei FACT-Fin<strong>der</strong> mit dem<br />
<strong>der</strong> Datenbank überein. Solr hat neun Suchergebnisse gefunden, von den fünf durch<br />
die gleiche Phonetik des Begriffs mächtig und ein Beitrag über den Begriff Machtwechsel<br />
als relevant identifiziert wurden. Nach visueller Inspektion ist <strong>der</strong> Post mit<br />
demBegriff Machtwechsel aus thematischer Sicht durchausals relevant fürdenSuchbegriff<br />
anzusehen, was vermutlich aufgrund des Präfixes Macht und nicht aufgrund<br />
<strong>der</strong> Semantik den Treffer erkannt hat.<br />
Bei FACT-Fin<strong>der</strong> wurden die Ergebnisse nach genauerem Betrachten vermutlich<br />
nach <strong>der</strong> Position des Vorkommens im Text angeordnet werden. Die Anordnung von<br />
Solr ist in diesem Fall an<strong>der</strong>s als bei FACT-Fin<strong>der</strong>. Die Posts, wo auf den ersten<br />
Blick <strong>der</strong> Textumfang geringer ist, werden weiter oben angeordnet.<br />
Volltextsuche: Laut <strong>der</strong> Datenbanksuche Oracle enthält kein Post diesen Suchbegriff.<br />
Ohne Phonetik liefert Solr keine Ergebnisse. FACT-Fin<strong>der</strong> findet ein Ergebnis mit