10.10.2013 Aufrufe

Kostenloser Download der gesamten Diplomarbeit - dotSource

Kostenloser Download der gesamten Diplomarbeit - dotSource

Kostenloser Download der gesamten Diplomarbeit - dotSource

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

KAPITEL 5. INTEGRATION IN SCOOBOX 64<br />

Die Zeitangaben wurden bei diesen Tests ebenfalls in dem CMS-Konsole aus dem Pipelet<br />

QuerySearchIndex, welches die Suchanfragen auf dem Index <strong>der</strong> Suchplattform ausführt,<br />

abgelesen.<br />

Im Folgenden werden die Ergebnisse <strong>der</strong> Suche an sieben Beispielen erläutert und gegenübergestellt.<br />

Die Auswahl <strong>der</strong> Begriffe sollte möglichst breites Spektrum an unterschiedlichen<br />

Szenarien mit geringer Anzahl an Beispielen abdecken, wobei folgende Begriffe<br />

verwendet wurden: Schneekugel, Shnekugel, Machtkampf, Volltextsuche, GEZ-Gebühr,<br />

Blog-Verzeichnis und Intershop.<br />

Schneekugel: DieDatenbankgeneriertzweiSuchergebnisseimText,welchedasSuchwort<br />

komplett in <strong>der</strong> Form enthalten. Diese Ergebnisse sind ebenfalls bei Solr und FACT-<br />

Fin<strong>der</strong> mit phonetischen Suche erhalten. Wenn die Suche ohne Phonetik erfolgt, so<br />

liefert Solr erwartungsgemäß zwei exakte Ergebnisse zurück. Das Suchergebnis von<br />

FACT-Fin<strong>der</strong> enthält ebenfalls zwei Beiträge. Mit Phonetik enthält die Ergebnismenge<br />

von Solr ein weiteres Ergebnis. Der von Solr verwendete phonetische Filter<br />

berechnet für Schneekugel und Schwungkraft den selben phonetischen Code, so dass<br />

<strong>der</strong> Beitrag (in dem das Stichwort vorkommt) fälschlicherweise in das Suchergebnis<br />

aufgenommen wird.<br />

Solr und FACT-Fin<strong>der</strong> ordnen die zwei richtigen Ergebnisse unterschiedlich in ihren<br />

Ergebnissen an. Solr ordnet den Beitrag, wo <strong>der</strong> Begriff vier mal vorkommt, ganz<br />

oben ein. FACT-Fin<strong>der</strong> dagegen stuft den Beitrag, wo <strong>der</strong> Begriff einmal vorkommt,<br />

jedoch weiter vorne im Text steht als relevanter ein, was entwe<strong>der</strong> auf die Berücksichtigung<br />

<strong>der</strong> Position o<strong>der</strong> Ignorieren <strong>der</strong> weiteren Vorkommnisse hindeutet.<br />

Schnekugel: In <strong>der</strong> Datenbankanfrage wirddieser Begriff nicht gefunden. OhnePhonetik<br />

findet Solr keine Ergebnisse, FACT-Fin<strong>der</strong> kann dagegen einen Beitrag mit Schneekugel<br />

immer noch finden. Was auf die weiterhin vorhandene Fehlertoleranz bei <strong>der</strong><br />

Suche vermuten lässt. Mit Phonetik stimmen die Ergebnisse mit <strong>der</strong> Suche nach<br />

Schneekugel erwartungsgemäß überein.<br />

Machtkampf: Die SQL-Abfrage liefert drei Suchergebnisse, wo <strong>der</strong> Begriff in exakter<br />

Form vorhanden ist und in jedem Post genau einmal im Attribut Text vorkommt.<br />

Bei<strong>der</strong>SucheohnePhonetikenthält dasSuchergebnisvonSolrundFACT-Fin<strong>der</strong>die<br />

exakten Ergebnisse. Das Ergebnis mit Phonetik stimmt bei FACT-Fin<strong>der</strong> mit dem<br />

<strong>der</strong> Datenbank überein. Solr hat neun Suchergebnisse gefunden, von den fünf durch<br />

die gleiche Phonetik des Begriffs mächtig und ein Beitrag über den Begriff Machtwechsel<br />

als relevant identifiziert wurden. Nach visueller Inspektion ist <strong>der</strong> Post mit<br />

demBegriff Machtwechsel aus thematischer Sicht durchausals relevant fürdenSuchbegriff<br />

anzusehen, was vermutlich aufgrund des Präfixes Macht und nicht aufgrund<br />

<strong>der</strong> Semantik den Treffer erkannt hat.<br />

Bei FACT-Fin<strong>der</strong> wurden die Ergebnisse nach genauerem Betrachten vermutlich<br />

nach <strong>der</strong> Position des Vorkommens im Text angeordnet werden. Die Anordnung von<br />

Solr ist in diesem Fall an<strong>der</strong>s als bei FACT-Fin<strong>der</strong>. Die Posts, wo auf den ersten<br />

Blick <strong>der</strong> Textumfang geringer ist, werden weiter oben angeordnet.<br />

Volltextsuche: Laut <strong>der</strong> Datenbanksuche Oracle enthält kein Post diesen Suchbegriff.<br />

Ohne Phonetik liefert Solr keine Ergebnisse. FACT-Fin<strong>der</strong> findet ein Ergebnis mit

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!