16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

8 Evaluation<br />

große Anzahl freier Parameter, welche idealerweise in all ihren Ausprägungen untersucht<br />

werden müssten. Da dies aufgrund des hohen Bedarfes an Ressourcen nicht zweckmäßig ist,<br />

wurde in dieser Arbeit nur eine kleine Auswahl <strong>von</strong> Parameterausprägungen der Teilsysteme<br />

berücksichtigt, und an diesen untersucht, wie sich die Fusion auf die Leistungsfähigkeit<br />

auswirkt.<br />

Multi-Sample-Fusion<br />

Für die in Abschnitt 7.2.1 beschriebene Multi-Sample-Fusion auf der Entscheidungsebene<br />

ist der Wert n (die Anzahl der Suchwiederholungen) der einzige Parameter, zusätzlich zu<br />

denen des zugrunde liegenden fusionslosen Systems. Der Zeitaufwand für den eigentlichen<br />

Suchvorgang erhöht sich um den Faktor n + 1 im Gegensatz zur ursprünglichen Suchzeit.<br />

Daher wurde die Evaluation nur für Werte n ≤ 3 durchgeführt.<br />

Neben diesem Parameter n der Suchwiederholungen existiert bei der Multi-Sample-Fusion<br />

auf der Vergleichsebene ein weiterer Parameter: die Auswahl der Fusionsfunktion der Ähnlichkeitsvektoren.<br />

Hierbei wurden die Minimum-, die Maximumfunktion sowie der Durchschnitt<br />

untersucht. Für den Parameter n galt hier ebenfalls n ≤ 3.<br />

Multialgorithmische Fusion<br />

Ein Retrievalsystem, das auf der Merkmalsebene eine multialgorithmische Fusion durchführt<br />

(siehe Abschnitt 7.2.2), hat einen Zeitaufwand für die Suche, der den eines Systems ohne Fusion<br />

nicht übersteigt, da sich die Längen der Merkmalszeichenketten durch die Fusion nicht<br />

vergrößern; lediglich die Alphabetgröße steigt. Die im Abschnitt 7.2.2 diskutierten, für eine<br />

solche Fusion geeigneten Merkmalstypen sind die lokale Schriftrichtung und -krümmung.<br />

Beide Merkmalstypen besitzen zwei Parameter: den Resamplingabstand und den jeweiligen<br />

Quantisierungsgrad. Für die Fusion beider Merkmalstypen ist es nötig, dass der Parameter des<br />

Resamplingabstandes der fusionierten Merkmale gleich ist. Damit ergibt sich eine Gesamtzahl<br />

<strong>von</strong> drei unabhängigen Parametern des fusionierten Gesamtsystems: der Resamplingabstand<br />

und zwei Quantisierungsgrade q1 und q2. Als Resamplingabstand wurden für die Tests die<br />

Werte 10, 15, 20 und 30 verwendet. Für q1 und q2 wurden die Werte 1, 4, 8 und 16 berücksichtigt<br />

(ohne q1 = q2 = 1).<br />

Die multialgorithmische Fusion auf der Entscheidungsebene ist ohne Weiteres für jede<br />

Kombination beliebiger Einzelsysteme, unabhängig <strong>von</strong> ihren jeweiligen Merkmalstypen und<br />

deren Parametern möglich. Aufgrund des hohen Zeitbedarfs für das Testen aller möglichen<br />

Kombinationen wurde in dieser Arbeit eine Teilmenge dieser Kombinationsmöglichkeiten<br />

berücksichtigt: es wurden jeweils zwei Teilsysteme miteinander fusioniert, wobei eines der<br />

Teilsysteme stets jenes war, welches die besten Einzelergebnisse erbrachte. Auf diese Weise<br />

sollte untersucht werden, ob die Resultate dieses besten Einzelsystems durch eine Fusion mit<br />

weniger leistungsstarken Einzelsystemen weiter gesteigert werden können.<br />

Für eine multialgorithmische Fusion auf der Entscheidungsebene wurden die Schwellwerte<br />

der Einzelsysteme unabhängig <strong>von</strong>einander variiert und für jede Schwellwertkombination die<br />

Precision und der Recall der Fusion ermittelt. Die Fusion wurde durchgeführt sowohl mittels<br />

Bestimmung der Schnitt-, als auch der Vereinigungsmenge der Ergebnismengen der Ein-<br />

110

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!