Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
8 Evaluation<br />
große Anzahl freier Parameter, welche idealerweise in all ihren Ausprägungen untersucht<br />
werden müssten. Da dies aufgrund des hohen Bedarfes an Ressourcen nicht zweckmäßig ist,<br />
wurde in dieser Arbeit nur eine kleine Auswahl <strong>von</strong> Parameterausprägungen der Teilsysteme<br />
berücksichtigt, und an diesen untersucht, wie sich die Fusion auf die Leistungsfähigkeit<br />
auswirkt.<br />
Multi-Sample-Fusion<br />
Für die in Abschnitt 7.2.1 beschriebene Multi-Sample-Fusion auf der Entscheidungsebene<br />
ist der Wert n (die Anzahl der Suchwiederholungen) der einzige Parameter, zusätzlich zu<br />
denen des zugrunde liegenden fusionslosen Systems. Der Zeitaufwand für den eigentlichen<br />
Suchvorgang erhöht sich um den Faktor n + 1 im Gegensatz zur ursprünglichen Suchzeit.<br />
Daher wurde die Evaluation nur für Werte n ≤ 3 durchgeführt.<br />
Neben diesem Parameter n der Suchwiederholungen existiert bei der Multi-Sample-Fusion<br />
auf der Vergleichsebene ein weiterer Parameter: die Auswahl der Fusionsfunktion der Ähnlichkeitsvektoren.<br />
Hierbei wurden die Minimum-, die Maximumfunktion sowie der Durchschnitt<br />
untersucht. Für den Parameter n galt hier ebenfalls n ≤ 3.<br />
Multialgorithmische Fusion<br />
Ein Retrievalsystem, das auf der Merkmalsebene eine multialgorithmische Fusion durchführt<br />
(siehe Abschnitt 7.2.2), hat einen Zeitaufwand für die Suche, der den eines Systems ohne Fusion<br />
nicht übersteigt, da sich die Längen der Merkmalszeichenketten durch die Fusion nicht<br />
vergrößern; lediglich die Alphabetgröße steigt. Die im Abschnitt 7.2.2 diskutierten, für eine<br />
solche Fusion geeigneten Merkmalstypen sind die lokale Schriftrichtung und -krümmung.<br />
Beide Merkmalstypen besitzen zwei Parameter: den Resamplingabstand und den jeweiligen<br />
Quantisierungsgrad. Für die Fusion beider Merkmalstypen ist es nötig, dass der Parameter des<br />
Resamplingabstandes der fusionierten Merkmale gleich ist. Damit ergibt sich eine Gesamtzahl<br />
<strong>von</strong> drei unabhängigen Parametern des fusionierten Gesamtsystems: der Resamplingabstand<br />
und zwei Quantisierungsgrade q1 und q2. Als Resamplingabstand wurden für die Tests die<br />
Werte 10, 15, 20 und 30 verwendet. Für q1 und q2 wurden die Werte 1, 4, 8 und 16 berücksichtigt<br />
(ohne q1 = q2 = 1).<br />
Die multialgorithmische Fusion auf der Entscheidungsebene ist ohne Weiteres für jede<br />
Kombination beliebiger Einzelsysteme, unabhängig <strong>von</strong> ihren jeweiligen Merkmalstypen und<br />
deren Parametern möglich. Aufgrund des hohen Zeitbedarfs für das Testen aller möglichen<br />
Kombinationen wurde in dieser Arbeit eine Teilmenge dieser Kombinationsmöglichkeiten<br />
berücksichtigt: es wurden jeweils zwei Teilsysteme miteinander fusioniert, wobei eines der<br />
Teilsysteme stets jenes war, welches die besten Einzelergebnisse erbrachte. Auf diese Weise<br />
sollte untersucht werden, ob die Resultate dieses besten Einzelsystems durch eine Fusion mit<br />
weniger leistungsstarken Einzelsystemen weiter gesteigert werden können.<br />
Für eine multialgorithmische Fusion auf der Entscheidungsebene wurden die Schwellwerte<br />
der Einzelsysteme unabhängig <strong>von</strong>einander variiert und für jede Schwellwertkombination die<br />
Precision und der Recall der Fusion ermittelt. Die Fusion wurde durchgeführt sowohl mittels<br />
Bestimmung der Schnitt-, als auch der Vereinigungsmenge der Ergebnismengen der Ein-<br />
110