16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

8 Evaluation<br />

Mittelwert über alle FRR(n):<br />

FRR = 1<br />

N<br />

N<br />

∑ FRR(n) «<br />

n=1<br />

In Anlehnung an dieses Vorgehen soll für die Evaluation des hier entwickelten Retrievalsystems<br />

gelten:<br />

precisionn(τ) =<br />

recalln(τ) =<br />

Zahl korrekter Treffer bei Suche nach Dokumenten <strong>von</strong> Person n<br />

Zahl aller Treffer bei Suche nach Dokumenten <strong>von</strong> Person n<br />

(8.8)<br />

Zahl korrekter Treffer bei Suche nach Dokumenten <strong>von</strong> Person n<br />

Zahl der erwarteten Treffer bei Suche nach Dokumenten <strong>von</strong> Person n (8.9)<br />

Hierbei seien precisionn(τ) und recalln(τ) die Precision und der Recall für einen Schreiber<br />

n. Der Funktionsparameter τ ist der Toleranz- oder Schwellwert für die Anfrage (vgl. Kapitel<br />

6). Für N verschiedene Schreiber ergeben sich damit die globalen Präzisions- und Recallwerte<br />

wie folgt:<br />

precision(τ) = 1 N<br />

N ∑ precisonn(τ) (8.10)<br />

n=1<br />

recall(τ) = 1 N<br />

N ∑ recalln(τ) (8.11)<br />

n=1<br />

Die Precision und der Recall als Funktionen des Parameters τ lassen sich als Graphen in<br />

Diagrammen darstellen. Dadurch ist zum einen der Einfluss des Schwellwertes τ auf diese<br />

Qualitätsmaße erkennbar, zum anderen ist hierdurch ein Vergleich unterschiedlicher Retrievalsysteme<br />

möglich. Abbildung 8.2 (links) zeigt das Beispiel eines solchen Diagramms für<br />

zwei verschiedene Retrievalsysteme, dargestellt als durchgezogene beziehungsweise gestrichelte<br />

Kurven.<br />

Der Schnittpunkt der Precision- und Recall-Kurve des jeweiligen Retrievalsystems entspricht<br />

etwa dem EER-Punkt 1 (engl. equal error rate) biometrischer Systeme, mit dem Unterschied,<br />

dass ein biometrisches System als umso besser gilt, je kleiner der EER-Wert ist,<br />

während für Retrievalsysteme möglichst hohe Werte der Precision und des Recalls im Schnittpunkt<br />

wünschenswert sind. Im Beispiel in Abbildung 8.2 wäre daher das System 1 besser als<br />

das System 2.<br />

Die rechte Seite der Abbildung 8.2 zeigt die Precision als Funktion des Recalls. Diese<br />

Art der Darstellung wird als Precision-Recall-Diagramm bezeichnet 2 [Rij79, S. 115] und ist<br />

1 Der EER-Punkt ist der Schnittpunkt der Fehlerkurven der FRR und FAR.<br />

2 In der Literatur finden sich mitunter auch Diagramme, die den Recall in Abhängigkeit <strong>von</strong> der Precision<br />

darstellen, und die als Recall-Precision-Diagramme bezeichnet werden [Mal06].<br />

102

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!