16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

1<br />

0<br />

recall<br />

precision<br />

1<br />

precision<br />

system 1<br />

system 2<br />

8.1 Grundlagen<br />

similarity threshold τ 1<br />

recall<br />

Abbildung 8.2: Grafische Darstellung der Precision und des Recalls zweier Retrievalsysteme<br />

als Funktionen eines Ähnlichkeitsschwellwertes (links) sowie als Precision-<br />

Recall-Diagramm (rechts)<br />

verwandt mit den klassischen ROC-Kurven (engl. receiver operating characteristic), welche<br />

für Klassifikatoren die Abhängigkeit der korrekt positiven <strong>von</strong> den falsch positiven Entscheidungen<br />

visualisieren [Faw06, HMS01, S. 454]. Die Schnittpunkte der Kurven in diesem<br />

Precision-Recall-Diagramm mit der Hauptdiagonalen (hier dargestellt als gepunktete Linie)<br />

entsprechen den Werten der Schnittpunkte der Precision- und Recall-Kurven im linken Diagramm.<br />

Jeder Punkt auf der Precision-Recall-Kurve eines Retrievalsystems entspricht einem anderen<br />

Schwellwert τ. Um den Vergleich <strong>von</strong> Retrievalsystemen zu vereinfachen, werden oftmals<br />

nur einzelne Größenwerte statt der kompletten Precision-Recall- oder ROC-Kurven herangezogen<br />

3 ; zum einen die bereits erwähnten Schnittpunkte mit der Hauptdiagonale [HMS01, S.<br />

455] und zum anderen die Flächen unter den Precision-Recall-Kurven (AUC, engl. area under<br />

curve) [Faw06]. Beide Größen können einen Wert im Intervall [0,1] annehmen.<br />

Für n diskrete Ähnlichkeitsschwellwerte τ1 bis τn seien precision(τ1) bis precision(τn) und<br />

recall(τ1) bis recall(τn) die ermittelten Werte der Precision und des Recalls. Es gilt hierbei<br />

und<br />

0 ≤ precision(τ1) ≤ precision(τ2) ≤ ... ≤ precision(τn) ≤ 1 (8.12)<br />

1 ≥ recall(τ1) ≥ recall(τ2) ≥ ... ≥ recall(τn) ≥ 0 (8.13)<br />

mit 0 ≤ τ1 < τ2 < ... < τn ≤ 1. Die AUC einer Precision-Recall-Kurve, die durch n Ähnlich-<br />

keitsschwellwerte τ1 bis τn definiert ist, kann wie folgt bestimmt werden:<br />

AUC =<br />

n 1<br />

∑<br />

i=0 2 ·<br />

�<br />

�<br />

precision(τi) + precision(τi+1)<br />

·<br />

�<br />

�<br />

recall(τi) − recall(τi+1)<br />

1<br />

(8.14)<br />

3 »To compare classifiers we may want to reduce ROC performance to a single scalar value representing expec-<br />

ted performance.« [Faw06]<br />

103

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!