16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8 Evaluation<br />

Hierbei wird die Fläche unter der Precision-Recall-Kurve als Summe <strong>von</strong> Teilflächen in<br />

Trapezform berechnet. Die Werte für τ0 und τn+1 sollen mit 0 beziehungsweise 1 festgelegt<br />

sein. Weiterhin gelte precision(0) = recall(1) = 0 und precision(1) = recall(0) = 1. Alternativ<br />

lässt sich die Fläche auch durch eine Zerlegung in Rechtecke annähern, wobei die<br />

Resultate dabei pessimistischer sind als bei der Trapezmethode:<br />

AUC ′ =<br />

n<br />

�<br />

�<br />

∑ precision(τi) · recall(τi) − recall(τi+1)<br />

i=1<br />

(8.15)<br />

Grafisch werden beide Methoden in Abbildung 8.3 veranschaulicht. Die Trapezmethode ist<br />

im linken Diagramm, die Rechteckmethode im rechten Diagramm dargestellt.<br />

1<br />

precision<br />

τ<br />

n<br />

τ<br />

n−1<br />

...<br />

τ 3<br />

τ<br />

2<br />

recall<br />

τ<br />

1<br />

1<br />

1<br />

precision<br />

AUC AUC’<br />

Abbildung 8.3: Berechnung der Fläche unter einer Precision-Recall-Kurve mittels der Trapezund<br />

der Rechteckmethode<br />

Der erwähnte Schnittpunkt einer Precision-Recall-Kurve mit der Hauptdiagonalen lässt sich<br />

nicht in jedem Fall exakt bestimmen, da bei lediglich endlich vielen Suchanfragen sich die<br />

Werte der Precision und des Recalls auch bei kontinuierlich steigenden Ähnlichkeitsschwellwerten<br />

in diskreten Schritten verändern. Der Schnittpunkt kann jedoch dadurch approximiert<br />

werden, dass für jenes Precision-Recall-Paar einer Kurve, welches der Hauptdiagonalen am<br />

nächsten liegt, der F1-Wert bestimmt wird; das der Hauptdiagonalen am nächsten liegende<br />

Precision-Recall-Paar minimiert den Wert |precision − recall|.<br />

mit<br />

104<br />

F1 = 2 × precision(τEER) × recall(τEER)<br />

precision(τEER) + recall(τEER)<br />

τ<br />

n<br />

τ<br />

n−1<br />

...<br />

τ 3<br />

τ<br />

2<br />

recall<br />

τ<br />

1<br />

1<br />

(8.16)<br />

τEER = argmin|precision(τ)<br />

− recall(τ)| (8.17)<br />

τ

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!