16.12.2012 Aufrufe

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

Zusammenfassung - Otto-von-Guericke-Universität Magdeburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

8 Evaluation<br />

(korrekt positiv) zur Anzahl aller Treffer. Der Recall ist das Verhältnis der Anzahl der korrekten<br />

Treffer zur Anzahl aller erwarteten Treffer. In einer alternativen Deutung beschreibt<br />

die Precision die bedingte Wahrscheinlichkeit, dass ein zufällig ausgewähltes Element x aus<br />

der Menge A aller gefundenen Dokumente auch Element der Menge B aller erwarteten Dokumente<br />

ist. Umgekehrt beschreibt der Recall die bedingte Wahrscheinlichkeit eines zufällig<br />

ausgewählten Elementes x aus B, auch Element in A zu sein.<br />

precision =<br />

P(x ∈ A ∩ B)<br />

P(x ∈ B|x ∈ A) =<br />

P(x ∈ A)<br />

recall =<br />

P(x ∈ A ∩ B)<br />

P(x ∈ A|x ∈ B) =<br />

P(x ∈ B)<br />

(8.4)<br />

(8.5)<br />

Eine hohe Precision bedeutet, dass nur wenige der <strong>von</strong> einem Retrievalsystem gefundenen<br />

Dokumente aus Sicht des Benutzers irrelevant sind und ein hoher Recall bedeutet, dass<br />

nur wenige relevante Dokumente bei einer Suche nicht gefunden wurden. Es ist unmittelbar<br />

einsichtig, dass die Güte eines Retrievalsystems umso höher ist, je höher die beiden Qualitätsmaße<br />

Precision und Recall sind. Wie sich im weiteren Verlauf dieses Kapitels zeigen wird,<br />

besteht zwischen beiden Qualitätsmaßen ein Zusammenhang, der dazu führt, dass beide Werte<br />

nicht unabhängig <strong>von</strong>einander betrachtet werden dürfen. Es ließe sich beispielsweise leicht<br />

ein Retrieval-System konstruieren, welches alle Dokumente der Menge D als Ergebnis liefert<br />

(d. h. A = D) und somit einen Recall <strong>von</strong> 1 beziehungsweise 100 % hätte. Die Precision eines<br />

solchen Systems wäre sehr gering, ebenso wie der Nutzen für den Anwender.<br />

Der Fallout gibt das Verhältnis der Anzahl der irrelevanten Treffer zur Gesamtzahl aller<br />

irrelevanten Treffer an. Dieses Qualitätsmaß drückt also die bedingte Wahrscheinlichkeit aus,<br />

dass irgendein irrelevantes Dokument x fälschlicherweise gefunden wird:<br />

f allout = P(x ∈ A|x ∈ ¯B) (8.6)<br />

Ein Retrievalsystem gilt als umso besser, je kleiner der Fallout ist. In Abbildung 8.1 sind<br />

die drei Qualitätsmaße in 3-Mengen-Venn-Diagrammen [Edw04] als Verhältnis der jeweils<br />

dunkleren grauen Fläche zur Summe beider grauen Flächen dargestellt.<br />

Um die Bewertung eines Retrievalsystems mittels der Qualitätsmaße Precision und Recall<br />

unter Berücksichtigung des oben skizzierten Zusammenhangs zwischen beiden Werten zu<br />

vereinfachen, wird in der Literatur häufig der F-Wert oder, präzizer, der F1-Wert (engl. F1measure)<br />

herangezogen, welcher laut [YL99, Ren04] erstmals in [Rij79] verwendet wurde.<br />

Dabei handelt es sich um den harmonischen Mittelwert aus Precision und Recall:<br />

F1 =<br />

2 × precision × recall<br />

precision + recall<br />

(8.7)<br />

Während bei den meisten Retrievalsystemen das Auffinden <strong>von</strong> Dokumenten mit bestimmten<br />

Eigenschaften im Vordergrund steht, zielt das in dieser Arbeit entwickelte System auf das<br />

Auffinden <strong>von</strong> Teilen <strong>von</strong> Dokumenten, das heißt <strong>von</strong> Textstellen (Worte, Teilworte, Wortgruppen,<br />

Symbole, . . . ) innerhalb <strong>von</strong> Handschriftdokumenten ab, woraus folgt, dass zur Bewertung<br />

der Güte des Retrievalsystems auch die Fähigkeit untersucht wird, fehlerfrei alle<br />

100

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!