Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Zusammenfassung - Otto-von-Guericke-Universität Magdeburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
8 Evaluation<br />
(korrekt positiv) zur Anzahl aller Treffer. Der Recall ist das Verhältnis der Anzahl der korrekten<br />
Treffer zur Anzahl aller erwarteten Treffer. In einer alternativen Deutung beschreibt<br />
die Precision die bedingte Wahrscheinlichkeit, dass ein zufällig ausgewähltes Element x aus<br />
der Menge A aller gefundenen Dokumente auch Element der Menge B aller erwarteten Dokumente<br />
ist. Umgekehrt beschreibt der Recall die bedingte Wahrscheinlichkeit eines zufällig<br />
ausgewählten Elementes x aus B, auch Element in A zu sein.<br />
precision =<br />
P(x ∈ A ∩ B)<br />
P(x ∈ B|x ∈ A) =<br />
P(x ∈ A)<br />
recall =<br />
P(x ∈ A ∩ B)<br />
P(x ∈ A|x ∈ B) =<br />
P(x ∈ B)<br />
(8.4)<br />
(8.5)<br />
Eine hohe Precision bedeutet, dass nur wenige der <strong>von</strong> einem Retrievalsystem gefundenen<br />
Dokumente aus Sicht des Benutzers irrelevant sind und ein hoher Recall bedeutet, dass<br />
nur wenige relevante Dokumente bei einer Suche nicht gefunden wurden. Es ist unmittelbar<br />
einsichtig, dass die Güte eines Retrievalsystems umso höher ist, je höher die beiden Qualitätsmaße<br />
Precision und Recall sind. Wie sich im weiteren Verlauf dieses Kapitels zeigen wird,<br />
besteht zwischen beiden Qualitätsmaßen ein Zusammenhang, der dazu führt, dass beide Werte<br />
nicht unabhängig <strong>von</strong>einander betrachtet werden dürfen. Es ließe sich beispielsweise leicht<br />
ein Retrieval-System konstruieren, welches alle Dokumente der Menge D als Ergebnis liefert<br />
(d. h. A = D) und somit einen Recall <strong>von</strong> 1 beziehungsweise 100 % hätte. Die Precision eines<br />
solchen Systems wäre sehr gering, ebenso wie der Nutzen für den Anwender.<br />
Der Fallout gibt das Verhältnis der Anzahl der irrelevanten Treffer zur Gesamtzahl aller<br />
irrelevanten Treffer an. Dieses Qualitätsmaß drückt also die bedingte Wahrscheinlichkeit aus,<br />
dass irgendein irrelevantes Dokument x fälschlicherweise gefunden wird:<br />
f allout = P(x ∈ A|x ∈ ¯B) (8.6)<br />
Ein Retrievalsystem gilt als umso besser, je kleiner der Fallout ist. In Abbildung 8.1 sind<br />
die drei Qualitätsmaße in 3-Mengen-Venn-Diagrammen [Edw04] als Verhältnis der jeweils<br />
dunkleren grauen Fläche zur Summe beider grauen Flächen dargestellt.<br />
Um die Bewertung eines Retrievalsystems mittels der Qualitätsmaße Precision und Recall<br />
unter Berücksichtigung des oben skizzierten Zusammenhangs zwischen beiden Werten zu<br />
vereinfachen, wird in der Literatur häufig der F-Wert oder, präzizer, der F1-Wert (engl. F1measure)<br />
herangezogen, welcher laut [YL99, Ren04] erstmals in [Rij79] verwendet wurde.<br />
Dabei handelt es sich um den harmonischen Mittelwert aus Precision und Recall:<br />
F1 =<br />
2 × precision × recall<br />
precision + recall<br />
(8.7)<br />
Während bei den meisten Retrievalsystemen das Auffinden <strong>von</strong> Dokumenten mit bestimmten<br />
Eigenschaften im Vordergrund steht, zielt das in dieser Arbeit entwickelte System auf das<br />
Auffinden <strong>von</strong> Teilen <strong>von</strong> Dokumenten, das heißt <strong>von</strong> Textstellen (Worte, Teilworte, Wortgruppen,<br />
Symbole, . . . ) innerhalb <strong>von</strong> Handschriftdokumenten ab, woraus folgt, dass zur Bewertung<br />
der Güte des Retrievalsystems auch die Fähigkeit untersucht wird, fehlerfrei alle<br />
100