Entwicklung eines Kollaborationsnetzwerkes - Bergische Universität ...
Entwicklung eines Kollaborationsnetzwerkes - Bergische Universität ...
Entwicklung eines Kollaborationsnetzwerkes - Bergische Universität ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Effektivitätsbestimmung <strong>eines</strong> Reduktionsverfahrens, müssen die Qualitäten der von dem Verfahren<br />
ermittelten Ergebnismengen bezogen auf einen Set an Suchszenarien sowie die Homogenität der<br />
erzielten Qualitäten bezogen auf die Gesamtheit der Suchszenarien analysiert werden. Die<br />
Zusammensetzung der Szenarien, beispielsweise die Verteilung der Kandidatenwertigkeiten, ist dabei<br />
zu berücksichtigen. Während der Verfahrensanalyse (siehe Abschnitt 6.6) wurden die Kennzahlen zur<br />
Qualitätsbestimmung stetig angepasst. Nachfolgend werden der Prozess der Kennzahlentwicklung<br />
sowie die final zur Verfahrensbewertung verwendeten Kennzahlen beschrieben.<br />
Precision und Recall<br />
Wie bei dem BUW‐Outsourcingnetzwerk findet bei Information Retrieval Systemen (beispielsweise<br />
Internetsuchmaschinen) eine automatisierte Filterung von Kandidatenmengen anhand von<br />
Suchanfragen statt. Als Information Retrieval wird die Suche nach Dokumenten verstanden. Ziel der<br />
Suche ist, möglichst alle zu einer Suchanfrage relevanten Dokumente zu finden, während die Menge<br />
ermittelter irrelevanter Dokumente möglichst gering sein soll.<br />
Zur Bewertung des Ergebnisses haben sich im Information Retrieval die Kennzahlen Precision und<br />
Recall durchgesetzt. Für deren Bestimmung sind laut [Goe12, S. 330] folgende Werte von Bedeutung:<br />
Anzahl der gefundenen relevanten Kandidaten ()<br />
Anzahl der gefundenen nicht relevanten Kandidaten ()<br />
Anzahl der nicht gefundenen relevanten Kandidaten ()<br />
Anzahl der nicht gefundenen nicht relevanten Kandidaten ()<br />
Die Precision (Präzision, Relevanzrate) ist die Genauigkeit, mit dem der Suchmechanismus relevante<br />
und nicht relevante Kandidaten trennt. Diese Kennzahl gibt den Anteil relevanter Kandidaten des<br />
Suchergebnisses an und wird wie folgt berechnet [Goe12, S. 330]:<br />
<br />
; ∈ |0 1<br />
<br />
Der Recall (Rückruf‐ oder Vollständigkeitsrate) gibt Aufschluss über die Vollständigkeit der relevanten<br />
Kandidaten. Diese Kennzahl gibt den Anteil gefundener relevanter Kandidaten in Relation zu allen<br />
relevanten Kandidaten an und wird wie folgt berechnet [Goe12, S. 330]:<br />
<br />
; ∈|0 1<br />
<br />
Im Information Retrieval ist die Kombination beider Kennzahlen von Bedeutung. Eine Trefferquote<br />
relevanter Ergebnisse von 100 % ( 1) ist relativ unbedeutend, sofern die Menge an irrelevanten<br />
Kandidaten ebenfalls hoch und die somit gering ist [Goe12, S. 330 f.].<br />
105