14.01.2014 Aufrufe

Entwicklung eines Kollaborationsnetzwerkes - Bergische Universität ...

Entwicklung eines Kollaborationsnetzwerkes - Bergische Universität ...

Entwicklung eines Kollaborationsnetzwerkes - Bergische Universität ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Effektivitätsbestimmung <strong>eines</strong> Reduktionsverfahrens, müssen die Qualitäten der von dem Verfahren<br />

ermittelten Ergebnismengen bezogen auf einen Set an Suchszenarien sowie die Homogenität der<br />

erzielten Qualitäten bezogen auf die Gesamtheit der Suchszenarien analysiert werden. Die<br />

Zusammensetzung der Szenarien, beispielsweise die Verteilung der Kandidatenwertigkeiten, ist dabei<br />

zu berücksichtigen. Während der Verfahrensanalyse (siehe Abschnitt 6.6) wurden die Kennzahlen zur<br />

Qualitätsbestimmung stetig angepasst. Nachfolgend werden der Prozess der Kennzahlentwicklung<br />

sowie die final zur Verfahrensbewertung verwendeten Kennzahlen beschrieben.<br />

Precision und Recall<br />

Wie bei dem BUW‐Outsourcingnetzwerk findet bei Information Retrieval Systemen (beispielsweise<br />

Internetsuchmaschinen) eine automatisierte Filterung von Kandidatenmengen anhand von<br />

Suchanfragen statt. Als Information Retrieval wird die Suche nach Dokumenten verstanden. Ziel der<br />

Suche ist, möglichst alle zu einer Suchanfrage relevanten Dokumente zu finden, während die Menge<br />

ermittelter irrelevanter Dokumente möglichst gering sein soll.<br />

Zur Bewertung des Ergebnisses haben sich im Information Retrieval die Kennzahlen Precision und<br />

Recall durchgesetzt. Für deren Bestimmung sind laut [Goe12, S. 330] folgende Werte von Bedeutung:<br />

Anzahl der gefundenen relevanten Kandidaten ()<br />

Anzahl der gefundenen nicht relevanten Kandidaten ()<br />

Anzahl der nicht gefundenen relevanten Kandidaten ()<br />

Anzahl der nicht gefundenen nicht relevanten Kandidaten ()<br />

Die Precision (Präzision, Relevanzrate) ist die Genauigkeit, mit dem der Suchmechanismus relevante<br />

und nicht relevante Kandidaten trennt. Diese Kennzahl gibt den Anteil relevanter Kandidaten des<br />

Suchergebnisses an und wird wie folgt berechnet [Goe12, S. 330]:<br />

<br />

; ∈ |0 1<br />

<br />

Der Recall (Rückruf‐ oder Vollständigkeitsrate) gibt Aufschluss über die Vollständigkeit der relevanten<br />

Kandidaten. Diese Kennzahl gibt den Anteil gefundener relevanter Kandidaten in Relation zu allen<br />

relevanten Kandidaten an und wird wie folgt berechnet [Goe12, S. 330]:<br />

<br />

; ∈|0 1<br />

<br />

Im Information Retrieval ist die Kombination beider Kennzahlen von Bedeutung. Eine Trefferquote<br />

relevanter Ergebnisse von 100 % ( 1) ist relativ unbedeutend, sofern die Menge an irrelevanten<br />

Kandidaten ebenfalls hoch und die somit gering ist [Goe12, S. 330 f.].<br />

105

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!