20.07.2013 Aufrufe

Agentensysteme - Dokumentenserver Fakultät für Mathematik und ...

Agentensysteme - Dokumentenserver Fakultät für Mathematik und ...

Agentensysteme - Dokumentenserver Fakultät für Mathematik und ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Entwicklungsstand<br />

gen. Dabei benötigten die Agenten nicht einmal eine Wissensrepräsentation<br />

dieser Domäne, sondern konnten praktisch auf Formulardaten arbeiten.<br />

Aus diesem Gr<strong>und</strong> war es auch nicht notwendig, diese Agenten<br />

mit ausgefeilten ‚intelligenten‘ Algorithmen auszustatten.<br />

Yenta unterscheidet sich in diesen <strong>und</strong> weiteren Punkten wesentlich von<br />

den erwähnten Programmen. Ausgangspunkt <strong>für</strong> die Entwicklung war<br />

die Beobachtung, daß es viele passive Nutzer des Internet gibt, die, da<br />

sie nicht selbst aktiv <strong>für</strong> Inhalte sorgen, nichts voneinander erfahren,<br />

aber möglicherweise einander weiterhelfen könnten. Ein weiterer Aspekt<br />

ist die Schwierigkeit, Experten <strong>für</strong> ein bestimmtes Thema im Internet zu<br />

finden. Die Yenta-Agenten haben also die Aufgabe, ohne Hilfe durch<br />

den Benutzer, dessen Interessenschwerpunkte herauszufinden, mit anderen<br />

Agenten Kontakt aufzunehmen <strong>und</strong> Cluster zu bilden.<br />

Der Ansatz von Yenta, diese Funktionen adäquat umzusetzen sieht wie<br />

folgt aus:<br />

• Interessen des Benutzers ermitteln<br />

Da sich das System nicht auf ein bestimmtes Thema beschränkt, ist<br />

es wenig sinnvoll, die Interessen durch die Angabe von Stichwörtern<br />

durch den Benutzer zu erfassen (abgesehen davon, daß dieser nicht<br />

mit einbezogen werden sollte). Ein späterer Vergleich dieser individuellen<br />

Angaben wird nur selten zu Übereinstimmungen führen.<br />

Statt dessen verarbeitet der Agent alles in elektronischer Textform<br />

vorliegende Material, das der Benutzer lokal gespeichert hat. Dazu<br />

gehören Email, News-Texte, Textdateien im Dateisystem u.ä41 .Für<br />

diese Dokumente werden, nach Stemming <strong>und</strong> Bildung der inversen<br />

Wortfrequenz, Dokumentenvektoren berechnet. Mit diesen ist es<br />

dann möglich, lokal Minicluster42 zu bilden, indem das Skalarprodukt<br />

zwischen jeweils zwei Dokumentvektoren ermittelt wird <strong>und</strong> bei<br />

Überschreitung eines bestimmten Schwellwert die zugehörigen Dokumente<br />

zusammenfaßt werden43 . Dieser Schritt wird von Foner als<br />

‚Preclustering‘ bezeichnet.<br />

• Kontaktaufnahme<br />

Im Gegensatz zu anderen Ansätzen verwendet Yenta eine strikt dezentralisierte<br />

peer-to-peer Architektur, d.h. es gibt keine zentrale<br />

Anlaufstelle, die Informationen über die Existenz <strong>und</strong>/oder den Inhalt<br />

anderer Agenten besitzt. Der Vorteil einer solchen Struktur ist, daß<br />

sie sich leichter skalieren läßt (der Aufwand eines zentralen Servers<br />

würde in Abhängigkeit von der Zahl der Agenten quadratisch steigen),<br />

das System ist weniger fehleranfällig <strong>und</strong> private Informationen,<br />

die in den Agenten gespeichert sind, sind besser vor Eindring-<br />

41 Foner verwendet des Begriff ‚Grain‘ (Korn, Samen) <strong>für</strong> diese Dokumente, da in einer späteren Version die Einbeziehung<br />

nicht-textuellen Materials vorgesehen ist<br />

42 Foner bezeichnet diese als ‚Granule‘ (Körnchen)<br />

43 Der tatsächliche Algorithmus ist etwas komplexer, um eine sinnvolle Zusammenfassung zu erhalten; er kann in [Fon97]<br />

nachgelesen werden; im wesentlichen basiert dieser Algorithmus auf dem vector space model, dasz.B.in[Sal89]beschrieben<br />

ist<br />

41

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!