Agentensysteme - Dokumentenserver Fakultät für Mathematik und ...
Agentensysteme - Dokumentenserver Fakultät für Mathematik und ...
Agentensysteme - Dokumentenserver Fakultät für Mathematik und ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Entwicklungsstand<br />
gen. Dabei benötigten die Agenten nicht einmal eine Wissensrepräsentation<br />
dieser Domäne, sondern konnten praktisch auf Formulardaten arbeiten.<br />
Aus diesem Gr<strong>und</strong> war es auch nicht notwendig, diese Agenten<br />
mit ausgefeilten ‚intelligenten‘ Algorithmen auszustatten.<br />
Yenta unterscheidet sich in diesen <strong>und</strong> weiteren Punkten wesentlich von<br />
den erwähnten Programmen. Ausgangspunkt <strong>für</strong> die Entwicklung war<br />
die Beobachtung, daß es viele passive Nutzer des Internet gibt, die, da<br />
sie nicht selbst aktiv <strong>für</strong> Inhalte sorgen, nichts voneinander erfahren,<br />
aber möglicherweise einander weiterhelfen könnten. Ein weiterer Aspekt<br />
ist die Schwierigkeit, Experten <strong>für</strong> ein bestimmtes Thema im Internet zu<br />
finden. Die Yenta-Agenten haben also die Aufgabe, ohne Hilfe durch<br />
den Benutzer, dessen Interessenschwerpunkte herauszufinden, mit anderen<br />
Agenten Kontakt aufzunehmen <strong>und</strong> Cluster zu bilden.<br />
Der Ansatz von Yenta, diese Funktionen adäquat umzusetzen sieht wie<br />
folgt aus:<br />
• Interessen des Benutzers ermitteln<br />
Da sich das System nicht auf ein bestimmtes Thema beschränkt, ist<br />
es wenig sinnvoll, die Interessen durch die Angabe von Stichwörtern<br />
durch den Benutzer zu erfassen (abgesehen davon, daß dieser nicht<br />
mit einbezogen werden sollte). Ein späterer Vergleich dieser individuellen<br />
Angaben wird nur selten zu Übereinstimmungen führen.<br />
Statt dessen verarbeitet der Agent alles in elektronischer Textform<br />
vorliegende Material, das der Benutzer lokal gespeichert hat. Dazu<br />
gehören Email, News-Texte, Textdateien im Dateisystem u.ä41 .Für<br />
diese Dokumente werden, nach Stemming <strong>und</strong> Bildung der inversen<br />
Wortfrequenz, Dokumentenvektoren berechnet. Mit diesen ist es<br />
dann möglich, lokal Minicluster42 zu bilden, indem das Skalarprodukt<br />
zwischen jeweils zwei Dokumentvektoren ermittelt wird <strong>und</strong> bei<br />
Überschreitung eines bestimmten Schwellwert die zugehörigen Dokumente<br />
zusammenfaßt werden43 . Dieser Schritt wird von Foner als<br />
‚Preclustering‘ bezeichnet.<br />
• Kontaktaufnahme<br />
Im Gegensatz zu anderen Ansätzen verwendet Yenta eine strikt dezentralisierte<br />
peer-to-peer Architektur, d.h. es gibt keine zentrale<br />
Anlaufstelle, die Informationen über die Existenz <strong>und</strong>/oder den Inhalt<br />
anderer Agenten besitzt. Der Vorteil einer solchen Struktur ist, daß<br />
sie sich leichter skalieren läßt (der Aufwand eines zentralen Servers<br />
würde in Abhängigkeit von der Zahl der Agenten quadratisch steigen),<br />
das System ist weniger fehleranfällig <strong>und</strong> private Informationen,<br />
die in den Agenten gespeichert sind, sind besser vor Eindring-<br />
41 Foner verwendet des Begriff ‚Grain‘ (Korn, Samen) <strong>für</strong> diese Dokumente, da in einer späteren Version die Einbeziehung<br />
nicht-textuellen Materials vorgesehen ist<br />
42 Foner bezeichnet diese als ‚Granule‘ (Körnchen)<br />
43 Der tatsächliche Algorithmus ist etwas komplexer, um eine sinnvolle Zusammenfassung zu erhalten; er kann in [Fon97]<br />
nachgelesen werden; im wesentlichen basiert dieser Algorithmus auf dem vector space model, dasz.B.in[Sal89]beschrieben<br />
ist<br />
41