10.10.2013 Aufrufe

Kostenloser Download der gesamten Diplomarbeit - dotSource

Kostenloser Download der gesamten Diplomarbeit - dotSource

Kostenloser Download der gesamten Diplomarbeit - dotSource

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

KAPITEL 2. GRUNDLAGEN 5<br />

aller Datenvariationen den Rahmen dieser Arbeit sprengen würde und die ausschließliche<br />

Betrachtung <strong>der</strong> textuellen Form für weitere Untersuchungen ausreichend ist.<br />

2.2 Information Retrieval System<br />

Im praktischen Umfeld wird Information Retrieval mithilfe eines Information Retrieval<br />

Systems (IRS) realisiert. IRS ist ein computergestütztes System, welches die Information<br />

speichert, organisiert, repräsentiert und gegen eine Nutzeranfrage automatisiert abruft.<br />

In <strong>der</strong> Abbildung 2.1 ist ein IRS schematisch abgebildet. Die Komponenten und ihre<br />

Funktionsweise werden im Folgenden gemäß [BYRN11] beschrieben.<br />

Nutzer<br />

Suchanfrage<br />

Modifikation<br />

Retrieval<br />

gefundene<br />

Dokumente<br />

Ranking<br />

geordnete<br />

Dokumente<br />

Formatierung<br />

Text Transformationen<br />

Retrieval Prozess<br />

Ranking Prozess<br />

Indexer<br />

Index<br />

Autor<br />

Dokumentensammlung<br />

Indizierungsprozess<br />

Abbildung 2.1: IRS-Architektur: Komponenten und Prozessablauf aus [BYRN11]<br />

Die Architektur eines IRS besteht im Wesentlichen aus drei Hauptkomponenten, welche<br />

für den Indizierungs-, Retrieval und Ranking Prozess verantwortlich sind. Grundlegend<br />

für jedes IRS ist die Dokumentensammlung, welche z.B. ein Autor aktualisiert und pflegt.<br />

Wenn die Informationen direkt aus dem Web geholt werden, so wird ein Web-Crawler,

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!