Kostenloser Download der gesamten Diplomarbeit - dotSource
Kostenloser Download der gesamten Diplomarbeit - dotSource
Kostenloser Download der gesamten Diplomarbeit - dotSource
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
KAPITEL 2. GRUNDLAGEN 5<br />
aller Datenvariationen den Rahmen dieser Arbeit sprengen würde und die ausschließliche<br />
Betrachtung <strong>der</strong> textuellen Form für weitere Untersuchungen ausreichend ist.<br />
2.2 Information Retrieval System<br />
Im praktischen Umfeld wird Information Retrieval mithilfe eines Information Retrieval<br />
Systems (IRS) realisiert. IRS ist ein computergestütztes System, welches die Information<br />
speichert, organisiert, repräsentiert und gegen eine Nutzeranfrage automatisiert abruft.<br />
In <strong>der</strong> Abbildung 2.1 ist ein IRS schematisch abgebildet. Die Komponenten und ihre<br />
Funktionsweise werden im Folgenden gemäß [BYRN11] beschrieben.<br />
Nutzer<br />
Suchanfrage<br />
Modifikation<br />
Retrieval<br />
gefundene<br />
Dokumente<br />
Ranking<br />
geordnete<br />
Dokumente<br />
Formatierung<br />
Text Transformationen<br />
Retrieval Prozess<br />
Ranking Prozess<br />
Indexer<br />
Index<br />
Autor<br />
Dokumentensammlung<br />
Indizierungsprozess<br />
Abbildung 2.1: IRS-Architektur: Komponenten und Prozessablauf aus [BYRN11]<br />
Die Architektur eines IRS besteht im Wesentlichen aus drei Hauptkomponenten, welche<br />
für den Indizierungs-, Retrieval und Ranking Prozess verantwortlich sind. Grundlegend<br />
für jedes IRS ist die Dokumentensammlung, welche z.B. ein Autor aktualisiert und pflegt.<br />
Wenn die Informationen direkt aus dem Web geholt werden, so wird ein Web-Crawler,