31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

L<strong>in</strong>k-Topologie<br />

PageRank und der Backl<strong>in</strong>k-Crawler<br />

• Vorschlag: Crawler arbeitet nicht nur (wie z.B. bei AltaVista) <strong>die</strong><br />

L<strong>in</strong>ks e<strong>in</strong>er aktuellen Seite ab, sondern folgt den Backl<strong>in</strong>ks (also<br />

den L<strong>in</strong>ks, <strong>die</strong> auf <strong>die</strong> aktuelle Seite l<strong>in</strong>ken). Vor.: URL s<strong>in</strong>d<br />

bekannt (also bei der Vorwärtssuche bereits gefunden)<br />

• mögliche Methoden:<br />

– abarbeiten, wie es kommt (bei großen Datenmengen<br />

<strong>in</strong>effizient)<br />

– nach Anzahl der Backl<strong>in</strong>ks (etwa bei > 100 Indikator auf<br />

„heiße“ Seite)<br />

– nach PageRank der Seiten („excellent order<strong>in</strong>g metric“)<br />

Junghoo Cho; Hector Garcia-Mol<strong>in</strong>a; Lawrence Page: Efficient crawl<strong>in</strong>g through URL order<strong>in</strong>g. –<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 312<br />

In: Proceed<strong>in</strong>gs of the 7th International World Wide Web Conference. – Brisbane, 1998.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!