31.07.2013 Aufrufe

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

Einführung in die Informationswissenschaft

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Crawler.<br />

Grundlagen des Information Retrieval<br />

Beispiel: Scooter<br />

von AltaVista<br />

Louis M. Monier: System for add<strong>in</strong>g a new<br />

entry to a web page table upon receiv<strong>in</strong>g a web<br />

page <strong>in</strong>clud<strong>in</strong>g a l<strong>in</strong>k to another web page<br />

not hav<strong>in</strong>g a correspond<strong>in</strong>g entry <strong>in</strong> the web<br />

page table. – Patent Nr. US 6.032.196. –<br />

Assignee: Digital Equipment Corp. –<br />

Priorität: 28. August 1998;<br />

erteilt: 29. Februar 2000.<br />

ja<br />

Sende erfasste Seite<br />

an das<br />

Indexierungssystem<br />

Analyse der erfassten Web-Seite<br />

S<strong>in</strong>d alle URL-L<strong>in</strong>ks zu anderen Web-<br />

Seiten abgearbeitet?<br />

HHU Düsseldorf, WS 2004/05 <strong>E<strong>in</strong>führung</strong> <strong>in</strong> <strong>die</strong> <strong>Informationswissenschaft</strong> 94<br />

ne<strong>in</strong><br />

Bearbeite nächste URL<br />

Ist im Speicher bereits e<strong>in</strong> E<strong>in</strong>trag für<br />

<strong>die</strong>se URL?<br />

ne<strong>in</strong><br />

Ist im Speicher bereits e<strong>in</strong> E<strong>in</strong>trag für<br />

e<strong>in</strong>e def<strong>in</strong>ierte Spiegelung <strong>die</strong>ser URL?<br />

ne<strong>in</strong><br />

Füge E<strong>in</strong>trag für e<strong>in</strong>e neue Web-Seite <strong>in</strong> den aktuellen<br />

Puffer e<strong>in</strong> (Markierung: "nicht erfasst");<br />

füge E<strong>in</strong>trag für e<strong>in</strong>e neue Web-Seite <strong>in</strong> <strong>die</strong> Datenbank<br />

e<strong>in</strong> (Markierung: "nicht erfasst")<br />

ja<br />

ja

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!