25.04.2013 Views

Tesi doctoral de Meritxell Martí: 'Venus a Google. Anàlisi dels ...

Tesi doctoral de Meritxell Martí: 'Venus a Google. Anàlisi dels ...

Tesi doctoral de Meritxell Martí: 'Venus a Google. Anàlisi dels ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Dur a terme una exploració web és un procés força complex, donat que<br />

significa haver d’interactuar amb una enorme quantitat <strong>de</strong> servidors web. La<br />

velocitat d’exploració <strong>de</strong> <strong>Google</strong> és <strong>de</strong> cent pàgines per segon o tres-centes<br />

connexions HTTP (protocol <strong>de</strong> transferència d’hipertext) simultàniament i<br />

sis-cents kbytes <strong>de</strong> da<strong>de</strong>s per segon. 14 En aquest sentit, un aspecte rellevant<br />

en la cerca <strong>de</strong> da<strong>de</strong>s és el rànquing o posicionament. Donat que el cercador<br />

ens ofereix la informació <strong>de</strong> forma jerarquitzada, val la pena consi<strong>de</strong>rar quin<br />

criteri segueix a l’hora d’or<strong>de</strong>nar els webs trobats. <strong>Google</strong> ha patentat un<br />

sistema <strong>de</strong> posicionament <strong>de</strong> les pàgines web basat en un algoritme anomenat<br />

PageRank. Aquest sistema permet situar una pàgina en una <strong>de</strong>terminada<br />

posició respecte les altres, <strong>de</strong>cidint-ne la importància en una consulta donada.<br />

La i<strong>de</strong>a bàsica d’aquest algoritme es la referencialitat. Com més pàgines<br />

apuntin cap a una altra pàgina per mitjà d’enllaços (links), aquesta darrera<br />

serà consi<strong>de</strong>rada més important. Cal recordar aquí que l’enllaç és la pedra<br />

angular <strong>de</strong> l’hipertext i aquest, al seu torn, d’Internet. PageRank computa els<br />

enllaços <strong>de</strong> cada pàgina i estableix que no només una pàgina serà més<br />

rellevant en la mesura que més pàgines l’enllacin, sinó que també té en<br />

compte la importància <strong>de</strong> les pàgines que enllacen: quants enllaços tenen<br />

aquestes pàgines, per qui són enllaça<strong>de</strong>s i així successivament. PageRank<br />

mesura <strong>de</strong> forma objectiva la importància <strong>de</strong>ls webs a partir d’una equació <strong>de</strong><br />

500 milions <strong>de</strong> variables i prop <strong>de</strong> 2.000 milions <strong>de</strong> termes. 15 Destaquem el<br />

sistema PageRank per donar una justificació final a la tria <strong>de</strong> <strong>Google</strong> com a<br />

motor <strong>de</strong> cerca per a l’obtenció <strong>de</strong> les da<strong>de</strong>s d’aquest treball <strong>de</strong> camp, en la<br />

mesura que ens ofereix una cerca eficaç i amb un sistema avançat <strong>de</strong><br />

posicionament <strong>de</strong> la informació web basada en la rellevància, cosa que<br />

garanteix la qualitat i la no aleatorietat <strong>de</strong>ls resultats. Aprofitem per indicar<br />

14 CURT, Franklin. “How Internet Search Engines Work”, al portal Howstuffworks:<br />

[consulta:<br />

15/06/2011].<br />

15 “¿Qué es y cómo funciona <strong>Google</strong>?”, al portal Promocion.org:<br />

[consulta: 20/06/2011].<br />

37

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!