15.05.2013 Views

Sigma 35 - Hezkuntza, Unibertsitate eta Ikerketa Saila - Euskadi.net

Sigma 35 - Hezkuntza, Unibertsitate eta Ikerketa Saila - Euskadi.net

Sigma 35 - Hezkuntza, Unibertsitate eta Ikerketa Saila - Euskadi.net

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Álgebra lineal para la ordenación de Google de las páginas web<br />

Mikel Lezaun<br />

Este artículo trata de contestar a la cuestión ¿cómo se ordenan las páginas web para conseguir<br />

que las diez primeras páginas mostradas contengan información útil para el usuario? La<br />

respuesta la da el Algoritmo PageRank diseñado por Brin y Page para ordenar las páginas web.<br />

Como se verá, las matemáticas de este algoritmo son del nivel de los cursos básicos de licenciatura.<br />

Ahora bien, aunque aquí no se traten, para alcanzar el éxito también ha habido una<br />

cuidadosa y eficiente implementación del algoritmo y un esmerado diseño de las cuestiones<br />

computacionales inherentes al problema.<br />

Algoritmo PageRank<br />

El objetivo propuesto es ordenar todas las páginas web P 1 , P 2 , P 3 ,….., P n–1 , P n atendiendo a<br />

alguna valoración de importancia que se deberá establecer. Luego, cuando se muestre el<br />

resultado de una búsqueda, las páginas aparecerán ordenadas de mayor a menor importancia.<br />

Todo usuario de Google está acostumbrado a navegar de unas páginas a otras siguiendo los<br />

enlaces que contienen las páginas. Los enlaces no son recíprocos, la página P i puede tener un<br />

enlace a la página P j pero no al revés. La importancia de una página web no se definirá a priori<br />

por sus contenidos, se sustentará en la cantidad y calidad de los enlaces que haya de las restantes<br />

páginas a ella. Veremos que la importancia de una página web vendrá determinada por<br />

el cumplimiento de los siguientes principios que involucran a los enlaces de todas las páginas.<br />

1. Una página web tendrá mayor importancia cuanto mayor sea el número de páginas<br />

que enlazan con ella.<br />

2. La importancia de una página web dependerá de la importancia de las páginas que<br />

enlazan con ella, cuanto más importante sean mejor.<br />

3. La importancia de una página será mayor si además de importantes, las páginas que<br />

enlazan con ella tienen pocos enlaces. Es decir se valoran más los enlaces que vienen<br />

de una página si ésta tiene pocos enlaces.<br />

Para traducir estos principios a lenguaje matemático se comenzará por asignar al concepto<br />

de importancia un valor numérico. Así, para cada página P i su importancia será un número<br />

x i positivo. Obviamente la ordenación por importancia será la ordenación de los números x i .<br />

Los tres criterios anteriores pivotan sobre los enlaces de unas páginas a otras. Para representar<br />

numéricamente que la página web P j enlaza o no con la página P i se introducen los parámetros<br />

g ij que valen 1 si la página P j enlaza con la página P i y 0 en caso contrario. Como una<br />

página no enlaza con sí misma, siempre se tendrá que g ii = 0. Para cada página P j se denota<br />

por N j el número de enlaces que salen de ella. Por tanto<br />

98 abril 2010 2010ko apirila<br />

. Como se supondrá que<br />

todas las páginas tendrán al menos un enlace, los N j serán enteros positivos. Los valores g ij y<br />

en consecuencia los N j son datos, ya que se sabe si la página P j enlaza o no con la página P i .<br />

Veamos dos ejemplos sencillos con solo seis páginas web: P 1 , P 2 , P 3 , P 4 , P 5 y P 6 . El objetivo es<br />

definir la importancia x 1 , x 2 , x 3 , x 4 , x 5 y x 6 de cada una para luego ordenarlas de mayor a menor.<br />

Comencemos por describir las relaciones de unas páginas con otras.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!