30.12.2012 Views

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

sesión Si se encuentra la distancia con su vecino más cercano, es <strong>de</strong>cir, la menor distancia calculada con otras<br />

sesiones.<br />

dmin = min sj − si<br />

,<br />

don<strong>de</strong> s j − si<br />

=<br />

( si, si)<br />

i<br />

2 2<br />

(( s )( s ))<br />

∑<br />

Se calcula el promedio <strong>de</strong> las menores distancias halladas.<br />

∑ ∑<br />

i i i i<br />

1 n<br />

d = ∑ d s<br />

n =<br />

Se construye la matriz <strong>de</strong> adyacencia A como sigue:<br />

( )<br />

prom min i<br />

i 1<br />

⎧1<br />

Aij<br />

= ⎨<br />

⎩ 0<br />

si S j − Si en otro caso<br />

< d<br />

don<strong>de</strong> d = u × d y u = seleccionado <strong>de</strong> forma empirica<br />

prom<br />

Encontrar los componentes conectados <strong>de</strong> la matriz. Cada componente es tomado como un cluster.<br />

Etapa 2: Aplicación <strong>de</strong>l Algoritmo Genético<br />

Inicialización: se generan <strong>de</strong> forma aleatoria una población <strong>de</strong> N ca<strong>de</strong>nas. El tamaño <strong>de</strong> las ca<strong>de</strong>nas es<br />

igual al número <strong>de</strong> grupos creados en la Etapa 1. Cada ca<strong>de</strong>na representa un subconjunto <strong>de</strong> grupos. Si, por<br />

ejemplo, el grupo 5 pertenece al subconjunto Ri, entonces la posición 5 <strong>de</strong> la ca<strong>de</strong>na tendrá un valor <strong>de</strong> 1.<br />

Para cada ca<strong>de</strong>na, se calcula Ui y Ui´ así:<br />

U i = { j La j − esim a posición <strong>de</strong> Ri si valor = 1}<br />

U ′ i = { j La j − esim a posición <strong>de</strong> Ri si valor = 0}<br />

Esto es, Ui es el conjunto <strong>de</strong> índices <strong>de</strong> las posiciones con valor 1 y Ui´ es el conjunto <strong>de</strong> índices <strong>de</strong> las<br />

posiciones con valor <strong>de</strong> 0 en la ca<strong>de</strong>na Ri.<br />

Posteriormente se calcula las distancias inter e intra <strong>de</strong> los clusters. La distancia intra se usa para medir la<br />

cercanía entre clusters que pertenecen a un mismo subconjunto, mientras que distancia inter es utilizada para<br />

medir la separación entre un subconjunto y los <strong>de</strong>más clusters.<br />

d ( R ) = max min k − j<br />

int ra i<br />

d ( R ) = min k − j<br />

int er i<br />

Conferência IADIS Ibero-Americana WWW/Internet 2007<br />

Fase <strong>de</strong> Reproducción: se calcula la función objetivo o fitness para cada ca<strong>de</strong>na <strong>de</strong> la siguiente forma:<br />

j∈U i<br />

j∈U i<br />

k ∈ Ui′ k∈U i<br />

k≠j fitness( R ) = d ( R ) ∗w−d( R )<br />

i inter i intra i<br />

don<strong>de</strong> w es un factor que <strong>de</strong>termina cual <strong>de</strong> las distancias, la distancia intra o la distancia inter,<br />

es más importante.<br />

Fase <strong>de</strong> Cruce: se seleccionan dos puntos <strong>de</strong> forma aleatoria <strong>de</strong> 1 hasta n. Para cada una <strong>de</strong> las ca<strong>de</strong>nas se<br />

selecciona una ca<strong>de</strong>na padre con la cual intercambia los valores presentes entre los dos puntos.<br />

Fase <strong>de</strong> Mutación: para cada ca<strong>de</strong>na o cromosoma, se selecciona <strong>de</strong> forma aleatoria un número <strong>de</strong> 1 hasta<br />

N, el cual indica la posición <strong>de</strong>l cromosoma que tendrá un cambio <strong>de</strong> valor. Si el valor es <strong>de</strong> 0, le asigna un 1<br />

o viceversa. Se <strong>de</strong>fine un valor <strong>de</strong> probabilidad igual a 0.1 para la asignación <strong>de</strong> 1s.<br />

Unión <strong>de</strong> grupos: este paso se aplica <strong>de</strong>spués <strong>de</strong>l cálculo <strong>de</strong>l fitness para cada ca<strong>de</strong>na. Inicialmente, se<br />

or<strong>de</strong>nan las ca<strong>de</strong>nas <strong>de</strong> mayor a menor fitness. La ca<strong>de</strong>na con mayor fitness es seleccionada con el fin <strong>de</strong><br />

unir los grupos que contiene. Luego se toma la siguiente ca<strong>de</strong>na en la lista or<strong>de</strong>nada y se verifica que ninguno<br />

<strong>de</strong> los grupos que se encuentran en ésta, hayan sido unidos en el paso anterior. Si algún grupo ya fue unido,<br />

se <strong>de</strong>scarta la ca<strong>de</strong>na, <strong>de</strong> lo contrario, se unen los grupos. Este paso <strong>de</strong> unión <strong>de</strong> grupos finaliza cuando ha<br />

sido recorrida toda la lista.<br />

301

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!