baja - TEC-Digital

More documents

Recommendations

Info

$Edición de textos científicos con LaTeX - TEC Digital - Tecnológico ...$

I.C. RENE EDMUNDO CUEVAS VALENCIA. Note que el hashing puede ser aplicado a llaves no numéricas, lo mismo que a llaves numéricas. Las posiciones de ordenamiento de secuencia de los caracteres en un valor de llave pueden ser utilizadas con sus equivalentes “numéricos”. Alternativamente, el algoritmo hash actúa sobre las representaciones binarias de los caracteres. Todas las funciones hash presentadas tienen destinado un espacio de tamaño fijo. Aumentar el tamaño del archivo relativo creado al usar una de estas funciones implica cambiar la función hash, para que se refiera a un espacio mayor y volver a cargar el nuevo archivo. Otras técnicas hash han sido desarrolladas que permiten que el archivo crezca o se reduzca sin obligar a una relocalización de los registros. Estos métodos son conocidos cono hashing dinámico, hashing extendible y hashing virtual. El espacio de almacenamiento asignado es dividido en cubetas. Cuando u registro tenga que ser insertado dentro de una cubeta llena, ésta es dividida en dos cubetas en las que los registros son distribuidos. Este enfoque aparecerá de nuevo, cuando discutamos árboles-B. El hashing dinámico utiliza una estructura de índice de árbol binario para almacenar las cubetas y para dirigir el acceso a los registros. El hashing extendible usa un directorio tabular basado en una estructura trie degenerada para almacenar las cubetas de pista y dirigir el acceso a los registros. El hashing virtual es un nombre general dado “para cualquier hashing que puede cambiar dinámicamente su función hash” (W. Litwin, “Virtual hashing: Adynamically changing hashing”, Proc. 4th Conf. ]Very large Databases, W. Berlin, 1978, pp. 517-523). Este término es bastante amplio e incluye no sólo técnicas de hashing dinámico y extendible, sino también técnicas que no utilizan ningunos índices. Para mayor información sobre estos métodos, debe consultar las referencias surgidas al final de este capítulo. METODOS PARA EL PROBLEMA DE LAS COLISIONES Dado que una función hashing mapea un espacio relativamente grande de valores de llave en un espacio de direcciones relativamente pequeño, es seguro que se producirán colisiones; más de un valor de llave será mapeado en una sola dirección relativa. Considere los dos valores de llave K1 y K2, los cuales son sinónimos con la función hash R. Suponga que la clase de equivalencia que contiene a K1 y K2 no contiene otros valores de llave; esto es, k1 y K2 no tienen otros sinónimos. Si K1 es primero almacenado en el archivo y su dirección es R(K1), entonces se dice que K1 está almacenado en su dirección de origen. Existen dos métodos básicos para determinar donde K2 debe ser alojado:1) direccionamiento abierto, en la cual otra dirección distinta de la dirección de origen es encontrada para K2 en el archivo relativo, y 2) separación de desborde, en el cual alguna dirección es encontrada para K2 fuera del área principalmente del archivo relativo, en un área especial de desborde, que es utilizada exclusivamente para almacenar registros que no pueden ser asignados a su dirección de origen. Se han desarrollado numerosas técnicas para mejorar colisiones. Ahora consideraremos dos de los métodos más comunes: • Sondeo lineal, que es una técnica de direccionamiento abierto MATERIAL DE APOYO A LA MATERIA DE ESTRUCTURAS DE DATOS III - 52 -
I.C. RENE EDMUNDO CUEVAS VALENCIA. • Doble Hashing, que puede ser aplicado como cualquier direccionamiento abierto o técnica de separación de desborde Compararemos el desempeño de estas técnicas y después introduciremos dos métodos para mejorar su comportamiento: • Encadenamiento de sinónimos • Direccionamiento por cubetas Sondeo lineal Una manera de encontrar una localidad para un registro, cuando no puede almacenarse en su dirección de origen, es utilizado el sondeo lineal, el cual es un proceso de búsqueda secuencial desde la dirección de origen para encontrar la siguiente localidad vacía. Esta técnica es también conocida como método de desbordamiento consecutivo. Para instrumentar el sondeo lineal debe ser posible determinar si una dirección está vacía. Esto puede hacerse inicializando una bandera en cada localidad a medida que se vaya llenando. La lógica básica de almacenar un registro por hashing, con la técnica de sondeo lineal, es mostrado en la figura 13-12. Note primero que el sondeo lineal puede usarse con cualquier técnica de hashing. Note también, que la aplicación del sondeo lineal deberá hacerse en tal forma que DIREC no caiga fuera del límite del archivo. En lugar de terminar cuando el límite del espacio de dirección se alcanza, regresamos al inicio del espacio y sondeamos desde ahí. Por lo tanto se hace necesario poder detectar cuando la dirección de origen base (aquí DIREC-ORIGEN) ha sido encontrada de nuevo, en cuyo caso el archivo está completamente lleno y no habrá espacio para la llave. Si el sondeo lineal se usa para resolver colisiones cuando se almacenan los registros, también se deberá usar cuando se recuperan los registros, a menos que el esquema de búsqueda en directorio se utilice en conjunción con el hashing. La lógica básica para recuperar registros por hashing con sondeo lineal se muestra en la figura 13- 13. Fin Aplicar el hash a la llave. Obteniendo la dirección de origen: Direc.: = r(key) Direc. Origen: = direc. ¿Está ocupada esa direc.? Si Aplicar sondeo lineal direc.: = direc. + 1 No Almacenarla llave en esa Dirección; cambiar la bandera para que indique ocupado MATERIAL DE APOYO A LA MATERIA DE ESTRUCTURAS DE DATOS III - 53 -
Page 1 and 2: I.C. RENE EDMUNDO CUEVAS VALENCIA.
Page 51: I.C. RENE EDMUNDO CUEVAS VALENCIA.
Page 77: I.C. RENE EDMUNDO CUEVAS VALENCIA.

baja - TEC-Digital

Create successful ePaper yourself

Delete template?

Save as template?