Top Banner
Alonso Ramirez Manzanares Computación y Algoritmos 09.05 Tablas de hash (2) mat-151 Thursday, May 11, 17
130

Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Sep 30, 2018

Download

Documents

duongnga
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05

Tablas de hash (2)

mat-151

Thursday, May 11, 17

Page 2: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

Thursday, May 11, 17

Page 3: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

Thursday, May 11, 17

Page 4: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

Thursday, May 11, 17

Page 5: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

Thursday, May 11, 17

Page 6: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

Thursday, May 11, 17

Page 7: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

Thursday, May 11, 17

Page 8: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

• cuando el número de elementos en total es proporcional al número de elementos en la tabla tenemos

Thursday, May 11, 17

Page 9: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

• cuando el número de elementos en total es proporcional al número de elementos en la tabla tenemos

Thursday, May 11, 17

Page 10: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

• cuando el número de elementos en total es proporcional al número de elementos en la tabla tenemos

Thursday, May 11, 17

Page 11: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

• cuando el número de elementos en total es proporcional al número de elementos en la tabla tenemos

Thursday, May 11, 17

Page 12: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2

Tablas de hash: resolviendo colisiones por encadenamiento

• cuando el número de elementos en total es proporcional al número de elementos en la tabla tenemos

• Tiempo de búsqueda constante en promedio.

Thursday, May 11, 17

Page 13: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 3

Tablas de hash: resolviendo colisiones por encadenamiento

Thursday, May 11, 17

Page 14: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 3

Tablas de hash: resolviendo colisiones por encadenamiento

• Para una búsqueda exitosa también se puede probar (libro de CLRS, p.p.227-228) que Θ(1+α) en promedio.

Thursday, May 11, 17

Page 15: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 3

Tablas de hash: resolviendo colisiones por encadenamiento

• Para una búsqueda exitosa también se puede probar (libro de CLRS, p.p.227-228) que Θ(1+α) en promedio.

• Tiempo de búsqueda constante en promedio.

Thursday, May 11, 17

Page 16: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 4

Tablas de hash: características de una buena función de hash

Thursday, May 11, 17

Page 17: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 4

Tablas de hash: características de una buena función de hash

• ¿Qué se espera de una buena función de hash?

Thursday, May 11, 17

Page 18: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 4

Tablas de hash: características de una buena función de hash

• ¿Qué se espera de una buena función de hash?

• Que satisfaga la suposición de hashing simple uniforme.

Thursday, May 11, 17

Page 19: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 4

Tablas de hash: características de una buena función de hash

• ¿Qué se espera de una buena función de hash?

• Que satisfaga la suposición de hashing simple uniforme.

• Que la regularidad no afecte la distribución (ej. números pares): independiente de cualquier patrón que exista en las llaves.

Thursday, May 11, 17

Page 20: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 4

Tablas de hash: características de una buena función de hash

• ¿Qué se espera de una buena función de hash?

• Que satisfaga la suposición de hashing simple uniforme.

• Que la regularidad no afecte la distribución (ej. números pares): independiente de cualquier patrón que exista en las llaves.

• Que nos permita minimizar el número de colisiones.

Thursday, May 11, 17

Page 21: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 4

Tablas de hash: características de una buena función de hash

• ¿Qué se espera de una buena función de hash?

• Que satisfaga la suposición de hashing simple uniforme.

• Que la regularidad no afecte la distribución (ej. números pares): independiente de cualquier patrón que exista en las llaves.

• Que nos permita minimizar el número de colisiones.

• Una probabilidad no nula de tener colisión es inevitable para cualquier función de hash en la práctica.

Thursday, May 11, 17

Page 22: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 4

Tablas de hash: características de una buena función de hash

• ¿Qué se espera de una buena función de hash?

• Que satisfaga la suposición de hashing simple uniforme.

• Que la regularidad no afecte la distribución (ej. números pares): independiente de cualquier patrón que exista en las llaves.

• Que nos permita minimizar el número de colisiones.

• Una probabilidad no nula de tener colisión es inevitable para cualquier función de hash en la práctica.

• La información cualitativa de la distribución de las llaves puede ser útil al momento del diseño.

Thursday, May 11, 17

Page 23: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 4

Tablas de hash: características de una buena función de hash

• ¿Qué se espera de una buena función de hash?

• Que satisfaga la suposición de hashing simple uniforme.

• Que la regularidad no afecte la distribución (ej. números pares): independiente de cualquier patrón que exista en las llaves.

• Que nos permita minimizar el número de colisiones.

• Una probabilidad no nula de tener colisión es inevitable para cualquier función de hash en la práctica.

• La información cualitativa de la distribución de las llaves puede ser útil al momento del diseño.

• Dos métodos clásicos: método de división y método de multiplicación.

Thursday, May 11, 17

Page 24: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 5

Función de hash: método de división

Thursday, May 11, 17

Page 25: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 5

Función de hash: método de división

• se mapea la llave k en la tabla T de m campos tomando el residuo de k dividido por m.

Thursday, May 11, 17

Page 26: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 5

Función de hash: método de división

• se mapea la llave k en la tabla T de m campos tomando el residuo de k dividido por m.

• por ejemplo:

Thursday, May 11, 17

Page 27: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 5

Función de hash: método de división

• se mapea la llave k en la tabla T de m campos tomando el residuo de k dividido por m.

• por ejemplo:

• generalmente esta aproximación es buena para cualquier valor de m, pero en algunos casos se necesitará una elección más cuidadosa de m:

Thursday, May 11, 17

Page 28: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 5

Función de hash: método de división

• se mapea la llave k en la tabla T de m campos tomando el residuo de k dividido por m.

• por ejemplo:

• generalmente esta aproximación es buena para cualquier valor de m, pero en algunos casos se necesitará una elección más cuidadosa de m:

• ¿hacer m par?

Thursday, May 11, 17

Page 29: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 5

Función de hash: método de división

• se mapea la llave k en la tabla T de m campos tomando el residuo de k dividido por m.

• por ejemplo:

• generalmente esta aproximación es buena para cualquier valor de m, pero en algunos casos se necesitará una elección más cuidadosa de m:

• ¿hacer m par?

Thursday, May 11, 17

Page 30: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 5

Función de hash: método de división

• se mapea la llave k en la tabla T de m campos tomando el residuo de k dividido por m.

• por ejemplo:

• generalmente esta aproximación es buena para cualquier valor de m, pero en algunos casos se necesitará una elección más cuidadosa de m:

• ¿hacer m par?

Thursday, May 11, 17

Page 31: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 5

Función de hash: método de división

• se mapea la llave k en la tabla T de m campos tomando el residuo de k dividido por m.

• por ejemplo:

• generalmente esta aproximación es buena para cualquier valor de m, pero en algunos casos se necesitará una elección más cuidadosa de m:

• ¿hacer m par?

• si las llaves son equiprobables no hay problema pero si las llaves tienen mayor probabilidad de ser pares o impares, la función no distribuirá las llaves en la tabla de manera uniforme.

Thursday, May 11, 17

Page 32: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 6

Función de hash: método de división

50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

Thursday, May 11, 17

Page 33: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 6

Función de hash: método de división

• ¿ hacer m una potencia de 2

50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

Thursday, May 11, 17

Page 34: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 6

Función de hash: método de división

• ¿ hacer m una potencia de 2

• el mapeo no depende de todos los bits de k.

50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

Thursday, May 11, 17

Page 35: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 6

Función de hash: método de división

• ¿ hacer m una potencia de 2

• el mapeo no depende de todos los bits de k.

• Si k=10110001110110102 y p=6, entonces h(k)=0110102

50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

Thursday, May 11, 17

Page 36: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 6

Función de hash: método de división

• ¿ hacer m una potencia de 2

• el mapeo no depende de todos los bits de k.

• Si k=10110001110110102 y p=6, entonces h(k)=0110102

• Recuerda que dividir por 2p es hacer un corrimiento a la derecha.

50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

Thursday, May 11, 17

Page 37: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 6

Función de hash: método de división

• ¿ hacer m una potencia de 2

• el mapeo no depende de todos los bits de k.

• Si k=10110001110110102 y p=6, entonces h(k)=0110102

• Recuerda que dividir por 2p es hacer un corrimiento a la derecha.

• Se puede implementar x % 2p == x & (2p - 1)

50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

Thursday, May 11, 17

Page 38: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 6

Función de hash: método de división

• ¿ hacer m una potencia de 2

• el mapeo no depende de todos los bits de k.

• Si k=10110001110110102 y p=6, entonces h(k)=0110102

• Recuerda que dividir por 2p es hacer un corrimiento a la derecha.

• Se puede implementar x % 2p == x & (2p - 1)

• los p-bits más bajos de las llaves deberían tener la misma probabilidad.

50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

Thursday, May 11, 17

Page 39: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 6

Función de hash: método de división

• ¿ hacer m una potencia de 2

• el mapeo no depende de todos los bits de k.

• Si k=10110001110110102 y p=6, entonces h(k)=0110102

• Recuerda que dividir por 2p es hacer un corrimiento a la derecha.

• Se puede implementar x % 2p == x & (2p - 1)

• los p-bits más bajos de las llaves deberían tener la misma probabilidad.

• Con un número cercano a una potencia de 2 es similar.50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

Thursday, May 11, 17

Page 40: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 6

Función de hash: método de división

• ¿ hacer m una potencia de 2

• el mapeo no depende de todos los bits de k.

• Si k=10110001110110102 y p=6, entonces h(k)=0110102

• Recuerda que dividir por 2p es hacer un corrimiento a la derecha.

• Se puede implementar x % 2p == x & (2p - 1)

• los p-bits más bajos de las llaves deberían tener la misma probabilidad.

• Con un número cercano a una potencia de 2 es similar.50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

50%8 = 6*8+278%8 = 9*8(72) + 689%8 = 11*8 + 115%8 = 8*1 + 71236%8 = 154*8 (1232) + 4

Thursday, May 11, 17

Page 41: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 7

Función de hash: método de división

Thursday, May 11, 17

Page 42: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 7

Función de hash: método de división

• ¿hacer m un número primo?

• Elegir un primo que no esté muy cerca de una potencia 2 o 10.

• Ej. queremos hacer una tabla de hash que resuelva colisiones por encadenamiento y que almacene cerca de n=2000 cadenas de caracteres donde cada caracter tiene 8 bits.

• Podemos soportar (verificar) en promedio 3 elementos en una lista de colisiones, entonces podemos poner m=701 (primo cerca de 2000/3 no muy cercano a una potencia de 2.

Thursday, May 11, 17

Page 43: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 7

Función de hash: método de división

• ¿hacer m un número primo?

• Elegir un primo que no esté muy cerca de una potencia 2 o 10.

• Ej. queremos hacer una tabla de hash que resuelva colisiones por encadenamiento y que almacene cerca de n=2000 cadenas de caracteres donde cada caracter tiene 8 bits.

• Podemos soportar (verificar) en promedio 3 elementos en una lista de colisiones, entonces podemos poner m=701 (primo cerca de 2000/3 no muy cercano a una potencia de 2.

• ver http://srinvis.blogspot.mx/2006/07/hash-table-lengths-and-prime-numbers.html

Thursday, May 11, 17

Page 44: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

Thursday, May 11, 17

Page 45: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

Thursday, May 11, 17

Page 46: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

Thursday, May 11, 17

Page 47: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

• En C++:

Thursday, May 11, 17

Page 48: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

• En C++:

Thursday, May 11, 17

Page 49: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

• En C++:

Thursday, May 11, 17

Page 50: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

• En C++:

Thursday, May 11, 17

Page 51: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

• En C++:

• el cálculo de la función de hash se realiza en tiempo constante O(1).

Thursday, May 11, 17

Page 52: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

• En C++:

• el cálculo de la función de hash se realiza en tiempo constante O(1).

• desventaja: llaves consecutivas se mapean a campos consecutivos.

Thursday, May 11, 17

Page 53: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

• En C++:

• el cálculo de la función de hash se realiza en tiempo constante O(1).

• desventaja: llaves consecutivas se mapean a campos consecutivos.

Thursday, May 11, 17

Page 54: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 8

Función de hash: método de división

• La función de hash sería:

• En C++:

• el cálculo de la función de hash se realiza en tiempo constante O(1).

• desventaja: llaves consecutivas se mapean a campos consecutivos.

Thursday, May 11, 17

Page 55: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 9

Función de hash: método de multiplicación

Thursday, May 11, 17

Page 56: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 9

Función de hash: método de multiplicación

• Este método funciona en dos pasos:

Thursday, May 11, 17

Page 57: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 9

Función de hash: método de multiplicación

• Este método funciona en dos pasos:

• Multiplicar la llave k por una constante A en el rango 0 < A < 1 y extraer la parte fraccionaria de kA.

Thursday, May 11, 17

Page 58: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 9

Función de hash: método de multiplicación

• Este método funciona en dos pasos:

• Multiplicar la llave k por una constante A en el rango 0 < A < 1 y extraer la parte fraccionaria de kA.

• Multiplicar este valor por m y tomar la función floor (entero más grande menor o igual al valor) del resultado.

Thursday, May 11, 17

Page 59: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 9

Función de hash: método de multiplicación

• Este método funciona en dos pasos:

• Multiplicar la llave k por una constante A en el rango 0 < A < 1 y extraer la parte fraccionaria de kA.

• Multiplicar este valor por m y tomar la función floor (entero más grande menor o igual al valor) del resultado.

Thursday, May 11, 17

Page 60: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 9

Función de hash: método de multiplicación

• Este método funciona en dos pasos:

• Multiplicar la llave k por una constante A en el rango 0 < A < 1 y extraer la parte fraccionaria de kA.

• Multiplicar este valor por m y tomar la función floor (entero más grande menor o igual al valor) del resultado.

Thursday, May 11, 17

Page 61: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 9

Función de hash: método de multiplicación

• Este método funciona en dos pasos:

• Multiplicar la llave k por una constante A en el rango 0 < A < 1 y extraer la parte fraccionaria de kA.

• Multiplicar este valor por m y tomar la función floor (entero más grande menor o igual al valor) del resultado.

• El valor de m no es crítico, generalmente se elige un valor potencia de 2 (2P) por facilidad de implementación.

Thursday, May 11, 17

Page 62: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 10

Función de hash: método de multiplicación

Thursday, May 11, 17

Page 63: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 10

Función de hash: método de multiplicación

• Suponemos que el tamaño de la palabra de una computadora es w bits y k se expresa en una sola palabra.

Thursday, May 11, 17

Page 64: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 10

Función de hash: método de multiplicación

• Suponemos que el tamaño de la palabra de una computadora es w bits y k se expresa en una sola palabra.

• Restringimos A a una fracción de la forma s/2w, donde s es un entero en el rango 0 < s < 2w.

Thursday, May 11, 17

Page 65: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 10

Función de hash: método de multiplicación

• Suponemos que el tamaño de la palabra de una computadora es w bits y k se expresa en una sola palabra.

• Restringimos A a una fracción de la forma s/2w, donde s es un entero en el rango 0 < s < 2w.

Thursday, May 11, 17

Page 66: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 10

Función de hash: método de multiplicación

• Suponemos que el tamaño de la palabra de una computadora es w bits y k se expresa en una sola palabra.

• Restringimos A a una fracción de la forma s/2w, donde s es un entero en el rango 0 < s < 2w.

• Multiplicamos primero k por el entero de w-bits s.

Thursday, May 11, 17

Page 67: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 10

Función de hash: método de multiplicación

• Suponemos que el tamaño de la palabra de una computadora es w bits y k se expresa en una sola palabra.

• Restringimos A a una fracción de la forma s/2w, donde s es un entero en el rango 0 < s < 2w.

• Multiplicamos primero k por el entero de w-bits s.

• El resultado es un valor de 2w-bits r12w+r0, donde r1 es la palabra superior del producto y r0 la palabra inferior.

Thursday, May 11, 17

Page 68: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 10

Función de hash: método de multiplicación

• Suponemos que el tamaño de la palabra de una computadora es w bits y k se expresa en una sola palabra.

• Restringimos A a una fracción de la forma s/2w, donde s es un entero en el rango 0 < s < 2w.

• Multiplicamos primero k por el entero de w-bits s.

• El resultado es un valor de 2w-bits r12w+r0, donde r1 es la palabra superior del producto y r0 la palabra inferior.

• El valor de hash de p-bits consiste en los p bits más significativos de r0.

Thursday, May 11, 17

Page 69: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 11

Función de hash: método de multiplicación• Ejemplo

67

Thursday, May 11, 17

Page 70: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 11

Función de hash: método de multiplicación• Ejemplo

67

Thursday, May 11, 17

Page 71: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 11

Función de hash: método de multiplicación• Ejemplo

67

Thursday, May 11, 17

Page 72: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 11

Función de hash: método de multiplicación• Ejemplo

67

Thursday, May 11, 17

Page 73: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 11

Función de hash: método de multiplicación• Ejemplo

10010101000001100 00000001000011001100000001000000

67

Thursday, May 11, 17

Page 74: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 11

Función de hash: método de multiplicación• Ejemplo

10010101000001100 00000001000011001100000001000000

67

Thursday, May 11, 17

Page 75: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 11

Función de hash: método de multiplicación• Ejemplo

10010101000001100 00000001000011001100000001000000

67

Para profundizar, ver Sección 6.4 Hashing, Art of computing programming, Donald. E. Knuth.

Thursday, May 11, 17

Page 76: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 12

Función de hash

• Heurísticas para la función de hash.

• Siempre encontraremos un conjunto valores de llave que hagan que una función de hash no distribuya bien los valores provocando colisiones.

Thursday, May 11, 17

Page 77: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 13

Tablas de hash: resolviendo colisiones por direccionamiento abierto (open addressing)

Thursday, May 11, 17

Page 78: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 13

Tablas de hash: resolviendo colisiones por direccionamiento abierto (open addressing)

• Todos los elementos se almacenan en la misma tabla hash.

Thursday, May 11, 17

Page 79: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 13

Tablas de hash: resolviendo colisiones por direccionamiento abierto (open addressing)

• Todos los elementos se almacenan en la misma tabla hash.

• Si el campo está lleno, vuelvo a aplicar la función de hash.

Thursday, May 11, 17

Page 80: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 13

Tablas de hash: resolviendo colisiones por direccionamiento abierto (open addressing)

• Todos los elementos se almacenan en la misma tabla hash.

• Si el campo está lleno, vuelvo a aplicar la función de hash.

• La tabla se puede “llenar” de tal manera que no se puedan hacer más inserciones

Thursday, May 11, 17

Page 81: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 13

Tablas de hash: resolviendo colisiones por direccionamiento abierto (open addressing)

• Todos los elementos se almacenan en la misma tabla hash.

• Si el campo está lleno, vuelvo a aplicar la función de hash.

• La tabla se puede “llenar” de tal manera que no se puedan hacer más inserciones

• ¿Qué podemos decir sobre el factor de carga?

Thursday, May 11, 17

Page 82: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 13

Tablas de hash: resolviendo colisiones por direccionamiento abierto (open addressing)

• Todos los elementos se almacenan en la misma tabla hash.

• Si el campo está lleno, vuelvo a aplicar la función de hash.

• La tabla se puede “llenar” de tal manera que no se puedan hacer más inserciones

• ¿Qué podemos decir sobre el factor de carga?

• α nunca puede ser más grande de UNO.

Thursday, May 11, 17

Page 83: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 13

Tablas de hash: resolviendo colisiones por direccionamiento abierto (open addressing)

• Todos los elementos se almacenan en la misma tabla hash.

• Si el campo está lleno, vuelvo a aplicar la función de hash.

• La tabla se puede “llenar” de tal manera que no se puedan hacer más inserciones

• ¿Qué podemos decir sobre el factor de carga?

• α nunca puede ser más grande de UNO.

• Cada elemento contiene un elemento o NULL, evita usar apuntadores.

Thursday, May 11, 17

Page 84: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 13

Tablas de hash: resolviendo colisiones por direccionamiento abierto (open addressing)

• Todos los elementos se almacenan en la misma tabla hash.

• Si el campo está lleno, vuelvo a aplicar la función de hash.

• La tabla se puede “llenar” de tal manera que no se puedan hacer más inserciones

• ¿Qué podemos decir sobre el factor de carga?

• α nunca puede ser más grande de UNO.

• Cada elemento contiene un elemento o NULL, evita usar apuntadores.

• La memoria liberada sirve para almacenar más elementos en la tabla (menos colisiones, acceso más rápido).

Thursday, May 11, 17

Page 85: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 13

Tablas de hash: resolviendo colisiones por direccionamiento abierto (open addressing)

• Todos los elementos se almacenan en la misma tabla hash.

• Si el campo está lleno, vuelvo a aplicar la función de hash.

• La tabla se puede “llenar” de tal manera que no se puedan hacer más inserciones

• ¿Qué podemos decir sobre el factor de carga?

• α nunca puede ser más grande de UNO.

• Cada elemento contiene un elemento o NULL, evita usar apuntadores.

• La memoria liberada sirve para almacenar más elementos en la tabla (menos colisiones, acceso más rápido).

• La inserción examina o prueba sistemáticamente la tabla hasta encontrar un campo vacio.

Thursday, May 11, 17

Page 86: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 14

Tablas de hash: resolviendo colisiones por direccionamiento abierto

Thursday, May 11, 17

Page 87: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 14

Tablas de hash: resolviendo colisiones por direccionamiento abierto

• El proceso de prueba, en lugar de tener un orden fijo 0,1,...,m-1 (cuánto tiempo tomaría una búsqueda?)

Thursday, May 11, 17

Page 88: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 14

Tablas de hash: resolviendo colisiones por direccionamiento abierto

• El proceso de prueba, en lugar de tener un orden fijo 0,1,...,m-1 (cuánto tiempo tomaría una búsqueda?)

• la búsqueda tomaría Θ(n)

Thursday, May 11, 17

Page 89: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 14

Tablas de hash: resolviendo colisiones por direccionamiento abierto

• El proceso de prueba, en lugar de tener un orden fijo 0,1,...,m-1 (cuánto tiempo tomaría una búsqueda?)

• la búsqueda tomaría Θ(n)

• La secuencia de prueba depende de llaves que fueron insertadas antes.

Thursday, May 11, 17

Page 90: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 14

Tablas de hash: resolviendo colisiones por direccionamiento abierto

• El proceso de prueba, en lugar de tener un orden fijo 0,1,...,m-1 (cuánto tiempo tomaría una búsqueda?)

• la búsqueda tomaría Θ(n)

• La secuencia de prueba depende de llaves que fueron insertadas antes.

• La función de hash depende ahora de ambas, de la llave y del número de prueba (empieza por 0):

Thursday, May 11, 17

Page 91: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 14

Tablas de hash: resolviendo colisiones por direccionamiento abierto

• El proceso de prueba, en lugar de tener un orden fijo 0,1,...,m-1 (cuánto tiempo tomaría una búsqueda?)

• la búsqueda tomaría Θ(n)

• La secuencia de prueba depende de llaves que fueron insertadas antes.

• La función de hash depende ahora de ambas, de la llave y del número de prueba (empieza por 0):

Thursday, May 11, 17

Page 92: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 14

Tablas de hash: resolviendo colisiones por direccionamiento abierto

• El proceso de prueba, en lugar de tener un orden fijo 0,1,...,m-1 (cuánto tiempo tomaría una búsqueda?)

• la búsqueda tomaría Θ(n)

• La secuencia de prueba depende de llaves que fueron insertadas antes.

• La función de hash depende ahora de ambas, de la llave y del número de prueba (empieza por 0):

• La secuencia de prueba para una llave k, debe ser una permutación de para que cada campo de la tabla sea eventualmente considerado mientras esta se llena.

Thursday, May 11, 17

Page 93: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 15

Tablas de hash: resolviendo colisiones por direccionamiento abierto

• HASH-INSERT( T, k )1. i ← 02. repeat j ← h(k,i)3. if T[ j ] = NULL4. then T[ j ] ← k5. return j6. else i ← i+17. until i = m8. error “hash table overflow”

HASH-SEARCH( T, k )

• i ← 01. repeat j ← h( k, i )2. if T[ j ] = k3. then return j4. else i ← i+1• until T[ j ] = NULL o i = m• return NULL

• La eliminación es difícil: no puede solo sustituirse por el valor NULL, hay que usar otro marcador: DELETED (si no es posible es más apropiado usar chaining)

Thursday, May 11, 17

Page 94: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 16

Tablas de hash: resolviendo colisiones por direccionamiento abierto

• Ejemplo: insertar llave k=496

0

586

133

204

481

m-1

T

• La búsqueda usa la misma secuencia de prueba, terminando exitosamente si encuentra la llave y no exitosamente si encuentra una llave vacía.

Thursday, May 11, 17

Page 95: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 16

Tablas de hash: resolviendo colisiones por direccionamiento abierto

• Ejemplo: insertar llave k=496

0

586

133

204

481

m-1

T

Probe h( 496, 0 )

Probe h( 496, 1 )

204

586

Probe h( 496, 2 )

496• La búsqueda usa la misma secuencia de prueba, terminando exitosamente si encuentra la llave y no exitosamente si encuentra una llave vacía.

Thursday, May 11, 17

Page 96: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 17

Tablas de hash: secuencias de prueba

• Se usan generalmente tres técnicas para obtener una secuencia de prueba:

• prueba lineal (linear probing)

• prueba cuadrática (quadratic probing)

• hashing doble (double hashing)

• Estas técnicas garantizan que la secuencia será una permutación de los indices de la tabla para cada llave k.

• Ninguna puede generar más de m2 secuencias de prueba, y no las m! que requiere un hashing uniforme.

• El hashing doble produce el mayor número de secuencias de prueba.

Thursday, May 11, 17

Page 97: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 18

Tablas de hash: prueba lineal

Thursday, May 11, 17

Page 98: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 18

Tablas de hash: prueba lineal

• Este método es simple pero sufre de clustering primario que causa el aumento del tiempo de búsqueda.

• La prueba inicial determina la secuencia, por lo que solo hay m secuencias distintas.

Thursday, May 11, 17

Page 99: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 19

Tablas de hash: prueba cuadrática

Thursday, May 11, 17

Page 100: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 19

Tablas de hash: prueba cuadrática

• Con c1 y c2 reales, c2 diferente de 0.

Thursday, May 11, 17

Page 101: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 19

Tablas de hash: prueba cuadrática

• Con c1 y c2 reales, c2 diferente de 0.

• En lugar de agregar 1 se agrega en función de i. (proporcional a dos constantes auxiliares)

Thursday, May 11, 17

Page 102: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 19

Tablas de hash: prueba cuadrática

• Con c1 y c2 reales, c2 diferente de 0.

• En lugar de agregar 1 se agrega en función de i. (proporcional a dos constantes auxiliares)

• Si dos llaves tienen la misma posición inicial de prueba, sus secuencias de prueba son las mismas.

Thursday, May 11, 17

Page 103: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 19

Tablas de hash: prueba cuadrática

• Con c1 y c2 reales, c2 diferente de 0.

• En lugar de agregar 1 se agrega en función de i. (proporcional a dos constantes auxiliares)

• Si dos llaves tienen la misma posición inicial de prueba, sus secuencias de prueba son las mismas.

• Produce m secuencias distintas, pero aminora el clustering primario.

Thursday, May 11, 17

Page 104: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 20

Tablas de hash: hashing doble

• Es uno de los mejores métodos disponibles porque las permutaciones producidas tienen muchas de las características de las elegidas aleatoriamente.

• Este método produce generalmente excelentes resultados cuando es primo relativo a m. Una manera de hacer esto es haciendo m una potencia de 2 y diseñando para producir solo números impares.

Sean a, b ∈ Z, se dice que son primos relativos (o coprimos) “a” y “b” si no tienen ningún factor primo en común, es decir, si no tienen otro divisor común más que 1 ó -1, o cumplen que el mcd (a, b) = 1.

• El intervalo de “salto” depende de los datos, datos que son mapeados al mismo slot viajan por diferentes trayectorias.

Thursday, May 11, 17

Page 105: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 21

Tablas de hash: hashing doble

• Llave = 14, tabla de hash de tamaño 13 con h1(k)=k mod 13 y h2(k) = 1+ (k mod 11).

• 14 mod 13, entonce h1 = 1

• 1+ 14 mod 11, entonces h2 = 4

• la llave 14 se inserta en el campo vacio 9 después de visitar los campos 1 y 5, que estaban ocupados.

Thursday, May 11, 17

Page 106: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 21

Tablas de hash: hashing doble

• Llave = 14, tabla de hash de tamaño 13 con h1(k)=k mod 13 y h2(k) = 1+ (k mod 11).

• 14 mod 13, entonce h1 = 1

• 1+ 14 mod 11, entonces h2 = 4

• la llave 14 se inserta en el campo vacio 9 después de visitar los campos 1 y 5, que estaban ocupados.

0

1 79

2

3

4 69

5 98

6

7 72

8

9 14

10

11 50

12

Thursday, May 11, 17

Page 107: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 21

Tablas de hash: hashing doble

• Llave = 14, tabla de hash de tamaño 13 con h1(k)=k mod 13 y h2(k) = 1+ (k mod 11).

• 14 mod 13, entonce h1 = 1

• 1+ 14 mod 11, entonces h2 = 4

• la llave 14 se inserta en el campo vacio 9 después de visitar los campos 1 y 5, que estaban ocupados.

0

1 79

2

3

4 69

5 98

6

7 72

8

9 14

10

11 50

12

Thursday, May 11, 17

Page 108: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 22

Tablas de hash: análisis del direccionamiento abierto

• Suponiendo que cada llave tiene la misma probabilidad de tener como secuencia de prueba una de las m! permutaciones.

• TEOREMA

• Dada una tabla de hash con direccionamiento abierto con factor de carga α=n/m < 1, el número esperado de pruebas en una búsqueda no exitosa es a lo más 1/(1-α).

Thursday, May 11, 17

Page 109: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 23

Tablas de hash: análisis del direccionamiento abierto

Thursday, May 11, 17

Page 110: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 23

Tablas de hash: análisis del direccionamiento abierto

• PRUEBA

Thursday, May 11, 17

Page 111: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 23

Tablas de hash: análisis del direccionamiento abierto

• PRUEBA

• Se necesita siempre al menos una prueba.

Thursday, May 11, 17

Page 112: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 23

Tablas de hash: análisis del direccionamiento abierto

• PRUEBA

• Se necesita siempre al menos una prueba.

• Con una probabilidad de n/m, la primera prueba encuentra un campo ocupado y requiere de una segunda prueba.

Thursday, May 11, 17

Page 113: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 23

Tablas de hash: análisis del direccionamiento abierto

• PRUEBA

• Se necesita siempre al menos una prueba.

• Con una probabilidad de n/m, la primera prueba encuentra un campo ocupado y requiere de una segunda prueba.

• Con una probabilidad (n-1)/(m-1), la segunda prueba encontrará un campo ocupado y una tercera prueba es necesaria.

Thursday, May 11, 17

Page 114: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 23

Tablas de hash: análisis del direccionamiento abierto

• PRUEBA

• Se necesita siempre al menos una prueba.

• Con una probabilidad de n/m, la primera prueba encuentra un campo ocupado y requiere de una segunda prueba.

• Con una probabilidad (n-1)/(m-1), la segunda prueba encontrará un campo ocupado y una tercera prueba es necesaria.

• Con una probabilidad (n-2)/(m-2), la tercera prueba encontrará un campo ocupado, etc.

Thursday, May 11, 17

Page 115: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 23

Tablas de hash: análisis del direccionamiento abierto

• PRUEBA

• Se necesita siempre al menos una prueba.

• Con una probabilidad de n/m, la primera prueba encuentra un campo ocupado y requiere de una segunda prueba.

• Con una probabilidad (n-1)/(m-1), la segunda prueba encontrará un campo ocupado y una tercera prueba es necesaria.

• Con una probabilidad (n-2)/(m-2), la tercera prueba encontrará un campo ocupado, etc.

• Sabiendo que para m>n:

Thursday, May 11, 17

Page 116: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 24

Tablas de hash: análisis del direccionamiento abierto

Thursday, May 11, 17

Page 117: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 25

Tablas de hash: implicaciones del resultado del teorema

Thursday, May 11, 17

Page 118: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 25

Tablas de hash: implicaciones del resultado del teorema

• Si α es constante, entonces accesar una tabla de hash con direccionamiento abierto toma tiempo constante.

Thursday, May 11, 17

Page 119: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 25

Tablas de hash: implicaciones del resultado del teorema

• Si α es constante, entonces accesar una tabla de hash con direccionamiento abierto toma tiempo constante.

• Si la tabla esta medio llena, entonces el número esperado de pruebas es 1/(1-0.5) = 2.

Thursday, May 11, 17

Page 120: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 25

Tablas de hash: implicaciones del resultado del teorema

• Si α es constante, entonces accesar una tabla de hash con direccionamiento abierto toma tiempo constante.

• Si la tabla esta medio llena, entonces el número esperado de pruebas es 1/(1-0.5) = 2.

• Si la tabla está 90% llena, entonces el número esperado de pruebas es 1/(1-0.9) = 10.

Thursday, May 11, 17

Page 121: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 25

Tablas de hash: implicaciones del resultado del teorema

• Si α es constante, entonces accesar una tabla de hash con direccionamiento abierto toma tiempo constante.

• Si la tabla esta medio llena, entonces el número esperado de pruebas es 1/(1-0.5) = 2.

• Si la tabla está 90% llena, entonces el número esperado de pruebas es 1/(1-0.9) = 10.

Thursday, May 11, 17

Page 122: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 25

Tablas de hash: implicaciones del resultado del teorema

• Si α es constante, entonces accesar una tabla de hash con direccionamiento abierto toma tiempo constante.

• Si la tabla esta medio llena, entonces el número esperado de pruebas es 1/(1-0.5) = 2.

• Si la tabla está 90% llena, entonces el número esperado de pruebas es 1/(1-0.9) = 10.

• Cuando las tablas se llenan la cosa se empieza a comporta de manera lineal, por eso siempre es bueno tener una tabla hash “amplia”.

Thursday, May 11, 17

Page 123: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 26

Funcion hash para caracteres codificados

Cadena (3 letras de 7 bits c/u)

OctalDecimal

Mod 64Mod 31(primo)

Thursday, May 11, 17

Page 124: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 26

Funcion hash para caracteres codificados

Cadena (3 letras de 7 bits c/u)

OctalDecimal

Mod 64Mod 31(primo)

Thursday, May 11, 17

Page 125: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 27

Tablas de #’s primos

¿Primos cercanos?

Thursday, May 11, 17

Page 126: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 28

Funciones Hash de cadenas largas

• Por ejemplo, si tenemos:

• Podemos descomponerla como (Algoritmo de Horner):

Thursday, May 11, 17

Page 127: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 28

Funciones Hash de cadenas largas

• Por ejemplo, si tenemos:

• Podemos descomponerla como (Algoritmo de Horner):

Necesitamos solamente guardar el modulo de esto

Thursday, May 11, 17

Page 128: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 29

• Con este código de hash para cadenas

Funciones Hash de cadenas largas

Para las primeras 1000 palabras distintas del libro Moby Dick.

M=96, a = 128

M=97, a = 128

M=96, a = 127

Thursday, May 11, 17

Page 129: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 30

Un codigo para tener Universal Hash para cadenas

• En lugar de tener un numero a fijo (radio), lo vamos moviendo de forma pseudo-aleatoria.

Esto hace demasiadas operaciones por cada caracter, es mejor tomar pedazos de mayor tamaño (conjunto de bits) de la cadena, pero vamos a tener un máximo en el tamaño de palabra de la máquina.

Thursday, May 11, 17

Page 130: Tablas de hash (2) - cimat.mxalram/comp_algo/clase21.pdf · Alonso Ramirez Manzanares Computación y Algoritmos 09.05 2 Tablas de hash: resolviendo colisiones por encadenamiento Thursday,

Alonso Ramirez Manzanares Computación y Algoritmos 09.05 31

Hacer un parser de # de palabras por linea

Thursday, May 11, 17