Tabla de picadillo

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Un pequeño libro de teléfono como mesa de hadas

En informática, una tabla hash, también conocida como mapa hash, es una estructura de datos que implementa una matriz o diccionario asociativo. Es un tipo de datos abstracto que asigna claves a valores. Una tabla hash utiliza una función hash para calcular un índice, también llamado código hash, en una matriz de cubos o ranuras< /i>, desde donde se puede encontrar el valor deseado. Durante la búsqueda, se aplica un hash a la clave y el hash resultante indica dónde se almacena el valor correspondiente.

Idealmente, la función hash asignará cada clave a un cubo único, pero la mayoría de los diseños de tablas hash emplean una función hash imperfecta, lo que podría causar colisiones de hash donde la función hash genera el mismo índice para más que una llave. Este tipo de colisiones normalmente se acomodan de alguna manera.

En una tabla hash bien dimensionada, la complejidad de tiempo promedio para cada búsqueda es independiente de la cantidad de elementos almacenados en la tabla. Muchos diseños de tablas hash también permiten inserciones y eliminaciones arbitrarias de pares clave-valor, a un costo promedio constante amortizado por operación.

Hashing es un ejemplo de una compensación de espacio-tiempo. Si la memoria es infinita, la clave completa se puede usar directamente como un índice para ubicar su valor con un solo acceso a la memoria. Por otro lado, si se dispone de un tiempo infinito, los valores se pueden almacenar sin tener en cuenta sus claves, y se puede utilizar una búsqueda binaria o una búsqueda lineal para recuperar el elemento.

En muchas situaciones, las tablas hash resultan ser, en promedio, más eficientes que los árboles de búsqueda o cualquier otra estructura de búsqueda de tablas. Por esta razón, se usan ampliamente en muchos tipos de software de computadora, particularmente para matrices asociativas, indexación de bases de datos, cachés y conjuntos.

Historia

La idea de hashing surgió de forma independiente en diferentes lugares. En enero de 1953, Hans Peter Luhn escribió un memorándum interno de IBM que utilizaba hash con encadenamiento. El direccionamiento abierto fue propuesto más tarde por A. D. Linh basándose en el artículo de Luhn. Casi al mismo tiempo, Gene Amdahl, Elaine M. McGraw, Nathaniel Rochester y Arthur Samuel de IBM Research implementaron hash para el ensamblador IBM 701. El direccionamiento abierto con sondeo lineal se atribuye a Amdahl, aunque Ershov tuvo la misma idea de forma independiente. El término "direccionamiento abierto" fue acuñado por W. Wesley Peterson en su artículo que analiza el problema de la búsqueda en archivos grandes.

El primer trabajo publicado sobre hashing con encadenamiento se le atribuye a Arnold Dumey, quien discutió la idea de usar el módulo de resto a primo como una función hash. La palabra "hashing" fue publicado por primera vez por un artículo de Robert Morris. Konheim y Weiss presentaron originalmente un análisis teórico del sondeo lineal.

Resumen

Una matriz asociativa almacena un conjunto de (key, valor) pares y permite la inserción, eliminación y búsqueda (búsqueda), con la limitación de teclas únicas. En la tabla de hash la implementación de arrays asociativos, un array ${displaystyle A}$ de longitud ${displaystyle m}$ se llena parcialmente con ${displaystyle n}$ elementos, donde ${displaystyle mgeq n}$ . Un valor ${displaystyle x}$ se almacena en un índice de ubicación ${displaystyle A[h(x)}$ , donde ${displaystyle h}$ es una función de hash, y ${displaystyle h(x)$ . Bajo supuestos razonables, las tablas de hash tienen mejores límites de complejidad de tiempo en las operaciones de búsqueda, eliminación e inserción en comparación con los árboles de búsqueda binaria auto-Balancing.

Las tablas hash también se usan comúnmente para implementar conjuntos, omitiendo el valor almacenado para cada clave y simplemente rastreando si la clave está presente.

Factor de carga

A factor de carga ${displaystyle alpha }$ es una estadística crítica de una tabla de precipitaciones, y se define como sigue:

{displaystyle {text{load factor} (alpha)={frac {n}{k},}

Tabla de picadillo

Historia

Resumen

Factor de carga

Función hash

Supuesto de universo entero

Hashing por división

Hashing por multiplicación

Elegir una función hash

Resolución de colisiones

Encadenamiento separado

Otras estructuras de datos para encadenamiento separado

Almacenamiento en caché y localidad de referencia

Direccionamiento abierto

Almacenamiento en caché y localidad de referencia

Otras técnicas de resolución de colisiones basadas en direccionamiento abierto

Hashing combinado

Hashing de cuco

Hopscotch hash

Hashing de Robin Hood

Cambio de tamaño dinámico

Cambiar el tamaño moviendo todas las entradas

Alternativas al refrito todo a la vez

Hashing lineal

Rendimiento

Aplicaciones

Matrices asociativas

Indización de bases de datos

Cachés

Conjuntos

Tabla de transposición

Implementaciones

En lenguajes de programación

Contenido relacionado