Almacenamiento de datos informáticos

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

El almacenamiento de datos informáticos o memoria es una tecnología que consta de componentes informáticos y medios de grabación que se utilizan para retener datos digitales. Es una función central y un componente fundamental de las computadoras.

La unidad central de procesamiento (CPU) de una computadora es lo que manipula los datos mediante la realización de cálculos. En la práctica, casi todas las computadoras usan una jerarquía de almacenamiento, que coloca opciones de almacenamiento rápidas pero costosas y pequeñas cerca de la CPU y opciones más lentas pero menos costosas y más grandes más lejos. En general, las tecnologías volátiles rápidas (que pierden datos cuando se apagan) se denominan "memoria", mientras que las tecnologías persistentes más lentas se denominan "almacenamiento".

Incluso los primeros diseños de computadora, la máquina analítica de Charles Babbage y la máquina analítica de Percy Ludgate, distinguían claramente entre procesamiento y memoria (Babbage almacenaba números como rotaciones de engranajes, mientras que Ludgate almacenaba números como desplazamientos de barras en lanzaderas). Esta distinción se amplió en la arquitectura de Von Neumann, donde la CPU consta de dos partes principales: la unidad de control y la unidad aritmética lógica (ALU). El primero controla el flujo de datos entre la CPU y la memoria, mientras que el segundo realiza operaciones aritméticas y lógicas sobre los datos.

Funcionalidad

Sin una cantidad significativa de memoria, una computadora simplemente podría realizar operaciones fijas e inmediatamente mostrar el resultado. Tendría que ser reconfigurado para cambiar su comportamiento. Esto es aceptable para dispositivos como calculadoras de escritorio, procesadores de señales digitales y otros dispositivos especializados. Las máquinas de Von Neumann se diferencian por tener una memoria en la que almacenan sus instrucciones de funcionamiento y datos. Tales computadoras son más versátiles en el sentido de que no necesitan reconfigurar su hardware para cada nuevo programa, sino que simplemente pueden reprogramarse con nuevas instrucciones en memoria; también tienden a ser más simples de diseñar, en el sentido de que un procesador relativamente simple puede mantener el estado entre cálculos sucesivos para generar resultados de procedimientos complejos. La mayoría de las computadoras modernas son máquinas de von Neumann.

Organización y representación de datos

Una computadora digital moderna representa datos utilizando el sistema numérico binario. El texto, los números, las imágenes, el audio y casi cualquier otra forma de información se pueden convertir en una cadena de bits o dígitos binarios, cada uno de los cuales tiene un valor de 0 o 1. La unidad de almacenamiento más común es el byte, igual a 8 bits. Una pieza de información puede ser manejada por cualquier computadora o dispositivo cuyo espacio de almacenamiento sea lo suficientemente grande como para acomodar la representación binaria de la pieza de información, o simplemente datos. Por ejemplo, las obras completas de Shakespeare, unas 1250 páginas impresas, se pueden almacenar en unos cinco megabytes (40 millones de bits) con un byte por carácter.

Los datos se codifican asignando un patrón de bits a cada carácter, dígito u objeto multimedia. Existen muchos estándares para la codificación (por ejemplo, codificaciones de caracteres como ASCII, codificaciones de imágenes como JPEG y codificaciones de video como MPEG-4).

Al agregar bits a cada unidad codificada, la redundancia permite que la computadora detecte errores en los datos codificados y los corrija en función de algoritmos matemáticos. Los errores generalmente ocurren con bajas probabilidades debido a cambios aleatorios de valor de bit, o "fatiga de bit físico", pérdida del bit físico en el almacenamiento de su capacidad para mantener un valor distinguible (0 o 1), o debido a errores en inter o intra. -Comunicación informática. Un cambio de bit aleatorio (por ejemplo, debido a una radiación aleatoria) normalmente se corrige tras la detección. Un bit o un grupo de bits físicos que funcionan mal (no siempre se conoce el bit defectuoso específico; la definición del grupo depende del dispositivo de almacenamiento específico) generalmente se delimita automáticamente, el dispositivo deja de usarlo y lo reemplaza con otro grupo equivalente en funcionamiento en el dispositivo, donde se restauran los valores de bits corregidos (si es posible). El método de comprobación de redundancia cíclica (CRC) se utiliza normalmente en comunicaciones y almacenamiento para la detección de errores. A continuación, se vuelve a intentar un error detectado.

Los métodos de compresión de datos permiten en muchos casos (como una base de datos) representar una cadena de bits por una cadena de bits más corta ("comprimir") y reconstruir la cadena original ("descomprimir") cuando sea necesario. Esto utiliza sustancialmente menos almacenamiento (decenas de porcentajes) para muchos tipos de datos a costa de más computación (comprimir y descomprimir cuando sea necesario). El análisis de la compensación entre el ahorro de costos de almacenamiento y los costos de los cálculos relacionados y los posibles retrasos en la disponibilidad de los datos se realiza antes de decidir si mantener ciertos datos comprimidos o no.

Por razones de seguridad, ciertos tipos de datos (p. ej., información de tarjetas de crédito) pueden mantenerse encriptados en el almacenamiento para evitar la posibilidad de una reconstrucción de información no autorizada a partir de fragmentos de instantáneas de almacenamiento.

Jerarquía de almacenamiento

En general, cuanto más bajo está un almacenamiento en la jerarquía, menor es su ancho de banda y mayor es su latencia de acceso desde la CPU. Esta división tradicional del almacenamiento en almacenamiento primario, secundario, terciario y fuera de línea también se rige por el costo por bit.

En el uso contemporáneo, la memoria suele ser memoria de acceso aleatorio de lectura y escritura de almacenamiento de semiconductores, normalmente DRAM (RAM dinámica) u otras formas de almacenamiento rápido pero temporal. El almacenamiento consiste en dispositivos de almacenamiento y sus medios a los que la CPU no puede acceder directamente (almacenamiento secundario o terciario), generalmente unidades de disco duro, unidades de disco óptico y otros dispositivos más lentos que la RAM pero no volátiles (retienen el contenido cuando se apaga).

Históricamente, la memoria se ha denominado memoria central, memoria principal, almacenamiento real o memoria interna. Mientras tanto, los dispositivos de almacenamiento no volátil se conocen como almacenamiento secundario, memoria externa o almacenamiento auxiliar/periférico.

Almacenamiento primario

El almacenamiento primario (también conocido como memoria principal, memoria interna o memoria principal), a menudo denominado simplemente memoria, es el único al que puede acceder directamente la CPU. La CPU lee continuamente las instrucciones almacenadas allí y las ejecuta según sea necesario. Todos los datos en los que se opera activamente también se almacenan allí de manera uniforme.

Históricamente, las primeras computadoras usaban líneas de retardo, tubos Williams o tambores magnéticos giratorios como almacenamiento principal. Para 1954, esos métodos poco confiables fueron reemplazados en su mayoría por memorias de núcleo magnético. La memoria central siguió siendo dominante hasta la década de 1970, cuando los avances en la tecnología de circuitos integrados permitieron que la memoria de semiconductores se volviera económicamente competitiva.

Esto condujo a la memoria de acceso aleatorio (RAM) moderna. Es de tamaño pequeño, ligero, pero bastante caro al mismo tiempo. Los tipos particulares de RAM que se utilizan para el almacenamiento principal son volátiles, lo que significa que pierden la información cuando no reciben alimentación. Además de almacenar programas abiertos, sirve como caché de disco y búfer de escritura para mejorar el rendimiento de lectura y escritura. Los sistemas operativos toman prestada la capacidad de RAM para el almacenamiento en caché siempre que no la necesite el software en ejecución. La memoria de repuesto se puede utilizar como unidad RAM para el almacenamiento temporal de datos a alta velocidad.

Como se muestra en el diagrama, tradicionalmente hay dos subcapas más del almacenamiento principal, además de la RAM principal de gran capacidad:

Los registros del procesador se encuentran dentro del procesador. Cada registro normalmente contiene una palabra de datos (a menudo 32 o 64 bits). Las instrucciones de la CPU instruyen a la unidad lógica aritmética para realizar varios cálculos u otras operaciones en estos datos (o con la ayuda de ellos). Los registros son los más rápidos de todas las formas de almacenamiento de datos informáticos.
La memoria caché del procesador es una etapa intermedia entre los registros ultrarrápidos y la memoria principal mucho más lenta. Se introdujo únicamente para mejorar el rendimiento de las computadoras. La información más utilizada en la memoria principal simplemente se duplica en la memoria caché, que es más rápida, pero de mucha menor capacidad. Por otro lado, la memoria principal es mucho más lenta, pero tiene una capacidad de almacenamiento mucho mayor que los registros del procesador. La configuración de caché jerárquica de varios niveles también se usa comúnmente: la caché principal es la más pequeña, la más rápida y está ubicada dentro del procesador; la caché secundaria es algo más grande y más lenta.

La memoria principal está directa o indirectamente conectada a la unidad central de procesamiento a través de un bus de memoria. En realidad, son dos buses (no en el diagrama): un bus de direcciones y un bus de datos. La CPU primero envía un número a través de un bus de direcciones, un número llamado dirección de memoria, que indica la ubicación deseada de los datos. Luego lee o escribe los datos en las celdas de memoria utilizando el bus de datos. Además, una unidad de gestión de memoria (MMU) es un pequeño dispositivo entre la CPU y la RAM que vuelve a calcular la dirección de memoria real, por ejemplo, para proporcionar una abstracción de la memoria virtual u otras tareas.

Como los tipos de RAM utilizados para el almacenamiento primario son volátiles (no se inicializan al inicio), una computadora que contenga solo dicho almacenamiento no tendría una fuente para leer las instrucciones para iniciar la computadora. Por lo tanto, el almacenamiento primario no volátil que contiene un pequeño programa de inicio (BIOS) se usa para arrancar la computadora, es decir, para leer un programa más grande desde el almacenamiento secundario no volátil a la RAM y comenzar a ejecutarlo. Una tecnología no volátil utilizada para este propósito se llama ROM, para memoria de solo lectura (la terminología puede ser algo confusa ya que la mayoría de los tipos de ROM también tienen capacidad de acceso aleatorio).

Muchos tipos de "ROM" no son literalmente de solo lectura, ya que es posible actualizarlos; sin embargo, es lento y la memoria debe borrarse en gran parte antes de que pueda volver a escribirse. Algunos sistemas integrados ejecutan programas directamente desde la ROM (o similar), porque estos programas rara vez se modifican. Las computadoras estándar no almacenan programas no rudimentarios en ROM, sino que utilizan grandes capacidades de almacenamiento secundario, que tampoco es volátil y no es tan costoso.

Recientemente, el almacenamiento primario y el almacenamiento secundario en algunos usos se refieren a lo que históricamente se denominó, respectivamente, almacenamiento secundario y almacenamiento terciario.

Almacenamiento secundario

El almacenamiento secundario (también conocido como memoria externa o almacenamiento auxiliar) difiere del almacenamiento primario en que la CPU no puede acceder directamente a él. La computadora generalmente usa sus canales de entrada/salida para acceder al almacenamiento secundario y transferir los datos deseados al almacenamiento primario. El almacenamiento secundario no es volátil (retiene los datos cuando se corta la alimentación). Los sistemas informáticos modernos suelen tener dos órdenes de magnitud más de almacenamiento secundario que el almacenamiento primario porque el almacenamiento secundario es menos costoso.

En las computadoras modernas, las unidades de disco duro (HDD) o las unidades de estado sólido (SSD) generalmente se usan como almacenamiento secundario. El tiempo de acceso por byte para HDD o SSD generalmente se mide en milisegundos (una milésima de segundo), mientras que el tiempo de acceso por byte para el almacenamiento principal se mide en nanosegundos (una milmillonésima de segundo). Por lo tanto, el almacenamiento secundario es significativamente más lento que el almacenamiento primario. Los dispositivos de almacenamiento óptico giratorio, como las unidades de CD y DVD, tienen tiempos de acceso aún más prolongados. Otros ejemplos de tecnologías de almacenamiento secundario incluyen unidades flash USB, disquetes, cintas magnéticas, cintas de papel, tarjetas perforadas y discos RAM.

Una vez que el cabezal de lectura/escritura del disco en los HDD alcanza la ubicación adecuada y los datos, los datos subsiguientes en la pista son muy rápidos de acceder. Para reducir el tiempo de búsqueda y la latencia de rotación, los datos se transfieren hacia y desde los discos en grandes bloques contiguos. El acceso secuencial o de bloques en los discos es mucho más rápido que el acceso aleatorio, y se han desarrollado muchos paradigmas sofisticados para diseñar algoritmos eficientes basados en el acceso secuencial y de bloques. Otra forma de reducir el cuello de botella de E/S es usar varios discos en paralelo para aumentar el ancho de banda entre la memoria primaria y la secundaria.

El almacenamiento secundario a menudo se formatea de acuerdo con un formato de sistema de archivos, que proporciona la abstracción necesaria para organizar los datos en archivos y directorios, al mismo tiempo que proporciona metadatos que describen al propietario de un determinado archivo, el tiempo de acceso, los permisos de acceso y otra información.

La mayoría de los sistemas operativos de las computadoras utilizan el concepto de memoria virtual, lo que permite la utilización de más capacidad de almacenamiento principal que la que está físicamente disponible en el sistema. A medida que la memoria principal se llena, el sistema mueve los fragmentos menos utilizados (páginas) a un archivo de intercambio o un archivo de página en el almacenamiento secundario, recuperándolos más tarde cuando sea necesario. Si se mueven muchas páginas a un almacenamiento secundario más lento, se degrada el rendimiento del sistema.

Almacenamiento terciario

El almacenamiento terciario o memoria terciaria está un nivel por debajo del almacenamiento secundario. Por lo general, implica un mecanismo robótico que montará (insertará) y desmontará medios de almacenamiento masivo extraíbles en un dispositivo de almacenamiento de acuerdo con las demandas del sistema; dichos datos a menudo se copian en un almacenamiento secundario antes de su uso. Se utiliza principalmente para archivar información a la que rara vez se accede, ya que es mucho más lento que el almacenamiento secundario (p. ej., 5 a 60 segundos frente a 1 a 10 milisegundos). Esto es principalmente útil para almacenes de datos extraordinariamente grandes, a los que se accede sin operadores humanos. Los ejemplos típicos incluyen bibliotecas de cintas y jukeboxes ópticos.

Cuando una computadora necesita leer información del almacenamiento terciario, primero consultará una base de datos de catálogo para determinar qué cinta o disco contiene la información. A continuación, la computadora le indicará a un brazo robótico que busque el medio y lo coloque en una unidad. Cuando la computadora haya terminado de leer la información, el brazo robótico devolverá el medio a su lugar en la biblioteca.

El almacenamiento terciario también se conoce como almacenamiento nearline porque está "casi en línea". La distinción formal entre almacenamiento en línea, casi en línea y fuera de línea es:

El almacenamiento en línea está inmediatamente disponible para E/S.
El almacenamiento Nearline no está disponible de inmediato, pero se puede hacer en línea rápidamente sin intervención humana.
El almacenamiento sin conexión no está disponible de inmediato y requiere alguna intervención humana para estar en línea.

Por ejemplo, las unidades de disco duro giratorias siempre activas son almacenamiento en línea, mientras que las unidades giratorias que giran automáticamente, como en matrices masivas de discos inactivos (MAID), son almacenamiento casi en línea. Los medios extraíbles, como los cartuchos de cinta que se pueden cargar automáticamente, como en las bibliotecas de cintas, son almacenamiento casi en línea, mientras que los cartuchos de cinta que deben cargarse manualmente son almacenamiento fuera de línea.

Almacenamiento fuera de línea

El almacenamiento fuera de línea es un almacenamiento de datos informáticos en un medio o dispositivo que no está bajo el control de una unidad de procesamiento. El medio se registra, generalmente en un dispositivo de almacenamiento secundario o terciario, y luego se retira o desconecta físicamente. Debe ser insertado o conectado por un operador humano antes de que una computadora pueda acceder a él nuevamente. A diferencia del almacenamiento terciario, no se puede acceder a él sin interacción humana.

El almacenamiento fuera de línea se utiliza para transferir información, ya que el medio separado se puede transportar fácilmente físicamente. Además, es útil para casos de desastre, donde, por ejemplo, un incendio destruye los datos originales, un medio en una ubicación remota no se verá afectado, lo que permitirá la recuperación ante desastres. El almacenamiento fuera de línea aumenta la seguridad general de la información, ya que es físicamente inaccesible desde una computadora y la confidencialidad o integridad de los datos no puede verse afectada por técnicas de ataque basadas en computadoras. Además, si rara vez se accede a la información almacenada con fines de archivo, el almacenamiento fuera de línea es menos costoso que el almacenamiento terciario.

En las computadoras personales modernas, la mayoría de los medios de almacenamiento secundarios y terciarios también se utilizan para el almacenamiento fuera de línea. Los discos ópticos y los dispositivos de memoria flash son los más populares y, en mucha menor medida, las unidades de disco duro extraíbles. En los usos empresariales, predomina la cinta magnética. Los ejemplos más antiguos son los disquetes, los discos Zip o las tarjetas perforadas.

Características del almacenamiento

Las tecnologías de almacenamiento en todos los niveles de la jerarquía de almacenamiento se pueden diferenciar mediante la evaluación de ciertas características centrales y la medición de características específicas de una implementación en particular. Estas características centrales son la volatilidad, la mutabilidad, la accesibilidad y la direccionabilidad. Para cualquier implementación particular de cualquier tecnología de almacenamiento, las características que vale la pena medir son la capacidad y el rendimiento.

Característica	Disco duro	Disco óptico	Memoria flash	Memoria de acceso aleatorio	Cinta lineal abierta
Tecnología	Disco magnetico	Rayo laser	Semiconductor	Cinta magnética
Volatilidad	No	No	No	Volátil	No
Acceso aleatorio	Sí	Sí	Sí	Sí	No
Latencia (tiempo de acceso)	~15 ms (rápido)	~150 ms (moderado)	Ninguno (instantáneo)	Ninguno (instantáneo)	Falta de acceso aleatorio (muy lento)
Controlador	Interno	Externo	Interno	Interno	Externo
Fallo con pérdida inminente de datos	Choque de cabeza	—	circuitos	—
Detección de errores	Diagnóstico (INTELIGENTE)	Medición de la tasa de error	Indicado por la reducción de las tasas de transferencia	(Almacenamiento a corto plazo)	Desconocido
Precio por espacio	Bajo	Bajo	Alto	Muy alto	Unidades muy bajas (pero caras)
Precio por unidad	Moderado	Bajo	Moderado	Alto	Unidades moderadas (pero caras)
Aplicación principal	Expansión de almacenamiento de estaciones de trabajo, servidores y archivos a medio plazo	Archivo a largo plazo, distribución de copias impresas	Electrónica portátil; sistema operativo	Tiempo real	Archivo a largo plazo

Volatilidad

La memoria no volátil retiene la información almacenada incluso si no se le suministra energía eléctrica constantemente. Es adecuado para el almacenamiento a largo plazo de la información. La memoria volátil requiere energía constante para mantener la información almacenada. Las tecnologías de memoria más rápidas son las volátiles, aunque esa no es una regla universal. Dado que se requiere que el almacenamiento primario sea muy rápido, utiliza predominantemente memoria volátil.

La memoria dinámica de acceso aleatorio es una forma de memoria volátil que también requiere que la información almacenada se vuelva a leer y escribir o actualizar periódicamente, de lo contrario desaparecería. La memoria estática de acceso aleatorio es una forma de memoria volátil similar a la DRAM con la excepción de que nunca necesita actualizarse mientras se enciende; pierde su contenido cuando se pierde la fuente de alimentación.

Se puede usar una fuente de alimentación ininterrumpida (UPS) para darle a una computadora una breve ventana de tiempo para mover la información del almacenamiento volátil primario al almacenamiento no volátil antes de que se agoten las baterías. Algunos sistemas, por ejemplo, EMC Symmetrix, tienen baterías integradas que mantienen el almacenamiento volátil durante varios minutos.

Mutabilidad

Almacenamiento de lectura/escritura o almacenamiento mutablePermite sobrescribir información en cualquier momento. Una computadora sin cierta cantidad de almacenamiento de lectura/escritura para fines de almacenamiento primario sería inútil para muchas tareas. Las computadoras modernas generalmente usan almacenamiento de lectura/escritura también para almacenamiento secundario.Escritura lenta, almacenamiento de lectura rápidaAlmacenamiento de lectura/escritura que permite sobrescribir la información varias veces, pero la operación de escritura es mucho más lenta que la operación de lectura. Los ejemplos incluyen CD-RW y SSD.Escribir una vez almacenamientoWrite once read many (WORM) permite que la información se escriba solo una vez en algún momento después de la fabricación. Los ejemplos incluyen memoria de solo lectura programable de semiconductores y CD-R.Almacenamiento de solo lecturaConserva la información almacenada en el momento de la fabricación. Los ejemplos incluyen circuitos integrados de ROM de máscara y CD-ROM.

Accesibilidad

Acceso aleatorioSe puede acceder a cualquier ubicación almacenada en cualquier momento en aproximadamente la misma cantidad de tiempo. Tal característica es muy adecuada para el almacenamiento primario y secundario. La mayoría de las memorias de semiconductores y las unidades de disco brindan acceso aleatorio, aunque solo la memoria flash admite el acceso aleatorio sin latencia, ya que no es necesario mover ninguna pieza mecánica.Acceso secuencialEl acceso a los datos será en orden serial, uno tras otro; por lo tanto, el tiempo para acceder a una determinada información depende de a qué información se accedió por última vez. Tal característica es típica del almacenamiento fuera de línea.

Direccionabilidad

Ubicación direccionableCada unidad de información accesible individualmente en el almacenamiento se selecciona con su dirección de memoria numérica. En las computadoras modernas, el almacenamiento direccionable por ubicación generalmente se limita al almacenamiento primario, al que se accede internamente mediante programas informáticos, ya que la direccionabilidad por ubicación es muy eficiente, pero onerosa para los humanos.Archivo direccionableLa información se divide en archivos de longitud variable y se selecciona un archivo en particular con un directorio y nombres de archivo legibles por humanos. El dispositivo subyacente sigue siendo direccionable por ubicación, pero el sistema operativo de una computadora proporciona la abstracción del sistema de archivos para que la operación sea más comprensible. En las computadoras modernas, el almacenamiento secundario, terciario y fuera de línea utiliza sistemas de archivos.Contenido direccionableCada unidad de información accesible individualmente se selecciona en función de (parte de) los contenidos almacenados allí. El almacenamiento direccionable por contenido se puede implementar mediante software (programa de computadora) o hardware (dispositivo de computadora), siendo el hardware una opción más rápida pero más costosa. La memoria direccionable de contenido de hardware se usa a menudo en la memoria caché de la CPU de una computadora.

Capacidad

Capacidad brutaLa cantidad total de información almacenada que puede contener un dispositivo o medio de almacenamiento. Se expresa como una cantidad de bits o bytes (por ejemplo, 10,4 megabytes).Densidad de almacenamiento de memoriaLa compacidad de la información almacenada. Es la capacidad de almacenamiento de un medio dividida con una unidad de longitud, área o volumen (por ejemplo, 1,2 megabytes por pulgada cuadrada).

Actuación

LatenciaEl tiempo que lleva acceder a una ubicación particular en el almacenamiento. La unidad de medida relevante suele ser el nanosegundo para el almacenamiento primario, el milisegundo para el almacenamiento secundario y el segundo para el almacenamiento terciario. Puede tener sentido separar la latencia de lectura y la latencia de escritura (especialmente para la memoria no volátil) y, en el caso del almacenamiento de acceso secuencial, la latencia mínima, máxima y media.RendimientoLa velocidad a la que se puede leer o escribir información en el almacenamiento. En el almacenamiento de datos informáticos, el rendimiento suele expresarse en términos de megabytes por segundo (MB/s), aunque también se puede utilizar la tasa de bits. Al igual que con la latencia, es posible que sea necesario diferenciar la velocidad de lectura y la velocidad de escritura. Además, el acceso a los medios secuencialmente, en lugar de al azar, generalmente produce el máximo rendimiento.granularidadEl tamaño del "fragmento" más grande de datos al que se puede acceder eficientemente como una sola unidad, por ejemplo, sin introducir latencia adicional.FiabilidadLa probabilidad de cambio de valor de bit espontáneo bajo varias condiciones, o tasa de falla general.

Se pueden usar utilidades como hdparm y sar para medir el rendimiento de IO en Linux.

Energía usada

Los dispositivos de almacenamiento que reducen el uso del ventilador se apagan automáticamente durante la inactividad, y los discos duros de bajo consumo pueden reducir el consumo de energía en un 90 por ciento.
Las unidades de disco duro de 2,5 pulgadas suelen consumir menos energía que las más grandes. Las unidades de estado sólido de baja capacidad no tienen piezas móviles y consumen menos energía que los discos duros. Además, la memoria puede consumir más energía que los discos duros. Las memorias caché grandes, que se utilizan para evitar golpear la pared de la memoria, también pueden consumir una gran cantidad de energía.

Seguridad

El cifrado de disco completo, el cifrado de volumen y disco virtual y el cifrado de archivos/carpetas están disponibles para la mayoría de los dispositivos de almacenamiento.

El cifrado de memoria de hardware está disponible en la arquitectura Intel, compatible con el cifrado de memoria total (TME) y el cifrado de memoria granular de página con claves múltiples (MKTME). y en la generación SPARC M7 desde octubre de 2015.

Vulnerabilidad y confiabilidad

Distintos tipos de almacenamiento de datos tienen diferentes puntos de falla y varios métodos de análisis predictivo de fallas.

Las vulnerabilidades que pueden conducir instantáneamente a la pérdida total son el bloqueo de la cabeza en los discos duros mecánicos y la falla de los componentes electrónicos en el almacenamiento flash.

Detección de errores

La falla inminente en las unidades de disco duro se puede estimar utilizando datos de diagnóstico SMART que incluyen las horas de funcionamiento y el recuento de giros, aunque se cuestiona su confiabilidad.

El almacenamiento flash puede experimentar tasas de transferencia descendentes como resultado de la acumulación de errores, que el controlador de memoria flash intenta corregir.

La salud de los medios ópticos se puede determinar midiendo los errores menores corregibles, de los cuales los recuentos altos significan medios deteriorados y/o de baja calidad. Demasiados errores menores consecutivos pueden provocar daños en los datos. No todos los proveedores y modelos de unidades ópticas admiten la detección de errores.

Medios de almacenamiento

A partir de 2011, los medios de almacenamiento de datos más utilizados son semiconductores, magnéticos y ópticos, mientras que el papel todavía tiene un uso limitado. Se propone el desarrollo de algunas otras tecnologías de almacenamiento fundamentales, como arreglos all-flash (AFA).

Semiconductor

La memoria de semiconductores utiliza chips de circuitos integrados (IC) basados en semiconductores para almacenar información. Los datos generalmente se almacenan en celdas de memoria de semiconductores de óxido de metal (MOS). Un chip de memoria semiconductor puede contener millones de celdas de memoria, que consisten en pequeños transistores de efecto de campo MOS (MOSFET) y/o condensadores MOS. Existen formas de memoria de semiconductor tanto volátiles como no volátiles, la primera utiliza MOSFET estándar y la última utiliza MOSFET de puerta flotante.

En las computadoras modernas, el almacenamiento primario consiste casi exclusivamente en memoria dinámica de acceso aleatorio (RAM) de semiconductores volátiles, particularmente memoria dinámica de acceso aleatorio (DRAM). Desde el cambio de siglo, un tipo de memoria de semiconductores de puerta flotante no volátil conocida como memoria flash ha ido ganando terreno como almacenamiento fuera de línea para computadoras domésticas. La memoria de semiconductor no volátil también se utiliza para el almacenamiento secundario en varios dispositivos electrónicos avanzados y computadoras especializadas que están diseñadas para ellos.

Ya en 2006, los fabricantes de computadoras portátiles y de escritorio comenzaron a usar unidades de estado sólido (SSD) basadas en flash como opciones de configuración predeterminadas para el almacenamiento secundario, ya sea además o en lugar del HDD más tradicional.

Magnético

El almacenamiento magnético utiliza diferentes patrones de magnetización en una superficie recubierta magnéticamente para almacenar información. El almacenamiento magnético no es volátil. Se accede a la información utilizando uno o más cabezales de lectura/escritura que pueden contener uno o más transductores de grabación. Un cabezal de lectura/escritura solo cubre una parte de la superficie, por lo que el cabezal o el medio o ambos deben moverse en relación con otro para acceder a los datos. En las computadoras modernas, el almacenamiento magnético tomará estas formas:

Disco magnetico;
- Disquete, utilizado para almacenamiento fuera de línea;
- Unidad de disco duro, utilizada para almacenamiento secundario.
Cinta magnética, utilizada para almacenamiento terciario y fuera de línea;
Carrusel de memoria (rollos magnéticos).

En las primeras computadoras, el almacenamiento magnético también se usaba como:

Almacenamiento primario en forma de memoria magnética, o memoria de núcleo, memoria de cuerda de núcleo, memoria de película delgada y/o memoria de torsión;
Almacenamiento terciario (por ejemplo, NCR CRAM) o fuera de línea en forma de tarjetas magnéticas;
En ese entonces, la cinta magnética se usaba a menudo para el almacenamiento secundario.

El almacenamiento magnético no tiene un límite definido de ciclos de reescritura como el almacenamiento flash y los medios ópticos regrabables, ya que la alteración de los campos magnéticos no provoca desgaste físico. Más bien, su vida útil está limitada por partes mecánicas.

Óptico

El almacenamiento óptico, el disco óptico típico, almacena información en deformidades en la superficie de un disco circular y lee esta información iluminando la superficie con un diodo láser y observando el reflejo. El almacenamiento en disco óptico no es volátil. Las deformidades pueden ser permanentes (medios de sólo lectura), formadas una vez (medios de escritura única) o reversibles (medios grabables o de lectura/escritura). Los siguientes formularios son actualmente de uso común:

CD, CD-ROM, DVD, BD-ROM: almacenamiento de solo lectura, utilizado para la distribución masiva de información digital (música, video, programas informáticos);
CD-R, DVD-R, DVD+R, BD-R: almacenamiento de una sola escritura, utilizado para almacenamiento terciario y fuera de línea;
CD-RW, DVD-RW, DVD+RW, DVD-RAM, BD-RE: almacenamiento de escritura lenta y lectura rápida, utilizado para almacenamiento terciario y fuera de línea;
Ultra Density Optical o UDO tiene una capacidad similar a BD-R o BD-RE y es un almacenamiento de lectura rápida y escritura lenta que se usa para almacenamiento terciario y fuera de línea.

El almacenamiento en disco magneto-óptico es un almacenamiento en disco óptico donde el estado magnético en una superficie ferromagnética almacena información. La información se lee ópticamente y se escribe combinando métodos magnéticos y ópticos. El almacenamiento en disco magneto-óptico es un almacenamiento no volátil, de acceso secuencial, escritura lenta y lectura rápida que se utiliza para el almacenamiento terciario y fuera de línea.

También se ha propuesto el almacenamiento de datos ópticos en 3D.

También se ha propuesto la fusión por magnetización inducida por la luz en fotoconductores magnéticos para el almacenamiento magnetoóptico de alta velocidad y bajo consumo de energía.

Papel

El almacenamiento de datos en papel, generalmente en forma de cinta de papel o tarjetas perforadas, se ha utilizado durante mucho tiempo para almacenar información para el procesamiento automático, particularmente antes de que existieran las computadoras de propósito general. La información se registraba perforando agujeros en el medio de papel o cartón y se leía mecánicamente (o luego ópticamente) para determinar si una ubicación particular en el medio era sólida o contenía un agujero. Los códigos de barras hacen posible que los objetos que se venden o transportan tengan cierta información legible por computadora adjunta de manera segura.

Se pueden realizar copias de seguridad de cantidades relativamente pequeñas de datos digitales (en comparación con otro almacenamiento de datos digitales) en papel como un código de barras de matriz para el almacenamiento a muy largo plazo, ya que la longevidad del papel suele superar incluso el almacenamiento de datos magnéticos.

Otros medios de almacenamiento o sustratos

Memoria de tubo de vacíoUn tubo Williams usaba un tubo de rayos catódicos y un tubo Selectron usaba un tubo de vacío grande para almacenar información. Estos dispositivos de almacenamiento primario duraron poco en el mercado, ya que el tubo Williams no era confiable y el tubo Selectron era costoso.Memoria electroacústicaLa memoria de línea de retardo usaba ondas de sonido en una sustancia como el mercurio para almacenar información. La memoria de línea de retardo era un almacenamiento de lectura/escritura secuencial de ciclo volátil dinámico y se usaba para el almacenamiento primario.cinta ópticaes un medio de almacenamiento óptico, que generalmente consiste en una tira larga y estrecha de plástico, en la que se pueden escribir patrones y desde la cual se pueden leer los patrones. Comparte algunas tecnologías con películas de cine y discos ópticos, pero no es compatible con ninguno. La motivación detrás del desarrollo de esta tecnología fue la posibilidad de capacidades de almacenamiento mucho mayores que las cintas magnéticas o los discos ópticos.Memoria de cambio de faseutiliza diferentes fases mecánicas de material de cambio de fase para almacenar información en una matriz direccionable X-Y y lee la información observando la resistencia eléctrica variable del material. La memoria de cambio de fase sería un almacenamiento de lectura/escritura de acceso aleatorio no volátil, y podría usarse para almacenamiento primario, secundario y fuera de línea. La mayoría de los discos ópticos regrabables y muchos de escritura única ya utilizan material de cambio de fase para almacenar información.Almacenamiento de datos holográficosalmacena información ópticamente dentro de cristales o fotopolímeros. El almacenamiento holográfico puede utilizar todo el volumen del medio de almacenamiento, a diferencia del almacenamiento en disco óptico, que se limita a una pequeña cantidad de capas superficiales. El almacenamiento holográfico sería no volátil, de acceso secuencial y de escritura única o de lectura/escritura. Puede usarse para almacenamiento secundario y fuera de línea. Consulte Disco versátil holográfico (HVD).memoria molecularalmacena información en polímero que puede almacenar carga eléctrica. La memoria molecular podría ser especialmente adecuada para el almacenamiento primario. La capacidad de almacenamiento teórica de la memoria molecular es de 10 terabits por pulgada cuadrada (16 Gbit/mm).Fotoconductores magnéticosalmacenar información magnética, que puede ser modificada por iluminación con poca luz.ADNalmacena información en nucleótidos de ADN. Se realizó por primera vez en 2012, cuando los investigadores lograron una proporción de 1,28 petabytes por gramo de ADN. En marzo de 2017, los científicos informaron que un nuevo algoritmo llamado fuente de ADN alcanzó el 85 % del límite teórico, a 215 petabytes por gramo de ADN.

Tecnologías relacionadas

Redundancia

Si bien el mal funcionamiento de un grupo de bits puede resolverse mediante mecanismos de detección y corrección de errores (ver arriba), el mal funcionamiento del dispositivo de almacenamiento requiere soluciones diferentes. Las siguientes soluciones son de uso común y válidas para la mayoría de los dispositivos de almacenamiento:

Duplicación de dispositivos (replicación): una solución común al problema es mantener constantemente una copia idéntica del contenido del dispositivo en otro dispositivo (generalmente del mismo tipo). La desventaja es que esto duplica el almacenamiento, y ambos dispositivos (copias) deben actualizarse simultáneamente con algunos gastos generales y posiblemente algunas demoras. La ventaja es la posible lectura simultánea de un mismo grupo de datos por parte de dos procesos independientes, lo que aumenta el rendimiento. Cuando se detecta que uno de los dispositivos replicados es defectuoso, la otra copia aún está operativa y se utiliza para generar una nueva copia en otro dispositivo (generalmente disponible en funcionamiento en un grupo de dispositivos de reserva para este propósito).
Matriz redundante de discos independientes (RAID): este método generaliza la duplicación de dispositivos anterior al permitir que un dispositivo en un grupo de n dispositivos falle y se reemplace con el contenido restaurado (la duplicación de dispositivos es RAID con n = 2). Los grupos RAID de n=5 o n=6 son comunes. n>2 ahorra almacenamiento, en comparación con n=2, a costa de más procesamiento durante el funcionamiento normal (a menudo con un rendimiento reducido) y el reemplazo del dispositivo defectuoso.

La duplicación de dispositivos y el RAID típico están diseñados para manejar una sola falla de dispositivo en el grupo de dispositivos RAID. Sin embargo, si ocurre una segunda falla antes de que el grupo RAID esté completamente reparado desde la primera falla, los datos pueden perderse. La probabilidad de un solo fallo suele ser pequeña. Por lo tanto, la probabilidad de dos fallas en un mismo grupo RAID en la proximidad del tiempo es mucho menor (aproximadamente la probabilidad al cuadrado, es decir, multiplicada por sí misma). Si una base de datos no puede tolerar ni siquiera una probabilidad tan pequeña de pérdida de datos, entonces el propio grupo RAID se replica (refleja). En muchos casos, dicha duplicación se realiza de forma remota geográficamente, en una matriz de almacenamiento diferente, para manejar también la recuperación de desastres (consulte la recuperación de desastres más arriba).

Conectividad de red

Un almacenamiento secundario o terciario puede conectarse a una computadora utilizando redes informáticas. Este concepto no pertenece al almacenamiento primario, que se comparte entre múltiples procesadores en menor grado.

El almacenamiento adjunto directo (DAS) es un almacenamiento masivo tradicional, que no utiliza ninguna red. Este sigue siendo un enfoque muy popular. Este trónimo se acuñó recientemente, junto con NAS y SAN.
El almacenamiento conectado a la red (NAS) es un almacenamiento masivo conectado a una computadora a la que otra computadora puede acceder a nivel de archivo a través de una red de área local, una red privada de área amplia o, en el caso del almacenamiento de archivos en línea, a través de Internet. NAS se asocia comúnmente con los protocolos NFS y CIFS/SMB.
La red de área de almacenamiento (SAN) es una red especializada que proporciona capacidad de almacenamiento a otras computadoras. La diferencia crucial entre NAS y SAN es que NAS presenta y administra sistemas de archivos a las computadoras cliente, mientras que SAN brinda acceso a nivel de direccionamiento de bloques (sin procesar), dejando que los sistemas adjuntos administren datos o sistemas de archivos dentro de la capacidad provista. SAN se asocia comúnmente con redes de canal de fibra.

Almacenamiento robótico

Grandes cantidades de cintas magnéticas individuales y discos ópticos o magneto-ópticos pueden almacenarse en dispositivos robóticos de almacenamiento terciario. En el campo del almacenamiento en cinta, se les conoce como bibliotecas de cintas, y en el campo del almacenamiento óptico, jukeboxes ópticos o bibliotecas de discos ópticos por analogía. Las formas más pequeñas de cualquiera de las tecnologías que contienen solo un dispositivo de accionamiento se denominan cargadores automáticos o cambiadores automáticos.

Los dispositivos de almacenamiento de acceso robótico pueden tener una serie de ranuras, cada una de las cuales contiene medios individuales y, por lo general, uno o más robots de selección que atraviesan las ranuras y cargan los medios en las unidades integradas. La disposición de las ranuras y los dispositivos de recogida afecta al rendimiento. Las características importantes de dicho almacenamiento son las posibles opciones de expansión: agregar ranuras, módulos, unidades, robots. Las bibliotecas de cintas pueden tener de 10 a más de 100 000 ranuras y proporcionan terabytes o petabytes de información casi en línea. Las máquinas de discos ópticos son soluciones algo más pequeñas, hasta 1.000 ranuras.

El almacenamiento robótico se utiliza para copias de seguridad y para archivos de alta capacidad en las industrias de imágenes, medicina y video. La gestión de almacenamiento jerárquico es una estrategia de archivado más conocida de migrar automáticamente archivos sin usar durante mucho tiempo desde un almacenamiento rápido en disco duro a bibliotecas o jukeboxes. Si se necesitan los archivos, se recuperan en el disco.

Contenido relacionado

Más resultados...