Memoria ECC

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
ECC Los DIMM suelen tener nueve chips de memoria a cada lado, uno más que generalmente se encuentra en DIMMs no CEC (algunos módulos pueden tener 5 o 18).

La memoria con código de corrección de errores (memoria ECC) es un tipo de almacenamiento de datos informáticos que utiliza un código de corrección de errores (ECC) para detectar y corregir la corrupción de datos de n bits que se produce en la memoria.

Normalmente, la memoria ECC mantiene un sistema de memoria inmune a errores de un solo bit: los datos que se leen de cada palabra son siempre los mismos que los datos que se escribieron en ella, incluso si uno de los bits realmente almacenados se ha invertido al estado incorrecto. La mayoría de las memorias no ECC no pueden detectar errores, aunque algunas memorias no ECC con soporte de paridad permiten la detección pero no la corrección.

La memoria ECC se utiliza en la mayoría de las computadoras en las que no se puede tolerar la corrupción de datos, como aplicaciones de control industrial, bases de datos críticas y cachés de memoria de infraestructura.

Concepto

Los códigos de corrección de errores protegen contra la corrupción de datos no detectada y se utilizan en computadoras donde dicha corrupción es inaceptable, por ejemplo, en aplicaciones informáticas científicas y financieras, o en servidores de archivos y bases de datos. Los códigos de corrección de errores también pueden reducir la cantidad de fallas en aplicaciones de servidores multiusuario y sistemas de máxima disponibilidad.

Las interferencias eléctricas o magnéticas dentro de un sistema informático pueden hacer que un solo bit de la memoria de acceso aleatorio dinámico (DRAM) cambie espontáneamente al estado opuesto. Inicialmente se pensó que esto se debía principalmente a las partículas alfa emitidas por contaminantes en el material de encapsulado del chip, pero las investigaciones han demostrado que la mayoría de los errores leves puntuales en los chips DRAM se producen como resultado de la radiación de fondo, principalmente neutrones de rayos cósmicos secundarios, que pueden cambiar el contenido de una o más celdas de memoria o interferir con los circuitos utilizados para leer o escribir en ellas. Por lo tanto, las tasas de error aumentan rápidamente con el aumento de la altitud; por ejemplo, en comparación con el nivel del mar, la tasa de flujo de neutrones es 3,5 veces mayor a 1,5 km y 300 veces mayor a 10-12 km (la altitud de crucero de los aviones comerciales). Como resultado, los sistemas que funcionan a grandes altitudes requieren disposiciones especiales para la confiabilidad.

Por ejemplo, la sonda espacial Cassini-Huygens, lanzada en 1997, contenía dos registradores de vuelo idénticos, cada uno con 2,5 gigabits de memoria en forma de matrices de chips DRAM comerciales. Gracias a la funcionalidad EDAC incorporada, la telemetría de ingeniería de la sonda informaba del número de errores (corregibles) de un solo bit por palabra y de errores (incorregibles) de dos bits por palabra. Durante los primeros dos años y medio de vuelo, la sonda informaba de una tasa de errores de un solo bit casi constante de unos 280 errores al día. Sin embargo, el 6 de noviembre de 1997, durante el primer mes en el espacio, el número de errores aumentó en más de un factor de cuatro en ese único día. Esto se atribuyó a un evento de partículas solares que había sido detectado por el satélite GOES 9.

Había cierta preocupación de que, a medida que aumenta la densidad de la DRAM y, por lo tanto, los componentes de los chips se hacen más pequeños, mientras que los voltajes operativos siguen cayendo, los chips DRAM se verán afectados por dicha radiación con mayor frecuencia, ya que las partículas de menor energía podrán cambiar el estado de una celda de memoria. Por otro lado, las celdas más pequeñas son objetivos más pequeños y los cambios en tecnologías como SOI pueden hacer que las celdas individuales sean menos susceptibles y, por lo tanto, contrarrestar, o incluso revertir, esta tendencia. Estudios recientes muestran que las alteraciones de un solo evento debido a la radiación cósmica han estado disminuyendo drásticamente con la geometría del proceso y las preocupaciones anteriores sobre el aumento de las tasas de error de celda de bits son infundadas.

Research

Los trabajos publicados entre 2007 y 2009 mostraron tasas de error muy variables con una diferencia de más de 7 órdenes de magnitud, que van desde 10−10 error/bit·h (aproximadamente un error de bit por hora por gigabyte de memoria) hasta 10−17 error/bit·h (aproximadamente un error de bit por milenio por gigabyte de memoria). En la conferencia SIGMETRICS/Performance '09 se presentó un estudio a gran escala basado en la gran cantidad de servidores de Google. La tasa de error real encontrada fue varios órdenes de magnitud mayor que la de los estudios previos a pequeña escala o de laboratorio, con entre 25.000 (2,5 × 10−11 error/bit·h) y 70.000 (7,0 × 10−11 error/bit·h, o 1 error de bit por gigabyte de RAM por 1,8 horas) errores por cada mil millones de horas de dispositivo por megabit. Más del 8% de los módulos de memoria DIMM se vieron afectados por errores por año.

La consecuencia de un error de memoria depende del sistema. En sistemas sin ECC, un error puede provocar un bloqueo o la corrupción de datos; en sitios de producción a gran escala, los errores de memoria son una de las causas de hardware más comunes de bloqueos de máquinas. Los errores de memoria pueden causar vulnerabilidades de seguridad. Un error de memoria puede no tener consecuencias si cambia un bit que no causa un mal funcionamiento observable ni afecta los datos utilizados en los cálculos o guardados. Un estudio de simulación de 2010 mostró que, para un navegador web, solo una pequeña fracción de los errores de memoria causaban corrupción de datos, aunque, como muchos errores de memoria son intermitentes y correlacionados, los efectos de los errores de memoria fueron mayores de lo que se esperaría de errores de software independientes.

Algunas pruebas concluyen que el aislamiento de las celdas de memoria DRAM puede ser sorteado por efectos secundarios no deseados de accesos especialmente diseñados a celdas adyacentes. Por lo tanto, el acceso a los datos almacenados en DRAM hace que las celdas de memoria pierdan sus cargas e interactúen eléctricamente, como resultado de la alta densidad de celdas en la memoria moderna, alterando el contenido de las filas de memoria cercanas que en realidad no fueron abordadas en el acceso a la memoria original. Este efecto se conoce como row hammer, y también se ha utilizado en algunos ataques de seguridad informática de escalada de privilegios.

Un ejemplo de un error de un solo bit que sería ignorado por un sistema sin comprobación de errores, que detendría una máquina con comprobación de paridad o que sería corregido invisiblemente por ECC: un solo bit se queda atascado en 1 debido a un chip defectuoso o cambia a 1 debido a la radiación de fondo o cósmica; se carga una hoja de cálculo que almacena números en formato ASCII y el carácter "8" (valor decimal 56 en la codificación ASCII) se almacena en el byte que contiene el bit atascado en su posición de bit más baja; luego, se realiza un cambio en la hoja de cálculo y se guarda. Como resultado, el "8" (0011 1000 binario) se ha convertido silenciosamente en un "9" (0011 1001).

Soluciones

Se han desarrollado varios enfoques para lidiar con los cambios de bits no deseados, entre ellos, la programación que tiene en cuenta la inmunidad, la memoria de paridad RAM y la memoria ECC.

Este problema se puede mitigar utilizando módulos DRAM que incluyan bits de memoria adicionales y controladores de memoria que aprovechen estos bits. Estos bits adicionales se utilizan para registrar la paridad o para utilizar un código de corrección de errores (ECC). La paridad permite la detección de todos los errores de un solo bit (en realidad, cualquier número impar de bits erróneos). El código de corrección de errores más común, un código Hamming de corrección de un solo error y detección de doble error (SECDED), permite corregir un error de un solo bit y (en la configuración habitual, con un bit de paridad adicional) detectar errores de doble bit. Chipkill ECC es una versión más eficaz que también corrige errores de múltiples bits, incluida la pérdida de un chip de memoria completo.

Aplicación

En 1982 este tablero de memoria 512KB de Cromemco utilizó 22 bits de almacenamiento por palabra de 16 bits para permitir la corrección de error de un solo bit.

Seymour Cray dijo la famosa frase "la paridad es para los agricultores" cuando le preguntaron por qué no la incluyó en el CDC 6600. Más tarde, incluyó la paridad en el CDC 7600, lo que provocó que los expertos comentaran que "aparentemente muchos agricultores compran computadoras". La IBM PC original y todas las PC hasta principios de los años 90 usaban la verificación de paridad. Las posteriores, en su mayoría, no.

Un controlador de memoria con capacidad ECC puede detectar y corregir errores de un solo bit por palabra (la unidad de transferencia de bus) y detectar (pero no corregir) errores de dos bits por palabra. El BIOS de algunas computadoras, cuando se combina con sistemas operativos como algunas versiones de Linux, BSD y Windows (Windows 2000 y posteriores), permite contar los errores de memoria detectados y corregidos, en parte para ayudar a identificar módulos de memoria defectuosos antes de que el problema se vuelva catastrófico.

Algunos chips DRAM incluyen circuitos de corrección de errores "internos" en el chip, que permiten que los sistemas con controladores de memoria no ECC sigan obteniendo la mayoría de los beneficios de la memoria ECC. En algunos sistemas, se puede lograr un efecto similar utilizando módulos de memoria EOS.

La detección y corrección de errores depende de una expectativa sobre los tipos de errores que ocurren. Implícitamente, se supone que el fallo de cada bit en una palabra de memoria es independiente, lo que resulta en la improbabilidad de dos errores simultáneos. Esto solía ser así cuando los chips de memoria tenían un ancho de un bit, lo que era típico en la primera mitad de la década de 1980; desarrollos posteriores trasladaron muchos bits al mismo chip. Esta debilidad se soluciona con varias tecnologías, entre ellas Chipkill de IBM, Extended ECC de Sun Microsystems, Chipspare de Hewlett-Packard y Single Device Data Correction (SDDC) de Intel.

La memoria DRAM puede proporcionar una mayor protección contra errores leves al depender de códigos de corrección de errores. Este tipo de memoria de corrección de errores, conocida como memoria ECC o protegida por EDAC, es particularmente deseable para aplicaciones con alta tolerancia a fallos, como servidores, así como para aplicaciones de espacio profundo debido al aumento de la radiación. Algunos sistemas también "limpian" la memoria, leyendo periódicamente todas las direcciones y escribiendo versiones corregidas si es necesario para eliminar errores leves.

El entrelazado permite distribuir el efecto de un único rayo cósmico, lo que puede alterar varios bits físicamente vecinos en varias palabras al asociar bits vecinos a diferentes palabras. Siempre que una alteración de un único evento (SEU) no supere el umbral de error (por ejemplo, un único error) en cualquier palabra en particular entre accesos, se puede corregir (por ejemplo, mediante un código de corrección de errores de un único bit) y se puede mantener un sistema de memoria efectivamente libre de errores.

Los controladores de memoria con corrección de errores tradicionalmente utilizan códigos Hamming, aunque algunos utilizan redundancia modular triple (TMR). Esta última es la preferida porque su hardware es más rápido que el del esquema de corrección de errores Hamming. Los sistemas de satélites espaciales suelen utilizar TMR, aunque la RAM de los satélites suele utilizar la corrección de errores Hamming.

Muchas de las primeras implementaciones de memoria ECC enmascaran los errores corregibles, actuando "como si" el error nunca hubiera ocurrido y solo informan los errores no corregibles. Las implementaciones modernas registran tanto los errores corregibles (CE) como los errores no corregibles (UE). Algunas personas reemplazan de manera proactiva los módulos de memoria que presentan altas tasas de error, con el fin de reducir la probabilidad de eventos de error no corregibles.

Muchos sistemas de memoria ECC utilizan un circuito EDAC "externo" entre la CPU y la memoria. Algunos sistemas con memoria ECC utilizan sistemas EDAC internos y externos; el sistema EDAC externo debe estar diseñado para corregir ciertos errores que el sistema EDAC interno no puede corregir. Las CPU de escritorio y servidor modernas integran el circuito EDAC en la CPU, incluso antes del cambio hacia los controladores de memoria integrados en la CPU, que están relacionados con la arquitectura NUMA. La integración de la CPU permite un sistema EDAC sin penalizaciones durante el funcionamiento sin errores.

A partir de 2009, los códigos de corrección de errores más comunes utilizan códigos Hamming o Hsiao que proporcionan corrección de errores de un solo bit y detección de errores de doble bit (SEC-DED). Se han propuesto otros códigos de corrección de errores para proteger la memoria: códigos de corrección de errores de doble bit y detección de errores de triple bit (DEC-TED), códigos de corrección de errores de un solo nibble y detección de errores de doble nibble (SNC-DND), códigos de corrección de errores Reed-Solomon, etc. Sin embargo, en la práctica, la corrección de múltiples bits se implementa generalmente intercalando múltiples códigos SEC-DED.

Las primeras investigaciones intentaron minimizar el área y los costos de retardo de los circuitos ECC. Hamming fue el primero en demostrar que los códigos SEC-DED eran posibles con una matriz de verificación particular. Hsiao demostró que una matriz alternativa con columnas de peso impar proporciona capacidad SEC-DED con menos área de hardware y menor retardo que los códigos SEC-DED de Hamming tradicionales. Investigaciones más recientes también intentan minimizar la potencia además de minimizar el área y el retardo.

Cache

Muchas CPU utilizan códigos de corrección de errores en la memoria caché del chip, incluidos los procesadores Intel Itanium, Xeon, Core y Pentium (desde la microarquitectura P6), AMD Athlon, Opteron, todos los procesadores basados en Zen y Zen+ (EPYC, EPYC Embedded, Ryzen y Ryzen Threadripper) y el DEC Alpha 21264.

A partir de 2006, EDC/ECC y ECC/ECC son las dos técnicas de protección de errores de caché más comunes que se utilizan en los microprocesadores comerciales. La técnica EDC/ECC utiliza un código de detección de errores (EDC) en la caché de nivel 1. Si se detecta un error, los datos se recuperan de la caché de nivel 2 protegida por ECC. La técnica ECC/ECC utiliza una caché de nivel 1 protegida por ECC y una caché de nivel 2 protegida por ECC. Las CPU que utilizan la técnica EDC/ECC siempre escriben todos los STORES en la caché de nivel 2, de modo que cuando se detecta un error durante una lectura de la caché de datos de nivel 1, se puede recuperar una copia de esos datos de la caché de nivel 2.

Memoria registrada

1 64 GiB DDR5-4800 ECC 1.1 V RDIMM

La memoria registrada o con buffer no es lo mismo que la memoria ECC; las tecnologías realizan funciones diferentes. Es habitual que la memoria utilizada en servidores sea tanto registrada, para permitir que se utilicen muchos módulos de memoria sin problemas eléctricos, como ECC, para la integridad de los datos. La memoria utilizada en ordenadores de sobremesa no suele ser ni una ni otra, por motivos económicos. Sin embargo, hay memoria ECC sin buffer (no registrada) disponible, y algunas placas base que no son para servidores admiten la funcionalidad ECC de dichos módulos cuando se utilizan con una CPU que admite ECC. La memoria registrada no funciona de forma fiable en placas base sin circuitos de buffer, y viceversa.

Ventajas y desventajas

En última instancia, existe un equilibrio entre la protección contra pérdidas inusuales de datos y un mayor costo.

La memoria ECC suele tener un precio más elevado en comparación con la memoria no ECC, debido al hardware adicional necesario para producir módulos de memoria ECC y a los menores volúmenes de producción de memoria ECC y hardware de sistema asociado. Las placas base, los chipsets y los procesadores que admiten ECC también pueden ser más caros.

La compatibilidad con ECC varía entre los fabricantes de placas base, por lo que es posible que una placa base incompatible con ECC no reconozca la memoria ECC. La mayoría de las placas base y procesadores para aplicaciones menos críticas no están diseñados para admitir ECC. Algunas placas y procesadores habilitados para ECC pueden admitir ECC sin búfer (no registrado), pero también funcionan con memoria no ECC; el firmware del sistema habilita la funcionalidad ECC si se instala memoria ECC.

El ECC puede reducir el rendimiento de la memoria en un 2-3 por ciento en algunos sistemas, según la aplicación y la implementación, debido al tiempo adicional que necesitan los controladores de memoria ECC para realizar la comprobación de errores. Sin embargo, los sistemas modernos integran las pruebas ECC en la CPU, lo que no genera demoras adicionales en los accesos a la memoria siempre que no se detecten errores. Este no es el caso del ECC en banda, que almacena tablas utilizadas para la protección en una región reservada de la memoria principal del sistema, compatible con Intel para Chromebooks, que mostró poco impacto en la navegación web y las tareas de productividad, pero provocó una reducción de hasta un 25 % en los puntos de referencia de juegos y edición de video.

La memoria compatible con ECC puede contribuir a un consumo adicional de energía debido a los circuitos de corrección de errores.

Notas

  1. ^ a b La mayoría de la memoria ECC utiliza un código SECDED.
  2. ^ Mientras que la palabra de 72 bits con 64 bits de datos y 8 bits de comprobación son comunes, ECC también se utiliza con tamaños más pequeños y más grandes.

Referencias

  1. ^ Werner Fischer. "RAM Revealed". admin-magazine.com. Retrieved 20 de octubre, 2014.
  2. ^ Single Event Upset at Ground Level, Eugene Normand, Member, IEEE, Boeing Defense & Space Group, Seattle, WA 98124-2499
  3. ^ a b "A Survey of Techniques for Modeling and Improvement Reliability of Computing Systems", IEEE TPDS, 2015
  4. ^ Gary M. Swift y Steven M. Guertin. "Observaciones en vuelo de Múltiple-Bit Upset en DRAMs". Jet Propulsion Laboratory
  5. ^ a b Borucki, "Comparison of Accelerated DRAM Soft Error Rates Measured at Component and System Level", 46th Annual International Reliability Physics Symposium, Phoenix, 2008, pp. 482-487
  6. ^ a b c d Schroeder, Bianca; Pinheiro, Eduardo; Weber, Wolf-Dietrich (2009). DRAM Errores en la naturaleza: un estudio de campo de gran escala (PDF). ACM. ISBN 978-1-60558-511-6. {{cite book}}: |journal= ignorado (ayuda)
    • Robin Harris (4 de octubre de 2009). Tasas de error de RDA: Pesadilla en la calle DIMM. ZDNet.
  7. ^ "Una medición de errores de memoria suave en sistemas de producción". Archivado desde el original en 2017-02-14. Retrieved 2011-06-27.
  8. ^ Li, Huang; Shen, Chu (2010). "Una evaluación realista de errores de hardware de memoria y sostenibilidad del sistema de software". Usenix Annual Tech Conference 2010" (PDF).
  9. ^ Yoongu Kim; Ross Daly; Jeremie Kim; Chris Fallin; Ji Hye Lee; Donghyuk Lee; Chris Wilkerson; Konrad Lai; Onur Mutlu (2014-06-24). "Flipping Bits in Memory Without Accessing Them: An Experimental Study of DRAM Disturbance Errores" (PDF). ece.cmu.edu. IEEE. Retrieved 2015-03-10.
  10. ^ Dan Goodin (2015-03-10). "Cutting-edge hack da súper estado de usuario explotando debilidad DRAM". Ars Technica. Retrieved 2015-03-10.
  11. ^ "CDC 6600". Microsoft Research. Retrieved 2011-11-23.
  12. ^ "Parity Checking". Pcguide.com. 2001-04-17. Retrieved 2011-11-23.
  13. ^ DOMARS. "!mca". docs.microsoft.com. Retrieved 2021-03-27.
  14. ^ a b A. H. Johnston. "Efectos de radiación espacial en memorias flash avanzadas" Archivado 2016-03-04 en la máquina Wayback. NASA Electronic Parts and Packaging Program (NEPP). 2001.
  15. ^ "ECC DRAM". smartmemory.com. Archivado desde el original en 2019-02-12. Retrieved 2021-06-12.
  16. ^ a b "Usando StrongArm SA-1110 en el Computador On-Board de Nanosatellite". Tsinghua Space Center, Tsinghua University, Beijing. Archivado desde el original en 2011-10-02. Retrieved 2009-02-16.
  17. ^ "Los ingenieros de Actel utilizan la redundancia de triple modulo en el nuevo FPGA duro de rad". Military & Aerospace Electronics. Archivado desde el original el 2012-07-14. Retrieved 2009-02-16.
  18. ^ "SEU Hardening of Field Programmable Gate Arrays (FPGAs) For Space Applications and Device Characterization". Klabs.org. 2010-02-03. Archivado desde el original el 2011-11-25. Retrieved 2011-11-23.
  19. ^ "FPGAs in Space". Techfocusmedia.net. Retrieved 2011-11-23.
  20. ^ Microelectrónica comercial Tecnologías para aplicaciones en el entorno de radiación satélite". Radhome.gsfc.nasa.gov. Archivado desde el original el 19 de diciembre de 2009. Retrieved 2011-11-23.
  21. ^ Doug Thompson, Mauro Carvalho Chehab. "EDAC - Detección de errores y corrección" Archivado 2009-09-05 en la máquina Wayback. 2005 - 2009. "El objetivo del módulo 'edac' es detectar e informar errores que ocurren dentro del sistema informático que funciona bajo linux."
  22. ^ a b "AMD-762TM System Controller Software/BIOS Design Guide, p. 179" (PDF).
  23. ^ a b Doe Hyun Yoon; Mattan Erez. "Memory Mapped ECC: Low-Cost Error Protection for Last Level Caches". 2009. p. 3
  24. ^ Daniele Rossi; Nicola Timoncini; Michael Spica; Cecilia Metra. "Error Correcting Code Analysis for Cache Memory High Reliability and Performance" Archived 2015-02-03 en la Wayback Machine.
  25. ^ Shalini Ghosh; Sugato Basu; y Nur A. Touba. "Seleccionar códigos de corrección de errores para minimizar los circuitos de control de memoria" Archivado 2015-02-03 en la máquina Wayback. p. 2 y p. 4.
  26. ^ Chris Wilkerson; Alaa R. Alameldeen; Zeshan Chishti; Wei Wu; Dinesh Somasekhar; Shih-lien Lu. "Reducir el poder de caché con códigos de error de errores de bajo costo y multi-bit". doi:10.1145/1816038.1815973.
  27. ^ M. Y. Hsiao. "A Class of Optimal Minimum Odd-weight-column SEC-DED Codes". 1970.
  28. ^ Intel Corporation. "Intel Xeon Processor E7 Family: Reliability, Availability, and Serviceability". 2011. p. 12.
  29. ^ "Bios y Cache". www.custom-build-computers.com. Retrieved 2021-03-27.
  30. ^ "MD Zen microarquitectura — Memory Hierarchy". WikiChip. Retrieved 15 de octubre 2018.
  31. ^ "AMD Zen+ microarquitectura — Hierarquía de memoria". WikiChip. Retrieved 15 de octubre 2018.
  32. ^ Jangwoo Kim; Nikos Hardavellas; Ken Mai; Babak Falsafi; James C. Hoe. "Multi-bit Tornillos Tolerant utilizando la codificación de errores de dos dimensiones". 2007. p. 2.
  33. ^ Nathan N. Sadler y Daniel J. Sorin. "Eligiendo un esquema de protección de errores para la búsqueda de datos L1 de un microprocesador". 2006. p. 1.
  34. ^ "Typical unbuffered ECC RAM module: Crucial CT25672BA1067".
  35. ^ Especificación de placa base de escritorio que soporta tanto la memoria RAM no amortiguada ECC como no CEC con CPU compatibles
  36. ^ "Discussion of ECC on pcguide". Pcguide.com. 2001-04-17. Retrieved 2011-11-23.
  37. ^ Benchmark de la plataforma AMD-762/Athlon con y sin ECC Archivado 2013-06-15 en la máquina Wayback
  38. ^ "ECCploit: ECC Memory Vulnerable to Rowhammer Attacks After All". Grupo de Seguridad de Sistemas y Redes en VU Amsterdam. 12 noviembre 2018. Retrieved 2018-11-22.
  39. ^ USA abandonó 20190332469A1, Amir A. RADJAI, Nagi Aboulenein, Steve L. GEIGER, Satyajit A. JADHAV, Bezan J. KAPADIA, Vivek Kozhikkottu, Rashmi LAKKUR SUBRAMANYAM, Srithar Rames, James M. Shehadi, Jason D. VAN DYKEN, "Dirección de acceso basado en memoria de banda módulo de protección de código corregido con amortiguación de síndrome", publicado 2019-10-31, asignado a Intel
  40. ^ US patent 11768731B2, Hartlieb, Heimo & Heiling, Christian, "System and method for transparent register data error detection and correction via a communication bus", publicado 2020-11-05, assigned to Infineon Technologies
  41. ^ Ganesh T S (2023-01-29). "ASRock Industrial NUCS BOX-1360P/D4 Review: Raptor Lake-P Impresses, plus Surprise ECC". pp. 2-6. Retrieved 2024-01-29.
  • SoftECC: Un sistema para el control de la integridad de la memoria del software
  • Una biblioteca de detección y corrección de errores DRAM compatible con software para HPC
  • Detección y corrección de la corrupción de datos silenciosos para la computación de alto rendimiento de gran escala
  • Errores de un solo golpe: Una perspectiva del proveedor del módulo de memoria sobre causa, impacto y detección
  • Intel Xeon Processor E3 - 1200 Product Family Memory Configuration Guide
  • Linus Torvalds On The Importance of ECC RAM, Calls Out Intel's "Bad Policies" Over ECC
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save