Armazenamento de dados do computador
Armazenamento de dados de computador é uma tecnologia que consiste em componentes de computador e mídia de gravação usados para reter dados digitais. É uma função central e um componente fundamental dos computadores.
A unidade central de processamento (CPU) de um computador é o que manipula os dados realizando cálculos. Na prática, quase todos os computadores usam uma hierarquia de armazenamento, que coloca opções de armazenamento rápidas, mas caras e pequenas, perto da CPU e opções mais lentas, mas menos caras e maiores, mais distantes. Geralmente, as tecnologias rápidas são chamadas de "memória", enquanto as tecnologias persistentes mais lentas são chamadas de "armazenamento".
Mesmo os primeiros projetos de computador, a Máquina Analítica de Charles Babbage e a Máquina Analítica de Percy Ludgate, distinguiam claramente entre processamento e memória (Babbage armazenava números como rotações de engrenagens, enquanto Ludgate armazenava números como deslocamentos de hastes em ônibus). Essa distinção foi estendida na arquitetura de Von Neumann, onde a CPU consiste em duas partes principais: a unidade de controle e a unidade lógica aritmética (ULA). O primeiro controla o fluxo de dados entre a CPU e a memória, enquanto o último realiza operações aritméticas e lógicas nos dados.
Funcionalidade
Sem uma quantidade significativa de memória, um computador seria apenas capaz de executar operações fixas e produzir imediatamente o resultado. Teria que ser reconfigurado para mudar seu comportamento. Isso é aceitável para dispositivos como calculadoras de mesa, processadores de sinais digitais e outros dispositivos especializados. As máquinas de Von Neumann diferem por terem uma memória na qual armazenam suas instruções de operação e dados. Esses computadores são mais versáteis porque não precisam ter seu hardware reconfigurado para cada novo programa, mas podem simplesmente ser reprogramados com novas instruções na memória; eles também tendem a ser mais simples de projetar, pois um processador relativamente simples pode manter o estado entre computações sucessivas para construir resultados processuais complexos. A maioria dos computadores modernos são máquinas von Neumann.
Organização e representação de dados
Um computador digital moderno representa dados usando o sistema numérico binário. Texto, números, imagens, áudio e quase qualquer outra forma de informação podem ser convertidos em uma sequência de bits ou dígitos binários, cada um com um valor de 0 ou 1. A unidade de armazenamento mais comum é o byte, igual para 8 bits. Uma informação pode ser manipulada por qualquer computador ou dispositivo cujo espaço de armazenamento seja grande o suficiente para acomodar a representação binária da informação, ou simplesmente dados. Por exemplo, as obras completas de Shakespeare, com cerca de 1.250 páginas impressas, podem ser armazenadas em cerca de cinco megabytes (40 milhões de bits) com um byte por caractere.
Os dados são codificados pela atribuição de um padrão de bits a cada caractere, dígito ou objeto multimídia. Existem muitos padrões para codificação (por exemplo, codificações de caracteres como ASCII, codificações de imagem como JPEG e codificações de vídeo como MPEG-4).
Ao adicionar bits a cada unidade codificada, a redundância permite que o computador detecte erros nos dados codificados e os corrija com base em algoritmos matemáticos. Os erros geralmente ocorrem em baixas probabilidades devido à inversão aleatória do valor do bit ou "fadiga física do bit", perda do bit físico no armazenamento de sua capacidade de manter um valor distinguível (0 ou 1) ou devido a erros na comunicação inter ou intra-computador. Uma inversão de bit aleatória (por exemplo, devido à radiação aleatória) é tipicamente corrigida após a detecção. Um bit ou um grupo de bits físicos com defeito (o bit defeituoso específico nem sempre é conhecido; a definição do grupo depende do dispositivo de armazenamento específico) é normalmente isolado automaticamente, retirado de uso pelo dispositivo e substituído por outro grupo equivalente em funcionamento no o dispositivo, onde os valores de bit corrigidos são restaurados (se possível). O método de verificação de redundância cíclica (CRC) é normalmente usado em comunicações e armazenamento para detecção de erros. Um erro detectado é então repetido.
Os métodos de compactação de dados permitem, em muitos casos (como um banco de dados), representar uma sequência de bits por uma sequência de bits mais curta ("comprimir") e reconstruir a sequência original ("descompactar") quando necessário. Isso utiliza substancialmente menos armazenamento (dezenas de porcentagens) para muitos tipos de dados ao custo de mais computação (compacte e descompacte quando necessário). A análise da compensação entre economia de custo de armazenamento e custos de cálculos relacionados e possíveis atrasos na disponibilidade de dados é feita antes de decidir se deve manter certos dados compactados ou não.
Por motivos de segurança, certos tipos de dados (por exemplo, informações de cartão de crédito) podem ser mantidos criptografados no armazenamento para evitar a possibilidade de reconstrução não autorizada de informações de blocos de instantâneos de armazenamento.
Hierarquia de armazenamento
Geralmente, quanto mais baixo um armazenamento estiver na hierarquia, menor será sua largura de banda e maior será sua latência de acesso da CPU. Essa divisão tradicional de armazenamento em armazenamento primário, secundário, terciário e off-line também é guiada pelo custo por bit.
No uso contemporâneo, memória é geralmente memória de acesso aleatório de leitura/gravação de armazenamento semicondutor, normalmente DRAM (RAM dinâmica) ou outras formas de armazenamento rápido, mas temporário. Armazenamento consiste em dispositivos de armazenamento e suas mídias não acessíveis diretamente pela CPU (armazenamento secundário ou terciário), normalmente unidades de disco rígido, unidades de disco óptico e outros dispositivos mais lentos que a RAM, mas não voláteis (retendo conteúdo quando desligado).
Historicamente, a memória tem, dependendo da tecnologia, sido chamada de memória central, memória central, armazenamento central, tambor, memória principal, armazenamento real ou memória interna. Enquanto isso, dispositivos de armazenamento persistentes mais lentos são chamados de armazenamento secundário, memória externa ou armazenamento auxiliar/periférico.
Armazenamento primário
Armazenamento primário (também conhecido como memória principal, memória interna ou memória principal), frequentemente referido simplesmente como memória, é a única diretamente acessível à CPU. A CPU lê continuamente as instruções armazenadas lá e as executa conforme necessário. Quaisquer dados operados ativamente também são armazenados lá de maneira uniforme.
Historicamente, os primeiros computadores usavam linhas de atraso, tubos de Williams ou tambores magnéticos rotativos como armazenamento primário. Em 1954, esses métodos não confiáveis foram substituídos principalmente por memória de núcleo magnético. A memória de núcleo permaneceu dominante até a década de 1970, quando os avanços na tecnologia de circuitos integrados permitiram que a memória de semicondutores se tornasse economicamente competitiva.
Isso levou à moderna memória de acesso aleatório (RAM). É pequeno, leve, mas bastante caro ao mesmo tempo. Os tipos específicos de RAM usados para armazenamento primário são voláteis, o que significa que eles perdem as informações quando não estão ligados. Além de armazenar programas abertos, ele serve como cache de disco e buffer de gravação para melhorar o desempenho de leitura e gravação. Os sistemas operacionais emprestam capacidade de RAM para armazenamento em cache, desde que não sejam necessários para o software em execução. A memória sobressalente pode ser utilizada como unidade RAM para armazenamento temporário de dados em alta velocidade.
Conforme mostrado no diagrama, tradicionalmente existem mais duas subcamadas do armazenamento primário, além da RAM principal de grande capacidade:
- Os registros do processador estão localizados dentro do processador. Cada registro normalmente contém uma palavra de dados (muitas vezes 32 ou 64 bits). Instruções da CPU instruem a unidade lógica aritmética para executar vários cálculos ou outras operações sobre esses dados (ou com a ajuda dele). Os registros são o mais rápido de todas as formas de armazenamento de dados de computador.
- O cache do processador é um estágio intermediário entre registros ultra-rápidos e memória principal muito mais lenta. Foi introduzido apenas para melhorar o desempenho dos computadores. A informação mais usada ativamente na memória principal é apenas duplicada na memória de cache, o que é mais rápido, mas de muito menor capacidade. Por outro lado, a memória principal é muito mais lenta, mas tem uma capacidade de armazenamento muito maior do que os registros do processador. A configuração de cache hierárquica de vários níveis também é comumente usada—cache primário sendo menor, mais rápido e localizado dentro do processador; cache secundário ser um pouco maior e mais lento.
A memória principal está direta ou indiretamente conectada à unidade de processamento central através de um barramento de memória. Na verdade, são dois barramentos (não no diagrama): um barramento de endereços e um barramento de dados. A CPU primeiro envia um número através de um barramento de endereço, um número chamado endereço de memória, que indica a localização desejada dos dados. Em seguida, ele lê ou grava os dados nas células de memória usando o barramento de dados. Além disso, uma unidade de gerenciamento de memória (MMU) é um pequeno dispositivo entre a CPU e a RAM que recalcula o endereço de memória real, por exemplo, para fornecer uma abstração da memória virtual ou outras tarefas.
Como os tipos de RAM usados para armazenamento primário são voláteis (não inicializados na inicialização), um computador contendo apenas esse armazenamento não teria uma fonte para ler as instruções, a fim de iniciar o computador. Portanto, o armazenamento primário não volátil contendo um pequeno programa de inicialização (BIOS) é usado para inicializar o computador, ou seja, para ler um programa maior do armazenamento secundário não volátil para a RAM e começar a executá-lo. Uma tecnologia não volátil usada para esse fim é chamada ROM, para memória somente leitura (a terminologia pode ser um pouco confusa, pois a maioria dos tipos de ROM também são capazes de acesso aleatório).
Muitos tipos de "ROM" não são literalmente somente leitura, pois é possível atualizá-los; no entanto, é lento e a memória deve ser apagada em grandes porções antes de poder ser reescrita. Alguns sistemas embarcados executam programas diretamente da ROM (ou similar), porque tais programas raramente são alterados. Os computadores padrão não armazenam programas não rudimentares em ROM e, em vez disso, usam grandes capacidades de armazenamento secundário, que também não é volátil e não é tão caro.
Recentemente, armazenamento primário e armazenamento secundário em alguns usos referem-se ao que foi historicamente chamado, respectivamente, de armazenamento secundário e terciário armazenamento.
Armazenamento secundário
Armazenamento secundário (também conhecido como memória externa ou armazenamento auxiliar) difere do armazenamento primário porque não é acessível diretamente pela CPU. O computador geralmente usa seus canais de entrada/saída para acessar o armazenamento secundário e transferir os dados desejados para o armazenamento primário. O armazenamento secundário não é volátil (retém os dados quando a energia é desligada). Os sistemas de computador modernos normalmente têm duas ordens de grandeza a mais de armazenamento secundário do que o armazenamento primário porque o armazenamento secundário é mais barato.
Nos computadores modernos, unidades de disco rígido (HDDs) ou unidades de estado sólido (SSDs) geralmente são usadas como armazenamento secundário. O tempo de acesso por byte para HDDs ou SSDs geralmente é medido em milissegundos (milésimos de segundo), enquanto o tempo de acesso por byte para armazenamento primário é medido em nanossegundos (bilionésimos de segundo). Assim, o armazenamento secundário é significativamente mais lento do que o armazenamento primário. Dispositivos de armazenamento ótico rotativo, como unidades de CD e DVD, têm tempos de acesso ainda mais longos. Outros exemplos de tecnologias de armazenamento secundário incluem unidades flash USB, disquetes, fita magnética, fita de papel, cartões perfurados e discos RAM.
Depois que o cabeçote de leitura/gravação do disco nos HDDs atinge o posicionamento adequado e os dados, os dados subsequentes na trilha são acessados muito rapidamente. Para reduzir o tempo de busca e a latência rotacional, os dados são transferidos de e para discos em grandes blocos contíguos. O acesso sequencial ou de bloco em discos é muito mais rápido do que o acesso aleatório, e muitos paradigmas sofisticados foram desenvolvidos para projetar algoritmos eficientes baseados em acesso sequencial e de bloco. Outra maneira de reduzir o gargalo de E/S é usar vários discos em paralelo para aumentar a largura de banda entre a memória principal e a secundária.
O armazenamento secundário geralmente é formatado de acordo com um formato de sistema de arquivos, que fornece a abstração necessária para organizar os dados em arquivos e diretórios, além de fornecer metadados que descrevem o proprietário de um determinado arquivo, o horário de acesso, as permissões de acesso e outros Informação.
A maioria dos sistemas operacionais de computador usa o conceito de memória virtual, permitindo a utilização de mais capacidade de armazenamento primário do que a fisicamente disponível no sistema. À medida que a memória principal é preenchida, o sistema move os blocos menos usados (páginas) para um arquivo de troca ou arquivo de paginação no armazenamento secundário, recuperando-os mais tarde, quando necessário. Se muitas páginas forem movidas para um armazenamento secundário mais lento, o desempenho do sistema será prejudicado.
Armazenamento terciário
Armazenamento terciário ou memória terciária é um nível abaixo do armazenamento secundário. Normalmente, envolve um mecanismo robótico que irá montar (inserir) e desmontar mídia removível de armazenamento em massa em um dispositivo de armazenamento de acordo com as demandas do sistema; esses dados geralmente são copiados para armazenamento secundário antes do uso. Ele é usado principalmente para arquivar informações raramente acessadas, pois é muito mais lento que o armazenamento secundário (por exemplo, 5 a 60 segundos versus 1 a 10 milissegundos). Isso é útil principalmente para armazenamentos de dados extraordinariamente grandes, acessados sem operadores humanos. Exemplos típicos incluem bibliotecas de fitas e jukeboxes óticas.
Quando um computador precisa ler informações do armazenamento terciário, primeiro ele consulta um banco de dados de catálogo para determinar qual fita ou disco contém as informações. Em seguida, o computador instruirá um braço robótico a buscar a mídia e colocá-la em uma unidade. Quando o computador terminar de ler as informações, o braço robótico retornará a mídia ao seu lugar na biblioteca.
O armazenamento terciário também é conhecido como armazenamento nearline porque é "próximo ao online". A distinção formal entre armazenamento online, nearline e offline é:
- O armazenamento online está imediatamente disponível para I/O.
- O armazenamento próximo não está imediatamente disponível, mas pode ser feito on-line rapidamente sem intervenção humana.
- O armazenamento offline não está imediatamente disponível e requer alguma intervenção humana para se tornar online.
Por exemplo, unidades de disco rígido giratórias sempre ativas são armazenamento on-line, enquanto unidades giratórias que diminuem a rotação automaticamente, como matrizes massivas de discos ociosos (MAID), são armazenamento nearline. Mídia removível, como cartuchos de fita que podem ser carregados automaticamente, como em bibliotecas de fita, são armazenamento nearline, enquanto cartuchos de fita que devem ser carregados manualmente são armazenamento off-line.
Armazenamento off-line
Armazenamento off-line é um armazenamento de dados de computador em uma mídia ou dispositivo que não está sob o controle de uma unidade de processamento. A mídia é gravada, geralmente em um dispositivo de armazenamento secundário ou terciário, e então fisicamente removida ou desconectada. Ele deve ser inserido ou conectado por um operador humano antes que um computador possa acessá-lo novamente. Ao contrário do armazenamento terciário, ele não pode ser acessado sem interação humana.
O armazenamento off-line é usado para transferir informações, pois a mídia separada pode ser facilmente transportada fisicamente. Além disso, é útil para casos de desastres, onde, por exemplo, um incêndio destrói os dados originais, um meio em um local remoto não é afetado, permitindo a recuperação de desastres. O armazenamento off-line aumenta a segurança geral das informações, pois é fisicamente inacessível a partir de um computador e a confidencialidade ou integridade dos dados não pode ser afetada por técnicas de ataque baseadas em computador. Além disso, se as informações armazenadas para fins de arquivamento raramente forem acessadas, o armazenamento off-line é mais barato do que o armazenamento terciário.
Em computadores pessoais modernos, a maioria das mídias de armazenamento secundário e terciário também são usadas para armazenamento off-line. Os discos ópticos e os dispositivos de memória flash são os mais populares e, em menor grau, os discos rígidos removíveis. Em usos corporativos, a fita magnética é predominante. Exemplos mais antigos são disquetes, discos Zip ou cartões perfurados.
Características de armazenamento
As tecnologias de armazenamento em todos os níveis da hierarquia de armazenamento podem ser diferenciadas pela avaliação de certas características principais, bem como pela medição de características específicas de uma implementação específica. Essas características principais são volatilidade, mutabilidade, acessibilidade e endereçamento. Para qualquer implementação específica de qualquer tecnologia de armazenamento, as características que valem a pena medir são capacidade e desempenho.
| Característica | Disco rígido | Disco óptico | Memória flash | Memória de acesso aleatório | Fita linear aberta |
|---|---|---|---|---|---|
| Tecnologia | Disco magnético | feixe de laser | Semicondutor | Fita magnética | |
| Volatilidade | Não. | Não. | Não. | Volátil | Não. |
| Acesso aleatório | Sim. | Sim. | Sim. | Sim. | Não. |
| Latência (tempo de acesso) | ~ 15 ms (swift) | ~ 150 ms (moderado) | Nenhum (instante) | Nenhum (instante) | Falta de acesso aleatório (muito lento) |
| Controlador | Intervenções | Execução | Intervenções | Intervenções | Execução |
| Falha com perda de dados iminente | Acidente de cabeça | — | Circuito | — | |
| Detecção de erros | Diagnóstico (S.M.A.R.T.) | Medição da taxa de erro | Indicado por taxas de transferência de downspiking | (armazenamento a curto prazo) | Desconhecido |
| Preço por espaço | Baixa | Baixa | Alto. | Muito alto. | Muito baixo (mas unidades caras) |
| Preço por unidade | Moderado | Baixa | Moderado | Alto. | Moderado (mas unidades caras) |
| Aplicação principal | Archival de médio prazo, backups de rotina, servidor, expansão de armazenamento de estação de trabalho | Archival de longo prazo, distribuição de cópia dura | Eletrônica portátil; sistema operacional | Em tempo real | Arquivo de longo prazo |
Volatilidade
A memória não volátil retém as informações armazenadas mesmo que não seja constantemente alimentada com energia elétrica. É adequado para armazenamento de informações a longo prazo. A memória volátil requer energia constante para manter as informações armazenadas. As tecnologias de memória mais rápidas são voláteis, embora essa não seja uma regra universal. Como o armazenamento primário deve ser muito rápido, ele usa predominantemente memória volátil.
A memória dinâmica de acesso aleatório é uma forma de memória volátil que também exige que as informações armazenadas sejam relidas e reescritas periodicamente, ou atualizadas, caso contrário, elas desapareceriam. A memória estática de acesso aleatório é uma forma de memória volátil semelhante à DRAM, com a exceção de que nunca precisa ser atualizada enquanto a energia for aplicada; ele perde seu conteúdo quando a fonte de alimentação é perdida.
Uma fonte de alimentação ininterrupta (UPS) pode ser usada para dar a um computador uma breve janela de tempo para mover as informações do armazenamento volátil primário para o armazenamento não volátil antes que as baterias se esgotem. Alguns sistemas, como o EMC Symmetrix, possuem baterias integradas que mantêm o armazenamento volátil por vários minutos.
Mutabilidade
- Armazenamento de leitura/gravação ou armazenamento mutável
- Permite que as informações sejam substituídas a qualquer momento. Um computador sem alguma quantidade de armazenamento de leitura / gravação para fins de armazenamento primário seria inútil para muitas tarefas. Computadores modernos normalmente usam armazenamento de leitura / gravação também para armazenamento secundário.
- Slow write, armazenamento de leitura rápida
- Leia/escrever armazenamento que permite que as informações sejam substituídas várias vezes, mas com a operação de gravação sendo muito mais lenta do que a operação de leitura. Exemplos incluem CD-RW e SSD.
- Escreva uma vez o armazenamento
- Escrever uma vez lido muitos (WORM) permite que as informações sejam escritas apenas uma vez em algum ponto após a fabricação. Exemplos incluem semicondutor programável memória somente leitura e CD-R.
- Leia apenas armazenamento
- Retém as informações armazenadas no momento da fabricação. Exemplos incluem máscara ROM ICs e CD-ROM.
Acessibilidade
- Acesso aleatório
- Qualquer local no armazenamento pode ser acessado a qualquer momento em aproximadamente a mesma quantidade de tempo. Essa característica é bem adequada para armazenamento primário e secundário. A maioria das memórias de semicondutores, memórias flash e discos rígidos fornecem acesso aleatório, embora ambas as memórias de semicondutor e flash tenham latência mínima quando comparadas com unidades de disco rígido, como nenhuma peça mecânica precisa ser movida.
- Acesso sequencial
- O acesso de peças de informação será em uma ordem serial, uma após a outra; portanto, o tempo para acessar um determinado pedaço de informação depende de qual pedaço de informação foi acessado pela última vez. Essa característica é típica de armazenamento off-line.
Endereçamento
- Location-addressable
- Cada unidade de informação acessível individualmente no armazenamento é selecionada com seu endereço de memória numérica. Em computadores modernos, o armazenamento de endereços de localização geralmente limita ao armazenamento primário, acessado internamente por programas de computador, já que a acessibilidade de localização é muito eficiente, mas onerosa para os seres humanos.
- Endereço de arquivo
- A informação é dividida arquivos de comprimento variável, e um arquivo particular é selecionado com nomes de diretório e arquivos legíveis pelo homem. O dispositivo subjacente ainda é localizável, mas o sistema operacional de um computador fornece a abstração do sistema de arquivos para tornar a operação mais compreensível. Em computadores modernos, sistemas de arquivos de uso de armazenamento secundário, terciário e off-line.
- Endereço de conteúdo
- Cada unidade de informação acessível individualmente é selecionada com base em (parte) os conteúdos armazenados lá. O armazenamento de conteúdo pode ser implementado usando software (programa de computador) ou hardware (dispositivo de computador), sendo o hardware mais rápido, mas mais caro opção. A memória endereçável de conteúdo de hardware é frequentemente usada em cache de CPU de um computador.
Capacidade
- Capacidade bruta
- A quantidade total de informações armazenadas que um dispositivo de armazenamento ou meio pode segurar. Ele é expresso como uma quantidade de bits ou bytes (por exemplo, 10,4 megabytes).
- Densidade de armazenamento de memória
- A compactação das informações armazenadas. É a capacidade de armazenamento de um meio dividido com uma unidade de comprimento, área ou volume (por exemplo, 1,2 megabytes por polegada quadrada).
Desempenho
- Latência
- O tempo necessário para acessar um local específico no armazenamento. A unidade de medição relevante é tipicamente nanossegunda para armazenamento primário, milissegundo para armazenamento secundário e segundo para armazenamento terciário. Pode fazer sentido separar a latência de leitura e escrever latência (especialmente para memória não volátil) e em caso de armazenamento de acesso sequencial, latência mínima, máxima e média.
- Através de
- A taxa em que as informações podem ser lidas de ou escritas para o armazenamento. No armazenamento de dados do computador, a taxa de transferência é geralmente expressa em termos de megabytes por segundo (MB/s), embora a taxa de bits também possa ser usada. Tal como acontece com a latência, a taxa de leitura e a taxa de escrita podem precisar ser diferenciadas. Também acessando mídia sequencialmente, ao contrário de aleatoriamente, normalmente produz o rendimento máximo.
- Granularidade
- O tamanho do maior "chunk" de dados que pode ser acessado de forma eficiente como uma única unidade, por exemplo, sem introduzir latência adicional.
- Confiabilidade
- A probabilidade de mudança espontânea de valor de bits em várias condições, ou taxa de falha geral.
Utilitários como hdparm e sar podem ser usados para medir o desempenho de E/S no Linux.
Uso de energia
- Dispositivos de armazenamento que reduzem o uso do ventilador automaticamente desligadas durante a inatividade e discos rígidos de baixa potência podem reduzir o consumo de energia em 90 por cento.
- Disco rígido de 2,5 polegadas muitas vezes consomem menos energia do que os maiores. As unidades de estado sólido de baixa capacidade não têm peças móveis e consomem menos energia do que discos rígidos. Além disso, a memória pode usar mais energia do que discos rígidos. Grandes caches, que são usados para evitar bater na parede de memória, também podem consumir uma grande quantidade de energia.
Segurança
Criptografia de disco total, criptografia de volume e disco virtual e/ou criptografia de arquivo/pasta está prontamente disponível para a maioria dos dispositivos de armazenamento.
A criptografia de memória de hardware está disponível na arquitetura Intel, suportando criptografia de memória total (TME) e criptografia de memória granular de página com várias chaves (MKTME). e na geração SPARC M7 desde outubro de 2015.
Vulnerabilidade e confiabilidade
Tipos distintos de armazenamento de dados têm diferentes pontos de falha e vários métodos de análise preditiva de falhas.
Vulnerabilidades que podem levar instantaneamente à perda total são travamentos em discos rígidos mecânicos e falha de componentes eletrônicos em armazenamento flash.
Detecção de erros
Falha iminente em unidades de disco rígido pode ser estimada usando S.M.A.R.T. dados de diagnóstico que incluem as horas de operação e a contagem de spin-ups, embora sua confiabilidade seja contestada.
O armazenamento flash pode sofrer taxas de transferência descendentes como resultado de erros acumulados, que o controlador de memória flash tenta corrigir.
A integridade da mídia óptica pode ser determinada pela medição de pequenos erros corrigíveis, cujas contagens altas significam mídia deteriorada e/ou de baixa qualidade. Muitos erros secundários consecutivos podem levar à corrupção de dados. Nem todos os fornecedores e modelos de unidades ópticas oferecem suporte à verificação de erros.
Mídia de armazenamento
A partir de 2011, as mídias de armazenamento de dados mais comumente usadas são semicondutoras, magnéticas e ópticas, enquanto o papel ainda tem um uso limitado. Algumas outras tecnologias de armazenamento fundamentais, como matrizes totalmente em flash (AFAs), são propostas para desenvolvimento.
Semicondutor
A memória semicondutora usa chips de circuito integrado (IC) baseados em semicondutores para armazenar informações. Os dados são normalmente armazenados em células de memória de metal-óxido-semicondutor (MOS). Um chip de memória semicondutor pode conter milhões de células de memória, consistindo em minúsculos transistores de efeito de campo MOS (MOSFETs) e/ou capacitores MOS. Existem formas voláteis e não voláteis de memória semicondutora, a primeira usando MOSFETs padrão e a última usando MOSFETs de porta flutuante.
Nos computadores modernos, o armazenamento primário consiste quase exclusivamente em memória dinâmica de acesso aleatório semicondutor volátil (RAM), particularmente memória dinâmica de acesso aleatório (DRAM). Desde a virada do século, um tipo de memória semicondutora de porta flutuante não volátil, conhecida como memória flash, vem ganhando espaço como armazenamento off-line para computadores domésticos. A memória semicondutora não volátil também é usada para armazenamento secundário em vários dispositivos eletrônicos avançados e computadores especializados projetados para eles.
Já em 2006, os fabricantes de notebooks e desktops começaram a usar unidades de estado sólido (SSDs) baseadas em flash como opções de configuração padrão para o armazenamento secundário, além ou em vez do HDD mais tradicional.
Magnético
O armazenamento magnético usa diferentes padrões de magnetização em uma superfície revestida magneticamente para armazenar informações. O armazenamento magnético é não volátil. A informação é acessada usando uma ou mais cabeças de leitura/gravação que podem conter um ou mais transdutores de gravação. Um cabeçote de leitura/gravação cobre apenas uma parte da superfície, de modo que o cabeçote ou a mídia ou ambos devem ser movidos em relação a outro para acessar os dados. Nos computadores modernos, o armazenamento magnético terá as seguintes formas:
- Disco magnético;
- Disco flexível, usado para armazenamento off-line;
- Disco rígido, usado para armazenamento secundário.
- Fita magnética, usada para armazenamento terciário e off-line;
- Memória de carrossel (rolos magnéticos).
Nos primeiros computadores, o armazenamento magnético também era usado como:
- Armazenamento primário em uma forma de memória magnética, ou memória do núcleo, memória da corda do núcleo, memória fina e / ou memória do torção;
- Terciário (por exemplo, NCR CRAM) ou armazenamento fora da linha na forma de cartões magnéticos;
- A fita magnética foi então frequentemente usada para armazenamento secundário.
O armazenamento magnético não tem um limite definido de ciclos de reescrita, como armazenamento flash e mídia ótica regravável, pois a alteração dos campos magnéticos não causa desgaste físico. Em vez disso, sua vida útil é limitada por peças mecânicas.
Óptico
O armazenamento óptico, o disco óptico típico, armazena informações em deformidades na superfície de um disco circular e lê essas informações iluminando a superfície com um diodo laser e observando a reflexão. O armazenamento em disco óptico é não volátil. As deformidades podem ser permanentes (mídia somente leitura), formadas uma vez (mídia de gravação única) ou reversíveis (mídia gravável ou de leitura/gravação). Os seguintes formulários são atualmente de uso comum:
- CD, CD-ROM, DVD, BD-ROM: Leia apenas armazenamento, usado para distribuição em massa de informações digitais (música, vídeo, programas de computador);
- CD-R, DVD-R, DVD+R, BD-R: Escreva uma vez o armazenamento, usado para armazenamento terciário e off-line;
- CD-RW, DVD-RW, DVD+RW, DVD-RAM, BD-RE: Gravação lenta, armazenamento de leitura rápida, usado para armazenamento terciário e off-line;
- Ultra Density Optical ou UDO é semelhante na capacidade de BD-R ou BD-RE e é lenta gravação, armazenamento de leitura rápida usado para armazenamento terciário e off-line.
O armazenamento de disco magneto-óptico é o armazenamento de disco óptico em que o estado magnético em uma superfície ferromagnética armazena informações. A informação é lida opticamente e escrita combinando métodos magnéticos e ópticos. O armazenamento de disco magneto-óptico é não volátil, acesso sequencial, gravação lenta, armazenamento de leitura rápida usado para armazenamento terciário e off-line.
O armazenamento de dados óticos 3D também foi proposto.
A fusão de magnetização induzida por luz em fotocondutores magnéticos também foi proposta para armazenamento magneto-óptico de alta velocidade e baixo consumo de energia.
Papel
O armazenamento de dados em papel, geralmente na forma de fita de papel ou cartões perfurados, tem sido usado há muito tempo para armazenar informações para processamento automático, principalmente antes da existência de computadores de uso geral. As informações eram registradas por meio de furos no meio de papel ou papelão e eram lidas mecanicamente (ou mais tarde opticamente) para determinar se um determinado local no meio era sólido ou continha um buraco. Os códigos de barras possibilitam que os objetos vendidos ou transportados tenham algumas informações legíveis por computador anexadas com segurança.
Quantidades relativamente pequenas de dados digitais (em comparação com outro armazenamento de dados digitais) podem ser copiadas em papel como um código de barras de matriz para armazenamento de longo prazo, pois a longevidade do papel normalmente excede até mesmo o armazenamento de dados magnéticos.
Outras mídias de armazenamento ou substratos
- Memória do tubo de vácuo
- Um tubo Williams usou um tubo de raios catódicos e um tubo Selectron usou um tubo de vácuo grande para armazenar informações. Estes dispositivos de armazenamento primários foram de curta duração no mercado, uma vez que o tubo Williams não era confiável, e o tubo Selectron era caro.
- Memória eletroacústica
- A memória delay-line usou ondas sonoras em uma substância como mercúrio para armazenar informações. A memória de linha de atraso foi volátil dinâmico, armazenamento de leitura/escrita sequencial de ciclo e foi usado para armazenamento primário.
- Fita óptica
- é um meio para armazenamento óptico, geralmente composto por uma tira longa e estreita de plástico, em que padrões podem ser escritos e de que os padrões podem ser lidos de volta. Ele compartilha algumas tecnologias com filmes de cinema e discos ópticos, mas é compatível com nenhum. A motivação por trás do desenvolvimento desta tecnologia foi a possibilidade de capacidades de armazenamento muito maiores do que qualquer fita magnética ou discos ópticos.
- Memória de mudança de fase
- usa diferentes fases mecânicas de material de mudança de fase para armazenar informações em uma matriz endereçável X-Y e lê as informações observando a resistência elétrica variável do material. Memória de mudança de fase seria não volátil, armazenamento de leitura/gravação de acesso aleatório, e pode ser usado para armazenamento primário, secundário e off-line. A maioria dos discos ópticos rewritable e muitos write-once já usam material de mudança de fase para armazenar informações.
- Armazenamento de dados holográficos
- armazena informações opticamente dentro de cristais ou fotopolímeros. O armazenamento holográfico pode utilizar todo o volume do meio de armazenamento, ao contrário do armazenamento de disco óptico, que é limitado a um pequeno número de camadas de superfície. O armazenamento holográfico seria não volátil, acesso sequencial e armazenamento de gravação ou leitura/gravação. Pode ser usado para armazenamento secundário e off-line. Veja o disco versátil holográfico (HVD).
- Memória molecular
- armazena informações em polímero que podem armazenar carga elétrica. A memória molecular pode ser especialmente adequada para armazenamento primário. A capacidade de armazenamento teórico da memória molecular é de 10 terabits por polegada quadrada (16 Gbit/mm2).
- Fotocondutores magnéticos
- armazenar informações magnéticas, que podem ser modificadas por iluminação de baixa luz.
- DNA
- armazena informações em nucleotídeos de DNA. Foi feito pela primeira vez em 2012, quando os pesquisadores alcançaram uma proporção de 1,28 petabytes por grama de DNA. Em março de 2017, cientistas relataram que um novo algoritmo chamado fonte de DNA alcançou 85% do limite teórico, em 215 petabytes por grama de DNA.
Tecnologias relacionadas
Redundância
Enquanto o mau funcionamento de um grupo de bits pode ser resolvido por mecanismos de detecção e correção de erros (veja acima), o mau funcionamento do dispositivo de armazenamento requer soluções diferentes. As soluções a seguir são comumente usadas e válidas para a maioria dos dispositivos de armazenamento:
- Espelhamento do dispositivo (replicação) – Uma solução comum para o problema está constantemente mantendo uma cópia idêntica do conteúdo do dispositivo em outro dispositivo (tipicamente de um mesmo tipo). A desvantagem é que isso duplica o armazenamento, e ambos os dispositivos (cópias) precisam ser atualizados simultaneamente com alguns overhead e possivelmente alguns atrasos. O upside é possível leitura simultânea de um mesmo grupo de dados por dois processos independentes, o que aumenta o desempenho. Quando um dos dispositivos replicados é detectado para ser defeituoso, a outra cópia ainda está operacional, e está sendo utilizada para gerar uma nova cópia em outro dispositivo (geralmente disponível operacional em um conjunto de dispositivos stand-by para esta finalidade).
- array redundante de discos independentes (RAID) Este método generaliza o espelhamento do dispositivo acima, permitindo que um dispositivo em um grupo de ndispositivos para falhar e ser substituído pelo conteúdo restaurado (Espelhamento do dispositivo é RAID com Não.). Grupos RAID Não. ou Não. são comuns. n>2 salva o armazenamento, quando comparado com Não., ao custo de mais processamento durante a operação regular (com desempenho frequentemente reduzido) e substituição de dispositivo defeituoso.
O espelhamento de dispositivo e RAID típico são projetados para lidar com uma única falha de dispositivo no grupo de dispositivos RAID. No entanto, se ocorrer uma segunda falha antes que o grupo de RAID seja completamente reparado da primeira falha, os dados poderão ser perdidos. A probabilidade de uma única falha é tipicamente pequena. Assim a probabilidade de duas falhas em um mesmo grupo de RAID em proximidade de tempo é bem menor (aproximadamente a probabilidade ao quadrado, ou seja, multiplicada por ela mesma). Se um banco de dados não puder tolerar nem mesmo essa probabilidade menor de perda de dados, o próprio grupo de RAID será replicado (espelhado). Em muitos casos, esse espelhamento é feito geograficamente remotamente, em uma matriz de armazenamento diferente, para lidar também com a recuperação de desastres (consulte a recuperação de desastres acima).
Conectividade de rede
Um armazenamento secundário ou terciário pode se conectar a um computador utilizando redes de computadores. Esse conceito não pertence ao armazenamento primário, que é compartilhado entre vários processadores em menor grau.
- O armazenamento direto (DAS) é um armazenamento em massa tradicional, que não usa nenhuma rede. Esta é ainda uma abordagem mais popular. Este retronym foi cunhado recentemente, juntamente com NAS e SAN.
- O armazenamento conectado à rede (NAS) é armazenamento em massa ligado a um computador que outro computador pode acessar ao nível do arquivo em uma rede de área local, uma rede de área ampla privada ou no caso de armazenamento de arquivos on-line, através da Internet. O NAS é comumente associado aos protocolos NFS e CIFS/SMB.
- A rede de área de armazenamento (SAN) é uma rede especializada, que fornece outros computadores com capacidade de armazenamento. A diferença crucial entre NAS e SAN é que o NAS apresenta e gerencia sistemas de arquivos para computadores cliente, enquanto a SAN fornece acesso ao nível de endereço de bloco (ru), deixando-o para anexar sistemas para gerenciar dados ou sistemas de arquivos dentro da capacidade fornecida. SAN é comumente associado com redes do canal de fibra.
Armazenamento robótico
Grandes quantidades de fitas magnéticas individuais e discos ópticos ou magneto-ópticos podem ser armazenados em dispositivos robóticos de armazenamento terciário. No campo de armazenamento em fita, eles são conhecidos como bibliotecas de fitas e, no campo de armazenamento óptico, jukeboxes ópticos ou bibliotecas de discos ópticos por analogia. As menores formas de qualquer tecnologia contendo apenas um dispositivo de acionamento são chamadas de carregadores automáticos ou trocadores automáticos.
Dispositivos de armazenamento de acesso robótico podem ter vários slots, cada um contendo mídia individual e, geralmente, um ou mais robôs de coleta que percorrem os slots e carregam mídia em unidades integradas. A disposição das ranhuras e dos dispositivos de seleção afeta o desempenho. Características importantes desse armazenamento são possíveis opções de expansão: adição de slots, módulos, drives, robôs. As bibliotecas de fitas podem ter de 10 a mais de 100.000 slots e fornecer terabytes ou petabytes de informações near-line. As jukeboxes ópticas são soluções um pouco menores, com até 1.000 slots.
O armazenamento robótico é usado para backups e para arquivos de alta capacidade nas indústrias de imagem, médica e de vídeo. O gerenciamento de armazenamento hierárquico é a estratégia de arquivamento mais conhecida para migrar automaticamente arquivos não utilizados há muito tempo do armazenamento rápido em disco rígido para bibliotecas ou jukeboxes. Se os arquivos forem necessários, eles serão recuperados de volta ao disco.
Contenido relacionado
Atari ST
Dublin Core
Alvin toffler