Dados digitais
Dados digitais, na teoria da informação e nos sistemas de informação, são informações representadas como uma sequência de símbolos discretos, cada um dos quais pode assumir um de apenas um número finito de valores de algum alfabeto, como letras ou dígitos. Um exemplo é um documento de texto, que consiste em uma cadeia de caracteres alfanuméricos. A forma mais comum de dados digitais em sistemas de informação modernos são os dados binários, que são representados por uma sequência de dígitos binários (bits), cada um dos quais pode ter um de dois valores, 0 ou 1.
Dados digitais podem ser contrastados com dados analógicos, que são representados por um valor de um intervalo contínuo de números reais. Os dados analógicos são transmitidos por um sinal analógico, que não apenas assume valores contínuos, mas também pode variar continuamente com o tempo, uma função contínua de valor real do tempo. Um exemplo é a variação da pressão do ar em uma onda sonora.
A palavra digital vem da mesma fonte que as palavras dígito e digitus (a palavra latina para dedo), já que os dedos geralmente são usado para contagem. O matemático George Stibitz, da Bell Telephone Laboratories, usou a palavra digital em referência aos rápidos pulsos elétricos emitidos por um dispositivo projetado para mirar e disparar armas antiaéreas em 1942. O termo é mais comumente usado em computação e eletrônicos, especialmente onde informações do mundo real são convertidas em forma numérica binária, como em áudio digital e fotografia digital.
Conversão de símbolo para digital
Como os símbolos (por exemplo, caracteres alfanuméricos) não são contínuos, representar símbolos digitalmente é bem mais simples do que converter informações contínuas ou analógicas em digitais. Em vez de amostragem e quantização como na conversão analógico-digital, técnicas como polling e codificação são usadas.
Um dispositivo de entrada de símbolo geralmente consiste em um grupo de chaves que são pesquisadas em intervalos regulares para ver quais chaves são acionadas. Os dados serão perdidos se, dentro de um único intervalo de pesquisa, dois interruptores forem pressionados ou um interruptor for pressionado, liberado e pressionado novamente. Este polling pode ser feito por um processador especializado no dispositivo para evitar sobrecarregar a CPU principal. Quando um novo símbolo é inserido, o dispositivo normalmente envia uma interrupção, em um formato especializado, para que a CPU possa lê-lo.
Para dispositivos com apenas alguns interruptores (como os botões em um joystick), o status de cada um pode ser codificado como bits (geralmente 0 para liberado e 1 para pressionado) em uma única palavra. Isso é útil quando as combinações de pressionamento de teclas são significativas e, às vezes, é usado para passar o status das teclas modificadoras em um teclado (como shift e control). Mas ele não escala para suportar mais chaves do que o número de bits em um único byte ou palavra.
Dispositivos com muitos interruptores (como um teclado de computador) geralmente organizam esses interruptores em uma matriz de varredura, com os interruptores individuais nas interseções das linhas x e y. Quando um interruptor é pressionado, ele conecta as linhas x e y correspondentes. O polling (geralmente chamado de varredura neste caso) é feito ativando cada linha x em sequência e detectando quais linhas y têm um sinal e, portanto, quais teclas são pressionadas. Quando o processador do teclado detecta que uma tecla mudou de estado, ele envia um sinal para a CPU indicando o código de varredura da tecla e seu novo estado. O símbolo é então codificado ou convertido em um número com base no status das teclas modificadoras e na codificação de caracteres desejada.
Uma codificação personalizada pode ser usada para um aplicativo específico sem perda de dados. No entanto, usar uma codificação padrão como ASCII é problemático se um símbolo como 'ß' precisa ser convertido, mas não está no padrão.
Estima-se que no ano de 1986 menos de 1% da capacidade tecnológica mundial para armazenar informações era digital e em 2007 já era de 94%. O ano de 2002 é considerado o ano em que a humanidade conseguiu armazenar mais informações em formato digital do que em analógico (o "início da era digital").
Estados
Os dados digitais vêm nestes três estados: dados em repouso, dados em trânsito e dados em uso. A confidencialidade, integridade e disponibilidade devem ser gerenciadas durante todo o ciclo de vida, desde o 'nascimento' à destruição dos dados.
Propriedades da informação digital
Toda informação digital possui propriedades comuns que a distinguem dos dados analógicos no que diz respeito às comunicações:
- Sincronização: Uma vez que a informação digital é transmitida pela sequência em que os símbolos são ordenados, todos os esquemas digitais têm algum método para determinar o início de uma sequência. Em linguagens humanas escritas ou faladas, a sincronização é normalmente fornecida por pausas (espaços), capitalização e pontuação. As comunicações da máquina normalmente usam sequências de sincronização especiais.
- Língua: Todas as comunicações digitais exigem linguagem formal, que neste contexto consiste em todas as informações que o remetente e receptor da comunicação digital devem possuir, com antecedência, para que a comunicação seja bem sucedida. As línguas são geralmente arbitrárias e especificam o significado a ser atribuído a sequências de símbolos particulares, o intervalo permitido de valores, métodos a serem usados para sincronização, etc.
- Erros: As perturbações (ruído) nas comunicações analógicas invariavelmente introduzem alguns, geralmente pequenos desvios ou erros entre a comunicação pretendida e real. As perturbações na comunicação digital só resultam em erros quando a perturbação é tão grande para resultar em um símbolo sendo mal interpretado como outro símbolo ou perturbando a sequência de símbolos. É geralmente possível ter uma comunicação digital quase livre de erros. Além disso, técnicas como códigos de verificação podem ser usadas para detectar erros e corrigi-los através da redundância ou retransmissão. Erros em comunicações digitais podem assumir a forma de erros de substituição em que um símbolo é substituído por outro símbolo, ou inserção / eliminação erros nos quais um símbolo extra incorreto é inserido ou excluído de uma mensagem digital. Erros não corrigidos nas comunicações digitais têm um impacto imprevisível e geralmente grande no conteúdo da informação da comunicação.
- Copiar: Devido à inevitável presença de ruído, fazer muitas cópias sucessivas de uma comunicação analógica é inviável porque cada geração aumenta o ruído. Como as comunicações digitais são geralmente livres de erros, cópias de cópias podem ser feitas indefinidamente.
- Granularidade: A representação digital de um valor analógico continuamente variável geralmente envolve uma seleção do número de símbolos a serem atribuídos a esse valor. O número de símbolos determina a precisão ou a resolução do dado resultante. A diferença entre o valor analógico real e a representação digital é conhecida como erro de quantificação. Por exemplo, se a temperatura real é 23.234456544453 graus, mas apenas dois dígitos (23) são atribuídos a este parâmetro em uma representação digital particular, o erro de quantificação é 0.234456544453. Esta propriedade da comunicação digital é conhecida como granulação.
- Comprimido: De acordo com Miller, "os dados digitais não compactados são muito grandes, e em sua forma bruta, ele realmente produziria um sinal maior (por isso, ser mais difícil de transferir) do que dados analógicos. No entanto, os dados digitais podem ser compactados. A compressão reduz a quantidade de espaço de largura de banda necessário para enviar informações. Os dados podem ser comprimidos, enviados e depois descomprimidos no local do consumo. Isso torna possível enviar muito mais informações e resulta em, por exemplo, sinais de televisão digital oferecendo mais espaço no espectro de ondas de ar para mais canais de televisão."
Sistemas digitais históricos
Embora os sinais digitais sejam geralmente associados aos sistemas digitais eletrônicos binários usados na eletrônica e na computação modernas, os sistemas digitais são realmente antigos e não precisam ser binários ou eletrônicos.
- O código genético do DNA é uma forma natural de armazenamento de dados digitais.
- Texto escrito (devido ao conjunto de caracteres limitado e ao uso de símbolos discretos – o alfabeto na maioria dos casos)
- O abacus foi criado em algum momento entre 1000 BC e 500 BC, mais tarde tornou-se uma forma de frequência de cálculo. Hoje em dia pode ser usado como uma calculadora digital muito avançada, mas básica que usa contas em linhas para representar números. Os grânulos só têm significado em estados discretos para cima e para baixo, não em estados analógicos no meio.
- A Aconselhamento é talvez o sinal digital não-eletrônico mais simples, com apenas dois estados (em e fora). Em particular, sinais de fumaça são um dos exemplos mais antigos de um sinal digital, onde uma "carreira" analógica (smoke) é modulada com um cobertor para gerar um sinal digital (puffs) que transmite informações.
- O código Morse usa seis estados digitais - ponto, traço, lacuna intra-caracter (entre cada ponto ou traço), lacuna curta (entre cada letra), lacuna média (entre palavras) e lacuna longa (entre frases) - para enviar mensagens através de uma variedade de potenciais portadores, como eletricidade ou luz, por exemplo, usando um telegrama elétrico ou uma luz piscando.
- A Braille usa um código de seis bits renderizado como padrões de ponto.
- Bandeira semaphore usa hastes ou bandeiras mantidas em posições particulares para enviar mensagens para o receptor observando-os alguma distância.
- As bandeiras de sinais marítimos internacionais têm marcas distintas que representam letras do alfabeto para permitir que os navios enviem mensagens um para o outro.
- Mais recentemente inventado, um modem modula um sinal analógico de "carreira" (como o som) para codificar informações digitais binárias, como uma série de pulsos de som digitais binários. Uma versão um pouco antes, surpreendentemente confiável do mesmo conceito foi empacotar uma sequência de informações de "sinal" digital de áudio e "sem sinal" (ou seja, "sound" e "silence") em fita cassete magnética para uso com computadores domésticos iniciais.
Contenido relacionado
Arte ASCII
Ada (linguagem de programação)
Computador Atanasoff-Berry