Información digital
Datos digitales, en la teoría de la información y los sistemas de información, es información representada como una cadena de símbolos discretos, cada uno de los cuales puede tomar uno de un número finito de valores de algún alfabeto, como letras o dígitos. Un ejemplo es un documento de texto, que consta de una cadena de caracteres alfanuméricos. La forma más común de datos digitales en los sistemas de información modernos son los datos binarios, que se representan mediante una cadena de dígitos binarios (bits), cada uno de los cuales puede tener uno de dos valores, 0 o 1.
Los datos digitales se pueden contrastar con los datos analógicos, que se representan mediante un valor de un rango continuo de números reales. Los datos analógicos se transmiten mediante una señal analógica, que no solo toma valores continuos, sino que puede variar continuamente con el tiempo, una función de tiempo continua de valor real. Un ejemplo es la variación de la presión del aire en una onda de sonido.
La palabra digital proviene de la misma fuente que las palabras dígito y digitus (la palabra latina para dedo), ya que los dedos a menudo se utilizado para contar. El matemático George Stibitz de Bell Telephone Laboratories usó la palabra digital en referencia a los pulsos eléctricos rápidos emitidos por un dispositivo diseñado para apuntar y disparar cañones antiaéreos en 1942. El término se usa más comúnmente en computación y electrónica, especialmente donde la información del mundo real se convierte a formato numérico binario como en audio digital y fotografía digital.
Conversión de símbolo a digital
Dado que los símbolos (por ejemplo, los caracteres alfanuméricos) no son continuos, representar símbolos digitalmente es bastante más simple que convertir información continua o analógica a digital. En lugar de muestreo y cuantificación como en la conversión de analógico a digital, se utilizan técnicas como sondeo y codificación.
Un dispositivo de entrada de símbolos generalmente consta de un grupo de interruptores que se sondean a intervalos regulares para ver qué interruptores están activados. Los datos se perderán si, dentro de un solo intervalo de sondeo, se presionan dos interruptores, o si se presiona, suelta y vuelve a presionar un interruptor. Este sondeo puede ser realizado por un procesador especializado en el dispositivo para evitar sobrecargar la CPU principal. Cuando se ingresa un nuevo símbolo, el dispositivo generalmente envía una interrupción, en un formato especializado, para que la CPU pueda leerlo.
Para dispositivos con solo unos pocos interruptores (como los botones de un joystick), el estado de cada uno se puede codificar como bits (generalmente 0 para soltar y 1 para presionar) en una sola palabra. Esto es útil cuando las combinaciones de pulsaciones de teclas son significativas y, a veces, se usa para pasar el estado de las teclas modificadoras en un teclado (como shift y control). Pero no se escala para admitir más claves que la cantidad de bits en un solo byte o palabra.
Los dispositivos con muchos interruptores (como un teclado de computadora) generalmente organizan estos interruptores en una matriz de escaneo, con los interruptores individuales en las intersecciones de las líneas x e y. Cuando se presiona un interruptor, conecta las líneas x e y correspondientes. El sondeo (a menudo llamado escaneo en este caso) se realiza activando cada línea x en secuencia y detectando qué líneas y luego tienen una señal, por lo tanto, qué teclas se presionan. Cuando el procesador del teclado detecta que una tecla ha cambiado de estado, envía una señal a la CPU indicando el código de escaneo de la tecla y su nuevo estado. Luego, el símbolo se codifica o se convierte en un número según el estado de las teclas modificadoras y la codificación de caracteres deseada.
Se puede usar una codificación personalizada para una aplicación específica sin pérdida de datos. Sin embargo, usar una codificación estándar como ASCII es problemático si un símbolo como 'ß' necesita ser convertido pero no está en el estándar.
Se estima que en el año 1986 menos del 1% de la capacidad tecnológica mundial para almacenar información era digital y en 2007 ya era el 94%. Se supone que el año 2002 fue el año en que la humanidad pudo almacenar más información en formato digital que en formato analógico (el "comienzo de la era digital").
Estados
Los datos digitales vienen en estos tres estados: datos en reposo, datos en tránsito y datos en uso. La confidencialidad, integridad y disponibilidad deben gestionarse durante todo el ciclo de vida desde el 'nacimiento' a la destrucción de los datos.
Propiedades de la información digital
Toda la información digital posee propiedades comunes que la distinguen de los datos analógicos con respecto a las comunicaciones:
- Sincronización: Dado que la información digital se transmite por la secuencia en la que se ordenan los símbolos, todos los esquemas digitales tienen algún método para determinar el comienzo de una secuencia. En lenguajes humanos escritos o hablados, la sincronización suele ser proporcionada por pausas (espacios), capitalización y puntuación. Las comunicaciones de máquinas suelen usar secuencias de sincronización especiales.
- Idioma: Todas las comunicaciones digitales requieren un idioma oficial, que en este contexto consiste en toda la información que el remitente y receptor de la comunicación digital deben poseer, de antemano, para que la comunicación sea exitosa. Los idiomas son generalmente arbitrarios y especifican el significado a asignar a determinadas secuencias de símbolos, el rango permitido de valores, métodos a utilizar para la sincronización, etc.
- Errores: Las perturbaciones (ruido) en las comunicaciones analógicas introducen invariablemente algunas desviaciones o errores generalmente pequeños entre la comunicación prevista y real. Las perturbaciones en la comunicación digital sólo resultan en errores cuando la perturbación es tan grande como para resultar en un símbolo siendo malinterpretado como otro símbolo o perturbar la secuencia de símbolos. Generalmente es posible tener una comunicación digital casi libre de errores. Además, técnicas como los códigos de verificación pueden utilizarse para detectar errores y corregirlos mediante redundancia o retransmisión. Los errores en las comunicaciones digitales pueden tomar la forma de errores de sustitución en el que un símbolo es reemplazado por otro símbolo, o inserción/deleción errores en los que se inserta o elimina un símbolo extra incorrecto de un mensaje digital. Los errores no corregidos en las comunicaciones digitales tienen un impacto impredecible y generalmente grande en el contenido de información de la comunicación.
- Copiado: Debido a la inevitable presencia de ruido, hacer muchas copias sucesivas de una comunicación analógica es infeasible porque cada generación aumenta el ruido. Debido a que las comunicaciones digitales son generalmente libres de errores, se pueden hacer copias indefinidamente.
- Granularidad: La representación digital de un valor analógico continuamente variable normalmente implica una selección del número de símbolos a asignar a ese valor. El número de símbolos determina la precisión o resolución del dato resultante. La diferencia entre el valor analógico real y la representación digital se conoce como error de cuantificación. Por ejemplo, si la temperatura real es de 23.234456544453 grados, pero si sólo dos dígitos (23) se asignan a este parámetro en una representación digital particular, el error de cuantificación es: 0.234456544453. Esta propiedad de la comunicación digital se conoce como granularidad.
- Compresible: Según Miller, "Los datos digitales no comprimidos son muy grandes, y en su forma cruda, en realidad produciría una señal más grande (antes será más difícil transferir) que los datos analógicos. Sin embargo, los datos digitales pueden ser comprimidos. La compresión reduce la cantidad de espacio ancho de banda necesario para enviar información. Los datos pueden ser comprimidos, enviados y luego descomprimidos en el sitio de consumo. Esto hace posible enviar mucha más información y dar como resultado, por ejemplo, señales de televisión digital que ofrecen más espacio en el espectro de ondas aéreas para más canales de televisión".
Sistemas digitales históricos
Aunque las señales digitales generalmente se asocian con los sistemas digitales electrónicos binarios utilizados en la electrónica y la informática modernas, los sistemas digitales son en realidad antiguos y no es necesario que sean binarios o electrónicos.
- El código genético de ADN es una forma natural de almacenamiento de datos digitales.
- Texto escrito (debido al conjunto de caracteres limitados y al uso de símbolos discretos – el alfabeto en la mayoría de los casos)
- El abacus fue creado en algún momento entre 1000 BC y 500 BC, luego se convirtió en una forma de frecuencia de cálculo. Actualmente se puede utilizar como una calculadora digital muy avanzada, pero básica que utiliza cuentas en filas para representar números. Las cuentas sólo tienen significado en estados discretos arriba y abajo, no en estados analógicos entre sí.
- A beacon es quizás la señal digital no electrónica más simple, con sólo dos estados (en y fuera). En particular, señales de humo son uno de los ejemplos más antiguos de una señal digital, donde se modula una "carrera" analógica con una manta para generar una señal digital (puffs) que transmite información.
- El código Morse utiliza seis estados digitales —dot, dash, brecha intra-character (entre cada punto o dash), brecha corta (entre cada letra), brecha media (entre palabras), y brecha larga (entre oraciones)— para enviar mensajes a través de una variedad de portadores potenciales como la electricidad o la luz, por ejemplo utilizando un telégrafo eléctrico o una luz flash.
- El Braille utiliza un código de seis bits que se presenta como patrones de puntos.
- Bandera semaforre utiliza varillas o banderas en posiciones particulares para enviar mensajes al receptor observándolos una cierta distancia.
- Las banderas de señal marítima internacional tienen marcas distintivas que representan letras del alfabeto para permitir que los barcos envíen mensajes entre sí.
- Más recientemente inventado, un módem modula una señal analógica "carrera" (como el sonido) para codificar la información digital electrónica binaria, como una serie de pulsos de sonido digital binarios. Una versión ligeramente anterior y sorprendentemente fiable del mismo concepto era agrupar una secuencia de audio digital "signal" y "no señal" información (es decir, "sonido" y "silencia") en cinta magnética de cassette para su uso con ordenadores caseros tempranos.
Contenido relacionado
Rn (lector de noticias)
Punto de acceso
Patrón de diseño