Datos (informática)
La data, datos o información digital, en la teoría de la información y los sistemas de información, son información representada como una cadena de símbolos discretos, cada uno de los cuales puede tomar uno de un número finito de valores de algún alfabeto, como letras o dígitos. Un ejemplo es un documento de texto, que consta de una cadena de caracteres alfanuméricos. La forma más común de datos digitales en los sistemas de información modernos son los datos binarios, que se representan mediante una cadena de dígitos binarios (bits), cada uno de los cuales puede tener uno de dos valores, 0 o 1.
Los datos digitales se pueden contrastar con los datos analógicos, que se representan mediante un valor de un rango continuo de números reales. Los datos analógicos se transmiten mediante una señal analógica, que no solo toma valores continuos, sino que puede variar continuamente con el tiempo, una función de tiempo continua de valor real. Un ejemplo es la variación de la presión del aire en una onda de sonido.
La palabra digital proviene de la misma fuente que las palabras digit y digitus (la palabra latina para dedo), ya que los dedos se usan a menudo para contar. El matemático George Stibitz de Bell Telephone Laboratories usó la palabra digital en referencia a los pulsos eléctricos rápidos emitidos por un dispositivo diseñado para apuntar y disparar cañones antiaéreos en 1942. El término se usa más comúnmente en computación y electrónica, especialmente donde el mundo real la información se convierte a formato numérico binario como en audio digital y fotografía digital.
Conversión de símbolo a digital
Dado que los símbolos (por ejemplo, los caracteres alfanuméricos) no son continuos, la representación digital de símbolos es bastante más sencilla que la conversión de información continua o analógica a digital. En lugar de muestreo y cuantificación como en la conversión de analógico a digital, se utilizan técnicas como sondeo y codificación.
Un dispositivo de entrada de símbolos generalmente consta de un grupo de interruptores que se consultan a intervalos regulares para ver qué interruptores están activados. Los datos se perderán si, dentro de un solo intervalo de sondeo, se presionan dos interruptores, o si se presiona, suelta y vuelve a presionar un interruptor. Este sondeo puede ser realizado por un procesador especializado en el dispositivo para evitar sobrecargar la CPU principal. Cuando se ingresa un nuevo símbolo, el dispositivo generalmente envía una interrupción, en un formato especializado, para que la CPU pueda leerlo.
Para dispositivos con solo unos pocos interruptores (como los botones de un joystick), el estado de cada uno se puede codificar como bits (generalmente 0 para liberar y 1 para presionar) en una sola palabra. Esto es útil cuando las combinaciones de pulsaciones de teclas son significativas y, a veces, se usa para pasar el estado de las teclas modificadoras en un teclado (como shift y control). Pero no se escala para admitir más claves que la cantidad de bits en un solo byte o palabra.
Los dispositivos con muchos interruptores (como el teclado de una computadora) generalmente organizan estos interruptores en una matriz de escaneo, con los interruptores individuales en las intersecciones de las líneas x e y. Cuando se presiona un interruptor, conecta las líneas x e y correspondientes. El sondeo (a menudo llamado escaneo en este caso) se realiza activando cada línea x en secuencia y detectando qué líneas y luego tienen una señal, por lo tanto, qué teclas se presionan. Cuando el procesador del teclado detecta que una tecla ha cambiado de estado, envía una señal a la CPU indicando el código de escaneo de la tecla y su nuevo estado. Luego, el símbolo se codifica o se convierte en un número según el estado de las teclas modificadoras y la codificación de caracteres deseada.
Se puede utilizar una codificación personalizada para una aplicación específica sin pérdida de datos. Sin embargo, usar una codificación estándar como ASCII es problemático si es necesario convertir un símbolo como 'ß' pero no está en el estándar.
Se estima que en el año 1986 menos del 1% de la capacidad tecnológica mundial para almacenar información era digital y en 2007 ya era el 94%. Se supone que el año 2002 será el año en que la humanidad pudo almacenar más información en formato digital que en formato analógico (el "comienzo de la era digital").
Estados
Los datos digitales vienen en estos tres estados: datos en reposo, datos en tránsito y datos en uso. La confidencialidad, integridad y disponibilidad deben gestionarse durante todo el ciclo de vida desde el 'nacimiento' hasta la destrucción de los datos.
Propiedades de la información digital
Toda la información digital posee propiedades comunes que la distinguen de los datos analógicos con respecto a las comunicaciones:
- Sincronización: dado que la información digital se transmite mediante la secuencia en la que se ordenan los símbolos, todos los esquemas digitales tienen algún método para determinar el comienzo de una secuencia. En los lenguajes humanos escritos o hablados, la sincronización generalmente se proporciona mediante pausas (espacios), mayúsculas y puntuación. Las comunicaciones de la máquina suelen utilizar secuencias de sincronización especiales.
- Idioma: Toda comunicación digital requiere de un lenguaje formal, que en este contexto consiste en toda la información que tanto el emisor como el receptor de la comunicación digital deben poseer, de antemano, para que la comunicación sea exitosa. Los lenguajes son generalmente arbitrarios y especifican el significado que se asignará a secuencias de símbolos particulares, el rango de valores permitido, los métodos que se utilizarán para la sincronización, etc.
- Errores: Las perturbaciones (ruido) en las comunicaciones analógicas invariablemente introducen alguna desviación o error, generalmente pequeño, entre la comunicación prevista y la real. Las perturbaciones en la comunicación digital no dan como resultado errores a menos que la perturbación sea tan grande como para que un símbolo se malinterprete como otro símbolo o altere la secuencia de símbolos. Por lo tanto, generalmente es posible tener una comunicación digital completamente libre de errores. Además, se pueden utilizar técnicas como los códigos de verificación para detectar errores y garantizar comunicaciones sin errores mediante redundancia o retransmisión. Los errores en las comunicaciones digitales pueden tomar la forma de errores de sustitución en los que un símbolo es reemplazado por otro símbolo, o de inserción/borradoerrores en los que se inserta o elimina un símbolo incorrecto adicional de un mensaje digital. Los errores no corregidos en las comunicaciones digitales tienen un impacto impredecible y generalmente grande en el contenido de la información de la comunicación.
- Copia: Debido a la inevitable presencia de ruido, hacer muchas copias sucesivas de una comunicación analógica es inviable porque cada generación aumenta el ruido. Debido a que las comunicaciones digitales generalmente están libres de errores, se pueden hacer copias de copias indefinidamente.
- Granularidad: la representación digital de un valor analógico continuamente variable generalmente implica una selección del número de símbolos que se asignarán a ese valor. El número de símbolos determina la precisión o resolución del dato resultante. La diferencia entre el valor analógico real y la representación digital se conoce como error de cuantificación. Por ejemplo, si la temperatura real es 23,234456544453 grados, pero si solo se asignan dos dígitos (23) a este parámetro en una representación digital particular, el error de cuantificación es: 0,234456544453. Esta propiedad de la comunicación digital se conoce como granularidad.
- Compresible: según Miller, "los datos digitales sin comprimir son muy grandes y, en su forma original, en realidad producirían una señal más grande (por lo tanto, serían más difíciles de transferir) que los datos analógicos. Sin embargo, los datos digitales se pueden comprimir. La compresión reduce la cantidad de espacio de ancho de banda necesario para enviar información. Los datos se pueden comprimir, enviar y luego descomprimir en el sitio de consumo. Esto hace posible enviar mucha más información y dar como resultado, por ejemplo, señales de televisión digital que ofrecen más espacio en el espectro de ondas por más canales de televisión".
Sistemas digitales históricos
Aunque las señales digitales generalmente se asocian con los sistemas digitales electrónicos binarios que se utilizan en la electrónica y la computación modernas, los sistemas digitales son en realidad antiguos y no es necesario que sean binarios o electrónicos.
- El código genético del ADN es una forma natural de almacenamiento de datos digitales.
- Texto escrito (debido al juego de caracteres limitado y al uso de símbolos discretos, el alfabeto en la mayoría de los casos)
- El ábaco se creó en algún momento entre el 1000 a. C. y el 500 a. C., luego se convirtió en una forma de cálculo de frecuencia. Hoy en día se puede usar como una calculadora digital muy avanzada pero básica que usa cuentas en filas para representar números. Las cuentas solo tienen significado en estados discretos hacia arriba y hacia abajo, no en estados intermedios analógicos.
- Una baliza es quizás la señal digital no electrónica más simple, con solo dos estados (encendido y apagado). En particular, las señales de humo son uno de los ejemplos más antiguos de una señal digital, donde un "portador" analógico (humo) se modula con una manta para generar una señal digital (soplos) que transmite información.
- El código Morse utiliza seis estados digitales: punto, guión, espacio entre caracteres (entre cada punto o guión), espacio corto (entre cada letra), espacio medio (entre palabras) y espacio largo (entre oraciones) para enviar mensajes a través de una variedad de portadores potenciales como la electricidad o la luz, por ejemplo usando un telégrafo eléctrico o una luz intermitente.
- El Braille usa un código de seis bits representado como patrones de puntos.
- El semáforo de bandera utiliza varillas o banderas sostenidas en posiciones particulares para enviar mensajes al receptor que los observa a cierta distancia.
- Las banderas de señales marítimas internacionales tienen marcas distintivas que representan letras del alfabeto para permitir que los barcos se envíen mensajes entre sí.
- Inventado más recientemente, un módem modula una señal "portadora" analógica (como el sonido) para codificar información digital eléctrica binaria, como una serie de pulsos de sonido digitales binarios. Una versión ligeramente anterior y sorprendentemente fiable del mismo concepto consistía en agrupar una secuencia de información de "señal" y "ausencia de señal" digital de audio (es decir, "sonido" y "silencio") en una cinta de casete magnética para usar con las primeras computadoras domésticas.
Contenido relacionado
Menú de contexto
Modulación por cambio de fase
Depurador