Data (datos)

Compartir Imprimir Citar

Los datos son hechos individuales, estadísticas o elementos de información, a menudo numéricos. En un sentido más técnico, los datos son un conjunto de valores de variables cualitativas o cuantitativas sobre una o más personas u objetos, mientras que un dato (singular de datos) es un valor único de una sola variable.

Aunque los términos "datos" e "información" a menudo se usan indistintamente, estos términos tienen significados distintos entre sí. En algunas publicaciones populares, a veces se dice que los datos se transforman en información cuando se ven en contexto o en un análisis posterior. Sin embargo, en los tratamientos académicos de la materia los datos son simplemente unidades de información. Los datos se utilizan en la investigación científica, la gestión empresarial (p. ej., datos de ventas, ingresos, beneficios, precio de las acciones), las finanzas, la gobernanza (p. ej., índices de criminalidad, índices de desempleo, índices de alfabetización) y prácticamente en cualquier otra forma de actividad organizativa humana (ej., censos del número de personas sin hogar por parte de organizaciones sin fines de lucro).

En general, los datos son átomos de toma de decisiones: son las unidades más pequeñas de información fáctica que se pueden utilizar como base para el razonamiento, la discusión o el cálculo. Los datos pueden variar desde ideas abstractas hasta medidas concretas, incluso estadísticas. Los datos se miden, recopilan, notifican y analizan, y se utilizan para crear visualizaciones de datos como gráficos, tablas o imágenes. Los datos como concepto general se refieren al hecho de que cierta información o conocimiento existente se representa o codifica de alguna forma adecuada para un mejor uso o procesamiento. Datos sin procesar("datos no procesados") es una colección de números o caracteres antes de que los investigadores los "limpien" y corrijan. Los datos sin procesar deben corregirse para eliminar los valores atípicos o los errores obvios de ingreso de datos o de instrumentos (p. ej., la lectura de un termómetro de una ubicación ártica al aire libre que registra una temperatura tropical). El procesamiento de datos comúnmente ocurre por etapas, y los "datos procesados" de una etapa pueden considerarse los "datos sin procesar" de la etapa siguiente. Los datos de campo son datos sin procesar que se recopilan en un entorno "in situ" no controlado. Los datos experimentales son datos que se generan dentro del contexto de una investigación científica mediante la observación y el registro.

Los datos han sido descritos como "el nuevo petróleo de la economía digital".

Etimología y terminología

El primer uso en inglés de la palabra "datos" data de la década de 1640. La palabra "datos" se utilizó por primera vez para referirse a "información informática transmisible y almacenable" en 1946. La expresión "procesamiento de datos" se utilizó por primera vez en 1954.

La palabra latina data es el plural de ' datum', "(cosa) dada", participio pasado neutro de dare "dar". En inglés, la palabra data puede usarse como un sustantivo plural en este sentido, con algunos escritores, generalmente aquellos que trabajan en ciencias naturales, ciencias de la vida y ciencias sociales, que usan datum en singular y data en plural, especialmente en el siglo XX. y en muchos casos también el 21 (por ejemplo, el estilo APA a partir de la 7ª edición todavía requiere que "datos" sea plural.). Sin embargo, en el lenguaje cotidiano y en gran parte del uso del desarrollo de software y la informática, "datos" se usa más comúnmente en singular como un sustantivo masivo (como "arena" o "lluvia"). El término big data toma el singular.

Significado

Datos, información, conocimiento y sabiduría son conceptos íntimamente relacionados, pero cada uno tiene su rol respecto al otro, y cada término tiene su significado. De acuerdo con una visión común, los datos se recopilan y analizan; los datos solo se convierten en información adecuada para tomar decisiones una vez que han sido analizados de alguna manera. Se puede decir que la medida en que un conjunto de datos es informativo para alguien depende de la medida en que sea inesperado para esa persona. La cantidad de información contenida en un flujo de datos puede caracterizarse por su entropía de Shannon.

El conocimiento es la comprensión basada en una amplia experiencia que trata con información sobre un tema. Por ejemplo, la altura del monte Everest generalmente se considera un dato. La altura puede medirse con precisión con un altímetro e ingresarse en una base de datos. Estos datos pueden incluirse en un libro junto con otros datos sobre el Monte Everest para describir la montaña de una manera útil para quienes deseen decidir cuál es el mejor método para escalarla. Una comprensión basada en la experiencia de escalar montañas que podría aconsejar a las personas sobre el camino para llegar a la cima del Monte Everest puede verse como "conocimiento". La escalada práctica del pico del Monte Everest basada en este conocimiento puede verse como "sabiduría". En otras palabras, la sabiduría se refiere a la aplicación práctica del conocimiento de una persona en aquellas circunstancias en las que puede resultar bueno.

A menudo se supone que los datos son el concepto menos abstracto, la información el siguiente menos y el conocimiento el más abstracto. Desde este punto de vista, los datos se convierten en información por interpretación; por ejemplo, la altura del monte Everest generalmente se considera "datos", un libro sobre las características geológicas del monte Everest puede considerarse "información" y una guía para escaladores que contiene información práctica sobre la mejor manera de llegar a la cima del monte Everest puede considerarse "conocimiento".. "Información" tiene una diversidad de significados que van desde el uso cotidiano hasta el uso técnico. Sin embargo, también se ha argumentado que esta visión invierte la forma en que los datos emergen de la información y la información del conocimiento.En términos generales, el concepto de información está estrechamente relacionado con las nociones de restricción, comunicación, control, datos, forma, instrucción, conocimiento, significado, estímulo mental, patrón, percepción y representación. Beynon-Davies utiliza el concepto de signo para diferenciar entre datos e información; los datos son una serie de símbolos, mientras que la información se produce cuando los símbolos se utilizan para referirse a algo.

Antes del desarrollo de dispositivos y máquinas informáticas, las personas tenían que recopilar datos manualmente e imponerles patrones. Desde el desarrollo de dispositivos y máquinas informáticas, estos dispositivos también pueden recopilar datos. En la década de 2010, las computadoras se utilizan ampliamente en muchos campos para recopilar datos y clasificarlos o procesarlos, en disciplinas que van desde el marketing, el análisis del uso de los servicios sociales por parte de los ciudadanos hasta la investigación científica. Estos patrones en los datos se ven como información que se puede utilizar para mejorar el conocimiento. Estos patrones pueden interpretarse como "verdad" (aunque "verdad" puede ser un concepto subjetivo) y pueden autorizarse como criterios estéticos y éticos en algunas disciplinas o culturas. Los eventos que dejan restos físicos o virtuales perceptibles se pueden rastrear a través de los datos.

Los dispositivos informáticos mecánicos se clasifican según cómo representan los datos. Una computadora analógica representa un dato como voltaje, distancia, posición u otra cantidad física. Una computadora digital representa una pieza de datos como una secuencia de símbolos extraídos de un alfabeto fijo. Las computadoras digitales más comunes usan un alfabeto binario, es decir, un alfabeto de dos caracteres que normalmente se denota como "0" y "1". Luego se construyen representaciones más familiares, como números o letras, a partir del alfabeto binario. Se distinguen algunas formas especiales de datos. Un programa de computadora es una colección de datos, que pueden interpretarse como instrucciones. La mayoría de los lenguajes informáticos distinguen entre programas y otros datos sobre los que operan los programas, pero en algunos lenguajes, en particular Lisp y lenguajes similares, los programas son esencialmente indistinguibles de otros datos. También es útil para distinguir metadatos, es decir, una descripción de otros datos. Un término similar pero anterior para los metadatos es "datos auxiliares". El ejemplo prototípico de metadatos es el catálogo de la biblioteca, que es una descripción del contenido de los libros.

Documentos de datos

Siempre que es necesario registrar datos, estos existen en forma de documentos de datos. Los tipos de documentos de datos incluyen:

Algunos de estos documentos de datos (repositorios de datos, estudios de datos, conjuntos de datos y software) están indexados en Data Citation Indexes, mientras que los artículos de datos están indexados en bases de datos bibliográficas tradicionales, por ejemplo, Science Citation Index. Ver más.

Recopilación de datos

La recopilación de datos se puede lograr a través de una fuente primaria (el investigador es la primera persona en obtener los datos) o una fuente secundaria (el investigador obtiene los datos que ya han sido recopilados por otras fuentes, como los datos difundidos en una revista científica). Las metodologías de análisis de datos varían e incluyen la triangulación y la filtración de datos.Este último ofrece un método articulado de recolección, clasificación y análisis de datos utilizando cinco posibles ángulos de análisis (al menos tres) para maximizar la objetividad de la investigación y permitir una comprensión lo más completa posible de los fenómenos investigados: métodos cualitativos y cuantitativos, literatura revisiones (incluidos artículos académicos), entrevistas con expertos y simulación por computadora. Posteriormente, los datos se "filtran" mediante una serie de pasos predeterminados para extraer la información más relevante.

En otros campos

Aunque los datos también se utilizan cada vez más en otros campos, se ha sugerido que su naturaleza altamente interpretativa podría estar en desacuerdo con el ethos de los datos como "dados". Peter Checkland introdujo el término capta (del latín capere, “tomar”) para distinguir entre una inmensa cantidad de datos posibles y un subconjunto de ellos, hacia los cuales se orienta la atención. Johanna Drucker ha argumentado que dado que las humanidades afirman que la producción de conocimiento es "situada, parcial y constitutiva", el uso de datos puede introducir suposiciones que son contraproducentes, por ejemplo, que los fenómenos son discretos o independientes del observador. El término capta, que enfatiza el acto de observación como constitutivo, se ofrece como una alternativa a los datos para las representaciones visuales en las humanidades.