Explosión de información

AjustarCompartirImprimirCitar

La explosión de la información es el rápido aumento en la cantidad de información o datos publicados y los efectos de esta abundancia. A medida que crece la cantidad de datos disponibles, el problema de administrar la información se vuelve más difícil, lo que puede conducir a una sobrecarga de información. El Online Oxford English Dictionary indica el uso de la frase en un artículo de New Statesman de marzo de 1964. The New York Times utilizó por primera vez la frase en su contenido editorial en un artículo de Walter Sullivan el 7 de junio de 1964, en el que describió la frase como "muy discutida". (p11.) El primer uso conocido de la frase fue en un discurso sobre televisión del presidente de NBC, Pat Weaver, en el Instituto de Profesionales de la Publicidad en Londres el 27 de septiembre de 1955. El discurso fue retransmitido en la estación de radio WSUI en Iowa y extraído en el periódico Daily Iowan dos meses después.

Muchos sectores están viendo este rápido aumento en la cantidad de información disponible, como atención médica, supermercados e incluso gobiernos con información de actas de nacimiento y registros de vacunación. Otro sector que se está viendo afectado por este fenómeno es el periodismo. Tal profesión, que en el pasado era responsable de la difusión de información, puede ser suprimida por la sobreabundancia de información de hoy.

Las técnicas para recopilar conocimientos a partir de una sobreabundancia de información electrónica (p. ej., la fusión de datos puede ayudar en la extracción de datos) existen desde la década de 1970. Otra técnica común para tratar con tal cantidad de información es la investigación cualitativa. Dichos enfoques tienen como objetivo organizar la información, sintetizar, categorizar y sistematizar para que sea más utilizable y más fácil de buscar.

Patrones de crecimiento

  • La capacidad tecnológica mundial para almacenar información creció de 2,6 exabytes de forma óptima en 1986 a 15,7 en 1993, más de 54,5 en 2000, y a 295 exabytes en 2007.
  • La capacidad tecnológica del mundo para recibir información a través de redes de transmisión única fue de 432 exabytes de información (optimally comprimido) en 1986, 715 exabytes (optimally comprimido) en 1993, 1.200 exabytes (optimally comprimido) en 2000, y 1.900 en 2007.
  • La capacidad efectiva del mundo para intercambiar información a través de redes de telecomunicaciones bidireccionales fue de 0,281 exabytes de información (optimally comprimido) en 1986, 0.471 en 1993, 2.2 en 2000, y 65 exabytes (optimally comprimido) en 2007.

Una nueva métrica que se está utilizando en un intento de caracterizar el crecimiento de la información específica de la persona es el almacenamiento en disco por persona (DSP), que se mide en megabytes/persona (donde megabytes es 106 bytes y se abrevia MB). Global DSP (GDSP) es el espacio total en disco rígido (en MB) de unidades nuevas vendidas en un año dividido por la población mundial en ese año. La métrica GDSP es una medida cruda de cuánto almacenamiento en disco podría usarse para recopilar datos específicos de personas sobre la población mundial. En 1983, se vendieron en todo el mundo un millón de unidades fijas con un total estimado de 90 terabytes; Las unidades de 30 MB tenían el segmento de mercado más grande. En 1996, se vendieron 105 millones de unidades, con un total de 160.623 terabytes, siendo las unidades de 1 y 2 gigabytes líderes en la industria. Para el año 2000, con unidades de 20 GB liderando la industria, se proyecta que las unidades rígidas vendidas en el año alcancen un total de 2.829.288 terabytes. Las ventas de unidades de disco rígido superarán los $34 mil millones en 1997.

Según Latanya Sweeney, existen tres tendencias en la recopilación de datos hoy en día:

Tipo 1. Expansión del número de campos que se recopilan, conocida como la tendencia "recopilar más".

Tipo 2. Reemplazar una recopilación de datos agregados existente por una específica de la persona, conocida como la tendencia "recopilar específicamente".

Tipo 3. Recopile información iniciando una nueva recopilación de datos específicos de la persona, conocida como la tendencia "recójala si puede".

Términos relacionados

Desde que "información" en los medios electrónicos a menudo se usa como sinónimo de "datos", el término explosión de información está estrechamente relacionado con el concepto de inundación de datos (también denominado diluvio de datos). A veces también se utiliza el término inundación de información. Todos estos básicamente se reducen a la cantidad cada vez mayor de datos electrónicos intercambiados por unidad de tiempo. La conciencia sobre las cantidades de datos no manejables creció junto con el advenimiento de un procesamiento de datos cada vez más poderoso desde mediados de la década de 1960.

Desafíos

Aunque la abundancia de información puede ser beneficiosa en varios niveles, algunos problemas pueden ser motivo de preocupación, como la privacidad, las pautas legales y éticas, el filtrado y la precisión de los datos. El filtrado se refiere a encontrar información útil en medio de tantos datos, lo cual se relaciona con el trabajo de los científicos de datos. Un ejemplo típico de una necesidad de filtrado de datos (minería de datos) es en el cuidado de la salud ya que en los próximos años se debe tener disponibles los EHR (Registros Electrónicos de Salud) de los pacientes. Con tanta información disponible, los médicos deberán poder identificar patrones y seleccionar datos importantes para el diagnóstico del paciente. Por otro lado, según algunos expertos, tener tantos datos públicos disponibles dificulta proporcionar datos que sean realmente anónimos. Otro punto a tener en cuenta son los lineamientos legales y éticos, que se relacionan con quién será el titular de los datos y con qué frecuencia está obligado a revelarlos y por cuánto tiempo. Con tantas fuentes de datos, otro problema será la precisión de los mismos. Una fuente que no es de confianza puede ser cuestionada por otras, solicitando un nuevo conjunto de datos, provocando una repetición en la información. Según Edward Huth, otra preocupación es la accesibilidad y el costo de dicha información. La tasa de accesibilidad podría mejorarse ya sea reduciendo los costos o aumentando la utilidad de la información. La reducción de costos según el autor, podría ser realizada por asociaciones, las cuales deberían evaluar qué información era relevante y recopilarla de manera más organizada.

Servidores web

En agosto de 2005, había más de 70 millones de servidores web. En septiembre de 2007 había más de 135 millones de servidores web.

Blogs

Según Technorati, la cantidad de blogs se duplica aproximadamente cada 6 meses con un total de 35,3 millones de blogs en abril de 2006. Este es un ejemplo de las primeras etapas del crecimiento logístico, donde el crecimiento es aproximadamente exponencial, ya que los blogs son un innovación reciente. A medida que la cantidad de blogs se acerca a la cantidad de posibles productores (humanos), se produce la saturación, el crecimiento disminuye y, finalmente, la cantidad de blogs se estabiliza.

Contenido relacionado

Maricultura

Recuento de referencias

Formato de película

Más resultados...