Minería de datos

La minería de datos es un proceso de extracción y descubrimiento de patrones en grandes conjuntos de datos que involucra métodos en la intersección del aprendizaje automático, las estadísticas y los sistemas de bases de datos. La minería de datos es un subcampo interdisciplinario de la informática y las estadísticas con el objetivo general de extraer información (con métodos inteligentes) de un conjunto de datos y transformar la información en una estructura comprensible para su uso posterior. La minería de datos es el paso de análisis del proceso de "descubrimiento de conocimiento en bases de datos", o KDD. Además del paso de análisis sin procesar, también involucra aspectos de administración de datos y bases de datos, procesamiento previo de datos, consideraciones de modelo e inferencia, métricas de interés, consideraciones de complejidad, procesamiento posterior de estructuras descubiertas, visualización y actualización en línea.

El término "minería de datos" es inapropiado porque el objetivo es la extracción de patrones y conocimiento de grandes cantidades de datos, no la extracción (minería) de datos en sí. También es una palabra de moda y se aplica con frecuencia a cualquier forma de procesamiento de información o datos a gran escala (recopilación, extracción, almacenamiento, análisis y estadísticas), así como a cualquier aplicación de sistema informático de soporte de decisiones, incluida la inteligencia artificial (p. aprendizaje) e inteligencia de negocios. El libro Minería de datos: herramientas y técnicas prácticas de aprendizaje automático con Java (que cubre principalmente material de aprendizaje automático) originalmente se llamaría simplemente Aprendizaje práctico de máquinas y el término minería de datossolo se agregó por razones de marketing. A menudo, los términos más generales (a gran escala) análisis y análisis de datos, o, cuando se refieren a métodos reales, inteligencia artificial y aprendizaje automático, son más apropiados.

La tarea real de minería de datos es el análisis semiautomático o automático de grandes cantidades de datos para extraer patrones interesantes previamente desconocidos, como grupos de registros de datos (análisis de conglomerados), registros inusuales (detección de anomalías) y dependencias (minería de reglas de asociación, minería de patrones secuenciales). Esto generalmente implica el uso de técnicas de bases de datos como índices espaciales. Estos patrones se pueden ver como una especie de resumen de los datos de entrada y se pueden usar en análisis posteriores o, por ejemplo, en aprendizaje automático y análisis predictivo. Por ejemplo, el paso de extracción de datos podría identificar varios grupos en los datos, que luego se pueden usar para obtener resultados de predicción más precisos mediante un sistema de soporte de decisiones. Ni la recopilación de datos, la preparación de datos, ni la interpretación y el informe de resultados son parte del paso de extracción de datos,

It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout. The point of using Lorem Ipsum is that it has a more-or-less normal distribution of letters, as opposed to using 'Content here, content here', making it look like readable English.

You must log in to access this content
Iniciar con Google
Iniciar con Facebook
x