Análisis forense de datos

Compartir Imprimir Citar

El análisis forense de datos (FDA) es una rama del análisis forense digital. Examina datos estructurados con respecto a incidentes de delitos financieros. El objetivo es descubrir y analizar patrones de actividades fraudulentas. Los datos de los sistemas de aplicaciones o de sus bases de datos subyacentes se denominan datos estructurados.

Los datos no estructurados, por el contrario, se toman de aplicaciones de oficina y comunicación o de dispositivos móviles. Estos datos no tienen una estructura general y su análisis implica aplicar palabras clave o mapear patrones de comunicación. El análisis de datos no estructurados generalmente se conoce como informática forense.

Metodología

El análisis de grandes volúmenes de datos generalmente se realiza en un sistema de base de datos separado administrado por el equipo de análisis. Los sistemas en vivo generalmente no están dimensionados para ejecutar un análisis individual extenso sin afectar a los usuarios habituales. Por otro lado, metódicamente es preferible analizar copias de datos en sistemas separados y proteger a los equipos de análisis contra la acusación de alterar los datos originales.

Debido a la naturaleza de los datos, el análisis se centra más a menudo en el contenido de los datos que en la base de datos en la que se encuentran. Si la base de datos en sí es de interés, se aplica el análisis forense de la base de datos.

Para analizar grandes conjuntos de datos estructurados con la intención de detectar delitos financieros, se necesitan al menos tres tipos de experiencia en el equipo: un analista de datos para realizar los pasos técnicos y escribir las consultas, un miembro del equipo con amplia experiencia en los procesos y controles internos en el área relevante de la empresa investigada y un científico forense que esté familiarizado con los patrones de comportamiento fraudulento.

Después de una fase inicial de análisis utilizando métodos de análisis exploratorio de datos, la fase siguiente suele ser muy iterativa. Comenzando con una hipótesis sobre cómo el perpetrador podría haber creado una ventaja personal, los datos se analizan para obtener evidencia de respaldo. Después de eso, la hipótesis se refina o se descarta.

La combinación de diferentes bases de datos, en particular datos de diferentes sistemas o fuentes, es muy eficaz. Estas fuentes de datos son desconocidas para el perpetrador o tales que no pueden ser manipuladas por el perpetrador posteriormente.

La visualización de datos se utiliza a menudo para mostrar los resultados.