Análisis forense de audio

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

El análisis forense de audio es el campo de la ciencia forense relacionado con la adquisición, el análisis y la evaluación de grabaciones de sonido que, en última instancia, pueden presentarse como prueba admisible en un tribunal de justicia o en algún otro lugar oficial.

La evidencia forense de audio puede provenir de una investigación criminal realizada por la policía o como parte de una investigación oficial sobre un accidente, fraude, acusación de difamación o algún otro incidente civil.

Los aspectos principales del análisis forense de audio son el establecimiento de la autenticidad de la evidencia de audio, la mejora de las grabaciones de audio para mejorar la inteligibilidad del habla y la audibilidad de los sonidos de bajo nivel, y la interpretación y documentación de la evidencia sónica, como la identificación de los hablantes, la transcripción del diálogo y la reconstrucción del crimen. o escenas de accidentes y líneas de tiempo.

El análisis forense de audio moderno hace un uso extensivo del procesamiento de señales digitales, y el uso anterior de filtros analógicos ahora está obsoleto. Se utilizan ampliamente técnicas como el filtrado adaptativo y las transformadas discretas de Fourier. Los avances recientes en técnicas forenses de audio incluyen biometría de voz y análisis de frecuencia de redes eléctricas.

Historia

La posibilidad de realizar análisis forenses de audio depende de la disponibilidad de grabaciones de audio realizadas fuera de los límites de un estudio de grabación. Las primeras grabadoras portátiles de cinta magnética aparecieron en la década de 1950 y pronto estos dispositivos se utilizaron para obtener grabaciones clandestinas de entrevistas y escuchas telefónicas, así como para grabar interrogatorios.

El primer caso legal que invocó las técnicas forenses de audio en los tribunales federales de EE. UU. fue el caso Estados Unidos contra McKeever, que tuvo lugar en la década de 1950. Por primera vez, se le pidió al juez del caso McKeever que determinara la admisibilidad legal de la conversación grabada que involucraba al acusado.

La Oficina Federal de Investigaciones (FBI) de EE. UU. comenzó a implementar el análisis forense de audio y la mejora de audio a principios de la década de 1960.

El campo del análisis forense de audio se estableció principalmente en 1973 durante el escándalo de Watergate. Un tribunal federal encargó a un panel de ingenieros de audio que investigara las brechas en las cintas Watergate del presidente Nixon, que eran grabaciones secretas que hizo el presidente estadounidense Richard Nixon mientras estaba en el cargo. La sonda encontró nueve secciones separadas de una cinta vital que habían sido borradas. El informe dio lugar a nuevas técnicas para analizar la cinta magnética.

Autenticidad

Una grabación de audio digital puede presentar muchos desafíos para la evaluación de la autenticidad. El análisis de autenticidad de las grabaciones de audio digital se basa en los rastros que quedan dentro de la grabación durante el proceso de grabación y en otras operaciones de edición posteriores. El primer objetivo del análisis es detectar e identificar cuáles de estos rastros se pueden recuperar de la grabación de audio y documentar sus propiedades. En un segundo paso, se analizan las propiedades de las huellas recuperables para determinar si apoyan o se oponen a la hipótesis de que se ha modificado la grabación.

Para acceder a la autenticidad de la evidencia de audio, el examinador necesita varios tipos de observación, como: verificar la capacidad de grabación, el formato de grabación, revisar el historial del documento, escuchar el audio completo.

Los métodos para acceder a la integridad del audio digital se pueden dividir en dos categorías principales:

Técnica basada en contenedores
Técnica basada en el contenido

Análisis de contenedores

El análisis de contenedores consta de cálculo HASH, MAC y análisis de formato de archivo.

Análisis hash: una cadena de caracteres única se deriva de los bits y bytes del archivo de audio y se calcula mediante una función hash derivada matemáticamente. Estos pueden ser útiles para verificar que no se hayan producido modificaciones en un archivo desde el momento en que se realiza su cálculo HASH hasta la siguiente instancia de cálculo HASH.
Sellos de tiempo MAC: Mediante los sellos de tiempo MAC el examinador puede detectar la fecha y hora de creación del archivo y de sus modificaciones, así como su hora de último acceso . Los sellos de tiempo MAC son generados por el enclavamiento del sistema digital, pero esto puede corromperse mediante una operación de copia/transferencia o mediante operaciones de edición.
Formato de archivo: análisis de algunos parámetros de audio incrustados en el formato de audio (códec, frecuencia de muestreo, profundidad de bits, etc.).
Encabezado: los científicos pueden detectar un cambio en la grabación utilizando la información del encabezado del formato de archivo . Según el dispositivo y la marca, puede haber información sobre el modelo, el número de serie, la versión del firmware, la hora, la fecha y la duración de la grabación (según lo determinado por la configuración del reloj interno). Es útil anotar las marcas de tiempo y compararlas con la fecha y la hora que afirman los encargados del registro en cuanto a cuándo se realizó el archivo.
Datos hexadecimales: los datos digitales sin procesar del archivo pueden contener información útil que se puede examinar en un lector hexadecimal con un visor de caracteres ASCII. Es posible que se muestren direcciones de bloque de información de audio, títulos de software externo, operaciones de posprocesamiento y otra información útil.

Análisis de contenido

El análisis de contenido es la parte central del proceso de análisis forense digital y se basa en el contenido del archivo de audio para encontrar rastros de manipulación y operaciones de procesamiento anti-forense. Las técnicas forenses de audio basadas en contenido se pueden dividir en las siguientes categorías:

Frecuencia de red eléctrica (ENF)
Firma ambiente acústico

La ENF

Artículo principal: análisis de frecuencia de red eléctrica

La frecuencia de la red eléctrica es uno de los análisis forenses de audio más confiables y robustos.

Todos los dispositivos de grabación digital son sensibles a la frecuencia inducida de la fuente de alimentación a 50 o 60 Hz, lo que a su vez proporciona una firma de forma de onda identificable dentro de la grabación. Esto se aplica tanto a las unidades alimentadas por la red eléctrica como a los dispositivos portátiles cuando estos últimos se utilizan cerca de cables de transmisión o equipos alimentados por la red eléctrica.

El vector de características ENF se obtiene mediante un filtrado de paso de banda entre el rango de 49‑51 Hz, sin volver a muestrear el archivo de audio, para separar la forma de onda ENF de la grabación original. Luego, los resultados se trazan y analizan en la base de datos proporcionada por el proveedor de energía para probar o refutar la integridad de la grabación, lo que proporciona una autenticación probatoria y científica del material en análisis.

La firma del entorno acústico

Artículo principal: Firma acústica

Una grabación de audio suele ser una combinación de múltiples señales acústicas, como: fuentes directas, señales o reflejos indirectos, fuentes secundarias y ruido ambiental. Las señales indirectas, las fuentes secundarias y el ruido ambiental se utilizan para caracterizar un entorno acústico. El trabajo duro es extrapolar las señales acústicas de la grabación de audio.

La identificación del entorno acústico dinámico (AEI) se puede calcular utilizando una estimación de la reverberación y el ruido de fondo.

Mejora de audio

La mejora de audio es un proceso forense que tiene como objetivo mejorar la inteligibilidad del archivo de audio eliminando y limpiando el ruido no deseado de una grabación que de otro modo sería ininteligible.

Los científicos forenses intentan eliminar estos ruidos sin afectar la información original presente en el archivo de audio. La mejora permite obtener una mejor inteligibilidad del expediente, que puede ser crucial para determinar la participación o no de una persona en un delito.

El núcleo del análisis de mejora de audio es detectar problemas de ruido y extraerlo del archivo original. De hecho, si el ruido puede someterse a ingeniería inversa de algún modo, puede explotarse e investigarse para permitir su posterior eliminación o atenuación.

Los objetivos de la mejora de audio forense son:

Aumentar la precisión en las transcripciones
Disminuir la fatiga de los oyentes
Aumentar la inteligibilidad del habla
Aumentar SNR

El primer paso del proceso de mejora de audio es la escucha crítica: se revisa la grabación completa para formular una estrategia forense sólida. La creación de clones de la grabación de audio es fundamental, ya que nunca se trabaja sobre la grabación maestra para tener el archivo original y poder compararlo. A lo largo de todo el proceso de mejora, el original se compara constantemente con la grabación original sin procesar, lo que evita el procesamiento excesivo y los problemas de preferencia que pueden surgir más adelante en una prueba. Seguir las pautas y los procedimientos de trabajo permite que un especialista diferente logre los mismos resultados utilizando el mismo procesamiento.

Podemos dividir el sonido de interferencia en dos categorías: ruido estacionario o ruido variable en el tiempo.

El ruido estacionario tiene un carácter consistente, como un gemido, zumbido, retumbo o silbido continuo. Suponga que el ruido estacionario ocupa un rango de frecuencia que difiere de las señales de interés, como una grabación de voz con un retumbar constante en el rango de frecuencia por debajo de 100 Hz. En ese caso, puede ser posible aplicar un filtro fijo, como un filtro de paso de banda, para pasar aproximadamente el ancho de banda del habla. Por lo general, el ancho de banda del habla oscila entre 250 Hz y 4 kHz. En caso de que el ancho de banda del ruido estacionario ocupe el mismo rango de frecuencia de la señal deseada, un filtro de separación simple no será útil. Sin embargo, aún puede ser posible aplicar la ecualización para mejorar la audibilidad/inteligibilidad de la señal deseada.

Las fuentes de ruido variable en el tiempo generalmente requieren un procesamiento más complicado que las fuentes de ruido estacionarias y, a menudo, no se suprimen de manera efectiva.

Método de mejora

La mejora de audio se realiza con métodos de dominio de tiempo, control automático de ganancia y dominio de frecuencia, filtros selectivos de frecuencia y sustracción espectral.

Control de ganancia automática

La mejora en el dominio del tiempo suele implicar ajustes de ganancia para normalizar la envolvente de amplitud de la señal de audio grabada. Por lo general, se utiliza la técnica de control automático de ganancia, o la técnica de compresión/expansión de ganancia, que trata de alcanzar un nivel de sonido constante durante la reproducción: las partes de la grabación relacionadas únicamente con el ruido se hacen más silenciosas, los pasajes de señal de baja amplitud se amplifican y se vuelven más fuertes. pasajes se atenúan o se dejan solos.

Un enfoque común es aplicar una puerta de ruido o un proceso de silenciamiento en la señal ruidosa. La puerta de ruido se puede realizar como un dispositivo electrónico diseñado para este propósito, o puede ser un software para procesar con una computadora. La puerta de ruido compara el nivel de tiempo corto de su señal de entrada con un umbral de nivel predeterminado. Si el nivel de la señal está por encima del umbral, la puerta se abre y la señal pasa; de lo contrario, si el nivel de la señal está por debajo del umbral, la puerta se cierra y la señal no puede pasar. El papel del examinador es ajustar el nivel de umbral para que el habla pueda pasar a través de la puerta mientras se bloquea la señal de ruido que se produce en las partes de silencio. Una puerta de ruido puede ayudar al oyente a comprender una señal que se percibe como menos ruidosa porque el sonido de fondo se desactiva durante las pausas de la conversación. Sin embargo, la puerta de ruido en su versión simple no puede reducir el nivel de ruido y simultáneamente aumentar la señal cuando ambos están presentes al mismo tiempo y la puerta está abierta.

Luego existen también sistemas de puerta de ruido más avanzados que aprovechan algunas técnicas de procesamiento de señales digitales para ejecutar una separación de puerta en diferentes bandas de frecuencia. Estos sistemas avanzados ayudan al examinador a eliminar tipos particulares de ruido y silbidos presentes en la grabación de audio.

Filtros selectivos de frecuencia

Los filtros selectivos de frecuencia es una técnica que opera en el dominio de la frecuencia. El principio detrás de esta técnica es mejorar la calidad de una grabación mediante la atenuación selectiva de los componentes tonales en el espectro, como zumbidos y zumbidos relacionados con la potencia. El uso de un ecualizador de audio multibanda también puede ser útil para reducir el ruido fuera de banda y al mismo tiempo conservar la banda de frecuencia de interés, como el rango de frecuencia del habla.

Resta espectral

La sustracción espectral es una técnica de procesamiento de señales digitales en la que se estima un espectro de ruido a corto plazo a partir de un cuadro y luego se lo resta del espectro de cuadros cortos de la señal de entrada ruidosa. El espectro obtenido después de la resta se usa para reconstruir el marco de ruido reducido de la señal de salida. El proceso continúa para los cuadros subsiguientes para crear la señal de salida completa a través de un procedimiento de superposición y adición.

La eficacia de la sustracción espectral se basa en la capacidad de estimar el espectro de ruido. La estimación generalmente se obtiene de un marco de señal de entrada que se sabe que contiene solo el ruido de fondo, como una pausa entre oraciones en una conversación grabada. Los métodos de reducción de ruido más sofisticados combinan los conceptos de detección de nivel en el dominio del tiempo y sustracción espectral en el dominio de la frecuencia. Se utilizan reglas y modelos de señal adicionales para separar los componentes de la señal que probablemente sean parte de la señal deseada de aquellos que probablemente sean ruido aditivo.

Interpretación

Después de la autenticación y mejora, el archivo de audio examinado debe evaluarse e interpretarse para determinar su importancia para la investigación.

Por ejemplo, en el caso de una grabación de voz, esto significa preparar una transcripción del contenido de audio, identificar a los hablantes, interpretar los sonidos de fondo, etc.

En 2009, la Academia Nacional de Ciencias de EE. UU. (NAS) publicó un informe titulado Fortalecimiento de la ciencia forense en los Estados Unidos: un camino a seguir. El informe fue muy crítico con las muchas áreas de la ciencia forense, incluido el análisis forense de audio, que tradicionalmente se ha basado en el análisis y la comparación subjetivos.

La importancia y confiabilidad de las pruebas forenses dependen de una variedad de contribuciones a una investigación. Casi siempre está presente cierto nivel de incertidumbre, porque generalmente la evidencia forense de audio se interpreta con consideraciones objetivas y subjetivas.

Mientras que en un estudio científico la incertidumbre se puede medir con algunos indicadores, y el análisis continuo puede proporcionar información adicional en el futuro, un examen forense no suele estar sujeto a una revisión continua. El juicio debe hacerse en el momento en que se escucha el caso, por lo que el tribunal debe sopesar las diversas pruebas y evaluar cualquier nivel de duda que pueda haber.

Contenido relacionado

Más resultados...