Comparación de grabación analógica y digital
El sonido se puede grabar, almacenar y reproducir mediante técnicas digitales o analógicas. Ambas técnicas introducen errores y distorsiones en el sonido, y estos métodos pueden compararse sistemáticamente. Músicos y oyentes han discutido sobre la superioridad de las grabaciones de sonido digitales frente a las analógicas. Los argumentos a favor de los sistemas analógicos incluyen la ausencia de mecanismos de error fundamentales que están presentes en los sistemas de audio digital, incluido el aliasing y el ruido de cuantificación. Los defensores de lo digital señalan los altos niveles de rendimiento posibles con el audio digital, incluida una excelente linealidad en la banda audible y bajos niveles de ruido y distorsión.
Dos diferencias destacadas en el rendimiento entre los dos métodos son el ancho de banda y la relación señal-ruido (relación S/N). El ancho de banda del sistema digital está determinado, según la frecuencia de Nyquist, por la frecuencia de muestreo utilizada. El ancho de banda de un sistema analógico depende de las capacidades físicas y electrónicas de los circuitos analógicos. La relación S/N de un sistema digital puede estar limitada por la profundidad de bits del proceso de digitalización, pero la implementación electrónica de los circuitos de conversión introduce ruido adicional. En un sistema analógico, existen otras fuentes naturales de ruido analógico, como parpadeo e imperfecciones en el medio de grabación. Otras diferencias de rendimiento son específicas de los sistemas que se comparan, como la capacidad de algoritmos de filtrado más transparentes en los sistemas digitales y la saturación armónica y las variaciones de velocidad de los sistemas analógicos.
Rango dinámico
El rango dinámico de un sistema de audio es una medida de la diferencia entre los valores de amplitud más pequeños y más grandes que se pueden representar en un medio. Lo digital y lo analógico difieren tanto en los métodos de transferencia y almacenamiento, como en el comportamiento exhibido por los sistemas debido a estos métodos.
El rango dinámico de los sistemas de audio digital puede superar el de los sistemas de audio analógico. Las cintas de cassette analógicas de consumo tienen un rango dinámico de 60 a 70 dB. Las transmisiones analógicas de FM rara vez tienen un rango dinámico que supere los 50 dB. El rango dinámico de un disco de vinilo de corte directo puede superar los 70 dB. Las cintas maestras de estudio analógicas pueden tener un rango dinámico de hasta 77 dB. Un LP hecho de diamante perfecto tiene un tamaño de característica atómica de aproximadamente 0,5 nanómetros que, con un tamaño de ranura de 8 micras, produce un rango dinámico teórico de 110 dB. Un LP hecho de vinilo perfecto tendría un rango dinámico teórico de 70 dB. Las mediciones indican el rendimiento real máximo en el rango de 60 a 70 dB. Por lo general, un convertidor de analógico a digital de 16 bits puede tener un rango dinámico de entre 90 y 95 dB, mientras que la relación señal-ruido (aproximadamente el equivalente del rango dinámico, teniendo en cuenta la ausencia de ruido de cuantificación pero la presencia de cinta silbido) de una grabadora de cinta profesional de carrete a carrete de ¼ de pulgada estaría entre 60 y 70 dB en la salida nominal de la grabadora.
Los beneficios de usar grabadoras digitales con una precisión superior a 16 bits se pueden aplicar a los 16 bits de CD de audio. El fundador de Meridian Audio, John Robert Stuart, destaca que con el interpolado correcto, la resolución de un sistema digital es teóricamente infinita y que es posible, por ejemplo, resolver sonidos a −110 dB (por debajo de la escala completa digital) en un canal diseñado de 16 bits.
Condiciones de sobrecarga
Hay algunas diferencias en el comportamiento de los sistemas analógicos y digitales cuando hay señales de alto nivel, donde existe la posibilidad de que dichas señales puedan sobrecargar el sistema. Con señales de alto nivel, la cinta magnética analógica se acerca a la saturación y la respuesta de alta frecuencia cae en proporción a la respuesta de baja frecuencia. Si bien es indeseable, el efecto audible de esto puede ser razonablemente inobjetable. Por el contrario, las grabadoras digitales PCM muestran un comportamiento no benigno en sobrecarga; las muestras que exceden el nivel de cuantización pico simplemente se truncan, recortando la forma de onda directamente, lo que introduce distorsión en forma de grandes cantidades de armónicos de alta frecuencia. En principio, los sistemas digitales PCM tienen el nivel más bajo de distorsión no lineal en toda la amplitud de la señal. Suele ocurrir lo contrario con los sistemas analógicos, donde la distorsión tiende a aumentar a niveles de señal altos. Un estudio de Manson (1980) consideró los requisitos de un sistema de audio digital para una transmisión de alta calidad. Llegó a la conclusión de que un sistema de 16 bits sería suficiente, pero señaló la pequeña reserva que proporcionaba el sistema en condiciones normales de funcionamiento. Por esta razón, se sugirió que un limitador de señal de acción rápida o un 'clipper suave' utilizarse para evitar que el sistema se sobrecargue.
Con muchas grabaciones, las distorsiones de alto nivel en los picos de la señal pueden quedar enmascaradas de forma audible por la señal original, por lo que pueden aceptarse grandes cantidades de distorsión en los niveles de señal pico. La diferencia entre los sistemas analógicos y digitales es la forma de error de señal de alto nivel. Algunos de los primeros convertidores de analógico a digital mostraban un comportamiento no benigno cuando estaban sobrecargados, donde las señales de sobrecarga estaban 'envueltas' de positivo a negativo de escala completa. Los diseños de convertidores modernos basados en la modulación sigma-delta pueden volverse inestables en condiciones de sobrecarga. Por lo general, un objetivo de diseño de los sistemas digitales es limitar las señales de alto nivel para evitar la sobrecarga. Para evitar la sobrecarga, un sistema digital moderno puede comprimir las señales de entrada para que no se pueda alcanzar la escala completa digital.
Degradación física
A diferencia de la duplicación analógica, las copias digitales son réplicas exactas que se pueden duplicar indefinidamente y sin pérdida de generación, en principio. La corrección de errores permite que los formatos digitales toleren un deterioro significativo de los medios, aunque los medios digitales no son inmunes a la pérdida de datos. Los discos compactos CD-R de consumo tienen una vida útil limitada y variable debido a problemas de calidad inherentes y de fabricación.
Con los discos de vinilo, habrá cierta pérdida de fidelidad en cada reproducción del disco. Esto se debe al desgaste de la aguja en contacto con la superficie del disco. Las cintas magnéticas, tanto analógicas como digitales, se desgastan por la fricción entre la cinta y los cabezales, las guías y otras partes del transporte de la cinta a medida que la cinta se desliza sobre ellos. El residuo marrón depositado en los hisopos durante la limpieza de la trayectoria de la cinta de una máquina de cinta son en realidad partículas de revestimiento magnético que se desprenden de las cintas. El síndrome de cobertizo pegajoso es un problema frecuente con las cintas más antiguas. Las cintas también pueden sufrir arrugas, estiramientos y arrugas en los bordes de la base de la cinta de plástico, en particular debido a cubiertas de cinta de baja calidad o desalineadas.
Cuando se reproduce un CD, no hay contacto físico involucrado ya que los datos se leen ópticamente usando un rayo láser. Por lo tanto, no se produce tal deterioro del soporte y, con el cuidado adecuado, el CD sonará exactamente igual cada vez que se reproduzca (descontando el envejecimiento del reproductor y del propio CD); sin embargo, este es un beneficio del sistema óptico, no de la grabación digital, y el formato Laserdisc disfruta del mismo beneficio sin contacto con las señales ópticas analógicas. Los CD se pudren y se degradan lentamente con el tiempo, incluso si se almacenan correctamente y no se reproducen. M-DISC, una tecnología óptica grabable que se comercializa como legible durante 1000 años, está disponible en ciertos mercados, pero a finales de 2020 nunca se ha vendido en formato CD-R. (Sin embargo, el sonido podría almacenarse en un M-DISC DVD-R utilizando el formato DVD-Audio).
Ruido
Para las señales de audio electrónicas, las fuentes de ruido incluyen ruido mecánico, eléctrico y térmico en el ciclo de grabación y reproducción. Se puede cuantificar la cantidad de ruido que un equipo de audio agrega a la señal original. Matemáticamente, esto se puede expresar mediante la relación señal/ruido (SNR o relación S/N). A veces, en su lugar, se cita el rango dinámico máximo posible del sistema.
Con los sistemas digitales, la calidad de la reproducción depende de los pasos de conversión de analógico a digital y de digital a analógico, y no depende de la calidad del medio de grabación, siempre que sea adecuado para retener los valores digitales sin error. Los medios digitales capaces de almacenamiento y recuperación de bits perfectos han sido comunes durante algún tiempo, ya que generalmente se desarrollaron para el almacenamiento de software que no tiene tolerancia al error.
El proceso de conversión de analógico a digital, según la teoría, siempre introducirá distorsión de cuantificación. Esta distorsión se puede representar como ruido de cuantificación no correlacionado mediante el uso de interpolación. La magnitud de este ruido o distorsión está determinada por el número de niveles de cuantificación. En los sistemas binarios, esto se determina y normalmente se expresa en términos del número de bits. Cada bit adicional agrega aproximadamente 6 dB en la SNR posible, p. 24 x 6 = 144 dB para cuantificación de 24 bits, 126 dB para 21 bits y 120 dB para 20 bits. El sistema digital de 16 bits del CD de audio Red Book tiene 216= 65 536 amplitudes de señal posibles, lo que teóricamente permite una SNR de 98 dB.
Retumbar
Rumble es una forma de ruido característico causado por imperfecciones en los cojinetes de los tocadiscos. El plato tiende a tener una pequeña cantidad de movimiento además de la rotación deseada y la superficie del tocadiscos también se mueve hacia arriba, hacia abajo y de lado a lado ligeramente. Este movimiento adicional se agrega a la señal deseada como ruido, generalmente de frecuencias muy bajas, creando un sonido retumbante durante pasajes silenciosos. Los tocadiscos muy económicos a veces usaban rodamientos de bolas, que es muy probable que generen cantidades audibles de ruido. Los tocadiscos más caros tienden a usar cojinetes de manguito masivos, que es mucho menos probable que generen cantidades ofensivas de estruendo. El aumento de la masa del plato giratorio también tiende a reducir el ruido. Un buen tocadiscos debe tener un ruido de al menos 60 dB por debajo del nivel de salida especificado del pick-up. Debido a que no tienen partes móviles en la ruta de la señal, los sistemas digitales no están sujetos a ruidos sordos.
Guau y aleteo
Wow y flutter son un cambio en la frecuencia de un dispositivo analógico y son el resultado de imperfecciones mecánicas. Wow es una forma de aleteo que ocurre a un ritmo más lento. Wow y flutter son más notorios en señales que contienen tonos puros. Para los discos LP, la calidad del tocadiscos tendrá un gran efecto en el nivel de sorpresa y aleteo. Un buen tocadiscos tendrá valores de wow y flutter inferiores al 0,05 %, que es la variación de velocidad con respecto al valor medio. Wow y flutter también pueden estar presentes en la grabación, como resultado del funcionamiento imperfecto de la grabadora. Debido a su uso de osciladores de cristal de precisión para su base de tiempo, los sistemas digitales no están sujetos a wow y flutter.
Respuesta de frecuencia
Para los sistemas digitales, el límite superior de la respuesta de frecuencia está determinado por la frecuencia de muestreo. La elección de la frecuencia de muestreo de la muestra en un sistema digital se basa en el teorema de muestreo de Nyquist-Shannon. Esto establece que una señal muestreada se puede reproducir exactamente siempre que se muestree a una frecuencia mayor que el doble del ancho de banda de la señal, la frecuencia de Nyquist. Por lo tanto, una frecuencia de muestreo de 40 kHz es matemáticamente suficiente para capturar toda la información contenida en una señal que tiene componentes de frecuencia menores o iguales a 20 kHz. El teorema de muestreo también requiere que el contenido de frecuencia por encima de la frecuencia de Nyquist se elimine de la señal antes de muestrearla. Esto se logra utilizando filtros antisolapamiento que requieren una banda de transición para reducir suficientemente el aliasing. El ancho de banda proporcionado por la frecuencia de muestreo de 44 100 Hz utilizada por el estándar para CD de audio es lo suficientemente amplia como para cubrir todo el rango de audición humana, que se extiende aproximadamente de 20 Hz a 20 kHz. Las grabadoras digitales profesionales pueden grabar frecuencias más altas, mientras que algunos sistemas de consumo y de telecomunicaciones graban un rango de frecuencia más restringido.
Algunos fabricantes de cintas analógicas especifican respuestas de frecuencia de hasta 20 kHz, pero es posible que estas mediciones se hayan realizado a niveles de señal más bajos. Los casetes compactos pueden tener una respuesta que se extiende hasta 15 kHz a un nivel de grabación completo (0 dB). En niveles más bajos (−10 dB), los casetes suelen estar limitados a 20 kHz debido al autoborrado del medio de cinta.
La respuesta de frecuencia de un reproductor de LP convencional puede ser de 20 Hz a 20 kHz, ±3 dB. La respuesta de baja frecuencia de los discos de vinilo está restringida por el ruido sordo (descrito anteriormente), así como por las características físicas y eléctricas de todo el conjunto del transductor y el brazo captador. La respuesta de alta frecuencia del vinilo depende del cartucho. Los registros CD4 contenían frecuencias de hasta 50 kHz. Se han reducido experimentalmente frecuencias de hasta 122 kHz en discos LP.
Alias
Los sistemas digitales requieren que todo el contenido de la señal de alta frecuencia por encima de la frecuencia de Nyquist se elimine antes del muestreo, lo que, si no se hace, dará como resultado que estas frecuencias ultrasónicas "se doblen" en frecuencias en el rango audible, produciendo una especie de distorsión llamada aliasing. El aliasing se evita en los sistemas digitales mediante un filtro anti-aliasing. Sin embargo, diseñar un filtro analógico que elimine con precisión todo el contenido de frecuencia exactamente por encima o por debajo de una determinada frecuencia de corte no es práctico. En cambio, generalmente se elige una frecuencia de muestreo que está por encima del requisito de Nyquist. Esta solución se denomina sobremuestreo y permite utilizar un filtro anti-aliasing menos agresivo y de menor costo.
Los primeros sistemas digitales pueden haber sufrido una serie de degradaciones de señal relacionadas con el uso de filtros anti-aliasing analógicos, por ejemplo, dispersión de tiempo, distorsión no lineal, ondulación, dependencia de la temperatura de los filtros, etc. Uso de un diseño de sobremuestreo y delta-sigma modulación, el filtro anti-aliasing analógico menos agresivo se puede complementar con un filtro digital. Este enfoque tiene varias ventajas. Se puede hacer que el filtro digital tenga una función de transferencia casi ideal, con ondulación en banda baja y sin envejecimiento ni deriva térmica.
Los sistemas analógicos no están sujetos al límite de Nyquist ni al aliasing y, por lo tanto, no requieren filtros antialiasing ni ninguna de las consideraciones de diseño asociadas con ellos. En cambio, los límites de los formatos de almacenamiento analógico están determinados por las propiedades físicas de su construcción.
Tasas de muestreo
El audio con calidad de CD se muestrea a 44 100 Hz (frecuencia de Nyquist = 22,05 kHz) y a 16 bits. Muestrear la forma de onda a frecuencias más altas y permitir una mayor cantidad de bits por muestra permite reducir aún más el ruido y la distorsión. DAT puede muestrear audio hasta a 48 kHz, mientras que DVD-Audio puede ser de 96 o 192 kHz y una resolución de hasta 24 bits. Con cualquiera de estas frecuencias de muestreo, la información de la señal se captura por encima de lo que generalmente se considera el rango de audición humana.
Trabajo realizado en 1981 por Muraoka et al. mostró que las señales musicales con componentes de frecuencia superiores a 20 kHz solo se distinguían de las que no las tenían algunos de los 176 sujetos de prueba. Un estudio de percepción realizado por Nishiguchi et al. (2004) concluyeron que "no se encontraron diferencias significativas entre los sonidos con y sin componentes de muy alta frecuencia entre los estímulos sonoros y los sujetos... sin embargo, [Nishiguchi et al] aún no puede confirmar ni negar la posibilidad de que algunos los sujetos podían discriminar entre sonidos musicales con y sin componentes de muy alta frecuencia."
En las pruebas de escucha a ciegas realizadas por Bob Katz en 1996, relatadas en su libro Mastering Audio: The Art and the Science, los sujetos que usaban el mismo equipo de reproducción de alta frecuencia de muestreo no podían discernir ningún sonido audible. diferencia entre material de programa filtrado de forma idéntica para eliminar frecuencias por encima de 20 kHz frente a 40 kHz. Esto demuestra que la presencia o ausencia de contenido ultrasónico no explica la variación auditiva entre frecuencias de muestreo. Él postula que la variación se debe en gran medida al rendimiento de los filtros limitadores de banda en los convertidores. Estos resultados sugieren que el principal beneficio de usar frecuencias de muestreo más altas es que empuja la distorsión de fase consecuente de los filtros limitadores de banda fuera del rango audible y que, en condiciones ideales, las frecuencias de muestreo más altas pueden no ser necesarias. Dunn (1998) examinó el rendimiento de los convertidores digitales para ver si estas diferencias en el rendimiento podían explicarse por los filtros de limitación de banda utilizados en los convertidores y buscando los artefactos que introducen.
Cuantificación
Una señal se registra digitalmente mediante un convertidor de analógico a digital, que mide la amplitud de una señal analógica a intervalos regulares especificados por la frecuencia de muestreo y luego almacena estos números muestreados en el hardware de la computadora. Los números en las computadoras representan un conjunto finito de valores discretos, lo que significa que si una señal analógica se muestrea digitalmente usando métodos nativos (sin interpolación), la amplitud de la señal de audio simplemente se redondeará a la representación más cercana. Este proceso se denomina cuantificación y estos pequeños errores en las mediciones se manifiestan auditivamente como ruido de bajo nivel o distorsión. Se ha señalado que esta forma de distorsión, a veces denominada distorsión granular o de cuantificación, es un defecto de algunos sistemas y grabaciones digitales, en particular de algunas de las primeras grabaciones digitales, en las que se decía que la versión digital era inferior a la versión analógica. Sin embargo, "si la cuantificación se realiza utilizando el tramado correcto, entonces la única consecuencia de la digitalización es efectivamente la adición de un blanco, ruido de fondo no correlacionado, benigno y aleatorio. El nivel del ruido depende del número de bits en el canal."
El rango de valores posibles que una muestra puede representar numéricamente está determinado por la cantidad de dígitos binarios utilizados. Esto se denomina resolución y generalmente se denomina profundidad de bits en el contexto del audio PCM. El nivel de ruido de cuantificación está directamente determinado por este número, disminuyendo exponencialmente (linealmente en unidades de dB) a medida que aumenta la resolución. Con una profundidad de bits adecuada, el ruido aleatorio de otras fuentes dominará y enmascarará completamente el ruido de cuantificación. El estándar de CD Redbook utiliza 16 bits, lo que mantiene el ruido de cuantificación 96 dB por debajo de la amplitud máxima, muy por debajo de un nivel perceptible con casi cualquier material fuente. La adición de interpolación efectiva significa que, en términos prácticos, la resolución está limitada por nuestra capacidad para resolver sonidos en ruido... No tenemos problemas para medir (y escuchar) señales de –110dB en un entorno bien diseñado. dieciséis- canal de bits." DVD-Audio y los equipos de grabación profesionales más modernos permiten muestras de 24 bits.
Los sistemas analógicos no tienen necesariamente niveles digitales discretos en los que se codifica la señal. En consecuencia, la precisión con la que se puede conservar la señal original está limitada por el ruido de fondo intrínseco y el nivel máximo de señal de los medios y el equipo de reproducción.
Cuantificación en medios analógicos
Dado que los medios analógicos están compuestos de moléculas, la estructura microscópica más pequeña representa la unidad de cuantificación más pequeña de la señal grabada. Los procesos naturales de oscilación, como los movimientos térmicos aleatorios de las moléculas, el tamaño distinto de cero del instrumento de lectura y otros efectos de promedio, hacen que el límite práctico sea mayor que el de la característica estructural molecular más pequeña. Un LP teórico compuesto por un diamante perfecto, con un tamaño de ranura de 8 micras y un tamaño de característica de 0,5 nanómetros, tiene una cuantificación similar a una muestra digital de 16 bits.
Dither como solución
Es posible hacer que el ruido de cuantización sea audiblemente benigno mediante la aplicación de interpolación. Para ello, se añade ruido a la señal original antes de la cuantificación. El uso óptimo de dither tiene el efecto de hacer que el error de cuantificación sea independiente de la señal y permite que la información de la señal se retenga por debajo del bit menos significativo del sistema digital.
Los algoritmos de interpolación también suelen tener la opción de emplear algún tipo de modelado de ruido, que lleva la frecuencia de gran parte del ruido de interpolación a áreas que son menos audibles para los oídos humanos, lo que reduce el nivel de ruido de fondo aparente para el oyente.
La interpolación se suele aplicar durante la masterización antes de la reducción de profundidad de bits final y también en varias etapas de DSP.
Fractuación de tiempo
Un aspecto que puede degradar el rendimiento de un sistema digital es el jitter. Este es el fenómeno de las variaciones en el tiempo de lo que debería ser el espaciado correcto de muestras discretas de acuerdo con la frecuencia de muestreo. Esto puede deberse a imprecisiones de tiempo del reloj digital. Idealmente, un reloj digital debería producir un pulso de tiempo exactamente a intervalos regulares. Otras fuentes de fluctuación dentro de los circuitos electrónicos digitales son la fluctuación inducida por datos, en la que una parte del flujo digital afecta a una parte posterior a medida que fluye a través del sistema, y la fluctuación inducida por la fuente de alimentación, en la que el ruido de la fuente de alimentación provoca irregularidades en la sincronización de señales en los circuitos que alimenta.
La precisión de un sistema digital depende de los valores de amplitud muestreados, pero también depende de la regularidad temporal de estos valores. Las versiones analógicas de esta dependencia temporal se conocen como error de tono y wow-and-flutter.
El jitter periódico produce ruido de modulación y se puede considerar como el equivalente del flutter analógico. La fluctuación aleatoria altera el ruido de fondo del sistema digital. La sensibilidad del convertidor a la fluctuación de fase depende del diseño del convertidor. Se ha demostrado que una fluctuación aleatoria de 5 ns puede ser significativa para los sistemas digitales de 16 bits.
En 1998, Benjamin y Gannon investigaron la audibilidad del jitter mediante pruebas auditivas. Descubrieron que el nivel más bajo de inestabilidad audible era de alrededor de 10 ns (rms). Esto fue en una señal de prueba de onda sinusoidal de 17 kHz. Con la música, ningún oyente encontró fluctuaciones audibles a niveles inferiores a 20 ns. Un artículo de Ashihara et al. (2005) intentaron determinar los umbrales de detección de fluctuaciones aleatorias en señales musicales. Su método involucró pruebas de escucha ABX. Al discutir sus resultados, los autores comentaron que:
Hasta el momento, el jitter real en los productos de consumo parece ser demasiado pequeño para ser detectado por lo menos para la reproducción de señales de música. No está claro, sin embargo, si los umbrales de detección obtenidos en el presente estudio representarían realmente el límite de la resolución auditiva o se limitaría a la resolución del equipo. Las distorsiones debidas a los pequeños jitters pueden ser más pequeñas que las distorsiones debido a las características no lineales de los altavoces. Ashihara y Kiryu [8] evaluaron la linealidad de altavoces y auriculares. Según su observación, los auriculares parecen ser más preferibles para producir suficiente presión de sonido en los tambores del oído con distorsiones más pequeñas que los altavoces.
Procesamiento de señales
Después de la grabación inicial, es común que la señal de audio se altere de alguna manera, como con el uso de compresión, ecualización, retrasos y reverberación. Con lo analógico, esto viene en forma de componentes de hardware externos, y con lo digital, lo mismo se logra típicamente con complementos en una estación de trabajo de audio digital (DAW).
Una comparación de filtrado analógico y digital muestra las ventajas técnicas de ambos métodos. Los filtros digitales son más precisos y flexibles. Los filtros analógicos son más simples, pueden ser más eficientes y no introducen latencia.
Hardware analógico
Al alterar una señal con un filtro, la señal emitida puede diferir en el tiempo de la señal en la entrada, que se mide como su respuesta de fase. Todos los ecualizadores analógicos exhiben este comportamiento, con la cantidad de cambio de fase que difiere en algún patrón y se centra alrededor de la banda que se está ajustando. Aunque este efecto altera la señal de una manera distinta a un cambio estricto en la respuesta de frecuencia, por lo general no es objetable para los oyentes.
Filtros digitales
Debido a que las variables involucradas pueden especificarse con precisión en los cálculos, los filtros digitales pueden funcionar objetivamente mejor que los componentes analógicos. Otros procesos, como el retardo y la mezcla, se pueden realizar exactamente.
Los filtros digitales también son más flexibles. Por ejemplo, el ecualizador de fase lineal no introduce un cambio de fase dependiente de la frecuencia. Este filtro puede implementarse digitalmente usando un filtro de respuesta de impulso finito pero no tiene una implementación práctica usando componentes analógicos.
Una ventaja práctica del procesamiento digital es la recuperación más conveniente de la configuración. Los parámetros de los complementos se pueden almacenar en la computadora, mientras que los detalles de los parámetros en una unidad analógica deben escribirse o registrarse si la unidad necesita ser reutilizada. Esto puede ser engorroso cuando las mezclas completas deben recuperarse manualmente usando una consola analógica y un equipo externo. Cuando se trabaja digitalmente, todos los parámetros pueden almacenarse simplemente en un archivo de proyecto DAW y recuperarse al instante. La mayoría de los DAW profesionales modernos también procesan complementos en tiempo real, lo que significa que el procesamiento puede ser en gran medida no destructivo hasta la mezcla final.
Modelado analógico
Ahora existen muchos complementos que incorporan modelado analógico. Hay ingenieros de audio que los avalan y sienten que se comparan por igual en sonido con los procesos analógicos que imitan. El modelado analógico tiene algunos beneficios sobre sus contrapartes analógicas, como la capacidad de eliminar el ruido de los algoritmos y las modificaciones para hacer que los parámetros sean más flexibles. Por otro lado, otros ingenieros también sienten que el modelado sigue siendo inferior a los componentes externos genuinos y aún prefieren mezclar "fuera de la caja".
Calidad de sonido
Evaluación subjetiva
La evaluación subjetiva intenta medir el rendimiento de un componente de audio según el oído humano. La forma más común de prueba subjetiva es una prueba de escucha, donde el componente de audio simplemente se usa en el contexto para el que fue diseñado. Esta prueba es popular entre los revisores de alta fidelidad, donde el revisor utiliza el componente durante un período de tiempo y luego describe el rendimiento en términos subjetivos. Las descripciones comunes incluyen si el componente tiene un sonido brillante o cálido, o qué tan bien el componente logra presentar una imagen espacial.
Otro tipo de prueba subjetiva se realiza en condiciones más controladas e intenta eliminar posibles sesgos de las pruebas de escucha. Este tipo de pruebas se realizan con el componente oculto al oyente y se denominan pruebas ciegas. Para evitar un posible sesgo de la persona que ejecuta la prueba, la prueba ciega se puede realizar para que esta persona también desconozca el componente que se está probando. Este tipo de prueba se llama prueba doble ciego. Este tipo de prueba se usa a menudo para evaluar el rendimiento de la compresión de audio con pérdida.
Los críticos de las pruebas doble ciego ven que no permiten que el oyente se sienta completamente relajado al evaluar el componente del sistema y, por lo tanto, no pueden juzgar las diferencias entre los diferentes componentes tan bien como las pruebas a simple vista (no ciegas). Aquellos que emplean el método de prueba doble ciego pueden tratar de reducir el estrés del oyente al permitir una cierta cantidad de tiempo para el entrenamiento del oyente.
Primeras grabaciones digitales
Las primeras máquinas de audio digital tenían resultados decepcionantes, con convertidores digitales que introducían errores que el oído podía detectar. Las compañías discográficas lanzaron sus primeros LP basados en masters de audio digital a fines de la década de 1970. Los CD estuvieron disponibles a principios de la década de 1980. En ese momento, la reproducción de sonido analógico era una tecnología madura.
Hubo una respuesta crítica mixta a las primeras grabaciones digitales lanzadas en CD. En comparación con el disco de vinilo, se notó que el CD revelaba mucho más la acústica y el ruido ambiental de fondo del entorno de grabación. Por esta razón, las técnicas de grabación desarrolladas para discos analógicos, por ejemplo, la ubicación del micrófono, debían adaptarse para adaptarse al nuevo formato digital.
Algunas grabaciones analógicas fueron remasterizadas para formatos digitales. Las grabaciones analógicas realizadas con la acústica natural de una sala de conciertos tendían a beneficiarse de la remasterización. El proceso de remasterización fue criticado ocasionalmente por estar mal manejado. Cuando la grabación analógica original era bastante brillante, la remasterización a veces daba como resultado un énfasis de agudos poco natural.
Super Audio CD y DVD-Audio
El formato Super Audio CD (SACD) fue creado por Sony y Philips, quienes también fueron los desarrolladores del anterior formato de CD de audio estándar. SACD utiliza Direct Stream Digital (DSD) basado en la modulación delta-sigma. Con esta técnica, los datos de audio se almacenan como una secuencia de valores de amplitud fija (es decir, 1 bit) a una frecuencia de muestreo de 2,884 MHz, que es 64 veces la frecuencia de muestreo de 44,1 kHz utilizada por un CD. En cualquier momento, la amplitud de la señal analógica original está representada por la densidad de 1's o 0's en el flujo de datos. Por lo tanto, este flujo de datos digitales se puede convertir en analógico pasándolo a través de un filtro de paso bajo analógico.
El formato DVD-Audio utiliza PCM lineal estándar a frecuencias de muestreo y profundidades de bits variables, que como mínimo igualan y, por lo general, superan con creces las del audio de CD estándar (16 bits, 44,1 kHz).
En la popular prensa de alta fidelidad, se sugirió que PCM lineal "crea [una] reacción de estrés en las personas", y que DSD "es el único sistema de grabación digital que no [...] tener estos efectos". Esta afirmación parece tener su origen en un artículo de 1980 del Dr. John Diamond. El núcleo de la afirmación de que las grabaciones PCM (la única técnica de grabación digital disponible en ese momento) creaba una reacción de estrés se basaba en el uso de la técnica pseudocientífica de la kinesiología aplicada, por ejemplo, por el Dr. Diamond en una presentación de la 66ª Convención AES (1980) con el mismo título. Diamond había utilizado anteriormente una técnica similar para demostrar que la música rock (a diferencia de la clásica) era mala para la salud debido a la presencia del "ritmo anápsico detenido". Las afirmaciones de Diamond con respecto al audio digital fueron retomadas por Mark Levinson, quien afirmó que mientras las grabaciones PCM provocaban una reacción de estrés, las grabaciones DSD no. Sin embargo, una prueba subjetiva doble ciego entre PCM lineal de alta resolución (DVD-Audio) y DSD no reveló una diferencia estadísticamente significativa. Los oyentes involucrados en esta prueba notaron su gran dificultad para escuchar cualquier diferencia entre los dos formatos.
Preferencia analógica
El renacimiento del vinilo se debe en parte a la imperfección del audio analógico, que añade "calidez". Algunos oyentes prefieren ese audio al de un CD. El fundador y editor Harry Pearson de la revista The Absolute Sound dice que "los LP son decididamente más musicales. Los CD drenan el alma de la música. La implicación emocional desaparece". El productor de doblaje Adrian Sherwood tiene sentimientos similares sobre la cinta de casete analógica, que él prefiere debido a que es 'más cálida'. sonido.
Aquellos que están a favor del formato digital señalan los resultados de las pruebas a ciegas, que demuestran el alto rendimiento posible con las grabadoras digitales. La afirmación es que el "sonido analógico" es más un producto de las imprecisiones del formato analógico que cualquier otra cosa. Uno de los primeros y mayores defensores del audio digital fue el director de orquesta clásico Herbert von Karajan, quien dijo que la grabación digital era "definitivamente superior a cualquier otra forma de grabación que conozcamos". También fue pionero en el fracasado Digital Compact Cassette y dirigió la primera grabación que se lanzó comercialmente en CD: Eine Alpensinfonie de Richard Strauss. Los analistas musicales también cuestionaron la percepción de que el audio analógico es demostrablemente superior luego de las revelaciones de que el sello de audiófilos Mobile Fidelity Sound Lab había estado usando de manera encubierta archivos Direct Stream Digital para producir lanzamientos de vinilo comercializados como provenientes de cintas maestras analógicas, con el abogado y audiófilo Randy. Braun afirmando que "Estas personas que afirman tener oídos dorados y pueden escuchar la diferencia entre analógico y digital, bueno, resulta que ustedes no pudieron'."
Sistemas híbridos
Si bien las palabras audio analógico generalmente implican que el sonido se describe utilizando un enfoque de señal continua, y las palabras audio digital implican un enfoque discreto, existen métodos de codificación audio que caen en algún lugar entre los dos. De hecho, todos los sistemas analógicos muestran un comportamiento discreto (cuantificado) a escala microscópica. Si bien los discos de vinilo y los casetes compactos comunes son medios analógicos y utilizan métodos de codificación física casi lineales (por ejemplo, profundidad de ranura en espiral, intensidad del campo magnético de la cinta) sin cuantización o alias notables, existen sistemas no lineales analógicos que muestran efectos similares a los que se encuentran en los digitales, como aliasing y "hard" pisos dinámicos (por ejemplo, audio de alta fidelidad modulado en frecuencia en cintas de video, señales codificadas PWM).
Contenido relacionado
Disco compacto
AIBO
AGM-114 Infierno