Codificación de audio avanzada
Codificación de audio avanzada (AAC) es un estándar de codificación de audio para la compresión de audio digital con pérdida. Diseñado para ser el sucesor del formato MP3, AAC generalmente logra una calidad de sonido superior a la de los codificadores MP3 con la misma tasa de bits.
AAC ha sido estandarizado por ISO e IEC como parte de las especificaciones MPEG-2 y MPEG-4. Parte de AAC, HE-AAC ("AAC+"), forma parte de MPEG-4 Audio y se adopta en los estándares de radio digital DAB+ y Digital Radio Mondiale, y en los estándares de televisión móvil DVB-H y ATSC- M/H.
AAC admite la inclusión de 48 canales de audio de ancho de banda completo (hasta 96 kHz) en una transmisión más 16 canales de efectos de baja frecuencia (LFE, limitado a 120 Hz), hasta 16 canales de "acoplamiento" o canales de diálogo y hasta 16 flujos de datos. La calidad del estéreo es satisfactoria para requisitos modestos a 96 kbit/s en modo estéreo conjunto; sin embargo, la transparencia de alta fidelidad exige velocidades de datos de al menos 128 kbit/s (VBR). Las pruebas de audio MPEG-4 han demostrado que AAC cumple con los requisitos denominados "transparente" para la UIT a 128 kbit/s para estéreo y 320 kbit/s para audio 5.1. AAC usa solo un algoritmo de transformada de coseno discreto modificado (MDCT), lo que le otorga una mayor eficiencia de compresión que MP3, que usa un algoritmo de codificación híbrido que es en parte MDCT y en parte FFT.
AAC es el formato de audio predeterminado o estándar para iPhone, iPod, iPad, Nintendo DSi, Nintendo 3DS, YouTube Music, Apple Music, iTunes, DivX Plus Web Player, PlayStation 4 y varios teléfonos Nokia Serie 40. Es compatible con una amplia gama de dispositivos y software, como PlayStation Vita, Wii, reproductores de audio digital como Sony Walkman o SanDisk Clip, dispositivos Android y BlackBerry, varios sistemas de audio integrados en el automóvil y también es uno de los formatos de audio utilizados. en el reproductor web de Spotify.
Historia
Antecedentes
La transformada de coseno discreta (DCT), un tipo de codificación de transformada para la compresión con pérdida, fue propuesta por Nasir Ahmed en 1972 y desarrollada por Ahmed con T. Natarajan y K. R. Rao en 1973, publicando sus resultados en 1974. Esto llevó al desarrollo de la transformada de coseno discreta modificada (MDCT), propuesta por J. P. Princen, A. W. Johnson y A. B. Bradley en 1987, siguiendo el trabajo anterior de Princen y Bradley en 1986. El estándar de codificación de audio MP3 introducido en 1994 utilizó un algoritmo de codificación híbrido que es parte MDCT y parte FFT. AAC utiliza un algoritmo puramente MDCT, lo que le otorga una mayor eficiencia de compresión que MP3. El desarrollo avanzó aún más cuando Lars Liljeryd introdujo un método que redujo radicalmente la cantidad de información necesaria para almacenar la forma digitalizada de una canción o un discurso.
AAC se desarrolló con la cooperación y las contribuciones de empresas como Bell Labs, Fraunhofer IIS, Dolby Laboratories, LG Electronics, NEC, NTT Docomo, Panasonic, Sony Corporation, ETRI, JVC Kenwood, Philips, Microsoft y NTT. Fue declarado oficialmente estándar internacional por el Grupo de expertos en imágenes en movimiento en abril de 1997. Se especifica como Parte 7 del estándar MPEG-2 y Subparte 4 en la Parte 3 del estándar MPEG. -4 estándar.
Estandarización
En 1997, AAC se introdujo por primera vez como MPEG-2 Parte 7, conocido formalmente como ISO/IEC 13818-7:1997. Esta parte de MPEG-2 era una parte nueva, ya que MPEG-2 ya incluía MPEG-2 Parte 3, conocida formalmente como ISO/IEC 13818-3: MPEG-2 BC (Compatible con versiones anteriores). Por lo tanto, MPEG-2 Parte 7 también se conoce como MPEG-2 NBC (Non-Backward Compatible), porque no es compatible con los formatos de audio MPEG-1 (MP1, MP2 y MP3).
MPEG-2 Parte 7 definió tres perfiles: perfil Baja complejidad (AAC-LC / LC-AAC), perfil Principal (AAC Main) y Perfil de tasa de muestreo escalable (AAC-SSR). El perfil AAC-LC consta de un formato base muy parecido al formato de codificación de codificación de audio perceptual (PAC) de AT&T, con la adición de modelado de ruido temporal (TNS), la ventana Kaiser (descrita a continuación), un cuantificador no uniforme, y una reelaboración del formato de flujo de bits para manejar hasta 16 canales estéreo, 16 canales mono, 16 canales de efectos de baja frecuencia (LFE) y 16 canales de comentarios en un flujo de bits. El perfil Principal agrega un conjunto de predictores recursivos que se calculan en cada toque del banco de filtros. El SSR utiliza un banco de filtros PQMF de 4 bandas, con cuatro bancos de filtros más cortos a continuación, para permitir tasas de muestreo escalables.
En 1999, MPEG-2 Parte 7 se actualizó y se incluyó en la familia de estándares MPEG-4 y se conoció como MPEG-4 Parte 3, MPEG-4 Audio o ISO/IEC 14496-3:1999. Esta actualización incluyó varias mejoras. Una de estas mejoras fue la adición de Tipos de objetos de audio que se utilizan para permitir la interoperabilidad con una amplia gama de otros formatos de audio como TwinVQ, CELP, HVXC, Text-To-Speech Interface y MPEG-4. audio estructurado. Otra adición notable en esta versión del estándar AAC es Sustitución de ruido perceptual (PNS). En ese sentido, los perfiles AAC (perfiles AAC-LC, AAC Main y AAC-SSR) se combinan con la sustitución de ruido perceptivo y se definen en el estándar de audio MPEG-4 como Audio Object Types. Los tipos de objetos de audio MPEG-4 se combinan en cuatro perfiles de audio MPEG-4: principal (que incluye la mayoría de los tipos de objetos de audio MPEG-4), escalable (AAC LC, AAC LTP, CELP, HVXC, TwinVQ, Wavetable Synthesis, TTSI), voz (CELP, HVXC, TTSI) y síntesis de baja velocidad (síntesis de tabla de ondas, TTSI).
El software de referencia para MPEG-4 Parte 3 se especifica en MPEG-4 Parte 5 y los flujos de bits de conformidad se especifican en MPEG-4 Parte 4. MPEG-4 Audio sigue siendo compatible con versiones anteriores de MPEG-2 Parte 7.
La versión de audio MPEG-4 2 (ISO/IEC 14496-3:1999/Amd 1:2000) definió nuevos tipos de objetos de audio: el tipo de objeto AAC de bajo retardo (AAC-LD), la codificación aritmética dividida en bits (BSAC) tipo de objeto, codificación de audio paramétrica que utiliza versiones armónicas y de línea individual más resistentes al ruido y al error (ER) de los tipos de objeto. También definió cuatro nuevos perfiles de audio: perfil de audio de alta calidad, perfil de audio de bajo retraso, perfil de audio natural y perfil de interconexión de audio móvil.
El perfil HE-AAC (AAC LC con SBR) y el perfil AAC (AAC LC) se estandarizaron por primera vez en ISO/IEC 14496-3:2001/Amd 1:2003. El perfil HE-AAC v2 (AAC LC con SBR y estéreo paramétrico) se especificó por primera vez en ISO/IEC 14496-3:2005/Amd 2:2006. El tipo de objeto de audio estéreo paramétrico utilizado en HE-AAC v2 se definió por primera vez en ISO/IEC 14496-3:2001/Amd 2:2004.
La versión actual del estándar AAC se define en ISO/IEC 14496-3:2009.
AAC+ v2 también está estandarizado por ETSI (Instituto Europeo de Normas de Telecomunicaciones) como TS 102005.
El estándar MPEG-4 Parte 3 también contiene otras formas de comprimir el sonido. Estos incluyen formatos de compresión sin pérdidas, audio sintético y formatos de compresión de baja tasa de bits generalmente utilizados para voz.
Mejoras de AAC sobre MP3
Advanced Audio Coding está diseñado para ser el sucesor de MPEG-1 Audio Layer 3, conocido como formato MP3, que fue especificado por ISO/IEC en 11172-3 (MPEG-1 Audio) y 13818-3 (audio MPEG-2).
Las pruebas a ciegas realizadas a fines de la década de 1990 mostraron que AAC demostró una mayor calidad de sonido y transparencia que MP3 para archivos codificados con la misma velocidad de bits.
Las mejoras incluyen:
- más tasas de muestra (de 8 a 96 kHz) que MP3 (16 a 48 kHz);
- hasta 48 canales (MP3 admite hasta dos canales en modo MPEG-1 y hasta 5.1 canales en modo MPEG-2);
- tipos de bits arbitrarios y longitud de marco variable. Tasa constante estandarizada con depósito de bits;
- mayor eficiencia y más simple banco de filtros. AAC utiliza un MDCT puro (modificado transforma cosina discreta), en lugar de la codificación híbrida de MP3 (que era parte MDCT y parte FFT);
- mayor eficiencia de codificación para señales estacionarias (AAC utiliza un bloqueo de 1024 o 960 muestras, permitiendo una codificación más eficiente que los 576 bloques de muestras de MP3);
- mayor precisión de codificación para señales transitorias (AAC utiliza un bloqueo de 128 o 120 muestras, permitiendo una codificación más precisa que los bloques de muestras de 192 de MP3);
- posibilidad de utilizar Kaiser-Bessel función de ventana derivada para eliminar fuga espectral a expensas de ampliar el lóbulo principal;
- mucho mejor manejo de frecuencias de audio por encima de 16 kHz;
- estéreo articular más flexible (los diferentes métodos se pueden utilizar en diferentes rangos de frecuencia);
- módulos adicionales (herramientas) añadidos para aumentar la eficiencia de compresión: TNS, predicción atrasada, sustitución de ruido perceptual (PNS), etc. Estos módulos pueden combinarse para constituir diferentes perfiles de codificación.
En general, el formato AAC permite a los desarrolladores más flexibilidad para diseñar códecs que MP3 y corrige muchas de las opciones de diseño realizadas en la especificación de audio MPEG-1 original. Esta mayor flexibilidad a menudo conduce a estrategias de codificación más concurrentes y, como resultado, a una compresión más eficiente. Esto es especialmente cierto a velocidades de bits muy bajas, donde la codificación estéreo superior, la MDCT pura y los mejores tamaños de ventana de transformación dejan al MP3 incapaz de competir.
Si bien el formato MP3 tiene soporte de hardware y software casi universal, principalmente porque MP3 fue el formato elegido durante los primeros años cruciales de distribución y uso compartido generalizado de archivos de música a través de Internet, AAC es un fuerte competidor debido a algunos apoyo incondicional de la industria.
Funcionalidad
AAC es un algoritmo de codificación de audio de banda ancha que aprovecha dos estrategias de codificación principales para reducir drásticamente la cantidad de datos necesarios para representar audio digital de alta calidad:
- Los componentes de señal que son perceptualmente irrelevantes son descartados.
- Se eliminan las redundaciones de la señal de audio codificada.
El proceso de codificación real consta de los siguientes pasos:
- La señal se convierte desde el tiempo-dominio hasta el dominio de frecuencia utilizando la transformación cosina discreta (MDCT). Esto se hace utilizando bancos de filtros que toman un número adecuado de muestras de tiempo y los convierten en muestras de frecuencia.
- La señal de dominio de frecuencia está cuantificada basada en un modelo psicoacústico y codificada.
- Se agregan códigos de corrección de errores internos.
- La señal se almacena o transmite.
- Para prevenir las muestras corruptas, se aplica a cada marco una aplicación moderna del algoritmo Luhn mod N.
El estándar de audio MPEG-4 no define un conjunto único o pequeño de esquemas de compresión altamente eficientes, sino una caja de herramientas compleja para realizar una amplia gama de operaciones, desde codificación de voz de baja tasa de bits hasta codificación de audio de alta calidad y síntesis de música.
- La familia de algoritmos de codificación de audio MPEG-4 abarca la gama de codificación de habla de baja velocidad de bits (abajo a 2 kbit/s) a codificación de audio de alta calidad (a 64 kbit/s por canal y superior).
- AAC ofrece frecuencias de muestreo entre 8 kHz y 96 kHz y cualquier número de canales entre 1 y 48.
- En contraste con el banco de filtros híbridos de MP3, AAC utiliza la transformación cosina discreta modificada (MDCT) junto con el aumento de longitudes de ventana de 1024 o 960 puntos.
Los codificadores AAC pueden cambiar dinámicamente entre un solo bloque MDCT de 1024 puntos de longitud u 8 bloques de 128 puntos (o entre 960 puntos y 120 puntos, respectivamente).
- Si se produce un cambio de señal o un transitorio, se eligen 8 ventanas más cortas de 128/120 puntos cada una para su mejor resolución temporal.
- Por defecto, la ventana más larga de 1024 puntos/960-punto se utiliza de otra manera porque la resolución de frecuencia aumentada permite un modelo psicoacústico más sofisticado, lo que da lugar a una mayor eficiencia de codificación.
Codificación modular
AAC adopta un enfoque modular para la codificación. Dependiendo de la complejidad del flujo de bits a codificar, el rendimiento deseado y la salida aceptable, los implementadores pueden crear perfiles para definir cuál de un conjunto específico de herramientas desean usar para una aplicación en particular.
El estándar MPEG-2 Parte 7 (Codificación de audio avanzada) se publicó por primera vez en 1997 y ofrece tres perfiles predeterminados:
- Complejidad baja (LC) – el más simple y ampliamente utilizado y apoyado
- Perfil principal – como el perfil LC, con la adición de predicción al revés
- Tasa de muestreo escalable (SSR) a.k.a. Sample-Rate Scalable (SRS)
El estándar MPEG-4 Parte 3 (audio MPEG-4) definió varias herramientas de compresión nuevas (también conocidas como tipos de objetos de audio) y su uso en perfiles completamente nuevos. AAC no se utiliza en algunos de los perfiles de audio MPEG-4. El perfil MPEG-2 Parte 7 AAC LC, el perfil AAC principal y el perfil AAC SSR se combinan con la sustitución de ruido perceptual y se definen en el estándar de audio MPEG-4 como tipos de objetos de audio (bajo el nombre AAC LC, AAC principal y AAC SSR). Estos se combinan con otros tipos de objetos en los perfiles de audio MPEG-4. Aquí hay una lista de algunos perfiles de audio definidos en el estándar MPEG-4:
- Perfil de audio principal – definido en 1999, utiliza la mayoría de los tipos de objetos de audio MPEG-4 (AAC Main, AAC-LC, AAC-SSR, AAC-LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, síntesis principal)
- Perfil de audio escalable – definido en 1999, utiliza AAC-LC, AAC-LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI
- Perfil de audio de voz – definido en 1999, utiliza CELP, HVXC, TTSI
- Perfil de audio sintético – definida en 1999, TTSI, síntesis principal
- Alta Calidad Perfil de audio – definido en 2000, utiliza AAC-LC, AAC-LTP, AAC Scalable, CELP, ER-AAC-LC, ER-AAC-LTP, ER-AAC Scalable, ER-CELP
- Perfil de audio de baja emisión – definida en 2000, utiliza CELP, HVXC, TTSI, ER-AAC-LD, ER-CELP, ER-HVXC
- Low Delay AAC v2 - definido en 2012, utiliza AAC-LD, AAC-ELD y AAC-ELDv2
- Perfil de Internet de Audio Móvil – definido en 2000, utiliza ER-AAC-LC, ER-AAC-Scalable, ER-TwinVQ, ER-BSAC, ER-AAC-LD
- Perfil de AAC – definido en 2003, utiliza AAC-LC
- Perfil AAC de alta eficiencia – definido en 2003, utiliza AAC-LC, SBR
- Perfil AAC v2 de alta eficiencia – definido en 2006, utiliza AAC-LC, SBR, PS
- Extended High Efficiency AAC xHE-AAC – definido en 2012, utiliza USAC
Una de las muchas mejoras en el audio MPEG-4 es un tipo de objeto llamado predicción a largo plazo (LTP), que es una mejora del perfil principal que utiliza un predictor directo con menor complejidad computacional.
Conjunto de herramientas de protección contra errores de AAC
La aplicación de la protección contra errores permite la corrección de errores hasta cierto punto. Los códigos de corrección de errores generalmente se aplican por igual a toda la carga útil. Sin embargo, dado que las diferentes partes de una carga útil AAC muestran una sensibilidad diferente a los errores de transmisión, este no sería un enfoque muy eficiente.
La carga útil de AAC se puede subdividir en partes con diferentes sensibilidades de error.
- Los códigos de corrección de errores independientes se pueden aplicar a cualquiera de estas partes utilizando la herramienta Protección de Errores (EP) definida en el estándar MPEG-4 Audio.
- Este toolkit proporciona la capacidad de corrección de errores a las partes más sensibles de la carga útil para mantener la sobrecarga adicional baja.
- El kit de herramientas es compatible con decodificadores AAC más simples y preexistentes. Muchas de las funciones de corrección de errores del toolkit se basan en la difusión de información sobre la señal de audio de forma más uniforme en el flujo de datos.
AAC resistente a errores (ER)
Las técnicas de resistencia a errores (ER) se pueden utilizar para hacer que el esquema de codificación sea más sólido frente a los errores.
Para AAC, se desarrollaron y definieron tres métodos personalizados en MPEG-4 Audio
- Huffman Codeword Reordering (HCR) para evitar la propagación de errores dentro de datos espectral
- Códigos Virtuales (VCB11) para detectar errores graves dentro de datos espectrales
- Código de longitud variable reversible (RVLC) reducir la propagación de errores dentro de los datos del factor de escala
Retardo bajo AAC
Los estándares de codificación de audio MPEG-4 Low Delay (AAC-LD), Enhanced Low Delay (AAC-ELD) y Enhanced Low Delay v2 (AAC-ELDv2) como se define en ISO/IEC 14496-3:2009 e ISO/IEC 14496-3:2009/Amd 3 están diseñados para combinar las ventajas de la codificación de audio perceptual con el bajo retardo necesario para la transmisión bidireccional. comunicación. Se derivan estrechamente del formato MPEG-2 Advanced Audio Coding (AAC). La GSMA recomienda AAC-ELD como códec de voz de banda superancha en el perfil IMS para el servicio de videoconferencia de alta definición (HDVC).
Licencias y patentes
No se requieren licencias ni pagos para que un usuario transmita o distribuya contenido en formato AAC. Esta sola razón podría haber convertido a AAC en un formato más atractivo para distribuir contenido que su predecesor MP3, en particular para la transmisión de contenido (como la radio por Internet), según el caso de uso.
Sin embargo, se requiere una licencia de patente para todos los fabricantes o desarrolladores de AAC "usuario final" códecs. Los términos (tal como se revelaron a la SEC) utilizan precios por unidad. En el caso del software, cada computadora que ejecute el software debe considerarse una "unidad" separada.
Solía ser común que las implementaciones de software libre y de código abierto, como FFmpeg y FAAC, solo distribuyeran en forma de código fuente para no "suministrar de otro modo" un códec AAC. Sin embargo, desde entonces FFmpeg se ha vuelto más indulgente con los asuntos de patentes: el "gyan.dev" Las compilaciones recomendadas por el sitio oficial ahora contienen su códec AAC, con la página legal de FFmpeg que indica que la conformidad con la ley de patentes es responsabilidad del usuario. (Consulte a continuación en Productos compatibles con AAC, Software).
Los titulares de patentes de AAC incluyen Bell Labs, Dolby, Fraunhofer, LG Electronics, NEC, NTT Docomo, Panasonic, Sony Corporation, ETRI, JVC Kenwood, Philips, Microsoft y NTT. Según la lista de patentes de los términos de la SEC, la última patente de AAC de referencia vence en 2028 y la última patente para todas las extensiones de AAC mencionadas vence en 2031.
Extensiones y mejoras
Se han agregado algunas extensiones al primer estándar AAC (definido en MPEG-2 Parte 7 en 1997):
- Substitución perceptual de ruido (PNS), añadido en MPEG-4 en 1999. Permite la codificación del ruido como datos de pseudoranda.
- Predictor a largo plazo (LTP), añadido en MPEG-4 en 1999. Es un predictor delantero con menor complejidad computacional.
- Resiliencia de errores (ER), añadido en MPEG-4 Audio versión 2 en 2000, utilizado para el transporte a través de canales prono de error
- AAC-LD (Low Delay), definido en 2000, utilizado para aplicaciones de conversación en tiempo real
- AAC de alta eficiencia (HE-AAC), a.k.a. aacPlus v1 o AAC+, la combinación de SBR (Spectral Band Replication) y AAC LC. Usado para pequeños bitrates. Definido en 2003.
- HE-AAC v2, a.k.a. aacPlus v2, eAAC+ o AacPlus mejorado, la combinación de Stereo Paramétrico (PS) y HE-AAC; utilizado para bitrates incluso inferiores. Definido en 2004 y 2006.
- MPEG-4 escalable para indeseables (SLS), Aún no publicado, puede complementar un flujo AAC para proporcionar una opción de decodificación sin pérdidas, como en el producto "HD-AAC" de Fraunhofer IIS
Formatos de contenedores
Además de los formatos MP4, 3GP y otros contenedores basados en el formato de archivo multimedia base ISO para el almacenamiento de archivos, los datos de audio AAC se empaquetaron por primera vez en un archivo para el estándar MPEG-2 mediante el formato de intercambio de datos de audio (ADIF), que consiste en de un solo encabezado seguido de los bloques de datos de audio AAC sin procesar. Sin embargo, si los datos se transmitirán dentro de un flujo de transporte MPEG-2, se utiliza un formato de sincronización automática llamado Flujo de transporte de datos de audio (ADTS), que consta de una serie de cuadros, cada cuadro tiene un encabezado seguido de los datos de audio AAC. Este archivo y formato basado en transmisión se definen en MPEG-2 Parte 7, pero MPEG-4 solo los considera informativos, por lo que un decodificador MPEG-4 no necesita admitir ninguno de los formatos. Estos contenedores, así como una secuencia AAC sin procesar, pueden tener la extensión de archivo.aac. MPEG-4 Parte 3 también define su propio formato de sincronización automática llamado Low Overhead Audio Stream (LOAS) que encapsula no solo AAC, sino también cualquier esquema de compresión de audio MPEG-4 como TwinVQ y ALS. Este formato es el que se definió para su uso en flujos de transporte DVB cuando los codificadores usan SBR o extensiones AAC estéreo paramétricas. Sin embargo, está restringido a un único flujo AAC no multiplexado. Este formato también se conoce como Low Overhead Audio Transport Multiplex (LATM), que es solo una versión de transmisión múltiple intercalada de un LOAS.
Productos compatibles con CAA
Estándares de HDTV
ISDB-T japonesa
(feminine)En diciembre de 2003, Japón comenzó a transmitir el estándar DTV ISDB-T terrestre que implementa video MPEG-2 y audio MPEG-2 AAC. En abril de 2006, Japón comenzó a transmitir el subprograma móvil ISDB-T, llamado 1seg, que fue la primera implementación de video H.264/AVC con audio HE-AAC en el servicio de transmisión de HDTV Terrestre en el planeta.
ISDB-Tb internacional
En diciembre de 2007, Brasil comenzó a transmitir el estándar de DTV terrestre llamado International ISDB-Tb que implementa codificación de video H.264/AVC con audio AAC-LC en el programa principal (único o múltiple) y video H.264/AVC con audio HE -AACv2 en el subprograma móvil 1seg.
TDT
El ETSI, el organismo rector de estándares para la suite DVB, admite la codificación de audio AAC, HE-AAC y HE-AAC v2 en aplicaciones DVB desde al menos 2004. Las transmisiones DVB que usan la compresión H.264 para video normalmente usan HE -AAC para audio.
Hardware
ITunes y iPod
En abril de 2003, Apple llamó la atención general sobre AAC al anunciar que sus productos iTunes y iPod admitirían canciones en formato MPEG-4 AAC (a través de una actualización de firmware para iPods más antiguos). Los clientes pueden descargar música en una forma restringida de gestión de derechos digitales (DRM) de código cerrado de 128 kbit/s AAC (ver FairPlay) a través de iTunes Store o crear archivos sin DRM desde sus propios CD usando iTunes. En años posteriores, Apple comenzó a ofrecer videos musicales y películas, que también usan AAC para la codificación de audio.
El 29 de mayo de 2007, Apple comenzó a vender canciones y videos musicales de los sellos discográficos participantes a una tasa de bits más alta (256 kbit/s cVBR) y sin DRM, un formato denominado "iTunes Plus". La mayoría de estos archivos se adhieren al estándar AAC y se pueden reproducir en muchos productos que no son de Apple, pero incluyen información personalizada de iTunes, como ilustraciones de álbumes y un recibo de compra, para identificar al cliente en caso de que el archivo se filtre en peer-to. -redes de pares. Sin embargo, es posible eliminar estas etiquetas personalizadas para restaurar la interoperabilidad con reproductores que cumplan estrictamente con la especificación AAC. A partir del 6 de enero de 2009, casi toda la música en la iTunes Store regional de EE. UU. quedó libre de DRM, y el resto quedó libre de DRM a fines de marzo de 2009.
iTunes ofrece una "tasa de bits variable" opción de codificación que codifica pistas AAC en el esquema de tasa de bits variable restringida (una variante menos estricta de la codificación ABR); Sin embargo, la API de QuickTime subyacente ofrece un verdadero perfil de codificación VBR.
A partir de septiembre de 2009, Apple agregó compatibilidad con HE-AAC (que forma parte integral del estándar MP4) solo para transmisiones de radio, no para reproducción de archivos, e iTunes aún no admite la codificación VBR real.
Otros reproductores portátiles
- Archos
- Cowon (sin apoyo oficial en algunos modelos)
- Zen creativo portátil
- Fiio (todos los modelos actuales)
- Nintendo 3DS
- Nintendo DSi
- Philips GoGear Muse
- PlayStation Portable (PSP) con firmware 2.0 o mayor
- Samsung YEPP
- SanDisk Sansa (algunos modelos)
- Walkman
- Zune
- Cualquier jugador portátil que apoye completamente el firmware de la tercera parte Rockbox
Teléfonos móviles
Durante varios años, muchos teléfonos móviles de fabricantes como Nokia, Motorola, Samsung, Sony Ericsson, BenQ-Siemens y Philips han admitido la reproducción AAC. El primer teléfono de este tipo fue el Nokia 5510 lanzado en 2002, que también reproduce MP3. Sin embargo, este teléfono fue un fracaso comercial y los teléfonos con reproductores de música integrados no ganaron popularidad hasta 2005, cuando continuó la tendencia de tener AAC y compatibilidad con MP3. La mayoría de los nuevos teléfonos inteligentes y teléfonos con temas musicales admiten la reproducción de estos formatos.
- Sony Ericsson los teléfonos soportan varios formatos AAC en contenedor MP4. AAC-LC es compatible en todos los teléfonos que comienzan con K700, los teléfonos que comienzan con W550 tienen soporte de HE-AAC. Los últimos dispositivos como el P990, K610, W890i y posterior soporte HE-AAC v2.
- Nokia XpressMusic y otros teléfonos multimedia Nokia de nueva generación como N- y E-Series también soportan el formato AAC en perfiles LC, HE, M4A y HEv2. Estos también admiten reproducir audio AAC codificado por LTP.
- BlackBerry Los teléfonos que ejecutan el sistema operativo BlackBerry 10 soportan la reproducción AAC nativamente. Select previous generation BlackBerry OS devices also support AAC.
- bada OS
- iPhone de Apple soporta archivos AAC protegidos y FairPlay usados anteriormente como el formato de codificación predeterminado en iTunes Store hasta la eliminación de restricciones DRM en marzo de 2009.
- Android 2.3 y posterior soporta AAC-LC, HE-AAC y HE-AAC v2 en contenedores MP4 o M4A junto con varios otros formatos de audio. Android 3.1 y posterior soporta archivos ADTS crudos. Android 4.1 puede codificar AAC.
- WebOS por HP/Palm admite contenedores AAC, AAC+, eAAC+ y.m4a en su reproductor de música nativa, así como varios jugadores de terceros. Sin embargo, no admite los archivos FairPlay DRM de Apple descargados desde iTunes.
- Windows Phone's Silverlight runtime soporta AAC-LC, HE-AAC y HE-AAC v2 decodificación.
Otros dispositivos
- iPad de Apple: Admite archivos AAC y FairPlay protegidos AAC utilizados como formato de codificación predeterminado en iTunes Store
- Palm OS PDAs: Muchos PDAs basados en Palm OS y teléfonos inteligentes pueden jugar AAC y HE-AAC con el software de 3er partido Pocket Tunes. Versión 4.0, publicada en diciembre de 2006, agregó soporte para archivos nativos AAC y HE-AAC. El codec AAC para TCPMP, un popular reproductor de vídeo, fue retirado después de la versión 0.66 debido a problemas de patente, pero todavía se puede descargar de sitios distintos de corecodec.org. CorePlayer, el seguimiento comercial a TCPMP, incluye soporte AAC. Otros programas de Palm OS que apoyan AAC incluyen Kinoma Player y AeroPlayer.
- Windows Mobile: Admite AAC ya sea por el reproductor nativo de Windows Media o por productos de terceros (TCPMP, CorePlayer)
- Epson: Admite la reproducción de AAC en el P-2000 y P-4000 Multimedia/Photo Storage Viewers
- Sony Reader: reproduce archivos M4A que contienen AAC, y muestra metadatos creados por iTunes. Otros productos de Sony, incluyendo el A and E series de Walkmans de red, soportan AAC con actualizaciones de firmware (publicado en mayo de 2006) mientras que la serie S lo soporta fuera de la caja.
- Sonos Digital Media Player: admite la reproducción de archivos AAC
- Barnes & Noble Nook Color: admite la reproducción de archivos codificados AAC
- Roku SoundBridge: un reproductor de audio de red, admite la reproducción de archivos codificados AAC
- Squeezebox: reproductor de audio de red (hecho por Slim Devices, una empresa Logitech) que admite la reproducción de archivos AAC
- PlayStation 3: admite codificación y decodificación de archivos AAC
- Xbox 360: soporta la transmisión de AAC a través del software Zune, y de iPods compatibles conectados a través del puerto USB
- Wii: admite archivos AAC a través de la versión 1.1 del Canal de Fotos al 11 de diciembre de 2007. Todos los perfiles y bitrates de AAC se soportan mientras esté en la extensión de archivo.m4a. Esta actualización removió la compatibilidad MP3, pero los usuarios que han instalado esto pueden rebajarse libremente a la versión antigua si así lo desean.
- Pulso Livescribe y Echo Smartpens: grabar y almacenar audio en formato AAC. Los archivos de audio se pueden reproducir usando el altavoz integrado del bolígrafo, auriculares adjuntos o en un ordenador usando el software Livescribe Desktop. Los archivos AAC se almacenan en la carpeta "My Documents" del usuario del sistema operativo Windows y se pueden distribuir y reproducir sin hardware o software especializado de Livescribe.
- Google Chromecast: admite la reproducción de audio LC-AAC y HE-AAC
Software
Casi todos los reproductores multimedia de computadora actuales incluyen decodificadores integrados para AAC, o pueden utilizar una biblioteca para decodificarlo. En Microsoft Windows, DirectShow se puede usar de esta manera con los filtros correspondientes para habilitar la reproducción AAC en cualquier reproductor basado en DirectShow. Mac OS X es compatible con AAC a través de las bibliotecas de QuickTime.
Adobe Flash Player, desde la actualización 3 de la versión 9, también puede reproducir secuencias AAC. Dado que Flash Player también es un complemento del navegador, también puede reproducir archivos AAC a través de un navegador.
El firmware de código abierto de Rockbox (disponible para varios reproductores portátiles) también ofrece soporte para AAC en distintos grados, según el modelo de reproductor y el perfil AAC.
La compatibilidad opcional con iPod (reproducción de archivos AAC desprotegidos) para Xbox 360 está disponible como descarga gratuita desde Xbox Live.
La siguiente es una lista no exhaustiva de otras aplicaciones de reproducción de software:
- 3ivx MPEG-4: una suite de plugins DirectShow y QuickTime que soportan la codificación AAC o la decodificación AAC/ HE-AAC en cualquier aplicación DirectShow
- CorePlayer: también admite LC y HE AAC
- ffdshow: un filtro de código abierto gratuito DirectShow para Microsoft Windows que utiliza FAAD2 para soportar la decodificación AAC
- foobar2000: un reproductor de audio de software libre para Windows que soporta LC y HE AAC
- KMPlayer
- MediaMonkey
- AIMP
- Media Player Classic Home Cinema
- mp3tag
- MPlayer o xine: a menudo utilizado como decodificadores AAC en Linux o Macintosh
- MusicBee: un avanzado gestor de música y un reproductor que también admite la codificación y el enjuague a través de un plugin
- RealPlayer: incluye el encoder RealAudio 10 AAC de RealNetworks
- Songbird: admite AAC en Windows, Linux y Mac OS X incluyendo la codificación de gestión de derechos DRM utilizada para la música adquirida en iTunes Store, con un plug-in
- Sony SonicStage
- Reproductor multimedia VLC: admite reproducción y codificación de archivos MP4 y AAC crudos
- Winamp para Windows: incluye un encoder AAC que admite LC y HE AAC
- Windows Media Reproductor 12: lanzado con Windows 7, admite la reproducción de archivos AAC nativamente
- Otro Real: Rhapsody admite el código RealAudio AAC, además de ofrecer pistas de suscripción codificadas con AAC
- XBMC: apoya AAC (ambos LC y HE).
- XMMS: admite la reproducción MP4 utilizando un plugin proporcionado por la biblioteca faad2
Algunos de estos reproductores (p. ej., foobar2000, Winamp y VLC) también admiten la decodificación de ADTS (flujo de transporte de datos de audio) mediante el protocolo SHOUTcast. Los complementos para Winamp y foobar2000 permiten la creación de dichos flujos.
Audio digital de Nero
En mayo de 2006, Nero AG lanzó una herramienta de codificación AAC gratuita, Nero Digital Audio (la parte del códec AAC se ha convertido en Nero AAC Codec), que es capaz de codificar LC-AAC, HE -Transmisiones AAC y HE-AAC v2. La herramienta es solo una herramienta de interfaz de línea de comandos. También se incluye una utilidad separada para decodificar a PCM WAV.
Diversas herramientas, incluido el reproductor de audio foobar2000 y MediaCoder, pueden proporcionar una GUI para este codificador.
FAAC y FAAD2
FAAC y FAAD2 significan Freeware Advanced Audio Coder y Decoder 2 respectivamente. FAAC admite los tipos de objetos de audio LC, Main y LTP. FAAD2 admite tipos de objetos de audio LC, Main, LTP, SBR y PS. Aunque FAAD2 es software libre, FAAC no es software libre.
AAC Fraunhofer FDK
Un codificador/descodificador de código abierto creado por Fraunhofer incluido en Android se ha portado a otras plataformas. El codificador AAC nativo de FFmpeg no es compatible con HE-AAC y HE-AACv2, pero GPL 2.0+ de ffmpeg no es compatible con FDK AAC, por lo tanto, ffmpeg con libfdk-aac no es redistribuible. El codificador QAAC que utiliza Core Media Audio de Apple sigue siendo de mayor calidad que FDK.
FFmpeg y Libav
El codificador AAC nativo creado en libavcodec de FFmpeg y bifurcado con Libav se consideró experimental y deficiente. Se realizó una cantidad significativa de trabajo para la versión 3.0 de FFmpeg (febrero de 2016) para hacer que su versión sea utilizable y competitiva con el resto de los codificadores AAC. Libav no fusionó este trabajo y continúa usando la versión anterior del codificador AAC. Estos codificadores son de código abierto con licencia LGPL y se pueden construir para cualquier plataforma en la que se puedan construir los marcos FFmpeg o Libav.
Tanto FFmpeg como Libav pueden usar la biblioteca Fraunhofer FDK AAC a través de libfdk-aac, y aunque el codificador nativo de FFmpeg se ha vuelto estable y lo suficientemente bueno para el uso común, FDK todavía se considera el codificador de mayor calidad disponible para usar con FFmpeg. Libav también recomienda usar FDK AAC si está disponible. FFmpeg 4.4 y superior también pueden usar el codificador Apple audiotoolbox.
Aunque el codificador AAC nativo solo produce AAC-LC, el decodificador nativo de ffmpeg puede manejar una amplia gama de formatos de entrada.