AES3

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

estándar de interfaz de audio digital profesional

AES3 es un estándar para el intercambio de señales de audio digital entre dispositivos de audio profesionales. Una señal AES3 puede transportar dos canales de audio digital modulado por código de pulso a través de varios medios de transmisión, incluidas líneas balanceadas, líneas no balanceadas y fibra óptica.

AES3 fue desarrollado conjuntamente por Audio Engineering Society (AES) y la Unión Europea de Radiodifusión (EBU), por lo que también se conoce como AES/EBU. El estándar se publicó por primera vez en 1985 y se revisó en 1992 y 2003. AES3 se incorporó al estándar IEC 60958 de la Comisión Electrotécnica Internacional y está disponible en una variante de grado de consumo conocida como S/PDIF.

Historia y desarrollo

El desarrollo de estándares para la interconexión de audio digital para equipos de audio domésticos y profesionales comenzó a fines de la década de 1970 en un esfuerzo conjunto entre la Sociedad de Ingeniería de Audio y la Unión Europea de Radiodifusión, y culminó con la publicación de AES3 en 1985. El estándar AES3 se revisó en 1992 y 2003 y se publica en versiones AES y EBU. Al principio, el estándar se conocía con frecuencia como AES/EBU.

Las variantes que utilizan diferentes conexiones físicas se especifican en IEC 60958. Básicamente, se trata de versiones de consumo de AES3 para su uso en el entorno doméstico de alta fidelidad utilizando conectores que se encuentran más comúnmente en el mercado de consumo. Estas variantes se conocen comúnmente como S/PDIF.

Normas y documentos relacionados

CEI 60958

IEC 60958 (anteriormente IEC 958) es el estándar de la Comisión Electrotécnica Internacional sobre interfaces de audio digital. Reproduce el estándar de interconexión de audio digital profesional AES3 y la versión de consumo del mismo, S/PDIF.

El estándar consta de varias partes:

IEC 60958-1: General
IEC 60958-2: Modo de entrega de información de software
IEC 60958-3: Aplicaciones de consumo
IEC 60958-4: Aplicaciones profesionales
IEC 60958-5: Mejora de la aplicación del consumidor

AES-2id

AES-2id es un documento de información sobre AES publicado por la Audio Engineering Society para la ingeniería de audio digital: directrices para el uso de la interfaz AES3. Este documento proporciona pautas para el uso de AES3, práctica recomendada de AES para ingeniería de audio digital, formato de transmisión en serie para datos de audio digital representados linealmente de dos canales. Este documento también cubre la descripción de los estándares relacionados utilizados junto con AES3, como AES11. Los detalles completos de AES-2id se pueden estudiar en la sección de estándares del sitio web de Audio Engineering Society descargando copias del documento AES-2id como archivo PDF.

Conexiones de hardware

El estándar AES3 es paralelo a la parte 4 del estándar internacional IEC 60958. De los tipos de interconexión física definidos por IEC 60958, dos son de uso común.

IEC 60958 tipo I

Conector XLR, utilizado para conexiones IEC 60958 tipo I.

Las conexiones de tipo I utilizan cableado de par trenzado balanceado de 110 ohmios y tres conductores con conectores XLR. Las conexiones de tipo I se utilizan con mayor frecuencia en instalaciones profesionales y se consideran el conector estándar para AES3. La interfaz de hardware generalmente se implementa utilizando controladores y receptores de línea RS-422.

Tipo I extremos de conector
	Cable final	Final del dispositivo
Input	Enchufe masculino XLR	Jack femenino XLR
Producto	Enchufe femenino XLR	Jack masculino XLR

IEC 60958 tipo II

IEC 60958 Tipo II define una interfaz eléctrica u óptica desequilibrada para aplicaciones de electrónica de consumo. El precursor de la especificación IEC 60958 Tipo II fue la interfaz digital Sony/Philips, o S/PDIF. Ambos se basaron en el trabajo original de AES/EBU. S/PDIF y AES3 son intercambiables a nivel de protocolo, pero a nivel físico especifican diferentes niveles e impedancias de señalización eléctrica, lo que puede ser importante en algunas aplicaciones.

Conector BNC

Conector BNC, utilizado para conexiones AES-3id.

Las señales AES/EBU también se pueden ejecutar mediante conectores BNC no balanceados con un cable coaxial de 75 ohmios. La versión no balanceada tiene una distancia de transmisión muy larga en comparación con los 150 metros máximos de la versión balanceada. El estándar AES-3id define una variante eléctrica BNC de 75 ohmios de AES3. Esto utiliza el mismo cableado, parches e infraestructura que el video analógico o digital y, por lo tanto, es común en la industria de la transmisión.

Protocolo

Representación sencilla del protocolo para AES3 y S/PDIF

El protocolo de bajo nivel para la transmisión de datos en AES3 y S/PDIF es en gran medida idéntico, y el siguiente debate se aplica para S/PDIF, excepto como se indica.

AES3 se diseñó principalmente para admitir audio codificado en PCM estéreo en formato DAT a 48 kHz o en formato de CD a 44,1 kHz. No se intentó utilizar un operador capaz de admitir ambas tarifas; en cambio, AES3 permite que los datos se ejecuten a cualquier velocidad, y codifica el reloj y los datos juntos mediante el código de marca bifásico (BMC).

Cada bit ocupa un intervalo de tiempo. Cada muestra de audio (de hasta 24 bits) se combina con cuatro bits de bandera y un preámbulo de sincronización que tiene cuatro intervalos de tiempo para formar una subtrama de 32 intervalos de tiempo. Los 32 intervalos de tiempo de cada subtrama se asignan de la siguiente manera:

Subframe AES3
Tiempo de ranura	Nombre	Descripción
0–3	Preámbulo	Un preámbulo de sincronización (violación de código de marca de fase) para bloques de audio, marcos y subframes.
4 a 7	Muestra auxiliar (opcional)	Un canal auxiliar de baja calidad utilizado como se especifica en la palabra estado del canal, en particular para la charla de productor o grabación de comunicación estudio a estudio.
8–27, o 4–27	Muestra de audio	Una muestra almacenada con el bit más significativo (MSB) último. Si se utiliza la muestra auxiliar, los bits 4-7 no están incluidos. Los datos con pequeñas profundidades de bits de muestra siempre tienen MSB al bit 27 y son cero-extended hacia el bit menos significativo (LSB).
28	Validez (V)	Desconfigurar si los datos de audio son correctos y adecuados para la conversión D/A. Durante la presencia de muestras defectuosas, se puede instruir al equipo receptor para que mute su salida. La mayoría de los jugadores de CD utilizan para indicar que se está produciendo una corrección de ocultación en lugar de errores.
29	Datos de usuario (U)	Forma un flujo de datos serie para cada canal (con 1 bit por marco), con un formato especificado en la palabra estado del canal.
30	Estado del Canal (C)	Los bits de cada marco de un bloque de audio son collados dando una palabra de estado de canal de 192 bits. Su estructura depende de si se utiliza AES3 o S/PDIF.
31	Paridad (P)	Incluso bit parity para la detección de errores en la transmisión de datos. Excluye el preámbulo; Los bits 4–31 tienen un número uniforme de ellos.

Dos subfotogramas (A y B, normalmente usados para los canales de audio izquierdo y derecho) forman un fotograma. Los cuadros contienen períodos de 64 bits y se producen una vez por período de muestra de audio. En el nivel más alto, cada 192 fotogramas consecutivos se agrupan en un bloque de audio. Mientras que las muestras se repiten cada fotograma, los metadatos solo se transmiten una vez por bloque de audio. Con una frecuencia de muestreo de 48 kHz, hay 250 bloques de audio por segundo y 3 072 000 intervalos de tiempo por segundo respaldados por un reloj bifásico de 6,144 MHz.

Preámbulo de sincronización

El preámbulo de sincronización es un preámbulo especialmente codificado que identifica la subtrama y su posición dentro del bloque de audio. Los preámbulos no son bits de datos codificados en BMC normales, aunque todavía tienen un sesgo de CC cero.

Tres preámbulos son posibles:

X (o M): 11100010₂ si la ranura del tiempo anterior era 0, 00011101₂ si fuera 1. (Equivalentemente, 10010011₂ NRZI codificado.) Marca una palabra para el canal A (izquierda), aparte del comienzo de un bloque de audio.
Y (o W): 11100100₂ si la ranura del tiempo anterior era 0, 00011011₂ si fuera 1. (Equivalentemente, 10010110₂ NRZI codificado.) Marca una palabra para el canal B (derecho).
Z (o B): 11101000₂ si la ranura del tiempo anterior era 0, 00010111₂ si fuera 1. (Equivalentemente, 10011100₂ NRZI codificado.) Marca una palabra para el canal A (izquierda) al inicio de un bloque de audio.

Los tres preámbulos se denominan X, Y, Z en el estándar AES3; y M, W, B en IEC 958 (una extensión AES).

Los preámbulos de 8 bits se transmiten en el tiempo asignado a los primeros cuatro intervalos de tiempo de cada subtrama (intervalos de tiempo 0 a 3). Cualquiera de los tres marca el comienzo de una subtrama. X o Z marca el comienzo de un cuadro y Z marca el comienzo de un bloque de audio.

 Silencio 0 Silencio 1 Silencioso 2 Silencio 3 Silencio Silencio 0 Silencio 1 Silencio 2 Silencio 3 Silencio Time slots
_____________________________________________________________________________
/ ______/ _______/ _ Preámble X
________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
/ ____/ __________/ _ Preamble Y
_______________________________________________________________________________
/ _/ ____________/ _ Preamble Z
________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
/ ____/ ______/ ____/  All 0 bits BMC codificado
_
/ _/ _/ _/ _/ _/ _/ _/ _/ _/  All 1 bits BMC codificado

Silencio 0 Silencio 1 Silencioso 2 Silencio 3 Silencio Silencio 0 Silencio 1 Silencio 2 Silencio 3 Silencio Time slots

En AES3 de dos canales, los preámbulos forman un patrón de ZYXYXYXY..., pero es sencillo extender esta estructura a canales adicionales (más subtramas por trama), cada una con un preámbulo Y, como se hace en MADI protocolo.

Palabra de estado del canal

Hay un bit de estado de canal en cada subtrama, un total de 192 bits o 24 bytes para cada canal en cada bloque. Entre los estándares AES3 y S/PDIF, el contenido de la palabra de estado del canal de 192 bits difiere significativamente, aunque coinciden en que el bit de estado del primer canal distingue entre los dos. En el caso de AES3, el estándar describe, en detalle, la función de cada bit.

Byte 0: Datos de control básicos: tasa de muestra, compresión, énfasis
- bit 0: Un valor de 1 indica que este es AES3 datos de estado del canal. 0 indica que se trata de datos S/PDIF.
- bit 1: Un valor de 0 indica que esto es datos de PCM de audio lineal. Un valor de 1 indica otros datos (normalmente no audio).
- bits 2-4: Indica el tipo de preemfasis de señal aplicada a los datos. Generalmente establecido a 100₂ (ninguno).
- bit 5: Un valor de 0 indica que la fuente está bloqueada a algunos (sin especificar) tiempo externo. Un valor de 1 indica una fuente desbloqueada.
- bits 6-7: Tasa de muestra. Estos bits son redundantes cuando se transmite el audio en tiempo real (el receptor puede observar directamente la tasa de muestra), pero son útiles si los datos AES3 se registran o almacenan de otro modo. Las opciones no se especifican, 48 kHz (el predeterminado), 44.1 kHz y 32 kHz. Pueden indicarse opciones adicionales de tasa de muestra en la Tasa de muestra ampliada sobre el terreno (véase infra).
Byte 1: indica si el flujo de audio es estéreo, mono o alguna otra combinación.
- bits 0–3: Indica la relación de los dos canales; pueden ser datos de audio no relacionados, un par estéreo, datos mono duplicados, música y comentarios de voz, un código de suma/diferencia estéreo.
- bits 4–7: Se utiliza para indicar el formato de la palabra canal de usuario
Byte 2: longitud de la palabra audio
- bits 0–2: Uso de Aux bits. Esto indica cómo se utilizan los bits aux (tiempo ranuras 4-7). Generalmente fijado a 000₂ (no utilizado) o 001₂ (utilizado para datos de audio de 24 bits).
- bits 3-5: Longitud de la palabra. Especifica el tamaño de la muestra, relativo al máximo de 20 o 24 bits. Puede especificar 0, 1, 2 o 4 bits perdidos. Los bits no utilizados están llenos de 0, pero las funciones de procesamiento de audio como mezclar generalmente los llenará con datos válidos sin cambiar la longitud de palabra efectiva.
- bits 6–7: Desuso
Byte 3: Usado sólo para aplicaciones multicanal
Byte 4: Información adicional de la tasa de muestra
- bits 0–1: Indica el grado de referencia de la tasa de muestra, por AES11
- bit 2: Reserved
- bits 3–6: Tasa de muestra extendida. Esto indica otras tasas de muestra, no representables en byte 0 bits 6-7. Los valores se asignan para 24, 96 y 192 kHz, así como 22.05, 88.2 y 176.4 kHz.
- bit 7: Bandera de escalada de frecuencia de muestreo. Si se establece, indica que la tasa de muestra se multiplica por 1/1.001 para que coincida con los índices de marco de vídeo NTSC.
Byte 5: Reserved
Bytes 6-9: Cuatro caracteres ASCII para indicar el origen del canal. Ampliamente utilizado en grandes estudios.
Bytes 10–13: Cuatro caracteres ASCII indicando destino de canal, para controlar conmutadores automáticos. Menos a menudo usado.
Bytes 14–17: 32-bit dirección de muestra, incrementando bloque a bloque en 192 (porque hay 192 marcos por bloque). A 48 kHz, esto envuelve aproximadamente cada día.
Bytes 18–21: 32-bit muestra de dirección offset para indicar muestras desde la medianoche.
Byte 22: Indicación de fiabilidad de palabra de estado del canal
- bits 0–3: Reservado
- bit 4: Si se establece, bytes 0–5 (formato de firma) no son confiables.
- bit 5: Si se establece, bytes 6–13 (marcas de canal) no son fiables.
- bit 6: Si se establece, bytes 14-17 (dirección de muestreo) no son confiables.
- bit 7: Si se establece, bytes 18–21 (timestamp) no son confiables.
Byte 23: CRC. Este byte se utiliza para detectar la corrupción de la palabra de estado del canal, como puede ser causado por el cambio de punto medio.

Código de tiempo incrustado

Los datos de código de tiempo SMPTE se pueden incrustar en señales AES3. Puede usarse para sincronización y para registrar e identificar contenido de audio. Está incrustado como una palabra binaria de 32 bits en los bytes 18 a 21 de los datos de estado del canal.

El estándar AES11 proporciona información sobre la sincronización de estructuras de audio digital.

el estándar AES52 describe cómo insertar identificadores únicos en un flujo de bits AES3.

SMPTE 2110

SMPTE 2110-31 define cómo encapsular un flujo de datos AES3 en paquetes de protocolo de transporte en tiempo real para la transmisión a través de una red IP utilizando el marco de multidifusión basado en IP SMPTE 2110.

SMPTE 302M

SMPTE 302M-2007 define cómo encapsular un flujo de datos AES3 en un flujo de transporte MPEG para aplicaciones de televisión.

Otros formatos

El formato de audio digital AES3 también se puede transportar a través de una red de modo de transferencia asincrónica. El estándar para empaquetar tramas AES3 en celdas ATM es AES47.

Contenido relacionado

Más resultados...