WAV
Formato de archivo de audio de forma de onda (WAVE, o WAV debido a la extensión de su nombre de archivo; pronunciado "onda") es un estándar de formato de archivo de audio, desarrollado por IBM y Microsoft, para almacenar un flujo de bits de audio en PC. Es el formato principal utilizado en los sistemas Microsoft Windows para audio sin comprimir. La codificación de flujo de bits habitual es el formato de modulación de código de pulso lineal (LPCM).
WAV es una aplicación del método de formato de flujo de bits Resource Interchange File Format (RIFF) para almacenar datos en trozos y, por lo tanto, es similar al formato 8SVX y AIFF utilizado en las computadoras Amiga y Macintosh. respectivamente.
Descripción
El archivo WAV es una instancia de un formato de archivo de intercambio de recursos (RIFF) definido por IBM y Microsoft. El formato RIFF actúa como un "envoltorio" para varios formatos de codificación de audio.
Aunque un archivo WAV puede contener audio comprimido, el formato de audio WAV más común es el audio sin comprimir en el formato de modulación de código de pulso lineal (LPCM). LPCM es también el formato de codificación de audio estándar para CD de audio, que almacena audio LPCM de dos canales muestreado a 44,1 kHz con 16 bits por muestra. Dado que LPCM no está comprimido y retiene todas las muestras de una pista de audio, los usuarios profesionales o expertos en audio pueden usar el formato WAV con audio LPCM para obtener la máxima calidad de audio. Los archivos WAV también se pueden editar y manipular con relativa facilidad mediante software.
El formato WAV admite audio comprimido utilizando, en Microsoft Windows, el Administrador de compresión de audio (ACM). Se puede usar cualquier códec ACM para comprimir un archivo WAV. Se puede acceder a la interfaz de usuario (UI) para Audio Compression Manager a través de varios programas que lo usan, incluido Sound Recorder en algunas versiones de Windows.
A partir de Windows 2000, se definió un encabezado WAVE_FORMAT_EXTENSIBLE
que especifica múltiples datos de canales de audio junto con las posiciones de los altavoces, elimina la ambigüedad con respecto a los tipos de muestras y tamaños de contenedores en el formato WAV estándar y admite la definición de extensiones personalizadas para el fragmento de formato.
Hay algunas incoherencias en el formato WAV: por ejemplo, los datos de 8 bits no están firmados mientras que los de 16 bits están firmados y muchos fragmentos duplican la información que se encuentra en otros fragmentos.
Especificación
RIFA
Un archivo RIFF es un formato de archivo etiquetado. Tiene un formato de contenedor específico (un fragmento) que incluye una etiqueta de cuatro caracteres (FourCC) y el tamaño (número de bytes) del fragmento. La etiqueta especifica cómo se deben interpretar los datos dentro del fragmento, y hay varias etiquetas FourCC estándar. Las etiquetas que consisten en letras mayúsculas son etiquetas reservadas. El fragmento más externo de un archivo RIFF tiene una etiqueta de formulario RIFF
; los primeros cuatro bytes de datos de fragmentos son un FourCC que especifica el tipo de formulario y son seguidos por una secuencia de subfragmentos. En el caso de un archivo WAV, esos cuatro bytes son el FourCC WAVE
. El resto de los datos RIFF es una secuencia de fragmentos que describen la información de audio.
La ventaja de un formato de archivo etiquetado es que el formato se puede ampliar más adelante sin confundir a los lectores de archivos existentes. La regla para un lector RIFF (o WAV) es que debe ignorar cualquier fragmento etiquetado que no reconozca. El lector no podrá usar la nueva información, pero no debe confundirse.
La especificación para archivos RIFF incluye la definición de un fragmento INFO
. El fragmento puede incluir información como el título de la obra, el autor, la fecha de creación y la información de derechos de autor. Aunque el fragmento INFO
se definió en la versión 1.0, no se hizo referencia al fragmento en la especificación formal de un archivo WAV. Si el fragmento estuviera presente en el archivo, entonces un lector debería saber cómo interpretarlo, pero muchos lectores tuvieron problemas. Algunos lectores abortarían cuando encontraran el fragmento, algunos lectores procesarían el fragmento si fuera el primer fragmento en el formato RIFF y otros lectores lo procesarían si siguiera todos los datos de forma de onda esperados. En consecuencia, lo más seguro desde el punto de vista del intercambio era omitir el fragmento INFO
y otras extensiones y enviar un archivo de mínimo común denominador. Hay otros problemas de colocación de fragmentos INFO.
Se esperaba que los archivos RIFF se usaran en entornos internacionales, por lo que hay un fragmento CSET
para especificar el código de país, el idioma, el dialecto y la página de códigos para las cadenas en un archivo RIFF. Por ejemplo, especificar un fragmento CSET
apropiado debería permitir que las cadenas en un fragmento INFO
(y otros fragmentos en todo el archivo RIFF) se interpreten como caracteres cirílicos o japoneses.
RIFF también define un fragmento JUNK
cuyo contenido no es interesante. El fragmento permite eliminar un fragmento simplemente cambiando su FourCC. El fragmento también podría usarse para reservar algo de espacio para ediciones futuras, de modo que el archivo pueda modificarse sin tener que volver a escribirlo. Una definición posterior de RIFF introdujo un trozo de PAD
similar.
ONDA RIFF
La definición de nivel superior de un archivo WAV es:
∙WAVE-formilo usuario → RIFF(WAVE ' > > > [traducido] // De hecho... [traducido] // Puntos lindos [traducido del inglés] // Playlist [traducido] Lista de datos asociados ▪onda de onda-data] // Datos de onda
La definición muestra un formulario RIFF de nivel superior con la etiqueta WAVE
. Le sigue un fragmento de formato <fmt-ck>
obligatorio que describe el formato de los datos de muestra que siguen. El fragmento de formato incluye información como la codificación de la muestra, el número de bits por canal, el número de canales, la frecuencia de muestreo. La especificación WAV incluye algunas características opcionales. El fragmento de datos opcional informa el número de muestras para algunos esquemas de codificación comprimidos. El fragmento de punto de referencia (cue
) identifica algunos números de muestra significativos en el archivo de onda. La parte de la lista de reproducción permite que las muestras se reproduzcan desordenadas o repetidas en lugar de solo de principio a fin. La lista de datos asociada permite adjuntar etiquetas y notas (labl
y note
) a los puntos de referencia; Se puede proporcionar una anotación de texto (ltxt
) para un grupo de muestras (p. ej., información de subtítulos). Finalmente, el fragmento de datos de onda obligatorio contiene las muestras reales (en el formato especificado).
Tenga en cuenta que la definición del archivo WAV no muestra dónde debe colocarse un fragmento INFO
. Tampoco dice nada sobre la ubicación de un fragmento CSET
(que especifica el conjunto de caracteres utilizado).
La especificación RIFF intenta ser una especificación formal, pero su formalismo carece de la precisión que se ve en otros formatos etiquetados. Por ejemplo, la especificación RIFF no distingue claramente entre un conjunto de subfragmentos y una secuencia ordenada de subfragmentos. El fragmento de formulario RIFF sugiere que debería ser un contenedor de secuencia. La especificación sugiere que un fragmento LIST también es una secuencia: "Un fragmento LIST contiene una lista, o secuencia ordenada, de subfragmentos." Sin embargo, la especificación no proporciona una especificación formal del fragmento INFO
; un fragmento de LIST INFO
de ejemplo ignora la secuencia de fragmentos implícita en la descripción de INFO
. La definición de fragmento LIST para <wave-data>
utiliza el fragmento LIST como un contenedor de secuencia con buena semántica formal.
La especificación WAV permite no solo una matriz única y contigua de muestras de audio, sino también bloques discretos de muestras y silencio que se reproducen en orden. La mayoría de los archivos WAV usan una sola matriz de datos. La especificación para los datos de muestra es confusa:
El dato de onda-data] contiene los datos de forma de onda. Se define como sigue: ▪wave-data confiar → > > > > > ################################################################################################################################################################################################################################################################ Muestras de onda - No. Silencio * Cuenta de muestras silenciosas
Estas producciones son confusas. Aparentemente <data-list>
(indefinido) y <wave-list>
(definido pero no referenciado) deberían ser idénticos. Incluso si se soluciona ese problema, las producciones permiten que un <data-ck>
contenga un <wave-data>
recursivo (lo que implica problemas de interpretación de datos). La especificación debería haber sido algo como:
################################################################################################################################################################################################################################################################ ■data-ck usuario → datos(Seg. ################################################################################################################################################################################################################################################################ Muestras de onda - No. Silencio * Cuenta de muestras silenciosas
para evitar la recursividad.
Los archivos WAV pueden contener "listas" IFF incrustadas, que pueden contener varios "subfragmentos".
Metadatos
Como derivado de RIFF, los archivos WAV se pueden etiquetar con metadatos en el fragmento INFO. Además, los archivos WAV pueden incrustar cualquier tipo de metadatos, incluidos, entre otros, datos de la Plataforma de metadatos extensible (XMP) o etiquetas ID3 en fragmentos adicionales. Es posible que las aplicaciones no manejen esta información adicional o que esperen verla en un lugar en particular. Aunque la especificación RIFF requiere que las aplicaciones ignoren los fragmentos que no reconocen, algunas aplicaciones se confunden con fragmentos adicionales.
Popularidad
Los archivos WAV sin comprimir son grandes, por lo que compartir archivos WAV a través de Internet es poco común, excepto entre los profesionales del video, la música y el audio, donde la forma sin comprimir se ha convertido en el más popular de todos los formatos de audio y, para la mayoría, el ancho de banda grande de alta velocidad. las conexiones web son comunes. Muchos fabricantes de software de audio y música ahora lo prefieren como su formato de archivo predeterminado, aunque a menudo se admiten otros. La alta resolución del formato lo hace adecuado para retener archivos archivados de primera generación de alta calidad, para usar en un sistema donde el espacio en disco no es una restricción, o en aplicaciones como edición de audio donde el tiempo involucrado en comprimir y descomprimir datos, y las pérdidas en la calidad de tales conversiones son una preocupación.
Uso por emisoras
A pesar de su gran tamaño, la mayoría de las emisoras de radio utilizan archivos WAV sin comprimir, especialmente aquellos que han adoptado un sistema sin cinta.
- BBC Radio en el Reino Unido utiliza 48 kHz 16-bit audio WAV de dos canales como estándar en su sistema de edición y reproducción de audio SCISYS dira.
- La compañía de radio comercial del Reino Unido Global Radio utiliza archivos WAV de 16 bits de 44,1 kHz en el sistema de reproducción de Genesys y en toda su cadena de difusión.
- El sistema ABC "D-Cart", que fue desarrollado por la emisora australiana, utiliza archivos WAV de 48 kHz de 16 bits de dos canales, que es idéntico al de la cinta de audio digital.
- El consorcio Digital Radio Mondiale utiliza archivos WAV como estándar informal para simulación de transmisores y pruebas de receptor.
Limitaciones
El formato WAV está limitado a archivos de menos de 4 GiB, debido a su uso de un número entero sin signo de 32 bits para registrar el encabezado del tamaño del archivo. Aunque esto equivale a unas 6,8 horas de audio con calidad de CD (44,1 kHz, estéreo de 16 bits), a veces es necesario superar este límite, especialmente cuando se requieren mayores frecuencias de muestreo, resoluciones de bits o número de canales. Por lo tanto, el formato W64 se creó para su uso en Sound Forge. Su encabezado de 64 bits permite tiempos de grabación mucho más largos. El formato RF64 especificado por la Unión Europea de Radiodifusión también se ha creado para solucionar este problema.
Datos que no son de audio
Dado que la frecuencia de muestreo de un archivo WAV puede variar de 1 Hz a 4,3 GHz, y la cantidad de canales puede llegar a 65535, los archivos.wav también se han utilizado para datos que no son de audio. LTspice, por ejemplo, puede almacenar múltiples formas de onda de seguimiento de circuito en canales separados, a cualquier frecuencia de muestreo adecuada, con el rango de escala completa que representa ±1 V o A en lugar de una presión de sonido.
Discos compactos de audio
Los discos compactos de audio (CD) no usan el formato de archivo WAV, sino que usan audio Red Book. Lo común es que los CD de audio están codificados como modulación de código de pulso (PCM) sin comprimir, que es uno de los formatos admitidos por WAV. WAV es un formato de archivo para usar en una computadora que la mayoría de los reproductores de CD no pueden entender directamente. Para grabar archivos WAV en un CD de audio, se deben quitar los encabezados de los archivos, se debe transcodificar el contenido si aún no se ha almacenado como PCM, y los datos PCM se escriben directamente en el disco como pistas individuales con relleno de cero agregado para que coincida con el CD. tamaño del sector;s.
Para que el audio PCM pueda grabarse en un CD, debe estar en formato estéreo de 44,1 kHz y 16 bits.
Comparación de esquemas de codificación
El audio en archivos WAV se puede codificar en una variedad de formatos de codificación de audio, como GSM o MP3, para reducir el tamaño del archivo.
Esta es una referencia para comparar la calidad de audio monofónico (no estereofónico) y las tasas de bits de compresión de formatos de codificación de audio disponibles para archivos WAV, incluidos PCM, ADPCM, Microsoft GSM 06.10, CELP, SBC, Truespeech y MPEG Layer-3. Estos son los códecs ACM predeterminados que vienen con Windows.
Formato | Bitrate (kbit/s) | 1 minuto (KiB) |
---|---|---|
11,025 Hz 16 bit PCM | 176.4 | 1292 |
08.000 Hz 16 bit PCM | 128 | 0938 |
11,025 Hz 8 bit PCM | 088.2 | 0646 |
11,025 Hz μ-Law | 088.2 | 0646 |
08.000 Hz 8 bit PCM | 064 | 0469 |
08.000 Hz μ-Law | 064 | 0469 |
11,025 Hz 4 bit ADPCM | 044.1 | 0323 |
08.000 Hz 4 bit ADPCM | 032 | 0234 |
11,025 Hz GSM 06.10 | 018 | 0132 |
08.000 Hz MP3 16 kbit/s | 016 | 0117 |
08.000 Hz GSM 06.10 | 013 | 0103 |
08.000 Hz Lernout & Hauspie SBC 12 kbit/s | 012 | 0088 |
08.000 Hz DSP Group Truespeech | 009 | 0066 |
08.000 Hz MP3 8 kbit/s | 008 | 0060 |
08.000 Hz Lernout " Hauspie CELP | 004.8 | 0035 |
Los anteriores son archivos WAV; incluso aquellos que usan compresión MP3 tienen la extensión .wav
.
Contenido relacionado
Northrop Grumman E-8 ESTRELLAS conjuntas
Ventanas 98
Amplificador óptico