MPEG-4

Ajustar Compartir Imprimir Citar
Estándar de codificación de vídeo

MPEG-4 es un grupo de estándares internacionales para la compresión de datos visuales y de audio digital, sistemas multimedia y formatos de almacenamiento de archivos. Se introdujo originalmente a fines de 1998 como un grupo de formatos de codificación de audio y video y tecnología relacionada acordados por el Grupo de expertos en imágenes en movimiento (MPEG) de ISO/IEC (ISO/IEC JTC 1/SC29/WG11) bajo el estándar formal ISO/ IEC 14496: Codificación de objetos audiovisuales. Los usos de MPEG-4 incluyen la compresión de datos audiovisuales para video por Internet y distribución de CD, voz (teléfono, videoteléfono) y aplicaciones de transmisión de televisión. El estándar MPEG-4 fue desarrollado por un grupo liderado por Touradj Ebrahimi (luego presidente de JPEG) y Fernando Pereira.

Antecedentes

MPEG-4 absorbe muchas de las funciones de MPEG-1 y MPEG-2 y otros estándares relacionados, y agrega nuevas funciones, como la compatibilidad (ampliada) de VRML para renderizado 3D, archivos compuestos orientados a objetos (incluidos audio, video y VRML objetos), compatibilidad con gestión de derechos digitales especificada externamente y varios tipos de interactividad. AAC (Codificación de audio avanzada) se estandarizó como complemento de MPEG-2 (como Parte 1) antes de que se emitiera MPEG-4.

MPEG-4 sigue siendo un estándar en evolución y se divide en varias partes. Las empresas que promueven la compatibilidad con MPEG-4 no siempre indican claramente qué "parte" compatibilidad de nivel a la que se refieren. Las partes clave a tener en cuenta son MPEG-4 Parte 2 (incluido Advanced Simple Profile, utilizado por códecs como DivX, Xvid, Nero Digital y 3ivx y por QuickTime 6) y MPEG-4 parte 10 (MPEG-4 AVC/H.264 o Codificación de video avanzada, utilizada por el codificador x264, Nero Digital AVC, QuickTime 7 y medios de video de alta definición como Blu-ray Disc).

La mayoría de las características incluidas en MPEG-4 se dejan a los desarrolladores individuales para decidir si implementarlas o no. Esto significa que probablemente no haya implementaciones completas de todo el conjunto de estándares MPEG-4. Para hacer frente a esto, la norma incluye el concepto de "perfiles" y "niveles", lo que permite definir un conjunto específico de capacidades de manera apropiada para un subconjunto de aplicaciones.

Inicialmente, MPEG-4 estaba destinado principalmente a comunicaciones de video de baja tasa de bits; sin embargo, su alcance como estándar de codificación multimedia se amplió más tarde. MPEG-4 es eficiente en una variedad de velocidades de bits que van desde unos pocos kilobits por segundo hasta decenas de megabits por segundo. MPEG-4 proporciona las siguientes funciones:

Resumen

MPEG-4 proporciona una serie de tecnologías para desarrolladores, para varios proveedores de servicios y para usuarios finales:

El formato MPEG-4 puede realizar diversas funciones, entre las que se encuentran las siguientes:

Perfiles y Niveles

MPEG-4 proporciona un amplio y rico conjunto de herramientas para la codificación. Se han proporcionado subconjuntos de los conjuntos de herramientas MPEG-4 para su uso en aplicaciones específicas. Estos subconjuntos, denominados 'Perfiles', limitan el tamaño del conjunto de herramientas que debe implementar un decodificador. Para restringir la complejidad computacional, uno o más 'Niveles' se establecen para cada perfil. Una combinación de Perfil y Nivel permite:

Piezas MPEG-4

MPEG-4 consta de varios estándares, denominados "partes", incluidos los siguientes (cada parte cubre un aspecto determinado de la especificación completa):

Piezas MPEG-4
Parte Número Primera fecha de publicación pública (primera edición) Última fecha de publicación pública (última edición) Última enmienda Título Descripción
Parte 1ISO/IEC 14496-1 1999 2010 2014 Sistemas Describe sincronización y multiplexación de vídeo y audio. Por ejemplo, la versión 1 del formato de archivo MPEG-4 (obsoleted by version 2 defined in MPEG-4 Part 14). La funcionalidad de una pila de protocolo de transporte para la transmisión y/o almacenamiento de contenidos conforme a ISO/IEC 14496 no está dentro del alcance de 14496-1 y sólo se considera la interfaz a esta capa (DMIF). La información sobre el transporte de contenido MPEG-4 se define por ejemplo en MPEG-2 Transport Stream, RTP Audio Perfiles y otros.
Segunda parteISO/IEC 14496-2 1999 2004 2009 Visual Formato de compresión para datos visuales (video, texturas todavía, imágenes sintéticas, etc.). Uno de los muchos "profiles" en la Parte 2 es el Perfil Simple Avanzado (ASP).
Parte 3 ISO/IEC 14496-3 1999 2009 2017 Audio Un conjunto de formatos de compresión para codificación perceptual de señales de audio, incluyendo algunas variaciones de codificación avanzada de audio (AAC), así como otros formatos y herramientas de codificación de audio / voz (como Audio Coding sin pérdidas (ALS), codificación sin pérdidas escalables (SLS), audio estructurado, interfaz de texto a voz (TTSI), HVXC, CELP y otros)
Parte 4 ISO/IEC 14496-4 2000 2004 2016 Pruebas de conformidad Describe los procedimientos para probar la conformidad con otras partes de la norma.
Parte 5 ISO/IEC 14496-5 2000 2001 2017 Software de referencia Proporciona software de referencia para demostrar y aclarar las otras partes de la norma.
Parte 6 ISO/IEC 14496-6 1999 2000 Marco de integración multimedia de entrega (DMIF)
Parte 7 ISO/IEC TR 14496-7 2002 2004 Software de referencia optimizado para codificación de objetos audiovisuales Proporciona ejemplos de cómo mejorar las implementaciones (por ejemplo, en relación con la Parte 5).
Parte 8 ISO/IEC 14496-8 2004 2004 Transporte de contenidos ISO/IEC 14496 sobre redes IP Especifica un método para llevar contenido MPEG-4 en redes IP. También incluye directrices para diseñar formatos de carga útil RTP, reglas de uso de SDP para transportar información relacionada con ISO/IEC 14496-1, definiciones de tipo MIME, análisis sobre seguridad RTP y multicasting.
Parte 9 ISO/IEC TR 14496-9 2004 2009 Descripción del hardware de referencia Proporciona diseños de hardware para demostrar cómo implementar las otras partes de la norma.
Parte 10 ISO/IEC 14496-10 2003 2014 2016 Codificación avanzada de vídeo (AVC) Un formato de compresión para señales de vídeo que es técnicamente idéntico al estándar ITU-T H.264.
Parte 11 ISO/IEC 14496-11 2005 2015 Descripción de escena y motor de aplicación Se puede utilizar para contenidos ricos e interactivos con múltiples perfiles, incluyendo versiones 2D y 3D. MPEG-4 Parte 11 revisó MPEG-4 Parte 1 – ISO/IEC 14496-1:2001 y dos enmiendas a MPEG-4 Parte 1. Describe una descripción del nivel del sistema de un motor de aplicación (entrega, ciclo de vida, formato y comportamiento de aplicaciones de código Java descargables) y el Formato binario para escena (BIFS) y el formato Extensible MPEG-4 Textual (XMT) – una representación textual del contenido multimedia MPEG-4, etc. (También se conoce como BIFS, XMT, MPEG-J. MPEG-J fue definido en MPEG-4 Parte 21)
Parte 12 ISO/IEC 14496-12 2004 2015 2017 Formato de archivo de medios base ISO Un formato de archivo para almacenar contenido multimedia basado en el tiempo. Es un formato general que forma la base para varios otros formatos de archivo más específicos (por ejemplo, 3GP, Motion JPEG 2000, MPEG-4 Part 14). Es técnicamente idéntica a ISO/IEC 15444-12 (JPEG 2000 sistema de codificación de imágenes – Parte 12).
Parte 13 ISO/IEC 14496-13 2004 2004 Extensiones de gestión y protección de la propiedad intelectual (IPMP) MPEG-4 Parte 13 revisó una enmienda al MPEG-4 Parte 1 – ISO/IEC 14496-1:2001/Amd 3:2004. Especifica el procesamiento, sintaxis y semántica comunes de la Propiedad Intelectual (IPMP) para el transporte de herramientas IPMP en el flujo de bits, el transporte de información IPMP, la autenticación mutua de herramientas IPMP, una lista de las autoridades de registro necesarias para el apoyo de las especificaciones modificadas (por ejemplo, CISAC), etc. Se definió debido a la falta de interoperabilidad de diferentes mecanismos de protección (diferentes sistemas DRM) para proteger y distribuir contenidos digitales con derechos de autor como música o vídeo.
Parte 14 ISO/IEC 14496-14 2003 2003 2010 formato de archivo MP4 También se conoce como "MPEG-4 versión de formato de archivo 2". El formato de archivo contenedor designado para el contenido MPEG-4, que se basa en la Parte 12. Revisa y reemplaza por completo la Cláusula 13 de ISO/IEC 14496-1 (MPEG-4 Parte 1: Systems), en la que se especificó previamente el formato de archivo MPEG-4.
Parte 15 ISO/IEC 14496-15 2004 2017 2020 Parte 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format Para el almacenamiento del vídeo de la Parte 10. El formato de archivo se basa en la Parte 12, pero también permite el almacenamiento en otros formatos de archivo.
Parte 16 ISO/IEC 14496-16 2004 2011 2016 EXtensión Marco de Animación (AFX) Especifica el modelo MPEG-4 Animation Framework eXtension (AFX) para representar el contenido de gráficos 3D. MPEG-4 se extiende con objetos sintéticos de alto nivel para especificar geometría, textura, animación y algoritmos de compresión dedicados.
Parte 17 ISO/IEC 14496-17 2006 2006 Racionalización del formato de texto Timed Text subtitle format
Parte 18 ISO/IEC 14496-18 2004 2004 2014 Compresión de fuentes y streaming Para Open Font Format definido en la Parte 22.
Parte 19 ISO/IEC 14496-19 2004 2004 Flujo de textura sintetizado Los flujos de textura sintetizados se utilizan para la creación de clips de vídeo sintéticos de bitrate muy bajos.
Parte 20 ISO/IEC 14496-20 2006 2008 2010 Representación de escena ligera (LASER) y formato de agregación simple (SAF) Los requisitos de LASeR (eficiencia de compresión, código y huella de memoria) se cumplen aprovechando el formato Scalable Vector Graphics (SVG) definido por el World Wide Web Consortium.
Parte 21 ISO/IEC 14496-21 2006 2006 EXtensiones del Marco Gráfico MPEG-J (GFX) Describe un entorno programático ligero para aplicaciones multimedia interactivas avanzadas – un marco que combina un subconjunto del entorno de aplicación Java estándar MPEG (MPEG-J) con una API Java. (en la etapa "FCD" en julio de 2005, FDIS enero de 2006, publicado como norma ISO en 2006-11-22).
Parte 22 ISO/IEC 14496-22 2007 2015 2017 Open Font Format OFFS se basa en la especificación de formato de fuente de OpenType 1.4 y es técnicamente equivalente a esa especificación. Alcanzado "CD" en julio de 2005, publicado como norma ISO en 2007
Parte 23 ISO/IEC 14496-23 2008 2008 Representación musical simbólica (SMR) Etapa "FCD" alcanzada en octubre de 2006, publicada como norma ISO en 2008-01-28
Parte 24 ISO/IEC TR 14496-24 2008 2008 Interacción de audio y sistemas Describe el comportamiento conjunto deseado del formato de archivo MPEG-4 y MPEG-4 Audio.
Parte 25 ISO/IEC 14496-25 2009 2011 Modelo de compresión de gráficos 3D Define un modelo para conectar herramientas 3D Graphics Compression definidas en estándares MPEG-4 a primitivos gráficos definidos en cualquier otro estándar o especificación.
Parte 26 ISO/IEC 14496-26 2010 2010 2016 Audio Conformance
Parte 27 ISO/IEC 14496-27 2009 2009 2015 3D Graphics conformance 3D Graphics Conformance resume los requisitos, los hace referencias cruzadas a las características y define cómo se puede probar la conformidad con ellos. Se dan directrices sobre la construcción de pruebas para verificar la conformidad del decodificador.
Parte 28ISO/IEC 14496-28 2012 2012 Representación de fuentes compuestas
Parte 29 ISO/IEC 14496-29 2014 2015 Codificación de vídeo web El texto de la Parte 29 se deriva de la Parte 10 - ISO/IEC 14496-10. La codificación de vídeo web es una tecnología compatible con el Perfil de Bases Constrained de ISO/IEC 14496-10 (el subconjunto que se especifica en el Anexo A de Base Constrained es una especificación normativa, mientras que todas las partes restantes son informativas).
Parte 30 ISO/IEC 14496-30 2014 2014 Texto programado y otros overlays visuales en formato de archivo base ISO Describe el transporte de algunas formas de secuencias de texto templado y subtítulos en archivos basados en ISO/IEC 14496-12 - W3C Timed Text Markup Language 1.0, W3C WebVTT (Web Video Text Tracks). La documentación de estos formularios no excluye otra definición de transporte de texto templado o subtítulos; véase, por ejemplo, 3GPP Timed Text (3GPP TS 26.245).
Parte 31 ISO/IEC 14496-31 En desarrollo (2018-05) Codificación de vídeo para navegadores Codificación de vídeo para navegadores (VCB) - una tecnología de compresión de vídeo que está destinada a usar dentro del navegador World Wide Web
Parte 32 ISO/IEC CD 14496-32 En desarrollo Software de conformidad y referencia
Parte 33 IEDS ISO/IEC 14496-33 En desarrollo Codificación de vídeo en Internet

Los perfiles también se definen dentro de las "partes" individuales, por lo que la implementación de una parte normalmente no es una implementación de una parte completa.

MPEG-1, MPEG-2, MPEG-7 y MPEG-21 son otros conjuntos de estándares MPEG.

Niveles MPEG-4

Los niveles de perfil bajo son parte de las restricciones de codificación/descodificación de video MPEG-4 y son compatibles con el antiguo estándar ITU H.261, también compatible con los antiguos estándares de TV analógica para transmisión y grabación (como NTSC o PAL video). El perfil ASP en su nivel más alto es adecuado para la mayoría de los medios y reproductores de DVD habituales o para muchos sitios de video en línea, pero no para discos Blu-ray o contenido de video HD en línea.

Perfil Nivel Max.
buffer
Max.
bitrate
Max.
demora
Max.
VP
tamaño
Max.
VOP
tamaño
Max.
decoder
Tasa
Max. framesize
@ max.
bitrate
@ 30 Hz @ 25 Hz @ 24 Hz @ 15 Hz @ 12.5 Hz
SP L0 160642.50 2.048991.485 QCIF (176×144)
L0b 320128
L1 16064 128×96144×96160×96
L2 6401285.00 4.0963965.940 256×192304×192, 288×208304×208CIF (352×288)
L3 3841.66 8.19211.880 CIF (352×288)
L4a 1.2804.0000.32 16.384 1.20036.000 VGA (640×480)
L5 1,792 8.0000.22 1.62040,500 D1 NTSC (720×480)D1 PAL (720×576)
L6 3.968 12.0000.33 3.600108.000 720p (1280x720)
ASP L0 1601281.25 2.048992.970 QCIF (176×144)
L1
L2 6403841.66 4.0963965.940 256×192304×192, 288×208304×208CIF (352×288)
L3 7680,86 11.880 CIF (352×288)
L3b 1.0401.5000.69
L4 1.2803.0000.43 8.19279223.760 352×576, 704×288
L5 1,7928.0000.22 16.3841.62048,600 720×576
Unidades kbits kbits/s segundos bits macrobloques macroblocks/s pixels

Más adelante se han definido perfiles más avanzados para medios HD en el perfil AVC, que es funcionalmente idéntico al estándar ITU H.264 pero ahora también está integrado en MPEG-4 Parte 10 (consulte H.264/MPEG-4 AVC para la lista de niveles definidos en este perfil AVC).

Licencias

MPEG-4 contiene tecnologías patentadas, cuyo uso requiere licencia en países que reconocen las patentes de algoritmos de software. Más de dos docenas de empresas afirman tener patentes que cubren MPEG-4. MPEG LA otorga licencias de patentes requeridas para MPEG-4 Parte 2 Visual de una amplia gama de empresas (el audio se licencia por separado) y enumera todos sus licenciantes y licenciatarios en el sitio. Se están desarrollando nuevas licencias para las patentes del sistema MPEG-4 y no se ofrecen nuevas licencias, mientras que los titulares de su antigua licencia de sistemas MPEG-4 todavía están cubiertos por los términos de esa licencia para las patentes enumeradas (MPEG LA - Lista de patentes).

La mayoría de las patentes utilizadas para el formato MPEG-4 Visual pertenecen a tres empresas japonesas: Mitsubishi Electric (255 patentes), Hitachi (206 patentes) y Panasonic (200 patentes).