MPEG-4
MPEG-4 es un grupo de estándares internacionales para la compresión de datos visuales y de audio digital, sistemas multimedia y formatos de almacenamiento de archivos. Se introdujo originalmente a fines de 1998 como un grupo de formatos de codificación de audio y video y tecnología relacionada acordados por el Grupo de expertos en imágenes en movimiento (MPEG) de ISO/IEC (ISO/IEC JTC 1/SC29/WG11) bajo el estándar formal ISO/ IEC 14496: Codificación de objetos audiovisuales. Los usos de MPEG-4 incluyen la compresión de datos audiovisuales para video por Internet y distribución de CD, voz (teléfono, videoteléfono) y aplicaciones de transmisión de televisión. El estándar MPEG-4 fue desarrollado por un grupo liderado por Touradj Ebrahimi (luego presidente de JPEG) y Fernando Pereira.
Antecedentes
MPEG-4 absorbe muchas de las funciones de MPEG-1 y MPEG-2 y otros estándares relacionados, y agrega nuevas funciones, como la compatibilidad (ampliada) de VRML para renderizado 3D, archivos compuestos orientados a objetos (incluidos audio, video y VRML objetos), compatibilidad con gestión de derechos digitales especificada externamente y varios tipos de interactividad. AAC (Codificación de audio avanzada) se estandarizó como complemento de MPEG-2 (como Parte 1) antes de que se emitiera MPEG-4.
MPEG-4 sigue siendo un estándar en evolución y se divide en varias partes. Las empresas que promueven la compatibilidad con MPEG-4 no siempre indican claramente qué "parte" compatibilidad de nivel a la que se refieren. Las partes clave a tener en cuenta son MPEG-4 Parte 2 (incluido Advanced Simple Profile, utilizado por códecs como DivX, Xvid, Nero Digital y 3ivx y por QuickTime 6) y MPEG-4 parte 10 (MPEG-4 AVC/H.264 o Codificación de video avanzada, utilizada por el codificador x264, Nero Digital AVC, QuickTime 7 y medios de video de alta definición como Blu-ray Disc).
La mayoría de las características incluidas en MPEG-4 se dejan a los desarrolladores individuales para decidir si implementarlas o no. Esto significa que probablemente no haya implementaciones completas de todo el conjunto de estándares MPEG-4. Para hacer frente a esto, la norma incluye el concepto de "perfiles" y "niveles", lo que permite definir un conjunto específico de capacidades de manera apropiada para un subconjunto de aplicaciones.
Inicialmente, MPEG-4 estaba destinado principalmente a comunicaciones de video de baja tasa de bits; sin embargo, su alcance como estándar de codificación multimedia se amplió más tarde. MPEG-4 es eficiente en una variedad de velocidades de bits que van desde unos pocos kilobits por segundo hasta decenas de megabits por segundo. MPEG-4 proporciona las siguientes funciones:
- Mejor eficiencia de codificación sobre MPEG-2
- Capacidad para codificar datos multimedia mixtos (video, audio, discurso)
- Resiliencia de errores para permitir una transmisión robusta
- Capacidad para interactuar con la escena audiovisual generada en el receptor
Resumen
MPEG-4 proporciona una serie de tecnologías para desarrolladores, para varios proveedores de servicios y para usuarios finales:
- MPEG-4 permite a diferentes desarrolladores de software y hardware crear objetos multimedia que poseen mejores capacidades de adaptabilidad y flexibilidad para mejorar la calidad de tales servicios y tecnologías como televisión digital, gráficos de animación, la World Wide Web y sus extensiones.
- Los proveedores de red de datos pueden utilizar MPEG-4 para la transparencia de datos. Con la ayuda de procedimientos estándar, los datos MPEG-4 pueden ser interpretados y transformados en otros tipos de señales compatibles con cualquier red disponible.
- El formato MPEG-4 proporciona a los usuarios finales una amplia gama de interacción con diversos objetos animados.
- Standardized Digital Rights Management signaling, otherwise known in the MPEG community as Intellectual Property Management and Protection (IPMP).
El formato MPEG-4 puede realizar diversas funciones, entre las que se encuentran las siguientes:
- Múltiples y sincroniza los datos, asociados con objetos multimedia, de tal manera que puedan ser transportados de manera eficiente a través de canales de red.
- Interacción con la escena audiovisual, que se forma al lado del receptor.
Perfiles y Niveles
MPEG-4 proporciona un amplio y rico conjunto de herramientas para la codificación. Se han proporcionado subconjuntos de los conjuntos de herramientas MPEG-4 para su uso en aplicaciones específicas. Estos subconjuntos, denominados 'Perfiles', limitan el tamaño del conjunto de herramientas que debe implementar un decodificador. Para restringir la complejidad computacional, uno o más 'Niveles' se establecen para cada perfil. Una combinación de Perfil y Nivel permite:
- Un constructor de codec para implementar sólo el subconjunto de la norma necesaria, manteniendo la interacción con otros dispositivos MPEG-4 que implementan la misma combinación.
- Comprobando si los dispositivos MPEG-4 cumplen con el estándar, denominado prueba de conformidad.
Piezas MPEG-4
MPEG-4 consta de varios estándares, denominados "partes", incluidos los siguientes (cada parte cubre un aspecto determinado de la especificación completa):
Parte | Número | Primera fecha de publicación pública (primera edición) | Última fecha de publicación pública (última edición) | Última enmienda | Título | Descripción |
---|---|---|---|---|---|---|
Parte 1 | ISO/IEC 14496-1 | 1999 | 2010 | 2014 | Sistemas | Describe sincronización y multiplexación de vídeo y audio. Por ejemplo, la versión 1 del formato de archivo MPEG-4 (obsoleted by version 2 defined in MPEG-4 Part 14). La funcionalidad de una pila de protocolo de transporte para la transmisión y/o almacenamiento de contenidos conforme a ISO/IEC 14496 no está dentro del alcance de 14496-1 y sólo se considera la interfaz a esta capa (DMIF). La información sobre el transporte de contenido MPEG-4 se define por ejemplo en MPEG-2 Transport Stream, RTP Audio Perfiles y otros. |
Segunda parte | ISO/IEC 14496-2 | 1999 | 2004 | 2009 | Visual | Formato de compresión para datos visuales (video, texturas todavía, imágenes sintéticas, etc.). Uno de los muchos "profiles" en la Parte 2 es el Perfil Simple Avanzado (ASP). |
Parte 3 | ISO/IEC 14496-3 | 1999 | 2009 | 2017 | Audio | Un conjunto de formatos de compresión para codificación perceptual de señales de audio, incluyendo algunas variaciones de codificación avanzada de audio (AAC), así como otros formatos y herramientas de codificación de audio / voz (como Audio Coding sin pérdidas (ALS), codificación sin pérdidas escalables (SLS), audio estructurado, interfaz de texto a voz (TTSI), HVXC, CELP y otros) |
Parte 4 | ISO/IEC 14496-4 | 2000 | 2004 | 2016 | Pruebas de conformidad | Describe los procedimientos para probar la conformidad con otras partes de la norma. |
Parte 5 | ISO/IEC 14496-5 | 2000 | 2001 | 2017 | Software de referencia | Proporciona software de referencia para demostrar y aclarar las otras partes de la norma. |
Parte 6 | ISO/IEC 14496-6 | 1999 | 2000 | Marco de integración multimedia de entrega (DMIF) | ||
Parte 7 | ISO/IEC TR 14496-7 | 2002 | 2004 | Software de referencia optimizado para codificación de objetos audiovisuales | Proporciona ejemplos de cómo mejorar las implementaciones (por ejemplo, en relación con la Parte 5). | |
Parte 8 | ISO/IEC 14496-8 | 2004 | 2004 | Transporte de contenidos ISO/IEC 14496 sobre redes IP | Especifica un método para llevar contenido MPEG-4 en redes IP. También incluye directrices para diseñar formatos de carga útil RTP, reglas de uso de SDP para transportar información relacionada con ISO/IEC 14496-1, definiciones de tipo MIME, análisis sobre seguridad RTP y multicasting. | |
Parte 9 | ISO/IEC TR 14496-9 | 2004 | 2009 | Descripción del hardware de referencia | Proporciona diseños de hardware para demostrar cómo implementar las otras partes de la norma. | |
Parte 10 | ISO/IEC 14496-10 | 2003 | 2014 | 2016 | Codificación avanzada de vídeo (AVC) | Un formato de compresión para señales de vídeo que es técnicamente idéntico al estándar ITU-T H.264. |
Parte 11 | ISO/IEC 14496-11 | 2005 | 2015 | Descripción de escena y motor de aplicación | Se puede utilizar para contenidos ricos e interactivos con múltiples perfiles, incluyendo versiones 2D y 3D. MPEG-4 Parte 11 revisó MPEG-4 Parte 1 – ISO/IEC 14496-1:2001 y dos enmiendas a MPEG-4 Parte 1. Describe una descripción del nivel del sistema de un motor de aplicación (entrega, ciclo de vida, formato y comportamiento de aplicaciones de código Java descargables) y el Formato binario para escena (BIFS) y el formato Extensible MPEG-4 Textual (XMT) – una representación textual del contenido multimedia MPEG-4, etc. (También se conoce como BIFS, XMT, MPEG-J. MPEG-J fue definido en MPEG-4 Parte 21) | |
Parte 12 | ISO/IEC 14496-12 | 2004 | 2015 | 2017 | Formato de archivo de medios base ISO | Un formato de archivo para almacenar contenido multimedia basado en el tiempo. Es un formato general que forma la base para varios otros formatos de archivo más específicos (por ejemplo, 3GP, Motion JPEG 2000, MPEG-4 Part 14). Es técnicamente idéntica a ISO/IEC 15444-12 (JPEG 2000 sistema de codificación de imágenes – Parte 12). |
Parte 13 | ISO/IEC 14496-13 | 2004 | 2004 | Extensiones de gestión y protección de la propiedad intelectual (IPMP) | MPEG-4 Parte 13 revisó una enmienda al MPEG-4 Parte 1 – ISO/IEC 14496-1:2001/Amd 3:2004. Especifica el procesamiento, sintaxis y semántica comunes de la Propiedad Intelectual (IPMP) para el transporte de herramientas IPMP en el flujo de bits, el transporte de información IPMP, la autenticación mutua de herramientas IPMP, una lista de las autoridades de registro necesarias para el apoyo de las especificaciones modificadas (por ejemplo, CISAC), etc. Se definió debido a la falta de interoperabilidad de diferentes mecanismos de protección (diferentes sistemas DRM) para proteger y distribuir contenidos digitales con derechos de autor como música o vídeo. | |
Parte 14 | ISO/IEC 14496-14 | 2003 | 2003 | 2010 | formato de archivo MP4 | También se conoce como "MPEG-4 versión de formato de archivo 2". El formato de archivo contenedor designado para el contenido MPEG-4, que se basa en la Parte 12. Revisa y reemplaza por completo la Cláusula 13 de ISO/IEC 14496-1 (MPEG-4 Parte 1: Systems), en la que se especificó previamente el formato de archivo MPEG-4. |
Parte 15 | ISO/IEC 14496-15 | 2004 | 2017 | 2020 | Parte 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format | Para el almacenamiento del vídeo de la Parte 10. El formato de archivo se basa en la Parte 12, pero también permite el almacenamiento en otros formatos de archivo. |
Parte 16 | ISO/IEC 14496-16 | 2004 | 2011 | 2016 | EXtensión Marco de Animación (AFX) | Especifica el modelo MPEG-4 Animation Framework eXtension (AFX) para representar el contenido de gráficos 3D. MPEG-4 se extiende con objetos sintéticos de alto nivel para especificar geometría, textura, animación y algoritmos de compresión dedicados. |
Parte 17 | ISO/IEC 14496-17 | 2006 | 2006 | Racionalización del formato de texto | Timed Text subtitle format | |
Parte 18 | ISO/IEC 14496-18 | 2004 | 2004 | 2014 | Compresión de fuentes y streaming | Para Open Font Format definido en la Parte 22. |
Parte 19 | ISO/IEC 14496-19 | 2004 | 2004 | Flujo de textura sintetizado | Los flujos de textura sintetizados se utilizan para la creación de clips de vídeo sintéticos de bitrate muy bajos. | |
Parte 20 | ISO/IEC 14496-20 | 2006 | 2008 | 2010 | Representación de escena ligera (LASER) y formato de agregación simple (SAF) | Los requisitos de LASeR (eficiencia de compresión, código y huella de memoria) se cumplen aprovechando el formato Scalable Vector Graphics (SVG) definido por el World Wide Web Consortium. |
Parte 21 | ISO/IEC 14496-21 | 2006 | 2006 | EXtensiones del Marco Gráfico MPEG-J (GFX) | Describe un entorno programático ligero para aplicaciones multimedia interactivas avanzadas – un marco que combina un subconjunto del entorno de aplicación Java estándar MPEG (MPEG-J) con una API Java. (en la etapa "FCD" en julio de 2005, FDIS enero de 2006, publicado como norma ISO en 2006-11-22). | |
Parte 22 | ISO/IEC 14496-22 | 2007 | 2015 | 2017 | Open Font Format | OFFS se basa en la especificación de formato de fuente de OpenType 1.4 y es técnicamente equivalente a esa especificación. Alcanzado "CD" en julio de 2005, publicado como norma ISO en 2007 |
Parte 23 | ISO/IEC 14496-23 | 2008 | 2008 | Representación musical simbólica (SMR) | Etapa "FCD" alcanzada en octubre de 2006, publicada como norma ISO en 2008-01-28 | |
Parte 24 | ISO/IEC TR 14496-24 | 2008 | 2008 | Interacción de audio y sistemas | Describe el comportamiento conjunto deseado del formato de archivo MPEG-4 y MPEG-4 Audio. | |
Parte 25 | ISO/IEC 14496-25 | 2009 | 2011 | Modelo de compresión de gráficos 3D | Define un modelo para conectar herramientas 3D Graphics Compression definidas en estándares MPEG-4 a primitivos gráficos definidos en cualquier otro estándar o especificación. | |
Parte 26 | ISO/IEC 14496-26 | 2010 | 2010 | 2016 | Audio Conformance | |
Parte 27 | ISO/IEC 14496-27 | 2009 | 2009 | 2015 | 3D Graphics conformance | 3D Graphics Conformance resume los requisitos, los hace referencias cruzadas a las características y define cómo se puede probar la conformidad con ellos. Se dan directrices sobre la construcción de pruebas para verificar la conformidad del decodificador. |
Parte 28 | ISO/IEC 14496-28 | 2012 | 2012 | Representación de fuentes compuestas | ||
Parte 29 | ISO/IEC 14496-29 | 2014 | 2015 | Codificación de vídeo web | El texto de la Parte 29 se deriva de la Parte 10 - ISO/IEC 14496-10. La codificación de vídeo web es una tecnología compatible con el Perfil de Bases Constrained de ISO/IEC 14496-10 (el subconjunto que se especifica en el Anexo A de Base Constrained es una especificación normativa, mientras que todas las partes restantes son informativas). | |
Parte 30 | ISO/IEC 14496-30 | 2014 | 2014 | Texto programado y otros overlays visuales en formato de archivo base ISO | Describe el transporte de algunas formas de secuencias de texto templado y subtítulos en archivos basados en ISO/IEC 14496-12 - W3C Timed Text Markup Language 1.0, W3C WebVTT (Web Video Text Tracks). La documentación de estos formularios no excluye otra definición de transporte de texto templado o subtítulos; véase, por ejemplo, 3GPP Timed Text (3GPP TS 26.245). | |
Parte 31 | ISO/IEC 14496-31 | En desarrollo (2018-05) | Codificación de vídeo para navegadores | Codificación de vídeo para navegadores (VCB) - una tecnología de compresión de vídeo que está destinada a usar dentro del navegador World Wide Web | ||
Parte 32 | ISO/IEC CD 14496-32 | En desarrollo | Software de conformidad y referencia | |||
Parte 33 | IEDS ISO/IEC 14496-33 | En desarrollo | Codificación de vídeo en Internet |
Los perfiles también se definen dentro de las "partes" individuales, por lo que la implementación de una parte normalmente no es una implementación de una parte completa.
MPEG-1, MPEG-2, MPEG-7 y MPEG-21 son otros conjuntos de estándares MPEG.
Niveles MPEG-4
Los niveles de perfil bajo son parte de las restricciones de codificación/descodificación de video MPEG-4 y son compatibles con el antiguo estándar ITU H.261, también compatible con los antiguos estándares de TV analógica para transmisión y grabación (como NTSC o PAL video). El perfil ASP en su nivel más alto es adecuado para la mayoría de los medios y reproductores de DVD habituales o para muchos sitios de video en línea, pero no para discos Blu-ray o contenido de video HD en línea.
Perfil | Nivel | Max. buffer | Max. bitrate | Max. demora | Max. VP tamaño | Max. VOP tamaño | Max. decoder Tasa | Max. framesize | ||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
@ max. bitrate | @ 30 Hz | @ 25 Hz | @ 24 Hz | @ 15 Hz | @ 12.5 Hz | |||||||
SP | L0 | 160 | 64 | 2.50 | 2.048 | 99 | 1.485 | — | QCIF (176×144) | |||
L0b | 320 | 128 | ||||||||||
L1 | 160 | 64 | 128×96 | 144×96 | 160×96 | |||||||
L2 | 640 | 128 | 5.00 | 4.096 | 396 | 5.940 | 256×192 | 304×192, 288×208 | 304×208 | CIF (352×288) | ||
L3 | 384 | 1.66 | 8.192 | 11.880 | CIF (352×288) | |||||||
L4a | 1.280 | 4.000 | 0.32 | 16.384 | 1.200 | 36.000 | VGA (640×480) | |||||
L5 | 1,792 | 8.000 | 0.22 | 1.620 | 40,500 | D1 NTSC (720×480) | D1 PAL (720×576) | |||||
L6 | 3.968 | 12.000 | 0.33 | 3.600 | 108.000 | 720p (1280x720) | ||||||
ASP | L0 | 160 | 128 | 1.25 | 2.048 | 99 | 2.970 | QCIF (176×144) | ||||
L1 | ||||||||||||
L2 | 640 | 384 | 1.66 | 4.096 | 396 | 5.940 | 256×192 | 304×192, 288×208 | 304×208 | CIF (352×288) | ||
L3 | 768 | 0,86 | 11.880 | CIF (352×288) | ||||||||
L3b | 1.040 | 1.500 | 0.69 | |||||||||
L4 | 1.280 | 3.000 | 0.43 | 8.192 | 792 | 23.760 | 352×576, 704×288 | |||||
L5 | 1,792 | 8.000 | 0.22 | 16.384 | 1.620 | 48,600 | 720×576 | |||||
Unidades | kbits | kbits/s | segundos | bits | macrobloques | macroblocks/s | pixels |
Más adelante se han definido perfiles más avanzados para medios HD en el perfil AVC, que es funcionalmente idéntico al estándar ITU H.264 pero ahora también está integrado en MPEG-4 Parte 10 (consulte H.264/MPEG-4 AVC para la lista de niveles definidos en este perfil AVC).
Licencias
MPEG-4 contiene tecnologías patentadas, cuyo uso requiere licencia en países que reconocen las patentes de algoritmos de software. Más de dos docenas de empresas afirman tener patentes que cubren MPEG-4. MPEG LA otorga licencias de patentes requeridas para MPEG-4 Parte 2 Visual de una amplia gama de empresas (el audio se licencia por separado) y enumera todos sus licenciantes y licenciatarios en el sitio. Se están desarrollando nuevas licencias para las patentes del sistema MPEG-4 y no se ofrecen nuevas licencias, mientras que los titulares de su antigua licencia de sistemas MPEG-4 todavía están cubiertos por los términos de esa licencia para las patentes enumeradas (MPEG LA - Lista de patentes).
La mayoría de las patentes utilizadas para el formato MPEG-4 Visual pertenecen a tres empresas japonesas: Mitsubishi Electric (255 patentes), Hitachi (206 patentes) y Panasonic (200 patentes).
Contenido relacionado
Computadora personal IBM
Segmentación de memoria X86
Instrumento musical electronico