Mbox

AjustarCompartirImprimirCitar
Familia de formatos de archivo relacionados con el correo electrónico

Mbox es un término genérico para una familia de formatos de archivo relacionados que se utilizan para almacenar colecciones de mensajes de correo electrónico. Se implementó por primera vez en la quinta edición de Unix.

Todos los mensajes en un buzón mbox se concatenan y almacenan como texto sin formato en un solo archivo. Cada mensaje comienza con los cuatro caracteres "De" seguido de un espacio (la llamada 'línea From_') y la dirección de correo electrónico del remitente. RFC 4155 define que una marca de tiempo UTC sigue a otro carácter de espacio de separación.

Un formato similar a mbox es el Sistema de manejo de mensajes MH. Otros sistemas, como Microsoft Exchange Server y el servidor Cyrus IMAP, almacenan buzones de correo en bases de datos centralizadas administradas por el sistema de correo y no accesibles directamente por usuarios individuales. El formato de buzón maildir se cita a menudo como una alternativa al formato mbox para los sistemas de almacenamiento de correo electrónico en red.

Protocolos de almacenamiento de correo

A diferencia de los protocolos de Internet utilizados para el intercambio de correo electrónico, el formato utilizado para el almacenamiento de correo electrónico nunca se ha definido formalmente a través del mecanismo de estandarización RFC y se ha dejado completamente en manos del desarrollador de un cliente de correo electrónico. Sin embargo, el estándar POSIX definió un marco flexible junto con el programa mailx. En 2005, el tipo de medio application/mbox se estandarizó como RFC 4155, lo que insinuaba que mbox almacena los mensajes del buzón en su formato original de mensajes de Internet (RFC 2822), excepto por el carácter de nueva línea utilizado, el almacenamiento de datos limpios de siete bits y el requisito que cada mensaje recién agregado termina con una línea completamente vacía dentro de la base de datos de mbox.

Familia Mbox

El formato mbox utiliza una sola línea en blanco seguida de la cadena 'De ' (con un espacio) para delimitar mensajes; esto puede crear ambigüedades si un mensaje contiene la misma secuencia en el texto del mensaje.

A lo largo de los años, surgieron cuatro variantes populares pero incompatibles: mboxo, mboxrd, mboxcl y mboxcl2. El esquema de nombres fue desarrollado por Daniel J. Bernstein, Rahul Dhesi y otros en 1996. Cada uno se originó a partir de una versión diferente de Unix. mboxcl y mboxcl2 se originaron a partir del formato de archivo utilizado por las herramientas de correo Unix System V Release 4. mboxrd fue inventado por Rahul Dhesi et al. como una racionalización de mboxo y posteriormente adoptado por algunas herramientas de correo de Unix, incluido qmail.

Todas estas variantes tienen el problema de que el contenido del mensaje a veces debe modificarse para eliminar ambigüedades, como se muestra a continuación, por lo que las aplicaciones deben saber qué regla de comillas se ha utilizado para realizar la reversión correcta, que resultó ser poco práctico. Usando MIME y eligiendo una codificación de transferencia de contenido que cita "From_" líneas de una manera compatible con el estándar garantiza que no es necesario cambiar el contenido del mensaje, sino solo su representación MIME. Por lo tanto, las sumas de verificación permanecen constantes, una condición previa necesaria para admitir S/MIME y Pretty Good Privacy. Las aplicaciones que crean mensajes nuevos y los almacenan en archivos de base de datos mbox probablemente usarán este enfoque para separar el contenido del mensaje del formato de almacenamiento de la base de datos.

mboxo y mboxrd localizan el mensaje comenzando por escanear las líneas De que se encuentran antes de los encabezados del mensaje de correo electrónico. Si un "Desde " cadena se produce al principio de una línea en el encabezado o en el cuerpo de un mensaje (una infracción estándar de correo para el primero, pero no para el segundo), el mensaje de correo electrónico debe modificarse antes de que el mensaje se almacene en un mbox archivo de buzón o la línea se tomará como límite del mensaje. Para evitar malinterpretar un "From " cadena al comienzo de la línea en el cuerpo del correo electrónico como el comienzo de un nuevo correo electrónico, algunos sistemas "From-munge" el mensaje, generalmente anteponiendo un signo mayor que:

 Desde mi punto de vista...

En el formato mboxo, tales líneas tienen una ambigüedad irreversible. En el formato mboxo, esto puede conducir a la corrupción del mensaje. Si una línea ya contenía >From al principio (como en una cita), no se modifica cuando se escribe. Cuando el software de correo lo lee posteriormente, el > inicial se elimina por error. El formato mboxrd resuelve esto convirtiendo From a >From y convirtiendo >From a >>Desde , etc. La transformación es entonces siempre reversible.

Ejemplo:

De MAILER-DAEMON Fri Jul 8 12:08:34 2011De: Autor ■author@example.comA: Recipiente ■recipient@example.comAsunto: Muestra Mensaje 1 Este es el cuerpo.■ De (debería escaparse).Hay 3 líneas. De MAILER-DAEMON Fri Jul 8 12:08:34 2011De: Autor ■author@example.comA: Recipiente ■recipient@example.comAsunto: Muestra Mensaje 2 Este es el segundo cuerpo.

Los formatos mboxcl y mboxcl2 utilizan un encabezado Content-Length: para determinar la duración de los mensajes y, por lo tanto, el siguiente real De línea. mboxcl todavía cita De líneas en los propios mensajes como lo hace mboxrd, mientras que mboxcl2 no lo hace.

Mbox modificada

(feminine)

Algunos clientes de correo electrónico utilizan una modificación del formato mbox para sus carpetas de correo.

  • Eudora usó un mboxo Variación donde la dirección de correo electrónico de un remitente es reemplazada por la cadena constante "¿??@??". La mayoría de los clientes de mbox almacenan mensajes entrantes como recibidos. Eudora separa los archivos adjuntos incrustados en el mensaje, almacenando los archivos adjuntos como archivos individuales separados en una carpeta.
  • La familia Mozilla de los clientes de correo electrónico (Mozilla, Netscape, Thunderbird, et al.) usan un mboxrd variación con más complejo De la línea citando reglas.

Bloqueo de archivos

Debido a que se almacena más de un mensaje en un solo archivo, se necesita alguna forma de bloqueo de archivos para evitar la corrupción que puede resultar de dos o más procesos que modifican el buzón simultáneamente. Esto podría suceder si un programa de entrega de correo electrónico de la red entrega un mensaje nuevo al mismo tiempo que un lector de correo está eliminando un mensaje existente.

Diferentes formatos de mbox han utilizado varios mecanismos incompatibles entre sí para habilitar el bloqueo de archivos de mensajes, incluidos fcntl() y lockf(). Esto no funciona bien con los sistemas de archivos montados en la red, como el Sistema de archivos de red (NFS), por lo que tradicionalmente Unix usaba "bloqueo de puntos" archivos, que podrían crearse atómicamente incluso sobre NFS.

Los archivos de Mbox también deben bloquearse mientras se leen. De lo contrario, el lector puede ver el contenido del mensaje dañado si otro proceso está modificando el mbox al mismo tiempo, aunque no se dañe el archivo real.

Como formato de parche

En el desarrollo de código abierto, es común enviar parches en formato diff a una lista de correo para su discusión. El formato diff permite agregar "encabezados" irrelevantes, como datos de mbox. Los sistemas de control de versiones como git tienen soporte para generar parches con formato mbox y para enviarlos a la lista como correos electrónicos en un hilo.

Contenido relacionado

Pérdida de devolución de saldo

En telecomunicaciones, pérdida de devolución de saldo es una de dos...

Clientes potenciales AIOD

En telefonía fija, los cables AIOD son cables de equipos terminales que se utilizan únicamente para transmitir datos de marcación externa identificada...

Proyección digital

Proyección digital puede referirse...
Más resultados...
Tamaño del texto: