GEDCOM

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Especificación de datos genealógicos

GEDCOM (JED-kom), nombre completo FamilySearch GEDCOM, es una especificación de formato de archivo abierto de facto para almacenar datos genealógicos, y importarlo o exportarlo entre software de genealogía compatible. GEDCOM es un acrónimo que significa Comunicación de datos genealógicos. GEDCOM fue desarrollado por la Iglesia de Jesucristo de los Santos de los Últimos Días (Iglesia SUD) como una ayuda para la investigación genealógica. La mayoría del software de genealogía admite la importación y exportación al formato GEDCOM.

A partir de la versión 7.0, un archivo GEDCOM se define como texto sin formato codificado en UTF-8. Este archivo contiene información genealógica sobre individuos, como nombres, eventos y relaciones; Los metadatos vinculan estos registros entre sí. GEDCOM 7.0 es la primera versión que utiliza el control de versiones semántico y es la versión secundaria más reciente de la especificación.

El predecesor de 7.0, GEDCOM 5.5.1, se publicó como borrador en 1999. Ha recibido solo actualizaciones menores en los siguientes 20 años. La falta de actualizaciones del estándar y las deficiencias en sus capacidades hicieron que algunos programas de genealogía agregaran extensiones propietarias al formato, que no siempre son reconocidas por otros programas de genealogía, como la especificación GEDCOM 5.5 EL (Extended Locations). Se han sugerido otros estándares, como GEDCOM X, como reemplazos completos de GEDCOM.

GEDCOM 5.5.1 final, lanzado en 2019, sigue siendo el formato estándar de la industria para el intercambio de datos genealógicos. Sin embargo, con el lanzamiento de GEDCOM 7.0 en 2021, se está impulsando la adopción de 7.0. FamilySearch tiene la intención de ser compatible con GEDCOM 7.0 en el tercer trimestre de 2022, y Ancestry.com tiene compatibilidad con 7.0 en su hoja de ruta, pero aún no ha especificado una fecha de implementación. FamilySearch GEDCOM tiene un repositorio de GitHub.

Modelo

GEDCOM utiliza un modelo de datos vinculados al linaje, con énfasis en el vínculo de la familia nuclear y los individuos (niños) producidos por esa familia. Estos objetivos históricos se describen en el documento de especificación 7.0, "El registro FAM se estructuró originalmente para representar familias en las que un hombre HUSB (esposo o padre) y una mujer WIFE (esposa o madre) producen CHIL (hijos)."

El documento continúa diciendo que estos tipos de registros se pueden usar de manera más flexible para reflejar diferentes conceptos de familia. "El registro FAM también se puede usar para paralelos culturales a esto, incluidas familias nucleares, matrimonio, cohabitación, acogida, adopción, etc., independientemente del género de los socios... Las personas señaladas por HUSB y WIFE se denominan colectivamente 'parejas', 'padres' o 'cónyuges'."

Estructura de archivos

Un archivo GEDCOM consta de una sección de encabezado, registros y una sección de avance. Dentro de estas secciones, los registros representan personas (registro INDI), familias (registros FAM), fuentes de información (registros SOUR) y otros registros misceláneos, incluidas notas. Cada línea de un archivo GEDCOM comienza con un número de nivel donde todos los registros de nivel superior (HEAD, TRLR, SUBN y cada INDI, FAM, OBJE, NOTE, REPO, SOUR y SUBM) comienzan con una línea con nivel 0, mientras que otros números de nivel son números enteros positivos.

Aunque es posible escribir un archivo GEDCOM a mano, el formato fue diseñado para usarse con software y, por lo tanto, no es especialmente amigable para los humanos. Un validador GEDCOM que se puede usar para validar la estructura de un archivo GEDCOM se incluye como parte del proyecto PhpGedView, aunque no pretende ser un validador independiente. Para la validación independiente "The Windows GEDCOM Validator" puede ser usado. o el Gedcheck más antiguo sin mantenimiento de la Iglesia SUD.

Durante 2001, El Proyecto GEDCOM TestBook evaluó qué tan bien cuatro populares programas de genealogía se ajustaban al estándar GEDCOM 5.5 utilizando el programa Gedcheck. Los hallazgos mostraron que existía una serie de problemas y que "La falla más común que provocó la pérdida de datos fue la falta de lectura de la etiqueta NOTA en todos los niveles posibles en los que puede aparecer". En 2005, se evaluó el Genealogical Software Report Card (por Bill Mumford, quien participó en el GEDCOM Testbook Project original) e incluyó la prueba del estándar GEDCOM 5.5 mediante el programa Gedcheck.

Para ayudar con la adopción de GEDCOM 7.0, ahora también existen herramientas de validación para ese estándar.

Ejemplo

El siguiente es un archivo GEDCOM de muestra.

El encabezado (HEAD) incluye el programa fuente y la versión (Personal Ancestral File, 5.0), la versión GEDCOM (5.5), la codificación de caracteres (ANSEL) y un enlace a información sobre el remitente del archivo.

Los registros individuales (INDI) definen a John Smith (ID I1), Elizabeth Stansfield (ID I2) y James Smith (ID I3).

Showing translation for

The family record (FAM) links the husband (HUSBAND), wife (WIFE), and child (CHILD) by their ID numbers.

Versiones

La versión actual de la especificación que se usa ampliamente es GEDCOM 5.5.1 final, que se publicó el 15 de noviembre de 2019. Su predecesor, GEDCOM 5.5.1 draft fue emitido en 1999, presenta nueve nuevos atributos, etiquetas y agrega UTF-8 como una codificación de caracteres aprobada. El borrador no fue aprobado formalmente, pero sus disposiciones fueron adoptadas en parte por varios programas de genealogía, incluido FamilySearch.org.

GEDCOM vinculado al linaje es el denominador común deliberado de facto. A pesar de que la versión 5.5 del estándar GEDCOM se publicó por primera vez en 1996, muchos proveedores de software genealógico nunca han admitido completamente la función de texto Unicode multilingüe (en lugar del conjunto de caracteres ANSEL) introducida con esa versión de la especificación. El uso uniforme de Unicode permitiría el uso de juegos de caracteres internacionales. Un ejemplo es el almacenamiento de nombres de Asia oriental en sus caracteres originales chinos, japoneses y coreanos (CJK), sin los cuales podrían ser ambiguos y de poca utilidad para la investigación genealógica o histórica. PAF 5.2 es un ejemplo de software que utiliza UTF-8 como conjunto de caracteres interno y puede generar un UTF-8 GEDCOM.

GEDCOM 7.0 requiere codificación UTF-8 en todo momento y resuelve otros problemas antiguos con GEDCOM 5.5.1. El soporte multimedia en forma de un archivo.zip asociado, llamado GEDZip, es otra inclusión. Se están realizando esfuerzos para ver 7.0 adoptado como el nuevo estándar de intercambio. GEDCOM 7.0 permite identificar explícitamente qué estándares distintos de GEDCOM pueden aplicarse a un archivo en particular. GEDCOM siempre ha sido extensible, pero antes de 7.0 no había una forma estándar de identificar tales extensiones. Además, GEDCOM permite marcar explícitamente un evento como inexistente. Esto permite, por ejemplo, documentar que un individuo en particular nunca se casó.

Historial de versiones

<th class="reference" data-sort-value="1.0Versión antigua, ya no se mantiene: 1.0 <th class="reference" data-sort-value="2.0Versión antigua, ya no se mantiene: 2.0 <th class="reference" data-sort-value="3.0 StandardVersión antigua, ya no se mantiene: 3.0 Standard <th class="reference" data-sort-value="4.1 DraftVersión antigua, ya no se mantiene: 4.1 Proyecto <th class="reference" data-sort-value="4.2 DraftVersión antigua, ya no se mantiene: 4.2 Proyecto <th class="reference" data-sort-value="5.0 DraftVersión antigua, ya no se mantiene: 5.0 <th class="reference" data-sort-value="GEDCOM (Future Direction) DraftVersión antigua, ya no se mantiene: GEDCOM (dirección completa) <th class="reference" data-sort-value="5.5.1 DraftVersión antigua, ya no se mantiene: 5.5.1 Proyecto <th class="reference" data-sort-value="5.5.1 ReleaseVersión más antigua, sin embargo, mantenida: 5.5.1 Liberación <th class="reference" data-sort-value="5.5.5 ReleaseVersión antigua, ya no se mantiene: 5.5.5 Liberación <th class="reference" data-sort-value="7.0Versión estable actual: 7.0
Versión GEDCOM Fecha de lanzamiento Notas
1984
Dec 1985 PAF 2.0
Versión antigua, ya no se mantiene: 2.1 Feb 1987 GEDCOM para PAF 2.1
Versión antigua, ya no se mantiene: 2.3 Proyecto 7 de agosto de 1985 con los convenios de aplicación del GEDCOM PAF2.0
Versión antigua, ya no se mantiene: 2.4 Proyecto 13 de diciembre de 1985 con los convenios de aplicación del GEDCOM PAF2.0
9 de octubre de 1987 PAF 2.0 y 2.1 implementación de 3.0
Versión antigua, ya no se mantiene: 4.0 Standard Agosto de 1989 PAF 2.1 – 2.31
25 de enero de 1990
31 de diciembre de 1991 Se introdujeron estructuras vinculadas al linaje.
Versión antigua, ya no se mantiene: 5.1 Proyecto 18 de septiembre de 1992
Versión antigua, ya no se mantiene: 5.2 Proyecto 22 de enero de 1992
Versión antigua, ya no se mantiene: 5.3 Proyecto 4 de noviembre de 1993 Se introdujo un estándar Unicode (ISO/IEC 10646) como un conjunto de caracteres adicional.
Versión antigua, ya no se mantiene: 5.4 Proyecto 21 de agosto de 1995
Versión antigua, ya no se mantiene: 5.5 Normas 11 de diciembre de 1995 PAF 3, 4 y 5
Versión más antigua, sin embargo, mantenida: 5.5 Normas 2 de enero de 1996 PAF 3, 4 y 5 / 5,5 Estándar
1o de mayo de 1998 "usó un modelo de datos completamente nuevo"
2 de octubre de 1999 Utilizado por FamilySearch.org UTF-8 añadió como codificación de caracteres aprobado.
15 noviembre 2019 actual estándar, modificaciones menores de texto a 5.5.1 Borrador.
2 octubre 2019 Actualización no oficial de Tamura Jones
Versión antigua, ya no se mantiene: 5.6 Proyecto privado - "Jed Allen envió esos dos archivos a unas pocas personas sólo para una especie de "de comentarios privados"
Versión antigua, ya no se mantiene: 6.0 XML Draft 28 de diciembre de 2001 No se trata de una especificación completa, y no se recomienda comenzar a aplicar programas informáticos.
Versión antigua, ya no se mantiene: 7.0.0-rc1 Proyecto Febrero 2021 El candidato de lanzamiento reveló para RootsTech 2021, pero luego todas las conversaciones, especificaciones y el sitio web fueron eliminados el 25 de febrero de 2021
27 de mayo de 2021 Modernizar la codificación de caracteres, aclarar ambigüedades en 5.5.1 especificación, introducir versión semántica, mejorar el manejo multimedia
Leyenda:
Versión antigua
Versión más antigua, todavía mantenida
Última versión
Última versión de vista previa
Liberación del futuro

Limitaciones

Soporte para fuentes y eventos de varias personas

Un archivo GEDCOM puede contener información sobre eventos como nacimientos, defunciones, registros de censos, registros de barcos, matrimonios, etc.; una regla general es que un evento es algo que tuvo lugar en un momento específico, en un lugar específico (incluso si no se conocen la hora y el lugar). Los archivos GEDCOM también pueden contener atributos como descripción física, ocupación y número total de hijos; a diferencia de los eventos, los atributos generalmente no se pueden asociar con un tiempo o lugar específico.

La especificación GEDCOM requiere que cada evento o atributo esté asociado con exactamente un individuo o familia. Esto provoca redundancia para eventos como los registros del censo, donde la entrada del censo real a menudo contiene información sobre varias personas. En el archivo GEDCOM, para registros censales, un censo separado "CENS" se debe agregar un evento para cada individuo al que se hace referencia. Algunos programas de genealogía, como Gramps y The Master Genealogist, tienen estructuras de base de datos elaboradas para fuentes que se utilizan, entre otras cosas, para representar eventos de varias personas. Cuando las bases de datos se exportan desde uno de estos programas a GEDCOM, estas estructuras de bases de datos no se pueden representar en GEDCOM debido a esta limitación, con el resultado de que la información del evento o de la fuente, incluida toda la información de referencia de cita relevante, debe duplicarse en cada lugar en el que se encuentre. usado. Esta duplicación dificulta que el usuario mantenga la información relacionada con las fuentes.

En la especificación GEDCOM, los eventos que están asociados con una familia, como la información de matrimonio, solo se almacenan en un GEDCOM una vez, como parte del registro familiar (FAM), y luego ambos cónyuges se vinculan a ese registro familiar único.

Ambigüedad en la especificación

La especificación GEDCOM se hizo deliberadamente flexible para admitir muchas formas de codificar datos, particularmente en el área de las fuentes. Esta flexibilidad ha generado mucha ambigüedad y ha producido el efecto secundario de que algunos programas de genealogía que importan GEDCOM no importan todos los datos de un archivo.

Apoyo para diversas definiciones de familias y relaciones

GEDCOM no admite explícitamente la representación de datos de muchos tipos de relaciones interpersonales cercanas, como matrimonios del mismo sexo, parejas de hecho, cohabitación, poliamor o poligamia. Dichas relaciones solo se pueden representar utilizando la etiqueta genérica ASSO utilizada para cualquier tipo de relación.

Ordenación de eventos que no tienen fechas

La especificación GEDCOM no ofrece soporte explícito para mantener un orden de eventos conocido. En particular, se puede perder el orden de las relaciones (FAMS) de una persona y el orden de los hijos dentro de una relación (FAM). En muchos casos, la secuencia de eventos se puede derivar de las fechas asociadas. Pero las fechas no siempre se conocen, en particular cuando se trata de datos de hace siglos. Por ejemplo, en el caso de que una persona haya tenido dos relaciones, ambas con fechas desconocidas, pero por descripciones se sabe que la segunda sí es la segunda. El orden en que se registren estas FAMS en el registro INDI de GEDCOM dependerá del programa exportador. En Aldfaer por ejemplo, la secuencia depende de la ordenación de los datos por parte del usuario (alfabético, cronológico, de referencia, etc.). El estándar XML GEDCOM propuesto tampoco aborda este problema.

Características menos conocidas

GEDCOM tiene muchas características que no se usan comúnmente. Algunos paquetes de software no admiten todas las funciones que permite el estándar GEDCOM.

Multimedia

El estándar GEDCOM admite la inclusión de objetos multimedia (por ejemplo, fotos de personas). Dichos objetos multimedia pueden incluirse en el propio archivo GEDCOM (llamado "formulario incrustado") o en un archivo externo donde el nombre del archivo externo se especifica en el archivo GEDCOM (llamado " formulario vinculado"). Incrustar multimedia directamente en el archivo GEDCOM facilita la transmisión de datos, ya que toda la información (incluidos los datos multimedia) está en un archivo, pero el archivo resultante puede ser enorme. La vinculación de multimedia mantiene bajo control el tamaño del archivo GEDCOM, pero luego, al transmitir el archivo, los objetos multimedia deben transmitirse por separado o archivarse junto con GEDCOM en un archivo más grande. El soporte para incrustar medios directamente se eliminó en el borrador del estándar 5.5.1.

Información contradictoria

El estándar GEDCOM permite la especificación de múltiples opiniones o datos en conflicto, simplemente especificando múltiples registros del mismo tipo. Por ejemplo, si la fecha de nacimiento de una persona se registró el 10 de enero de 1800 en el certificado de nacimiento, pero el 11 de enero de 1800 en el certificado de defunción, se incluirían dos registros BIRT para esa persona, el primero con la fecha del 10 de enero de 1800 y dando como fuente el acta de nacimiento, y el segundo con fecha 11 de enero de 1800 y dando como fuente el acta de defunción. El registro preferido suele aparecer en primer lugar.

Este ejemplo codificado en GEDCOM podría verse así:

0 @I1@ INDI
1 NOMBRE John /Doe/
1 BIRT
2 DATE 10 JAN 1800
2 SOUR @S1@
3 DATA
4 TEXTO La transcripción del certificado de nacimiento iría aquí
3 NOTA Este registro de nacimiento es preferido porque proviene del certificado de nacimiento
3 QUAY 2
1 BIRT
2 DATE 11 JAN 1800
2 SOUR @S2@
3 DATA
4 TEXTO La transcripción del certificado de defunción iría aquí.
3 QUAY 2

Los datos en conflicto también pueden ser el resultado de errores del usuario. El estándar no especifica de ninguna manera que los contenidos deban ser consistentes. Una fecha de nacimiento como "10 ABR 1819" podría haberse registrado erróneamente como "10 ABR 1918" mucho después de la muerte de la persona. La única forma de revelar tales inconsistencias es mediante una validación rigurosa de los datos de contenido.

Internacionalización

El estándar GEDCOM admite la internacionalización de varias formas. En primer lugar, las versiones más nuevas del estándar permiten que los datos se almacenen en Unicode (o, más recientemente, UTF-8), por lo que se puede almacenar texto en cualquier idioma. En segundo lugar, de la misma manera que puede tener varios eventos en una persona, GEDCOM le permite tener varios nombres para una persona, por lo que los nombres se pueden almacenar en varios idiomas (aunque no existe una forma estandarizada de indicar qué instancia está en qué idioma).). Finalmente, en la última versión (5.5.1, aún no en uso generalizado), el campo NOMBRE también admite una variación fonética (FONE) y una variación romanizada (ROMN) del nombre.

GEDCOM X

En febrero de 2012, en la conferencia RootsTech 2012, FamilySearch describió un importante proyecto nuevo en torno a estándares genealógicos llamado GEDCOM X e invitó a colaborar. Incluye software desarrollado bajo la licencia de código abierto Apache. Incluye formatos de datos que facilitan la base de árboles genealógicos en fuentes y registros (tanto artefactos físicos como digitales), soporte para compartir y vincular datos en línea y una API.

En agosto de 2012, el empleado de FamilySearch y líder del proyecto GEDCOM X, Ryan Heaton, abandonó la afirmación de que GEDCOM X es el nuevo estándar de la industria y reposicionó a GEDCOM X como otro proyecto de código abierto de FamilySearch.

Después del lanzamiento de GEDCOM 7, FamilySearch posicionó a GEDCOM X como útil para la interoperabilidad con su software FamilySearch Family Tree.

Alternativas

Commsoft, los autores de la serie Roots de software de genealogía y Ultimate Family Tree, definieron una versión llamada GEDCOM orientado a eventos (también conocido como "Event GEDCOM" y originalmente llamado InterGED), que incluía eventos como artículos de primera clase (nivel cero). Aunque se basa en eventos, sigue siendo un modelo construido sobre una realidad asumida en lugar de evidencia. El evento GEDCOM fue más flexible, ya que permitió cierta separación entre los eventos creídos y los participantes. Sin embargo, Event GEDCOM no fue ampliamente adoptado por otros desarrolladores debido a sus diferencias semánticas. Dado que Roots y Ultimate Family Tree ya no están disponibles, muy pocas personas hoy en día utilizan Event GEDCOM.

Gramps XML es un formato abierto basado en XML creado por el proyecto de genealogía de código abierto Gramps y utilizado también por PhpGedView.

La Organización de Estándares de Información de Historia Familiar se estableció en 2012 con el objetivo de desarrollar estándares internacionales para la historia familiar y la información genealógica. Uno de los estándares que propuso la organización fue Extended Legacy Format (ELF), compatible con GEDCOM 5.5(.1) pero que incluye un mecanismo de extensibilidad. La organización solicitó comentarios públicos sobre el estándar propuesto en 2017. Retiró la propuesta porque la versión 7.0 de GEDCOM abordó muchas de las preocupaciones de la organización.

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save