Intercambio de datos

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

El intercambio de datos es el proceso de tomar datos estructurados bajo un esquema de origen y transformarlos en un esquema de destino, de modo que los datos de destino sean una representación precisa de los datos de origen. El intercambio de datos permite compartir datos entre diferentes programas informáticos.

Es similar al concepto relacionado de integración de datos, excepto que los datos se reestructuran realmente (con posible pérdida de contenido) en el intercambio de datos. Puede que no haya forma de transformar una instancia dadas todas las restricciones. Por el contrario, puede haber numerosas formas de transformar la instancia (posiblemente infinitas), en cuyo caso se debe identificar y justificar una opción de solución "mejor".

Intercambio de datos de un solo dominio

En algunos dominios, pueden existir unas pocas docenas de esquemas de origen y destino diferentes (formatos de datos propietarios). A menudo se desarrolla un "formato de intercambio" o "formato de intercambio" para un solo dominio y, a continuación, se escriben las rutinas necesarias (mapeos) para transformar/traducir (indirectamente) todos y cada uno de los esquemas de origen a todos y cada uno de los esquemas de destino utilizando el formato de intercambio como paso intermedio. Eso requiere mucho menos trabajo que escribir y depurar los cientos de rutinas diferentes que se requerirían para traducir directamente todos y cada uno de los esquemas de origen a todos y cada uno de los esquemas de destino.

Algunos ejemplos de estos formatos de intercambio transformadores incluyen:

  • Formato de intercambio estándar para datos geoespaciales;
  • Datos Formato Inter chance para datos de hoja de cálculo;
  • Formato de documento abierto para hojas de cálculo, gráficos, presentaciones y documentos de procesamiento de palabras;
  • GPS eXchange Formato o Keyhole Markup Idioma para describir los datos del GPS;
  • GDSII para distribución de circuitos integrados.

Métodos de intercambio de datos

Existen dos tipos de intercambio de datos: intercambio de datos de difusión e intercambio de datos entre pares (unicast).

En una red de difusión, los datos se transmiten simultáneamente a todos los participantes. Al igual que en una llamada en conferencia, todos los participantes reciben exactamente la misma información del orador al mismo tiempo.

En un modelo de intercambio de datos entre pares (unicast), los datos se envían únicamente al receptor de destino definido por una dirección específica. Al igual que en una llamada telefónica o un correo electrónico, la información solo fluye entre dos participantes de la red.

Idiomas del intercambio de datos

Un lenguaje o formato de intercambio de datos es un lenguaje que no depende del dominio y que puede utilizarse para datos de cualquier tipo de disciplina. Han evolucionado desde su orientación al marcado y la visualización hasta ofrecer un mayor soporte para la codificación de metadatos que describen los atributos estructurales de la información."

La práctica ha demostrado que ciertos tipos de lenguajes formales son más adecuados para esta tarea que otros, ya que su especificación está impulsada por un proceso formal en lugar de por necesidades particulares de implementación de software. Por ejemplo, XML es un lenguaje de marcado que fue diseñado para permitir la creación de dialectos (la definición de sublenguajes específicos del dominio). Sin embargo, no contiene diccionarios específicos del dominio ni tipos de hechos. La disponibilidad de diccionarios-taxonomías estándar y bibliotecas de herramientas como analizadores sintácticos, validadores de esquemas y herramientas de transformación es beneficiosa para un intercambio de datos confiable.

La siguiente es una lista parcial de lenguajes genéricos populares que se utilizan para el intercambio de datos en múltiples dominios.


Nombre/abbreviación Esquemas Flexible Verificación semántica Diccionario Modelo de información Sinónimos y homónimos Dialecting Normas web Transformaciones Ligero legible por humanos Compatibilidad
RDF Sí.[1]Sí. Sí. Sí. Sí. Sí. Sí. Sí. Sí. Sí. Parcial Subconjunto de web semántica
XML Sí.[2]Sí. No No No No Sí. Sí. Sí. No Sí. subconjunto de SGML, HTML
Atom Sí. Desconocida Desconocida Desconocida No Desconocida Sí. Sí. Sí. No No dialecto XML
JSON No Desconocida Desconocida Desconocida No Desconocida No Sí. No Sí. Sí. subconjunto de YAML
YAML No[3]Desconocida Desconocida Desconocida No Desconocida No No No[3]Sí. Sí.[4]superset of JSON
REBOL Sí.[7]Sí. No Sí. No Sí. Sí. No Sí.[7]Sí. Sí.[5]
Gellish Sí. Sí. Sí. Sí.[8]No Sí. Sí. ISO No Sí. Parcial[6]SQL, RDF/XML, OWL

Nomenclatura

  • Esquemas – Si la definición de idioma está disponible en forma interpretable por computadora
  • Flexible - Si el lenguaje permite la extensión de las capacidades de expresión semántica sin modificar el esquema
  • Verificación semántica – Si la definición del idioma permite la verificación semántica de la corrección de las expresiones en el idioma
  • Diccionario-Taxonomy - Si el idioma incluye un diccionario y una taxonomía ( jerarquía subtipo-supertipo) de conceptos con herencia
  • Sinónimos y homónimos – Si el idioma incluye y apoya el uso de sinónimos y homónimos en las expresiones
  • Dialecting – Si la definición de idioma está disponible en múltiples idiomas o dialectos naturales
  • Estándar Web o ISO – Organización que hizo suyo el lenguaje como estándar
  • Transformaciones – Si el idioma incluye una traducción a otros estándares
  • Ligero – Si una versión ligera está disponible, además de una versión completa
  • legible por el hombre – Ya sea que las expresiones en el idioma sean legibles por el hombre ( legibles por los humanos sin entrenamiento)
  • Compatibilidad - ¿Qué otras herramientas son posibles de usar o requeridos al usar el idioma

Notas:

  1. ^ RDF es un lenguaje flexible.
  2. ^ El esquema de XML contiene una gramática y vocabulario muy limitados.
  3. ^ Disponible como extensión.
  4. ^ En el formato predeterminado, no la sintaxis compacta.
  5. ^ La sintaxis es bastante simple (el lenguaje fue diseñado para ser legible por humanos); los dialectos pueden requerir conocimiento de dominio.
  6. ^ Los tipos de hecho estandarizados son denotados por frases estandarizadas en inglés, que la interpretación y el uso necesitan algún entrenamiento.
  7. ^ El dialecto parse se utiliza para especificar, validar y transformar dialectos.
  8. ^ La versión en inglés incluye un Diccionario Gellish Inglés-Taxonomy que también incluye tipos de hechos estandarizados (= tipos de relaciones).

XML para el intercambio de datos

La popularidad de XML para el intercambio de datos en la World Wide Web se debe a varias razones. En primer lugar, está estrechamente relacionado con los estándares preexistentes Standard Generalized Markup Language (SGML) y Hypertext Markup Language (HTML), y, como tal, un analizador escrito para admitir estos dos lenguajes se puede ampliar fácilmente para que admita también XML. Por ejemplo, XHTML se ha definido como un formato que es XML formal, pero que la mayoría de los analizadores HTML (si no todos) lo entienden correctamente.

YAML para el intercambio de datos

YAML es un lenguaje que fue diseñado para ser legible por humanos (y, por lo tanto, fácil de editar con cualquier editor de texto estándar). Su concepto suele ser similar al de reStructuredText o una sintaxis Wiki, que también intentan ser legibles tanto por humanos como por computadoras. YAML 1.2 también incluye un concepto abreviado que es compatible con JSON y, como tal, cualquier documento JSON también es YAML válido; sin embargo, esto no se aplica al revés.

REBOL para el intercambio de datos

REBOL es un lenguaje que fue diseñado para ser legible por humanos y fácil de editar utilizando cualquier editor de texto estándar. Para lograrlo, utiliza una sintaxis simple de formato libre con puntuación mínima y un conjunto rico de tipos de datos. Los tipos de datos REBOL como URL, correos electrónicos, valores de fecha y hora, tuplas, cadenas, etiquetas, etc. respetan los estándares comunes. REBOL está diseñado para no necesitar ningún metalenguaje adicional, ya que está diseñado de manera metacircular. La metacircularidad del lenguaje es la razón por la que, por ejemplo, el dialecto Parse utilizado (no exclusivamente) para las definiciones y transformaciones de dialectos REBOL también es en sí mismo un dialecto de REBOL. REBOL se utilizó como fuente de inspiración para JSON.

Gellish for data exchange

El inglés Gellish es un subconjunto formalizado del inglés natural, que incluye una gramática simple y una gran taxonomía de diccionarios de inglés extensible que define la terminología general y específica del dominio (términos para conceptos), mientras que los conceptos se organizan en una jerarquía de subtipos y supertipos (una taxonomía), que admite la herencia de conocimientos y requisitos. La taxonomía de diccionarios también incluye tipos de hechos estandarizados (también llamados tipos de relación). Los términos y los tipos de relación juntos se pueden utilizar para crear e interpretar expresiones de hechos, conocimientos, requisitos y otra información. El Gellish se puede utilizar en combinación con SQL, RDF/XML, OWL y varios otros metalenguajes. El estándar Gellish es una combinación de ISO 10303-221 (AP221) e ISO 15926.

Véase también

  • Atom (formato de archivo)
  • Transferencia de datos
  • Lenguaje de marcación ligera
  • RSS
  • Valores separados por la combinación (CSV)

Referencias

  1. ^ Heidarzadeh, A.; Sprintson, A. (2017-03-30). "Intercambio óptimo de datos sobre redes de radiodifusión con adversarios". 2016 Taller de Teoría de Información y Aplicaciones (ITA). ISBN 978-1-5090-2529-9 – vía IEEE.
  2. ^ "¿Qué es una transmisión?". Guía Digital IONOS. 2023-03-20. Retrieved 2024-04-03.
  3. ^ "Unicast". Guía Digital IONOS. 2023-03-23. Retrieved 2024-04-03.
  4. ^ Billingsley, F.C. (1988). "Intercambio de Datos Generales". ISPRS Archivos. 27 b3): 80–91. Retrieved 25 de mayo 2018. Las rutinas de transformación constituirán un lenguaje y sintaxis que deben ser disciplina e independiente de la máquina.
  5. ^ Nurseitov, N.; Paulson, M.; Reynolds, R.; Izurieta, C. (2009). "Comparison of JSON and XML Data Interchange Formats: A Case Study". Escenario: 157–162.
  6. ^ a b Lewis, J.; Moscovitz, M. (2009). CSS. APress. pp. 5 –6. ISBN 9781430219323. Retrieved 25 de mayo 2018.
  7. ^ "human-readable". Diccionarios de Oxford. Oxford University Press. Archivado desde el original el 30 de mayo de 2018. Retrieved 29 de mayo 2018.
  8. ^ Bendersky, E. (22 de noviembre de 2008). "JSON es YAML, pero YAML no es JSON". Sitio web de Eli Bendersky. Retrieved 29 de mayo 2018.
  9. ^ Sassenrath, C. (2000). "El lenguaje de scripting REBOL". Diario del Dr. Dobb. 25 (314): 64–8. Retrieved 29 de mayo 2018.
  10. ^ Sassenrath, C. (13 de diciembre de 2012). "En JSON y REBOL". REBOL.com. Retrieved 29 de mayo 2018.
  11. ^ van Renssen, A.; Vermaas, P.E.; Zwart, S.D. (2007). "Una taxonomía de funciones en inglés gelatino". Proceedings from the International Conference on Engineering Design 2007DS42_P_230. Retrieved 29 de mayo 2018.
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save