Valores separados por tabulaciones

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Formato de archivo de texto

Valores separados por tabulaciones (TSV) es un formato de archivo simple basado en texto para almacenar datos tabulares. Los registros están separados por nuevas líneas y los valores dentro de un registro están separados por caracteres de tabulación. Por tanto, el formato TSV es un formato de valores separados por delimitadores, similar a los valores separados por comas.

TSV es un formato de archivo simple que cuenta con un amplio soporte, por lo que a menudo se utiliza en el intercambio de datos para mover datos tabulares entre diferentes programas informáticos que admiten el formato. Por ejemplo, se podría utilizar un archivo TSV para transferir información de una base de datos a una hoja de cálculo.

Ejemplo

El encabezado del conjunto de datos de la flor Iris se puede almacenar como un TSV usando el siguiente texto sin formato (tenga en cuenta que la representación HTML puede convertir tabulaciones en espacios):

Longitud sépal Ancho de sepia Ancho de sepia
5.1 3.5 1.4 0,2 I. setosa
4.9 3.0 1.4 0,2 I. setosa
4.7 3.2 1.3 0,2 I. setosa
4.6 3.1 1,5 0,2 I. setosa
5.0 3.6 1.4 0,2 I. setosa

El texto llano TSV arriba corresponde a los siguientes datos tabulares:

Longitud del sepia Ancho sépalo Longitud petal Ancho petal Especies
5.1 3.5 1.4 0.2 I. setosa
4.9 3.0 1.4 0.2 I. setosa
4.7 3.2 1.3 0.2 I. setosa
4.6 3.1 1,5 0.2 I. setosa
5.0 3.6 1.4 0.2 I. setosa

Personaje escapando

El estándar de tipo de medios de la IANA para TSV logra simplicidad al simplemente no permitir pestañas dentro de los campos.

Dado que los valores en el formato TSV no pueden contener tabulaciones literales ni caracteres de nueva línea, es necesaria una convención para la conversión sin pérdidas de valores de texto con estos caracteres. Una convención común es realizar los siguientes escapes:

secuencia de escape significado
nalimentación de línea
tpestaña
rtransporte
\backslash

Otra convención común es utilizar la convención CSV de RFC 4180 y encerrar los valores que contienen tabulaciones o nuevas líneas entre comillas dobles. Esto puede dar lugar a ambigüedades.

Finales de línea

Los registros normalmente están separados por un avance de línea, como es típico en las plataformas Unix, o un retorno de carro y un avance de línea, como es típico en las plataformas Microsoft. Algunos programas pueden esperar lo último. La especificación de facto especifica que los registros están separados por un EOL, pero no especifica ninguna nueva línea específica.

Contenido relacionado

ALGOL Y

ALGOL Y fue el nombre dado a un sucesor especulado del lenguaje de programación ALGOL 60 que incorporaba algunas características radicales que fueron...

Tabla de métodos virtuales

En programación informática, una tabla de métodos virtuales una tabla de funciones virtuales, una tabla de llamadas virtuales , tabla de despacho, vtable o...

Hacer bucle while

En muchos lenguajes de programación de computadoras, un bucle do while es una declaración de flujo de control que ejecuta un bloque de código y luego...

Datosflex

DataFlex es un lenguaje de programación de alto nivel orientado a objetos y una herramienta visual de cuarta generación para desarrollar aplicaciones de...

Filosofía de la inteligencia artificial

La filosofía de la inteligencia artificial es una rama de la filosofía de la tecnología. Esta se centra en investigar la inteligencia artificial y sus...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save