Biplot

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Biplot of Fisher's iris data set. Los puntos dispersos son los puntajes de entrada de las observaciones y las flechas muestran la contribución de cada característica a los vectores de carga de entrada.
Biplot de espectro del conjunto de datos del iris de Anderson
Biplot de análisis crítico de los datos del iris de Fisher
Los biplots son un tipo de gráfico exploratorio utilizado en estadística, una generalización del diagrama de dispersión simple de dos variables. Un biplot superpone un gráfico de puntuaciones con un gráfico de cargas. Un biplot permite mostrar gráficamente información sobre muestras y variables de una matriz de datos. Las muestras se muestran como puntos, mientras que las variables se muestran como vectores, ejes lineales o trayectorias no lineales. En el caso de las variables categóricas, se pueden utilizar puntos de nivel de categoría para representar los niveles de una variable categórica. Un biplot generalizado muestra información tanto sobre variables continuas como categóricas.

El biplot fue introducido por K. Ruben Gabriel (1971).

Construcción

Un biplot se construye mediante la descomposición en valores singulares (SVD) para obtener una aproximación de bajo rango a una versión transformada de la matriz de datos X, cuyas n filas son las muestras (también llamadas casos u objetos) y cuyas p columnas son las variables. La matriz de datos transformada Y se obtiene a partir de la matriz original X centrando y, opcionalmente, estandarizando las columnas (las variables). Usando la descomposición en valores singulares (SVD), podemos escribir Y = Σk=1,...pdkukvkT;, donde uk son vectores columna de n-dimensionales, vk son vectores columna de p-dimensionales, y dk son una secuencia no creciente de escalares no negativos. El diagrama de dispersión bidimensional (BIPLOT) se forma a partir de dos diagramas de dispersión que comparten un conjunto común de ejes y tienen una interpretación de producto escalar entre conjuntos. El primer diagrama de dispersión se forma a partir de los puntos (d1αu1i, d2αu2i), para i = 1,...,n. El segundo diagrama se forma a partir de los puntos (d11−αv1j, d21−αv2j), para j = 1,...,p. Este es el biplot formado por los dos términos dominantes de la SVD, que puede representarse en una visualización bidimensional. Las opciones típicas de α son 1 (para interpretar la distancia en la visualización de filas) y 0 (para interpretar la distancia en la visualización de columnas), y en algunos casos excepcionales α = 1/2 para obtener un biplot escalado simétricamente (que no interpreta la distancia en las filas ni en las columnas, sino solo el producto escalar). El conjunto de puntos que representan las variables puede dibujarse como flechas desde el origen para reforzar la idea de que representan ejes del biplot sobre los cuales se pueden proyectar las muestras para aproximarse a los datos originales.

Referencias

  1. ^ Gabriel, K. R. (1971). La pantalla gráfica biplot de matrices con aplicación al análisis principal de componentes. Biometrika, 58(3), 453-467.

Fuentes

  • Gabriel, K.R. (1971). "La pantalla gráfica biplot de matrices con aplicación al análisis principal de componentes". Biometrika. 58 3): 453 –467. doi:10.1093/biomet/58.3.453.
  • Gower, J.C., Lubbe, S. and le Roux, N. (2010). Comprender biplots. Wiley. ISBN 978-0-470-01255-0
  • Gower, J.C. and Hand, D.J (1996). Biplots. Chapman & Hall, Londres, Reino Unido. ISBN 0-412-71630-5
  • Yan, W. y Kang, M.S. (2003). GGE Biplot Analysis. CRC Prensa, Boca Raton, Florida. ISBN 0-8493-1338-4
  • Demey, J.R., Vicente-Villardón, J.L., Galindo-Villardón, M.P. y Zambrano, A.Y. (2008). Determinación de marcadores moleculares asociados a la clasificación de genotipos por Biplotas Logísticas Externas. Bioinformática. 24(24):2832–2838
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save