Gráfico de Kiviat

Compartir Imprimir Citar

Un gráfico de radar es un método gráfico para mostrar datos multivariados en forma de un gráfico bidimensional de tres o más variables cuantitativas representadas en ejes que comienzan desde el mismo punto. La posición relativa y el ángulo de los ejes generalmente no brindan información, pero se pueden aplicar varias heurísticas, como algoritmos que trazan datos como el área total máxima, para ordenar las variables (ejes) en posiciones relativas que revelan distintas correlaciones, compensaciones, y una multitud de otras medidas comparativas.

El gráfico de radar también se conoce como gráfico web, gráfico de araña, gráfico de araña, gráfico de tela de araña, gráfico de estrellas, gráfico de estrellas, gráfico de telaraña, polígono irregular, gráfico polar o diagrama de Kiviat. Es equivalente a una gráfica de coordenadas paralelas, con los ejes dispuestos radialmente.

Visión de conjunto

El gráfico de radar es un gráfico y/o gráfico que consta de una secuencia de radios equiangulares, llamados radios, donde cada radio representa una de las variables. La longitud de datos de un radio es proporcional a la magnitud de la variable para el punto de datos en relación con la magnitud máxima de la variable en todos los puntos de datos. Se dibuja una línea que conecta los valores de datos para cada radio. Esto le da a la trama una apariencia de estrella y el origen de uno de los nombres populares de esta trama. El gráfico de estrellas se puede utilizar para responder a las siguientes preguntas:

Los gráficos de radar son una forma útil de mostrar observaciones multivariadas con un número arbitrario de variables. Cada estrella representa una sola observación. Por lo general, los gráficos de radar se generan en un formato de múltiples parcelas con muchas estrellas en cada página y cada estrella representa una observación. El gráfico de estrellas fue utilizado por primera vez por Georg von Mayr en 1877. Los gráficos de radar se diferencian de los gráficos de glifos en que todas las variables se utilizan para construir la figura de estrella graficada. No hay separación entre las variables de primer plano y de fondo. En cambio, las figuras en forma de estrella generalmente se organizan en una matriz rectangular en la página. Es algo más fácil ver patrones en los datos si las observaciones se organizan en un orden no arbitrario (si las variables se asignan a los rayos de la estrella en un orden significativo).

Aplicaciones

La principal aplicación de los gráficos de radar es medir datos multivariables que se comparten entre grupos, personas u objetos similares. Esto significa que los gráficos de radar tienen una variedad increíblemente amplia de usos en campos que incluyen atletismo, métricas de rendimiento, ciencias biológicas, educación y negocios, entre muchos otros. Estas aplicaciones permiten a los investigadores visualizar datos y ayudarlos a comparar, analizar y tomar decisiones de manera efectiva sobre los conjuntos de datos que están viendo en función de los conocimientos proporcionados por las variables graficadas.

Gráficos de radar comúnmente utilizados en los deportes para trazar las fortalezas y debilidades de los jugadores. Esto se hace calculando varias estadísticas relacionadas con el jugador que se pueden rastrear a lo largo del eje central del gráfico. Los ejemplos incluyen tiros, rebotes, asistencias, etc., o las estadísticas de bateo o lanzamiento de un jugador de béisbol. Esto crea una visualización centralizada de las fortalezas y debilidades de un jugador y, si se superpone con las estadísticas de otros jugadores o los promedios de la liga, puede mostrar dónde sobresale un jugador y dónde podría mejorar.Esta información sobre las fortalezas y debilidades de los jugadores podría resultar crucial para el desarrollo de los jugadores, ya que permite a los entrenadores ajustar el régimen de entrenamiento de un jugador para ayudar a mejorar sus debilidades. Los resultados del gráfico de radar también pueden ser útiles en el juego situacional. Si se demuestra que un bateador golpea mal contra lanzadores zurdos, entonces su equipo sabe que debe limitar sus apariciones en el plato contra lanzadores zurdos, mientras que el equipo contrario puede intentar forzar una situación en la que el bateador se vea obligado a batear contra el lanzador. Cuando se usan para comparar, también pueden ilustrar qué tan bueno es un atleta, como por ejemplo, un candidato al salón de la fama con otros candidatos al salón de la fama.

Otra aplicación de los gráficos de radar es el control de la mejora de la calidad para mostrar las métricas de rendimiento de varios objetos, incluidos los programas informáticos,computadoras, teléfonos, vehículos y más. Los programadores de computadoras a menudo usan análisis para probar el rendimiento de sus programas frente a otros. Un ejemplo de esto donde los gráficos de radar pueden ser útiles es el análisis de rendimiento de varios algoritmos de clasificación. Un programador podría recopilar varios algoritmos de clasificación diferentes, como selección, burbuja y rápido, luego analizar el rendimiento de estos algoritmos midiendo su velocidad, uso de memoria y uso de energía, luego graficarlos en un gráfico de radar para ver cómo funciona cada clasificación. bajo varios tamaños de datos. Otra aplicación de rendimiento es medir el rendimiento de autos similares entre sí. Un consumidor podría observar variables como la velocidad máxima de los automóviles, las millas por galón, los caballos de fuerza y ​​el torque. Luego, después de usar un gráfico de radar para visualizar los datos,

Otro uso importante de los gráficos de radar es en las ciencias de la vida. Los gráficos de radar se pueden utilizar para una gran variedad de conjuntos de datos relacionados, como las fortalezas y debilidades de las drogas y otros medicamentos.Utilizando el ejemplo de dos antidepresivos, un investigador puede clasificar variables como la eficacia, los efectos secundarios, el costo, etc. en una escala del uno al diez. Luego podrían graficar los resultados usando un gráfico de radar para ver la distribución de variables y encontrar cómo difieren, como que un antidepresivo sea más barato y de acción más rápida, pero que no tenga un gran alivio con el tiempo. Mientras tanto, el otro antidepresivo brinda un alivio más fuerte y se mantiene mejor con el tiempo, pero es más costoso. Otra aplicación de las ciencias biológicas es el análisis de pacientes. Los gráficos de radar se pueden usar para graficar las variables de la vida que afectan el bienestar de una persona y luego se pueden analizar para ayudarlos. Un ejemplo más específico es el caso de los atletas, cuyos diversos hábitos de bienestar, como el sueño, la dieta y el estrés, son monitoreados para asegurarse de que se mantengan en óptimas condiciones físicas.Si se mostrara alguna área sumergida, los médicos y entrenadores podrían intervenir para ayudar al atleta y mejorar su bienestar.

El gráfico de radar es una herramienta increíblemente útil y poderosa para la visualización de datos. La amplia gama de campos a los que se pueden aplicar y la multitud de formas en que se pueden usar en esos campos los convierte en un aspecto imprescindible de la minería y el análisis de datos. Son increíblemente útiles para encontrar el rendimiento de diferentes conjuntos de datos relacionados por el mismo conjunto de datos multivariable y tomar decisiones basadas en el análisis de esos conjuntos de datos. Además, tienen diseños relativamente fáciles de leer que pueden cambiar de color para ayudar a diferenciar los objetos que se miran, usan relativamente menos espacio en comparación con otros gráficos y, en general, tienen un aspecto suave y presentable. Los gráficos de radar tienen algunos inconvenientes, como intentar usarlos cuando las variables se miden en escalas que no están cerca unas de otras,A pesar de estos inconvenientes, los gráficos de radar son una de las mejores herramientas en una bolsa de herramientas de análisis de datos tanto para profesionales como para entusiastas.

Implementación de software

El software se puede utilizar para generar gráficos de radar de manera eficiente. Python (lenguaje de programación) es un ejemplo. Dentro de Python se puede acceder a diferentes bibliotecas de código con diferentes funcionalidades. Plotly es una biblioteca de gráficos útil para gráficos de radar en Python. Plotly admite varios tipos de gráficos de radar.

Para crear un gráfico de radar básico con Plotly, deberá definir una figura que consta de dos listas de datos, los radios y los valores de magnitud correspondientes. Next Plotly requiere que actualices el diseño de la figura, que incluye aspectos como la visibilidad del eje radial y si hay o no una leyenda en el gráfico. Una vez que esto se complete, todo lo que queda por hacer es llamar a la función de mostrar en su objeto de figura que producirá el gráfico de radar.

Para crear un gráfico de radar de trazas múltiples usando Plotly, el proceso es básicamente el mismo que el anterior con el gráfico de radar básico pero con una diferencia. De manera similar a los pasos anteriores, primero crea un objeto de figura, pero ahora, en lugar de llenar inmediatamente esta figura con datos, debe llamar a la función add_trace para cada rastro que desee agregar. Dentro de la función add_trace, los valores de radio y magnitud del gráfico de radar se ingresan para su traza respectiva.

Plotly no es la única biblioteca disponible para Python para producir un gráfico de radar, y Python no es el único lenguaje de programación en el que se pueden producir. Plotly se destaca como una excelente opción para producir gráficos de radar porque es fácil de usar y flexible. La lógica es simple de seguir y está bien documentada en su sitio web al que se hace referencia anteriormente. La opción de agregar trazos o simplemente usar uno lo hace flexible. Python es una buena opción para programar con análisis de datos. Siempre se crean nuevas bibliotecas para combinar con la gran cantidad que ya existe y la curva de aprendizaje del lenguaje es muy baja, lo que lo convierte en una buena opción incluso para aquellos con experiencia limitada en programación.

Uso

Como se mencionó anteriormente, el uso de gráficos de radar es para un mejor análisis visual de dos o más conjuntos de puntos de datos. A menudo, algunos usos de un gráfico de radar son para mostrar los atributos de cosas como personajes de videojuegos, deportistas, etc. Por el contrario, los gráficos de radar también se usan ampliamente en categorías académicas y de investigación para permitir el análisis visual de conjuntos de datos para luego explorarlos más rigurosamente. Podemos ver valores atípicos, conglomerados (consulte también Análisis de conglomerados) y otros análisis de tendencias dentro de los datos que, de lo contrario, podrían ser más difíciles de interpretar mientras se visualiza visualmente el conjunto de puntos de datos.Un ejemplo, como se muestra en la Figura 5, es uno de esos usos de un gráfico de radar. En este caso, utilizamos el gráfico de radar para visualizar dos ventanas genómicas de NP (ver también mapeo de la arquitectura del genoma y fosforilasa de nucleósido de purina) que pueden poseer o no. Nuestro conjunto de datos consta de catorce números que representan el porcentaje de NP que han visto nuestras ventanas genómicas. Es decir que las ventanas contienen esas secuencias NP. La implementación directa para el resultado de este gráfico de radar es la siguiente:

Nota: La implementación del código anterior utiliza la implementación del gráfico de radar de radar_factory junto con matplotlib y otros paquetes. Este es un código funcional que funcionará si copia y pega la implementación de radar_factory y el código como se ve arriba.

Dentro de este uso del gráfico de radar, nuestros puntos de datos dados estaban muy cerca unos de otros. Debido a esto, pudimos haber determinado visualmente que las ventanas tenían un valor cercano entre sí. Así en esta representación, la importancia viene de su aspecto visual para mostrar los puntos de datos en un formato fácil y agradable como se muestra. Ahora, al obtener una vista previa del gráfico de radar en sí, podemos determinar visualmente que la mayoría de los valores en relación con el NP estaban muy cerca. Es decir, los valores se encontraban generalmente dentro de la marca de diferencia de uno a cinco puntos. Ahora que hemos determinado ese hecho, podemos explorar más a fondo por qué ese es el caso y ajustar nuestros conjuntos de datos para ver algunos cambios posibles en los resultados, como se menciona en la sección anterior.

Interpretación y Análisis

Cualquier gráfico de radar se puede analizar para recopilar información que nos permita llegar a nuevas conclusiones. Los principales conocimientos que podemos derivar del análisis de un gráfico de radar son las nuevas relaciones entre las entidades o grupos con rasgos distintivos. Las relaciones que se encuentran son las que permiten sacar nuevas conclusiones al estudiar diferentes grupos y los rasgos compartidos entre ellos. El gráfico de radar también se puede utilizar para reforzar algo que ya se cree que es cierto. Por ejemplo, si creemos que dos rasgos están inversamente relacionados, trazar los rasgos de los grupos en un gráfico de radar puede confirmar o negar esas creencias. Otra información clave que podemos obtener al utilizar gráficos de radar es la información de rendimiento.Todas las características distintivas en los conjuntos de datos que analizamos tienen información alta y baja. Los gráficos de radar son ideales para observar qué funciones tienen una puntuación alta o baja entre los grupos. La forma también puede indicar cuán similares son los grupos. Si los grupos tienen una forma similar, entonces se puede decir que esos grupos son más similares en función de sus rasgos. Si los grupos tienen una forma diferente, entonces se puede decir que esos grupos son más diferentes en función de sus rasgos. En general, la idea subyacente es usar la información del gráfico de radar para hacer comparaciones entre las mismas métricas en diferentes grupos. Una manera fácil de hacer estas comparaciones es superponer los gráficos de radar de los grupos que se están observando. Ahora, se analizará el gráfico de radar en la Figura 6 a continuación.

Figura 6: Los gráficos de radar de todos los grupos se superpusieron para facilitar la comparación de valores. Mostrar los grupos de radar en cada grupo de esta manera permite que el análisis y la interpretación se realicen de manera más eficiente.

Ejemplo: análisis de gráfico de radar

Este gráfico de radar específico se derivó de tres grupos de perfiles nucleares en la región Hist1 del genoma humano. Para obtener más información sobre el proceso utilizado para recopilar los perfiles nucleares que se utilizan para la agrupación, acceda al mapeo de la arquitectura del genoma. Los rasgos que se estudian en este gráfico de radar están en el exterior del círculo de la figura de arriba. Hay tres formas diferentes en el gráfico de radar que corresponden a los tres grupos diferentes. El primer grupo es azul, el segundo grupo es rojo y el último grupo es verde. Los gráficos de radar individuales se proporcionan en la Figura 7, 8 y 9 respectivamente. Los valores que se muestran son los valores promedio de cada rasgo en cada grupo que van desde 0 -70%. Las formas de los gráficos de radar de conglomerados pueden proporcionar una idea general de qué conglomerados son similares y cuáles son diferentes. Los grupos dos y tres tienen formas similares y tienen un porcentaje muy similar de ventanas genómicas que tienen el rasgo LAD. El grupo uno tiene un porcentaje mucho mayor de ventanas genómicas con RNAPII-S5P y RNAPII-S7P en comparación con los otros grupos. Se sabe que el rasgo Hist1 y LAD deberían tener una relación inversa. En el gráfico podemos ver que mientras C1 y C2 tienen un porcentaje de LAD aproximado del 40 %, el rasgo LAD en C3 es menor con un porcentaje LAD aproximado del 31 %. El clúster C1 tiene un porcentaje de Hist1 más alto que los demás clústeres. Estas observaciones muestran cómo se puede usar el uso de gráficos de radar para reforzar o negar las creencias que uno tiene sobre los datos que se están estudiando. La idea inicial sobre la relación entre Hist1 y LAD se reforzó comparando los gráficos de radar. Otra idea que podemos derivar es cómo todos los grupos parecen tener porcentajes más altos de los rasgos RNAPII-S5P. Todos los racimos presentan esta característica en un porcentaje superior al 50%. Los rasgos de grupo de H3K9me3 y h3k27me3 que son muy bajos en cada uno de los grupos. Esta información nos ayuda a identificar los rasgos de mayor y menor rendimiento en los grupos.

Figura 8: Este gráfico de radar representa los porcentajes de rasgos del tercer grupo de perfiles nucleares. Las ventanas genómicas que ve este grupo son las que contienen los rasgos que se ven en el exterior del círculo.

Figura 9: Este gráfico de radar representa los porcentajes de rasgos del tercer grupo de perfiles nucleares. Las ventanas genómicas que ve este grupo son las que contienen los rasgos que se ven en el exterior del círculo.

Limitaciones

Los gráficos de radar son principalmente adecuados para mostrar valores atípicos y puntos en común de manera llamativa, o cuando un gráfico es mayor en cada variable que otro, y se utilizan principalmente para mediciones ordinales, donde cada variable corresponde a "mejor" en algún aspecto, y todas las variables en la misma escala..

Por el contrario, los gráficos de radar han sido criticados por no ser adecuados para tomar decisiones de compensación, cuando un gráfico es mayor que otro en algunas variables, pero menor en otras.

Además, es difícil comparar visualmente las longitudes de diferentes radios, porque las distancias radiales son difíciles de juzgar, aunque los círculos concéntricos ayudan como líneas de cuadrícula. En su lugar, se puede utilizar un gráfico lineal simple, especialmente para series de tiempo.

Los gráficos de radar pueden distorsionar los datos hasta cierto punto, especialmente cuando se rellenan áreas, porque el área contenida se vuelve proporcional al cuadrado de las medidas lineales. Por ejemplo, en un gráfico con 5 variables que van del 1 al 100, el área contenida por el polígono delimitado por 5 puntos cuando todas las medidas son 90, es más del 10 % más grande que el mismo para un gráfico con todos los valores de 82.

Los gráficos de radar también pueden volverse difíciles de comparar visualmente entre diferentes muestras en el gráfico cuando sus valores están cerca ya que sus líneas o áreas se confunden entre sí, como se muestra en la Figura 5 a continuación.

Estructura artificial

Los gráficos de radar imponen varias estructuras a los datos, que a menudo son artificiales:

Por ejemplo, los datos alternos 9, 1, 9, 1, 9, 1 producen un gráfico de radar de picos (que entra y sale), mientras que reordenar los datos como 9, 9, 9, 1, 1, 1 produce dos gráficos distintos. cuñas (sectores).

En algunos casos, existe una estructura natural y los gráficos de radar pueden ser adecuados. Por ejemplo, para los diagramas de datos que varían en un ciclo de 24 horas, los datos por hora se relacionan de forma natural con su vecino y tienen una estructura cíclica, por lo que se pueden mostrar naturalmente como un gráfico de radar.

Un conjunto de pautas sobre el uso de gráficos de radar (o más bien el "gráfico de área polar" estrechamente relacionado) es:

Tamaño del conjunto de datos

Los gráficos de radar son útiles para conjuntos de datos multivariados de tamaño pequeño a moderado. Su principal debilidad es que su eficacia se limita a conjuntos de datos con menos de unos pocos cientos de puntos. Después de eso, tienden a ser abrumadores.

Además, cuando se utilizan gráficos de radar con múltiples dimensiones o muestras, el gráfico de radar puede abarrotarse y ser más difícil de interpretar a medida que aumenta el número de muestras.

Por ejemplo, tome la tabla de estadísticas de bateo que compara el MVP de MLB 2021, Shohei Ohtani, con las estadísticas de los bateadores designados promedio de las ligas y algunos jugadores del Salón de la Fama. Estas estadísticas representan el porcentaje de hits, jonrones, ponches, etc. por turno al bate de un jugador. Para obtener más información sobre lo que representa cada estadística utilizada en la tabla, puede consultar esta referencia de la MLB.Usaremos esta tabla a continuación para crear gráficos de radar que comparen las estadísticas de bateo del MVP de 2021 con los promedios de la liga para los bateadores designados y los bateadores regulares, en un intento de visualizar las métricas de rendimiento y llegar a la conclusión visual de que Shohei superó al jugador promedio. A continuación, incluiremos muestras adicionales en la tabla Radar, utilizando a los jugadores del Salón de la Fama Jackie Robinson, Jim Thome y Frank Thomas para comparar a Shohei con algunos de los mejores bateadores de todos los tiempos. Este gráfico de radar no solo puede darnos una intuición de cómo Shohei se compara con los mejores jugadores históricos, sino que también servirá para mostrar las limitaciones de tener demasiadas muestras en un gráfico de radar.

Objetivolicenciado en LetrasOBPSLGoperacionesHORA%ASI QUE%CAMA Y DESAYUNO%
MLB0.2440.3170.4110.7280.0370.2320.087
DH0.2390.3160.4340.750.0470.2560.093
Shohei Ohtani0.2570.3720.5920.9650.0860.2960.15
jackie robinson0.3130.410.4770.8870.02820.05820.151
Jim Thorne0.2760.4020.5540.9560.0720.3020.207
franco thomas0.3010.4190.5550.9740.0630.170.203

Podemos ver en la Figura 10 cómo se puede interpretar fácilmente un gráfico de radar cuando el número de radios y muestras es relativamente pequeño. Cuando comparamos más muestras en la Figura 11, incluso sin un relleno de área en el gráfico de radar, se hace evidente lo difícil que puede llegar a ser interpretar o tomar decisiones de compensación.

Ejemplo

El gráfico de la derecha contiene las gráficas de estrellas de 15 autos. La lista de variables para el diagrama de estrella de muestra es:

  1. Precio
  2. Millaje (MPG)
  3. Registro de reparación de 1978 (1 = peor, 5 = mejor)
  4. Registro de reparación de 1977 (1 = peor, 5 = mejor)
  5. Espacio libre
  6. Habitación del asiento trasero
  7. Espacio en el maletero
  8. Peso
  9. Largo

Podemos mirar estos gráficos individualmente o podemos usarlos para identificar grupos de autos con características similares. Por ejemplo, podemos mirar la gráfica de estrellas del Cadillac Sevilla (el último de la imagen) y ver que es uno de los autos más caros, tiene un consumo de combustible por debajo del promedio (pero no entre los peores), tiene un promedio registro de reparación, y tiene un espacio y un tamaño promedio o superior al promedio. Luego podemos comparar los modelos Cadillac (las últimas tres gráficas) con los modelos AMC (las primeras tres gráficas). Esta comparación muestra patrones distintos. Los modelos AMC tienden a ser económicos, tienen un millaje de gasolina por debajo del promedio y son pequeños tanto en altura como en peso y en espacio. Los modelos Cadillac son caros, tienen un rendimiento de gasolina bajo y son grandes tanto en tamaño como en espacio.

Alternativas

De manera más simple, se puede usar un gráfico de líneas simple, particularmente para series de tiempo.

Para la comparación cualitativa gráfica de datos tabulares bidimensionales en varias variables, una alternativa común son las bolas de Harvey, que Consumer Reports utiliza ampliamente. La comparación en bolas de Harvey (y gráficos de radar) se puede ayudar significativamente ordenando las variables algorítmicamente para agregar orden.

El análisis de componentes principales (PCA) ofrece una forma excelente de visualizar estructuras dentro de datos multivariados.

Otra alternativa es utilizar pequeños gráficos de barras en línea, que pueden compararse con minigráficos.

Aunque los gráficos de radar y polares a menudo se describen como los mismos tipos de gráficos, algunas fuentes los diferencian e incluso consideran que el gráfico de radar es una variación del gráfico polar que no muestra datos en términos de coordenadas polares.