Ordenación (estadísticas)
ordenación o análisis de gradiente, en el análisis multivariado, es un método complementario al agrupamiento de datos y se utiliza principalmente en el análisis de datos exploratorio (en lugar de en la prueba de hipótesis). A diferencia del análisis de conglomerados, la ordenación ordena cantidades en un espacio latente (generalmente de dimensiones inferiores). En el espacio de ordenación, las cantidades que están cerca entre sí comparten atributos (es decir, son similares hasta cierto punto) y los objetos diferentes están más alejados entre sí. Estas relaciones entre los objetos, en cada uno de varios ejes o variables latentes, se caracterizan luego numérica y/o gráficamente en un biplot.
El primer método de ordenación, el análisis de componentes principales, fue sugerido por Karl Pearson en 1901.
Métodos
Los métodos de ordenación se pueden clasificar en términos generales en métodos basados en vectores propios, algoritmos o modelos. Muchas técnicas de ordenación clásicas, incluido el análisis de componentes principales, el análisis de correspondencia (CA) y sus derivados (análisis de correspondencia sin tendencia, análisis de correspondencia canónica y análisis de redundancia), pertenecen al primer grupo.
El segundo grupo incluye algunos métodos basados en la distancia, como el escalado multidimensional no métrico, y métodos de aprendizaje automático, como la incrustación de vecinos estocásticos distribuidos en T y la reducción de dimensionalidad no lineal.
El tercer grupo incluye métodos de ordenación basados en modelos, que pueden considerarse como extensiones multivariadas de los modelos lineales generalizados. Los métodos de ordenación basados en modelos son más flexibles en su aplicación que los métodos de ordenación clásicos, de modo que, por ejemplo, es posible incluir efectos aleatorios. A diferencia de los dos grupos antes mencionados, no existe una medida de distancia (implícita o explícita) en la ordenación. En cambio, es necesario especificar una distribución para las respuestas, como es típico en los modelos estadísticos. Estos y otros supuestos, como la supuesta relación media-varianza, pueden validarse con el uso de diagnósticos residuales, a diferencia de otros métodos de ordenación.
Aplicaciones
La ordenación se puede utilizar en el análisis de cualquier conjunto de objetos multivariados. Se utiliza con frecuencia en varias ciencias ambientales o ecológicas, particularmente en ecología de comunidades vegetales. También se utiliza en genética y biología de sistemas para análisis de datos de microarrays y en psicometría.
Contenido relacionado
Conjunto vacío
Historia de la lógica
Ley de los grandes números