Experimento factorial

Ajustar Compartir Imprimir Citar

En estadística, un experimento factorial completo es un experimento cuyo diseño consta de dos o más factores, cada uno con posibles valores discretos o "niveles", y cuyas unidades experimentales toman todas las combinaciones posibles de estos niveles en todos esos factores. Un diseño factorial completo también puede denominarse diseño completamente cruzado. Tal experimento permite al investigador estudiar el efecto de cada factor en la variable de respuesta, así como los efectos de las interacciones entre factores en la variable de respuesta.

Para la gran mayoría de los experimentos factoriales, cada factor tiene solo dos niveles. Por ejemplo, con dos factores, cada uno con dos niveles, un experimento factorial tendría cuatro combinaciones de tratamientos en total y, por lo general, se denomina diseño factorial 2×2. En tal diseño, la interacción entre las variables suele ser la más importante. Esto se aplica incluso a escenarios donde está presente un efecto principal y una interacción.

Si el número de combinaciones en un diseño factorial completo es demasiado alto para ser logísticamente factible, se puede hacer un diseño factorial fraccionado, en el que se omiten algunas de las combinaciones posibles (por lo general, al menos la mitad).

Historia

Los diseños factoriales fueron utilizados en el siglo XIX por John Bennet Lawes y Joseph Henry Gilbert de la Estación Experimental de Rothamsted.

Ronald Fisher argumentó en 1926 que los diseños "complejos" (como los diseños factoriales) eran más eficientes que estudiar un factor a la vez. Pescador escribió,

"Ningún aforismo se repite con más frecuencia en relación con los ensayos de campo, que debemos hacerle pocas preguntas a la Naturaleza, o, idealmente, una pregunta a la vez. El escritor está convencido de que esta opinión es totalmente errónea".

La naturaleza, sugiere, responderá mejor a "un cuestionario lógico y cuidadosamente pensado". Un diseño factorial permite determinar el efecto de varios factores e incluso las interacciones entre ellos con el mismo número de ensayos que son necesarios para determinar cualquiera de los efectos por sí mismo con el mismo grado de precisión.

Frank Yates hizo contribuciones significativas, particularmente en el análisis de diseños, mediante el análisis de Yates.

Es posible que el término "factorial" no se haya utilizado impreso antes de 1935, cuando Fisher lo utilizó en su libro The Design of Experiments.

Ventajas de los experimentos factoriales

Mucha gente examina el efecto de un solo factor o variable. En comparación con tales experimentos de un factor a la vez (OFAT), los experimentos factoriales ofrecen varias ventajas

Los diseños factoriales son más eficientes que los experimentos OFAT. Proporcionan más información a un costo similar o menor. Pueden encontrar condiciones óptimas más rápido que los experimentos OFAT.
Los diseños factoriales permiten examinar factores adicionales sin costo adicional.
Cuando el efecto de un factor es diferente para diferentes niveles de otro factor, no puede detectarse mediante un diseño de experimento OFAT. Se requieren diseños factoriales para detectar dichas interacciones. El uso de OFAT cuando las interacciones están presentes puede conducir a un malentendido grave de cómo cambia la respuesta con los factores.
Los diseños factoriales permiten estimar los efectos de un factor en varios niveles de los otros factores, lo que arroja conclusiones que son válidas en una variedad de condiciones experimentales.

Ejemplo de ventajas de los experimentos factoriales

En su libro Improving Almost Anything: Ideas and Essays, el estadístico George Box da muchos ejemplos de los beneficios de los experimentos factoriales. Acá hay uno. Los ingenieros del fabricante de rodamientos SKF querían saber si cambiar a un diseño de "jaula" menos costoso afectaría la vida útil del rodamiento. Los ingenieros le pidieron ayuda a Christer Hellstrand, un estadístico, para diseñar el experimento.

Box informa lo siguiente. "Los resultados se evaluaron mediante una prueba de vida acelerada... Las corridas fueron costosas porque debían realizarse en una línea de producción real y los experimentadores planeaban hacer cuatro corridas con la jaula estándar y cuatro con la jaula modificada. Christer preguntó si había otros factores que les gustaría probar. Dijeron que los había, pero que hacer ejecuciones adicionales excedería su presupuesto. Christer les mostró cómo podían probar dos factores adicionales "gratis", sin aumentar el número de ejecuciones y sin reducir el precisión de su estimación del efecto jaula. En este arreglo, llamado diseño factorial 2 × 2 × 2, cada uno de los tres factores se ejecutaría en dos niveles y se incluirían las ocho combinaciones posibles. Las diversas combinaciones se pueden mostrar convenientemente como los vértices de un cubo... " "En cada caso, la condición estándar se indica con un signo menos y la condición modificada con un signo más. Los factores que cambiaron fueron el tratamiento térmico, la osculación del anillo exterior y el diseño de la jaula. Los números muestran la duración relativa de la vida útil de los rodamientos. Si observa [el diagrama de cubo], puede ver que la elección del diseño de la jaula no hizo mucha diferencia. … Pero, si promedia los pares de números para el diseño de la jaula, obtiene la [tabla a continuación], que muestra lo que hicieron los otros dos factores. … Condujo al extraordinario descubrimiento de que, en esta aplicación en particular, la vida útil de un rodamiento puede multiplicarse por cinco si los dos factores, la osculación del anillo externo y los tratamientos térmicos del anillo interno, se incrementan juntos". la condición estándar se indica con un signo menos y la condición modificada con un signo más. Los factores que cambiaron fueron el tratamiento térmico, la osculación del anillo exterior y el diseño de la jaula. Los números muestran la duración relativa de la vida útil de los rodamientos. Si observa [el diagrama de cubo], puede ver que la elección del diseño de la jaula no hizo mucha diferencia. … Pero, si promedia los pares de números para el diseño de la jaula, obtiene la [tabla a continuación], que muestra lo que hicieron los otros dos factores. … Condujo al extraordinario descubrimiento de que, en esta aplicación en particular, la vida útil de un rodamiento puede multiplicarse por cinco si los dos factores, la osculación del anillo externo y los tratamientos térmicos del anillo interno, se incrementan juntos". la condición estándar se indica con un signo menos y la condición modificada con un signo más. Los factores que cambiaron fueron el tratamiento térmico, la osculación del anillo exterior y el diseño de la jaula. Los números muestran la duración relativa de la vida útil de los rodamientos. Si observa [el diagrama de cubo], puede ver que la elección del diseño de la jaula no hizo mucha diferencia. … Pero, si promedia los pares de números para el diseño de la jaula, obtiene la [tabla a continuación], que muestra lo que hicieron los otros dos factores. … Condujo al extraordinario descubrimiento de que, en esta aplicación en particular, la vida útil de un rodamiento puede multiplicarse por cinco si los dos factores, la osculación del anillo externo y los tratamientos térmicos del anillo interno, se incrementan juntos". Si observa [el diagrama de cubo], puede ver que la elección del diseño de la jaula no hizo mucha diferencia. … Pero, si promedia los pares de números para el diseño de la jaula, obtiene la [tabla a continuación], que muestra lo que hicieron los otros dos factores. … Condujo al extraordinario descubrimiento de que, en esta aplicación en particular, la vida útil de un rodamiento puede multiplicarse por cinco si los dos factores, la osculación del anillo externo y los tratamientos térmicos del anillo interno, se incrementan juntos". Si observa [el diagrama de cubo], puede ver que la elección del diseño de la jaula no hizo mucha diferencia. … Pero, si promedia los pares de números para el diseño de la jaula, obtiene la [tabla a continuación], que muestra lo que hicieron los otros dos factores. … Condujo al extraordinario descubrimiento de que, en esta aplicación en particular, la vida útil de un rodamiento puede multiplicarse por cinco si los dos factores, la osculación del anillo externo y los tratamientos térmicos del anillo interno, se incrementan juntos".

	Osculación −	osculacion +
Calor −	18	23
calor +	21	106

"Recordando que los rodamientos como este se han fabricado durante décadas, al principio es sorprendente que pueda llevar tanto tiempo descubrir una mejora tan importante. Una explicación probable es que, debido a que la mayoría de los ingenieros, hasta hace poco, han empleado solo un factor en una experimentación en el tiempo, los efectos de interacción se han perdido".

Ejemplo

El experimento factorial más simple contiene dos niveles para cada uno de los dos factores. Suponga que un ingeniero desea estudiar la potencia total utilizada por cada uno de dos motores diferentes, A y B, funcionando a dos velocidades diferentes, 2000 o 3000 RPM. El experimento factorial constaría de cuatro unidades experimentales: motor A a 2000 RPM, motor B a 2000 RPM, motor A a 3000 RPM y motor B a 3000 RPM. Cada combinación de un solo nivel seleccionado de cada factor está presente una vez.

Este experimento es un ejemplo de un experimento factorial 2 (o 2×2), llamado así porque considera dos niveles (la base) para cada uno de dos factores (la potencia o superíndice), o #niveles, produciendo 2 = 4 puntos factoriales.

Los diseños pueden involucrar muchas variables independientes. Como otro ejemplo, los efectos de tres variables de entrada se pueden evaluar en ocho condiciones experimentales que se muestran como las esquinas de un cubo.

Esto puede llevarse a cabo con o sin replicación, según el propósito previsto y los recursos disponibles. Proporcionará los efectos de las tres variables independientes sobre la variable dependiente y las posibles interacciones.

Notación

	A	B
(1)	−	−
a	+	−
b	−	+
abdominales	+	+

La notación utilizada para denotar experimentos factoriales transmite mucha información. Cuando un diseño se denota como factorial 2, esto identifica el número de factores (3); cuántos niveles tiene cada factor (2); y cuantas condiciones experimentales hay en el diseño (2 = 8). De manera similar, un diseño de 2 tiene cinco factores, cada uno con dos niveles, y 2 = 32 condiciones experimentales. Los experimentos factoriales pueden involucrar factores con diferentes números de niveles. Un diseño 2 3 tiene cinco factores, cuatro con dos niveles y uno con tres niveles, y tiene 16 × 3 = 48 condiciones experimentales.

Para ahorrar espacio, los puntos en un experimento factorial de dos niveles a menudo se abrevian con cadenas de signos más y menos. Las cadenas tienen tantos símbolos como factores, y sus valores dictan el nivel de cada factor: convencionalmente, $-$ para el primer (o bajo) nivel, y $+$ para el segundo (o alto) nivel. Los puntos en este experimento se pueden representar como $--$ , $+-$ , $-+$ y $++$ .

Los puntos factoriales también se pueden abreviar con (1), a, b y ab, donde la presencia de una letra indica que el factor especificado está en su nivel alto (o segundo) y la ausencia de una letra indica que el factor especificado está en su nivel bajo (o primero) (por ejemplo, "a" indica que el factor A está en su configuración alta, mientras que todos los demás factores están en su configuración baja (o primera). (1) se utiliza para indicar que todos los factores están en sus valores más bajos (o primeros).

Implementación

Para más de dos factores, un experimento factorial 2 generalmente se puede diseñar recursivamente a partir de un experimento factorial 2 replicando el experimento 2, asignando la primera réplica al primer (o bajo) nivel del nuevo factor, y la segunda réplica al segundo. (o alto) nivel. Este marco se puede generalizar para, por ejemplo, diseñar tres réplicas para factores de tres niveles, etc.

Un experimento factorial permite la estimación del error experimental de dos maneras. El experimento se puede replicar o, a menudo, se puede explotar el principio de escasez de efectos. La replicación es más común para experimentos pequeños y es una forma muy confiable de evaluar el error experimental. Cuando el número de factores es grande (normalmente más de 5 factores, pero esto varía según la aplicación), la replicación del diseño puede volverse operativamente difícil. En estos casos, es común ejecutar solo una única réplica del diseño y suponer que las interacciones de factores de más de cierto orden (por ejemplo, entre tres o más factores) son insignificantes. Bajo esta suposición, las estimaciones de tales interacciones de alto orden son estimaciones de un cero exacto, por lo tanto, realmente una estimación del error experimental.

Cuando hay muchos factores, se necesitarán muchas corridas experimentales, incluso sin replicación. Por ejemplo, experimentar con 10 factores en dos niveles cada uno produce 2 = 1024 combinaciones. En algún momento esto se vuelve inviable debido al alto costo o recursos insuficientes. En este caso, se pueden utilizar diseños factoriales fraccionados.

Al igual que con cualquier experimento estadístico, las corridas experimentales en un experimento factorial deben aleatorizarse para reducir el impacto que podría tener el sesgo en los resultados experimentales. En la práctica, esto puede ser un gran desafío operativo.

Los experimentos factoriales se pueden utilizar cuando hay más de dos niveles de cada factor. Sin embargo, el número de corridas experimentales requeridas para diseños factoriales de tres niveles (o más) será considerablemente mayor que para sus contrapartes de dos niveles. Por lo tanto, los diseños factoriales son menos atractivos si un investigador desea considerar más de dos niveles.

Análisis

Un experimento factorial se puede analizar mediante ANOVA o análisis de regresión. Para calcular el efecto principal de un factor "A", reste la respuesta promedio de todas las corridas experimentales para las cuales A estuvo en su nivel bajo (o primero) de la respuesta promedio de todas las corridas experimentales para las cuales A estuvo en su nivel alto (o segundo).) nivel.

Otras herramientas útiles de análisis exploratorio para experimentos factoriales incluyen gráficas de efectos principales, gráficas de interacción, gráficas de Pareto y una gráfica de probabilidad normal de los efectos estimados.

Cuando los factores son continuos, los diseños factoriales de dos niveles asumen que los efectos son lineales. Si se espera un efecto cuadrático para un factor, se debe usar un experimento más complicado, como un diseño compuesto central. La optimización de factores que podrían tener efectos cuadráticos es el objetivo principal de la metodología de superficie de respuesta.

Ejemplo de análisis

Montgomery da el siguiente ejemplo de análisis de un experimento factorial:.

A un ingeniero le gustaría aumentar la tasa de filtración (salida) de un proceso para producir una sustancia química y reducir la cantidad de formaldehído que se usa en el proceso. Los intentos anteriores de reducir el formaldehído han reducido la tasa de filtración. La tasa de filtración actual es de 75 galones por hora. Se consideran cuatro factores: temperatura (A), presión (B), concentración de formaldehído (C) y velocidad de agitación (D). Cada uno de los cuatro factores se probará en dos niveles.

En adelante, los signos menos (-) y más (+) indicarán si el factor se ejecuta en un nivel bajo o alto, respectivamente.

A	B	C	D	Tasa de filtración
−	−	−	−	45
+	−	−	−	71
−	+	−	−	48
+	+	−	−	sesenta y cinco
−	−	+	−	68
+	−	+	−	60
−	+	+	−	80
+	+	+	−	sesenta y cinco
−	−	−	+	43
+	−	−	+	100
−	+	−	+	45
+	+	−	+	104
−	−	+	+	75
+	−	+	+	86
−	+	+	+	70
+	+	+	+	96

Gráfico de los efectos principales que muestra las tasas de filtración para los ajustes bajo (-) y alto (+) para cada factor.
Gráfico de los efectos de interacción que muestra la tasa de filtración media en cada una de las cuatro posibles combinaciones de niveles para un par de factores dado.

Las líneas no paralelas en el gráfico de interacción A:C indican que el efecto del factor A depende del nivel del factor C. Se mantienen resultados similares para la interacción A:D. Los gráficos indican que el factor B tiene poco efecto sobre la tasa de filtración. El análisis de varianza (ANOVA) que incluye los 4 factores y todos los posibles términos de interacción entre ellos produce los coeficientes estimados que se muestran en la siguiente tabla.

Coeficientes	Estimar
Interceptar	70.063
A	10.813
B	1.563
C	4.938
D	7.313
A:B	0.063
C.A	−9.063
ANTES DE CRISTO	1.188
ANUNCIO	8.313
segundo:re	−0,188
CD	−0,563
A B C	0.938
A:B:D	2.063
A:C:D	−0,813
B:C:D	−1.313
A B C D	0.688

Diagrama de Pareto que muestra la magnitud relativa de los coeficientes de los factores.

Debido a que hay 16 observaciones y 16 coeficientes (intersección, efectos principales e interacciones), los valores p no se pueden calcular para este modelo. Los valores de los coeficientes y los gráficos sugieren que los factores importantes son A, C y D, y los términos de interacción A:C y A:D.

Los coeficientes para A, C y D son todos positivos en el ANOVA, lo que sugeriría ejecutar el proceso con las tres variables establecidas en el valor alto. Sin embargo, el efecto principal de cada variable es el promedio sobre los niveles de las otras variables. El diagrama de interacción A:C anterior muestra que el efecto del factor A depende del nivel del factor C, y viceversa. El factor A (temperatura) tiene muy poco efecto sobre la tasa de filtración cuando el factor C está en el nivel +. Pero el factor A tiene un gran efecto en la tasa de filtración cuando el factor C (formaldehído) está en el nivel −. La combinación de A en el nivel + y C en el nivel − da la tasa de filtración más alta. Esta observación indica cómo los análisis de un factor a la vez pueden pasar por alto interacciones importantes.

La mejor tasa de filtración se observa cuando A y D están en el nivel alto y C en el nivel bajo. Este resultado también satisface el objetivo de reducir el formaldehído (factor C). Debido a que B no parece ser importante, puede eliminarse del modelo. Al realizar el ANOVA utilizando los factores A, C y D, y los términos de interacción A:C y A:D, se obtiene el resultado que se muestra en la siguiente tabla, en la que todos los términos son significativos (p-valor < 0,05).

Coeficiente	Estimar	Error estándar	valor t	valor p
Interceptar	70.062	1.104	63.444	2,3 × 10
A	10.812	1.104	9.791	1,9 × 10
C	4.938	1.104	4.471	1,2 × 10
D	7.313	1.104	6.622	5,9 × 10
C.A	−9.063	1.104	−8.206	9,4 × 10
ANUNCIO	8.312	1.104	7.527	2 × 10