Pseudoreplicación

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

La pseudorreplicación (a veces denominada error de unidad de análisis) tiene muchas definiciones. Stuart H. Hurlbert definió la pseudorreplicación originalmente en 1984 como el uso de estadísticas inferenciales para probar los efectos del tratamiento con datos de experimentos en los que los tratamientos no se replican (aunque las muestras sí) o las réplicas no son estadísticamente independientes. Posteriormente, Millar y Anderson la identificaron como un caso especial de especificación inadecuada de factores aleatorios en el que están presentes tanto factores aleatorios como fijos. A veces se interpreta de manera estricta como una inflación del número de muestras o réplicas que no son estadísticamente independientes. Esta definición omite la confusión de los efectos de la unidad y del tratamiento en una razón F mal especificada. En la práctica, las razones F incorrectas para pruebas estadísticas de efectos fijos a menudo surgen de una razón F predeterminada que se forma sobre el error en lugar del término mixto.

Lazic definió la pseudorreplicación como un problema de muestras correlacionadas (por ejemplo, de estudios longitudinales) donde la correlación no se tiene en cuenta al calcular el intervalo de confianza para la media de la muestra. Para el efecto de la correlación serial o temporal, véase también el teorema del límite central de la cadena de Markov.

Pseudoreplicación debido a la correlación de muestras: sin contabilizar la correlación el intervalo de confianza del 90% para la media muestra es demasiado pequeño. Para resolver este problema, por ejemplo, el método de bloqueo se puede aplicar cuando las muestras correlativas se agrupan primero, luego se computan los medios de muestra correspondientes (para cada bloque). De estos dos "medios de muestra bloqueada" la media total de la muestra se calcula como su promedio, así como la desviación estándar. Esto proporciona una estimación mejor para el intervalo de confianza de la media muestra.

El problema de la especificación inadecuada surge cuando los tratamientos se asignan a unidades que son submuestreadas y el cociente F del tratamiento en una tabla de análisis de varianza (ANOVA) se forma con respecto al cuadrado medio residual en lugar de con respecto al cuadrado medio entre unidades. El cociente F relativo al cuadrado medio dentro de la unidad es vulnerable a la confusión de los efectos del tratamiento y de la unidad, especialmente cuando el número de unidades experimentales es pequeño (por ejemplo, cuatro unidades de tanques, dos tanques tratados, dos no tratados, varias submuestras por tanque). El problema se elimina formando el cociente F relativo al cuadrado medio correcto en la tabla ANOVA (tanque por tratamiento MS en el ejemplo anterior), cuando esto es posible. El problema se soluciona mediante el uso de modelos mixtos.

Hurlbert informó de la existencia de "pseudorreplicación" en el 48% de los estudios que examinó y que utilizaron estadísticas inferenciales. Varios estudios que examinaron artículos científicos publicados hasta 2016 descubrieron de manera similar que aproximadamente la mitad de los artículos eran sospechosos de pseudorreplicación. Cuando el tiempo y los recursos limitan la cantidad de unidades experimentales y los efectos de las unidades no se pueden eliminar estadísticamente mediante pruebas sobre la varianza de las unidades, es importante utilizar otras fuentes de información para evaluar el grado en que una razón F se ve confundida por los efectos de las unidades.

Replicación

La replicación aumenta la precisión de una estimación, mientras que la aleatorización aborda la aplicabilidad más amplia de una muestra a una población. La replicación debe ser apropiada: se debe considerar la replicación a nivel de la unidad experimental, además de la replicación dentro de las unidades.

Pruebas de hipotesis

Las pruebas estadísticas (por ejemplo, la prueba t y la familia de pruebas ANOVA relacionadas) se basan en una replicación adecuada para estimar la significación estadística. Las pruebas basadas en las distribuciones t y F suponen errores homogéneos, normales e independientes. Los errores correlacionados pueden dar lugar a una precisión falsa y a valores p demasiado pequeños.

Tipos

Hurlbert (1984) definió cuatro tipos de pseudorreplicación.

  • Seudoreplicación simple (Figura 5a en Hurlbert 1984) ocurre cuando hay una unidad experimental por tratamiento. Las estadísticas inferenciales no pueden separar la variabilidad debido al tratamiento de la variabilidad debido a unidades experimentales cuando sólo hay una medición por unidad.
  • La pseudoreplicación temporal (figura 5c en Hurlbert 1984) ocurre cuando las unidades experimentales difieren lo suficiente en el tiempo que los efectos temporales entre las unidades son probables, y los efectos del tratamiento están correlacionados con efectos temporales. Las estadísticas inferenciales no pueden separar la variabilidad debido al tratamiento de la variabilidad debido a unidades experimentales cuando sólo hay una medición por unidad.
  • La pseudoreplicación Sacrifica (Figura 5b en Hurlbert 1984) ocurre cuando los medios dentro de un tratamiento se utilizan en un análisis, y estos medios se prueban sobre la varianza de la unidad. En la Figura 5b el F-ratio erróneo tendrá 1 df en el numerador (tratamiento) significa cuadrado y 4 df en el denominador significa cuadrado(2-1 = 1 df para cada unidad experimental). La F-ratio correcta tendrá 1 df en el numerador (tratamiento) y 2 df en el denominador (2-1 = 1 df para cada tratamiento). Los controles F-ratio correctos para efectos de unidades experimentales pero con 2 df en el denominador tendrá poca potencia para detectar diferencias de tratamiento.
  • Seudoreplicación implícita ocurre cuando los errores estándar (o límites de confianza) se calculan dentro de unidades experimentales. Al igual que con otras fuentes de pseudoreplicación, los efectos del tratamiento no pueden separarse estadísticamente de efectos debido a la variación entre unidades experimentales.

Véase también

  • Replicación (estadística)
  • Reamplificación (estadística)

Referencias

  1. ^ Hurlbert, Stuart H. (2009). "El antiguo arte negro y la extensión transdisciplinaria de la pseudoreplicación". Journal of Comparative Psychology. 123 4): 434 –443. doi:10.1037/a0016221. ISSN 1939-2087. PMID 19929111.
  2. ^ a b Hurlbert, Stuart H. (1984). "Pseudoreplicación y diseño de experimentos de campo ecológico" (PDF). Ecological Monographs. 54 2). Ecological Society of America: 187 –211. Bibcode:1984EcoM...54..187H. doi:10.2307/1942661. JSTOR 1942661.
  3. ^ a b Millar, R.B.; Anderson, M.R. (2004). "Remedios para la pseudoreplicación". Fisheries Research. 70 ()2-3): 397 –407. doi:10.1016/j.fishres.2004.08.016.
  4. ^ a b Gholipour, Bahar (2018-03-15). "Los errores estatísticos pueden tainar tantos como la mitad de los estudios del ratón". Noticias de investigación del autismo. Retrieved 2018-03-24.
  5. ^ a b E, Lazic, Stanley (2010-01-14). "El problema de la pseudoreplicación en estudios neurocientíficos: ¿está afectando su análisis?". BMC Neurociencia. 11. BioMed Central Ltd: 5. doi:10.1186/1471-2202-11-5OCLC 805414397. PMC 2817684. PMID 20074371.{{cite journal}}: CS1 maint: múltiples nombres: lista de autores (link)
  6. ^ Lazic, SE (2010). "El problema de la pseudoreplicación en estudios neurocientíficos: ¿está afectando su análisis?". BMC Neurociencia. 11 5): 5. doi:10.1186/1471-2202-11-5. PMC 2817684. PMID 20074371.
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save