Sesgo de muestreo
En estadística, el sesgo de muestreo es un sesgo en el que una muestra se recopila de tal manera que algunos miembros de la población prevista tienen una probabilidad de muestreo mayor o menor que otros. Da como resultado una muestra sesgada de una población (o factores no humanos) en la que todos los individuos, o instancias, no tenían la misma probabilidad de haber sido seleccionados. Si esto no se tiene en cuenta, los resultados pueden atribuirse erróneamente al fenómeno en estudio y no al método de muestreo.
Las fuentes médicas a veces se refieren al sesgo de muestreo como sesgo de determinación. El sesgo de verificación tiene básicamente la misma definición, pero todavía se clasifica a veces como un tipo separado de sesgo.
Distinción del sesgo de selección
El sesgo de muestreo generalmente se clasifica como un subtipo de sesgo de selección, a veces denominado específicamente sesgo de selección de muestra, pero algunos lo clasifican como un tipo de sesgo separado. Una distinción, aunque no universalmente aceptada, del sesgo de muestreo es que socava la validez externa de una prueba (la capacidad de sus resultados para generalizarse a toda la población), mientras que el sesgo de selección aborda principalmente la validez interna de las diferencias o similitudes encontradas en la prueba. muestra a la mano. En este sentido, los errores que se produzcan en el proceso de recogida de la muestra o de la cohorte provocan un sesgo de muestreo, mientras que los errores en cualquier proceso posterior provocan un sesgo de selección.
Sin embargo, el sesgo de selección y el sesgo de muestreo a menudo se usan como sinónimos.
Tipos
- Selección de una área real específica. Por ejemplo, una encuesta de estudiantes de secundaria para medir el consumo de drogas ilegales de adolescentes será una muestra sesgada porque no incluye estudiantes o desertores escolarizados en el hogar. Una muestra también sesgada si algunos miembros están insuficientemente representados o sobrerepresentados en relación con otros de la población. Por ejemplo, una entrevista "hombre en la calle" que selecciona a las personas que caminan por un lugar determinado va a tener una sobrerepresentación de individuos sanos que son más propensos a estar fuera del hogar que los individuos con una enfermedad crónica. Esto puede ser una forma extrema de muestreo parcial, porque ciertos miembros de la población están totalmente excluidos de la muestra (es decir, tienen cero probabilidad de ser seleccionados).
- Autoselección sesgo (ver también sesgo de no respuesta), que es posible siempre que el grupo de personas estudiadas tenga alguna forma de control sobre si participar (como los estándares actuales de la ética de investigación de base humana requieren para muchas formas de estudio en tiempo real y longitudinal). La decisión de los participantes de participar puede estar correlacionada con rasgos que afectan al estudio, haciendo de los participantes una muestra no representativa. Por ejemplo, las personas que tienen opiniones fuertes o conocimientos sustanciales pueden estar más dispuestas a pasar tiempo respondiendo a una encuesta que las que no lo hacen. Otro ejemplo es en línea y encuestas telefónicas, que son muestras sesgadas porque los encuestados son autoseleccionados. Aquellos individuos que están muy motivados para responder, típicamente individuos que tienen opiniones fuertes, están excesivamente representados, y los individuos que son indiferentes o apáticos son menos propensos a responder. Esto a menudo conduce a una polarización de respuestas con perspectivas extremas que se dan un peso desproporcionado en el resumen. Como resultado, estos tipos de encuestas se consideran poco científicos.
- Exclusión El sesgo resulta de la exclusión de determinados grupos de la muestra, por ejemplo, la exclusión de sujetos que han emigrado recientemente al área de estudio (esto puede ocurrir cuando los recién llegados no están disponibles en un registro utilizado para identificar la población de origen). Excluir sujetos que salen del área de estudio durante el seguimiento es más bien equivalente a la deserción o no respuesta, un sesgo de selección en que afecta más bien la validez interna del estudio.
- Sesgo de usuario saludable, cuando la población del estudio es probablemente más saludable que la población general. Por ejemplo, es poco probable que alguien en mala salud tenga un trabajo como trabajador manual.
- La falacia de Berkson, cuando la población estudiada es seleccionada de un hospital y así es menos saludable que la población general. Esto puede dar lugar a una correlación negativa espuriosa entre enfermedades: un paciente hospitalario sin diabetes es más probablemente tener otra enfermedad dada como la colecistitis, ya que deben haber tenido alguna razón para entrar en el hospital en primer lugar.
- Overmatching, coincidiendo con un aparente confundador que en realidad es el resultado de la exposición. El grupo de control se vuelve más similar a los casos de exposición que la población general.
- Sesgo de supervivencia, en el que sólo se seleccionan sujetos "supervivientes", ignorando aquellos que cayeron de vista. Por ejemplo, el uso del registro de las empresas actuales como indicador de clima empresarial o economía ignora las empresas que fallaron y ya no existen.
- Malmquist bias, un efecto en la astronomía observacional que conduce a la detección preferencial de objetos intrínsecamente brillantes.
Muestreo basado en síntomas
El estudio de las condiciones médicas comienza con informes anecdóticos. Por su naturaleza, dichos informes sólo incluyen los derivados para diagnóstico y tratamiento. Un niño que no puede funcionar en la escuela tiene más probabilidades de ser diagnosticado con dislexia que un niño que tiene dificultades pero aprueba. Un niño examinado por una condición tiene más probabilidades de ser examinado y diagnosticado con otras condiciones, sesgando las estadísticas de comorbilidad. A medida que ciertos diagnósticos se asocian con problemas de comportamiento o discapacidad intelectual, los padres intentan evitar que sus hijos sean estigmatizados con esos diagnósticos, lo que introduce más sesgos. Los estudios cuidadosamente seleccionados de poblaciones enteras muestran que muchas condiciones son mucho más comunes y, por lo general, mucho más leves de lo que se creía anteriormente.
Selección truncada en estudios de pedigrí
Los genetistas están limitados en la forma en que pueden obtener datos de las poblaciones humanas. Como ejemplo, considere una característica humana. Nos interesa decidir si la característica se hereda como un simple rasgo mendeliano. Siguiendo las leyes de la herencia mendeliana, si los padres de una familia no tienen la característica, pero portan el alelo para ella, son portadores (por ejemplo, un heterocigoto no expresivo). En este caso, sus hijos tendrán cada uno un 25% de posibilidades de mostrar la característica. El problema surge porque no podemos saber qué familias tienen ambos padres como portadores (heterocigotos) a menos que tengan un hijo que presente la característica. La descripción sigue el libro de texto de Sutton.
La figura muestra los pedigríes de todas las posibles familias con dos hijos cuando los padres son portadores (Aa).
- Selección sin tregua. En un mundo perfecto debemos ser capaces de descubrir todas esas familias con un gen, incluyendo aquellos que son simplemente portadores. En esta situación el análisis estaría libre de sesgo de determinación y los pedigros estarían bajo "no tregua selección" En la práctica, la mayoría de los estudios identifican e incluyen a las familias en un estudio basado en ellas que tienen individuos afectados.
- Selección de Truncate. Cuando afligido particulares tienen la misma posibilidad de ser incluido en un estudio que se llama selección truncate, lo que significa la exclusión inadvertida (truncación) de las familias que son portadoras de un gen. Debido a que la selección se realiza a nivel individual, las familias con dos o más niños afectados tendrían mayor probabilidad de incluirse en el estudio.
- Selección completa es un caso especial donde cada uno familia con un niño afectado tiene la misma posibilidad de ser seleccionado para el estudio.
Las probabilidades de que cada una de las familias sea seleccionada se dan en la figura, con la frecuencia de muestreo de los niños afectados también. En este caso simple, el investigador buscará una frecuencia de 4⁄7 o 5⁄8 para la característica, según el tipo de selección truncada utilizada.
El efecto cavernícola
Un ejemplo de sesgo de selección se denomina "efecto cavernícola". Gran parte de nuestra comprensión de los pueblos prehistóricos proviene de las cuevas, como las pinturas rupestres realizadas hace casi 40.000 años. Si hubiera habido pinturas contemporáneas sobre árboles, pieles de animales o laderas, habrían desaparecido hace mucho tiempo. Del mismo modo, es muy probable que la evidencia de pozos de fuego, basureros, sitios de entierro, etc. permanezcan intactos hasta la era moderna en las cuevas. Los pueblos prehistóricos están asociados con las cuevas porque ahí es donde todavía existen los datos, no necesariamente porque la mayoría de ellos vivieron en cuevas la mayor parte de sus vidas.
Problemas debido al sesgo de muestreo
El sesgo de muestreo es problemático porque es posible que una estadística calculada de la muestra sea sistemáticamente errónea. El sesgo de muestreo puede conducir a una sobreestimación o subestimación sistemática del parámetro correspondiente en la población. El sesgo de muestreo se produce en la práctica, ya que es prácticamente imposible garantizar una perfecta aleatoriedad en el muestreo. Si el grado de tergiversación es pequeño, entonces la muestra puede tratarse como una aproximación razonable a una muestra aleatoria. Además, si la muestra no difiere notablemente en la cantidad que se mide, una muestra sesgada aún puede ser una estimación razonable.
La palabra sesgo tiene una fuerte connotación negativa. De hecho, los sesgos a veces provienen de la intención deliberada de engañar u otro fraude científico. En el uso estadístico, el sesgo simplemente representa una propiedad matemática, sin importar si es deliberado o inconsciente o debido a imperfecciones en los instrumentos utilizados para la observación. Si bien algunas personas pueden usar deliberadamente una muestra sesgada para producir resultados engañosos, más a menudo, una muestra sesgada es solo un reflejo de la dificultad para obtener una muestra verdaderamente representativa o la ignorancia del sesgo en su proceso de medición o análisis. Un ejemplo de cómo puede existir la ignorancia de un sesgo es el uso generalizado de una proporción (también conocido como cambio de pliegue) como una medida de diferencia en biología. Debido a que es más fácil lograr una razón grande con dos números pequeños con una diferencia dada, y relativamente más difícil lograr una razón grande con dos números grandes con una diferencia mayor, es posible que se pasen por alto diferencias significativas grandes al comparar mediciones numéricas relativamente grandes. Algunos han llamado a esto un 'sesgo de demarcación' porque el uso de una razón (división) en lugar de una diferencia (resta) elimina los resultados del análisis de la ciencia a la pseudociencia (Ver Problema de demarcación).
Algunas muestras utilizan un diseño estadístico sesgado que, sin embargo, permite la estimación de parámetros. El Centro Nacional de Estadísticas de Salud de EE. UU., por ejemplo, sobremuestrea deliberadamente las poblaciones minoritarias en muchas de sus encuestas a nivel nacional para obtener suficiente precisión en las estimaciones dentro de estos grupos. Estas encuestas requieren el uso de ponderaciones de muestra (ver más adelante) para producir estimaciones adecuadas en todos los grupos étnicos. Siempre que se cumplan ciertas condiciones (principalmente que los pesos se calculen y utilicen correctamente), estas muestras permiten una estimación precisa de los parámetros de la población.
Ejemplos históricos
Un ejemplo clásico de una muestra sesgada y los resultados engañosos que produjo ocurrió en 1936. En los primeros días de las encuestas de opinión, la revista estadounidense Literary Digest recopiló más de dos millones de encuestas postales y predijo que la El candidato republicano a las elecciones presidenciales de Estados Unidos, Alf Landon, vencería al actual presidente, Franklin Roosevelt, por un amplio margen. El resultado fue exactamente lo contrario. La encuesta Literary Digest representó una muestra recopilada de lectores de la revista, complementada con registros de propietarios de automóviles registrados y usuarios de teléfonos. Esta muestra incluía una representación excesiva de personas adineradas que, como grupo, tenían más probabilidades de votar por el candidato republicano. En contraste, una encuesta de solo 50 mil ciudadanos seleccionados por la organización de George Gallup predijo con éxito el resultado, lo que llevó a la popularidad de la encuesta de Gallup.
Otro ejemplo clásico ocurrió en las elecciones presidenciales de 1948. La noche de las elecciones, el Chicago Tribune publicó el titular DEWEY DERROTA A TRUMAN, que resultó ser un error. Por la mañana, el sonriente presidente electo, Harry S. Truman, fue fotografiado sosteniendo un periódico con este titular. La razón por la que el Tribune se equivocó es que su editor confió en los resultados de una encuesta telefónica. La investigación de encuestas estaba entonces en su infancia y pocos académicos se dieron cuenta de que una muestra de usuarios de teléfonos no era representativa de la población general. Los teléfonos aún no estaban generalizados y quienes los tenían solían ser prósperos y tenían direcciones estables. (En muchas ciudades, el directorio telefónico de Bell System contenía los mismos nombres que el Registro Social). Además, la encuesta de Gallup en la que el Tribune basó su titular tenía más de dos semanas de antigüedad en el momento de la impresión.
En los datos de calidad del aire, los contaminantes (como el monóxido de carbono, el monóxido de nitrógeno, el dióxido de nitrógeno o el ozono) muestran con frecuencia altas correlaciones, ya que provienen de los mismos procesos químicos. Estas correlaciones dependen del espacio (es decir, la ubicación) y el tiempo (es decir, el período). Por lo tanto, una distribución de contaminantes no es necesariamente representativa para cada lugar y cada período. Si un instrumento de medida de bajo coste se calibra con datos de campo de forma multivariante, más precisamente por colocación junto a un instrumento de referencia, las relaciones entre los diferentes compuestos se incorporan al modelo de calibración. Por la reubicación del instrumento de medición, se pueden producir resultados erróneos.
Un ejemplo del siglo XXI es la pandemia de COVID-19, donde se ha demostrado que las variaciones en el sesgo de muestreo en las pruebas de COVID-19 explican amplias variaciones tanto en las tasas de letalidad como en la distribución de casos por edad entre países.
Correcciones estadísticas para una muestra sesgada
Si se excluyen segmentos completos de la población de una muestra, entonces no hay ajustes que puedan producir estimaciones que sean representativas de toda la población. Pero si algunos grupos están subrepresentados y se puede cuantificar el grado de subrepresentación, entonces las ponderaciones de la muestra pueden corregir el sesgo. Sin embargo, el éxito de la corrección se limita al modelo de selección elegido. Si faltan ciertas variables, los métodos utilizados para corregir el sesgo podrían ser inexactos.
Por ejemplo, una población hipotética podría incluir 10 millones de hombres y 10 millones de mujeres. Suponga que una muestra sesgada de 100 pacientes incluye 20 hombres y 80 mujeres. Un investigador podría corregir este desequilibrio asignando un peso de 2,5 para cada hombre y 0,625 para cada mujer. Esto ajustaría cualquier estimación para lograr el mismo valor esperado que una muestra que incluyera exactamente 50 hombres y 50 mujeres, a menos que hombres y mujeres difieran en su probabilidad de participar en la encuesta.
Contenido relacionado
Rango intercuartil
Eventos colectivamente exhaustivos
Evento complementario