Escala Likert

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Escala de medición sicométrica

Una escala Likert (LIK-ərt) es una escala psicométrica que lleva el nombre de su inventor, el psicólogo social estadounidense Rensis Likert, que se utiliza habitualmente en cuestionarios de investigación. Es el enfoque más utilizado para escalar las respuestas en la investigación de encuestas, de modo que el término (o más completamente la escala tipo Likert) a menudo se usa indistintamente con escala de calificación. aunque existen otros tipos de escalas de calificación.

Likert distinguió entre una escala propiamente dicha, que surge de respuestas colectivas a un conjunto de ítems (generalmente ocho o más), y el formato en el que se califican las respuestas a lo largo de un rango. Técnicamente hablando, una escala Likert se refiere sólo a lo primero. La diferencia entre estos dos conceptos tiene que ver con la distinción que hizo Likert entre el fenómeno subyacente que se investiga y los medios para capturar la variación que apunta al fenómeno subyacente.

Al responder a un ítem Likert, los encuestados especifican su nivel de acuerdo o desacuerdo en una escala simétrica de acuerdo-en desacuerdo para una serie de afirmaciones. Por lo tanto, el rango captura la intensidad de sus sentimientos hacia un elemento determinado.

Se puede crear una escala como la suma simple o el promedio de las respuestas del cuestionario sobre el conjunto de elementos individuales (preguntas). Al hacerlo, la escala Likert supone que las distancias entre cada opción (opción de respuesta) son iguales. Muchos investigadores emplean un conjunto de elementos que están altamente correlacionados (que muestran una alta consistencia interna) pero que también juntos capturarán el dominio completo bajo estudio (lo que requiere correlaciones que no son perfectas). Otros se apegan a un estándar según el cual "se supone que todos los elementos son réplicas entre sí o, en otras palabras, se consideran instrumentos paralelos". Por el contrario, la teoría de pruebas moderna trata la dificultad de cada ítem (los ICC) como información que debe incorporarse en los ítems de escala.

Composición

Un cuestionario de ejemplo sobre un diseño del sitio web, con respuestas como escala de Likert

Una escala Likert es la suma de las respuestas a varios ítems Likert. Debido a que muchas escalas Likert emparejan cada ítem constituyente de Likert con su propia instancia de una escala visual analógica (por ejemplo, una línea horizontal, en la que el sujeto indica una respuesta haciendo círculos o marcando marcas), a veces se hace referencia erróneamente a un ítem individual. como ser o tener una escala, y este error crea una confusión generalizada en la literatura y el lenguaje del campo.

Un ítem Likert es simplemente una afirmación que se le pide al encuestado que evalúe dándole un valor cuantitativo en cualquier tipo de dimensión subjetiva u objetiva, siendo el nivel de acuerdo/desacuerdo la dimensión más comúnmente utilizada. Los elementos Likert bien diseñados exhiben tanto "simetría" y "equilibrio". Simetría significa que contienen números iguales de posiciones positivas y negativas cuyas distancias respectivas son bilateralmente simétricas con respecto al valor "neutral"/cero (ya sea que ese valor se presente como candidato o no). Equilibrio significa que la distancia entre cada valor candidato es la misma, lo que permite que las comparaciones cuantitativas, como el promedio, sean válidas entre elementos que contienen más de dos valores candidatos.

El formato de un elemento Likert típico de cinco niveles, por ejemplo, podría ser:

  1. No está de acuerdo.
  2. Disagree
  3. Ni de acuerdo ni de desacuerdo
  4. Acorde
  5. Muy de acuerdo

La escala Likert es un método de escala bipolar que mide la respuesta positiva o negativa a una afirmación. A veces se utiliza una escala de puntos pares, donde la opción intermedia de "ni de acuerdo ni en desacuerdo" no está disponible. A esto a veces se le llama "elección forzada" método, ya que se elimina la opción neutral. La opción neutral puede verse como una opción fácil de tomar cuando un encuestado no está seguro, por lo que es cuestionable si es una verdadera opción neutral. Un estudio de 1987 encontró diferencias insignificantes entre el uso de personas "indecisas" y "neutral" como opción intermedia en una escala Likert de cinco puntos.

Las escalas Likert pueden estar sujetas a distorsión por varias causas. Los encuestados pueden:

  • Evite usar categorías de respuesta extrema (bias de tendencia central), especialmente por el deseo de evitar ser percibido como una opinión extremista (un caso de parcialidad de conveniencia social). Este efecto puede aparecer temprano en una prueba debido a la expectativa de que las preguntas que el sujeto tiene puntos de vista más fuertes sobre pueden seguir, de tal manera que en las preguntas anteriores uno "leaves espacio" para respuestas más fuertes más adelante en la prueba. Esta expectativa crea sesgo que es especialmente pernicioso porque sus efectos no son uniformes a lo largo de la prueba y no pueden ser corregidos por la normalización sencilla en todo el tablero;
  • Convenir en las declaraciones presentadas (sesgo de aquiescencia), con este efecto especialmente fuerte entre los niños, las personas con discapacidad del desarrollo, las personas de edad y las personas sometidas a una cultura de institucionalización que fomenta e incentiva el anhelo de complacer;
  • Desacuerdo con las frases que se presentan de un deseo defensivo de evitar hacer declaraciones erróneas y/o evitar consecuencias negativas que los encuestados puedan temer que sus respuestas se utilicen contra ellos, especialmente si se interpretan erróneamente o se sacan de contexto;
  • Proporcionar respuestas que creen que serán evaluadas como la fuerza o la falta de debilidad/disfunción ("faking good");
  • Proporcionar respuestas que creen que serán evaluadas como indicando debilidad o presencia de deterioro/patología ("faking bad");
  • Trate de retratar a sí mismos o a su organización a la luz de que creen que el examinador o la sociedad consideran más favorable que sus verdaderas creencias (Social desirability bias, la versión intersubjetiva del objetivo "faking good" discutido anteriormente);
  • Trate de describirse a sí mismos o a su organización a la luz de que creen que el examinador o la sociedad consideran menos favorable/más desfavorable que sus verdaderas creencias (desactivación de la norma, la versión intersubjetiva de la "falta" objetiva discutida anteriormente.

Diseñar una escala con clave equilibrada (un número igual de afirmaciones positivas y negativas y, especialmente, un número igual de afirmaciones positivas y negativas con respecto a cada puesto o tema en cuestión) puede obviar el problema del sesgo de aquiescencia, ya que la aquiescencia en términos positivos Los elementos con clave equilibrarán la aquiescencia con respecto a los elementos con clave negativa, pero los sesgos defensivos, de tendencia central y de deseabilidad social son algo más problemáticos.

Puntuación y análisis

Una vez completado el cuestionario, cada elemento se puede analizar por separado o, en algunos casos, las respuestas a los elementos se pueden sumar para crear una puntuación para un grupo de elementos. Por lo tanto, las escalas Likert a menudo se denominan escalas sumativas.

Si los elementos individuales de Likert pueden considerarse como datos de nivel de intervalo o si deben tratarse como datos categóricos ordenados es objeto de considerable desacuerdo en la literatura, con fuertes convicciones sobre cuáles son los métodos más aplicables. Este desacuerdo se remonta, en muchos aspectos, a la medida en que los ítems de Likert se interpretan como datos ordinales.

Hay dos consideraciones principales en esta discusión. Primero, las escalas Likert son arbitrarias. El valor asignado a un ítem Likert no tiene una base numérica objetiva, ni en términos de teoría de la medida ni de escala (a partir de la cual se puede determinar una métrica de distancia). El valor asignado a cada ítem Likert lo determina simplemente el investigador que diseña la encuesta, quien toma la decisión basándose en el nivel de detalle deseado. Sin embargo, por convención, a los elementos Likert se les tiende a asignar valores enteros positivos progresivos. Las escalas Likert suelen oscilar entre 2 y 10, siendo 3, 5 o 7 las más comunes. Además, esta estructura progresiva de la escala es tal que cada ítem sucesivo de Likert se trata como si indicara una 'mejor' respuesta que el valor anterior. (Esto puede diferir en los casos en los que se necesita el orden inverso de la escala Likert).

El segundo punto, y posiblemente el más importante, es si la "distancia" entre cada categoría de artículo sucesiva es equivalente, lo que se infiere tradicionalmente. Por ejemplo, en el ítem Likert de cinco puntos anterior, la inferencia es que la 'distancia' entre las categorías 1 y 2 es lo mismo que entre las categorías 3 y 4. En términos de buenas prácticas de investigación, es importante una presentación equidistante por parte del investigador; de lo contrario, puede producirse un sesgo en el análisis. Por ejemplo, un ítem Likert de cuatro puntos con las categorías "Malo", "Promedio", "Bueno" y "Muy bueno" Es poco probable que tenga todas las categorías equidistantes ya que sólo hay una categoría que puede recibir una calificación por debajo del promedio. Podría decirse que esto sesgaría cualquier resultado a favor de un resultado positivo. Por otro lado, incluso si un investigador presenta lo que él o ella cree que son categorías equidistantes, es posible que el encuestado no las interprete como tales.

Una buena escala Likert, como la anterior, presentará una simetría de categorías alrededor de un punto medio con calificadores lingüísticos claramente definidos. En tal escalamiento simétrico, los atributos equidistantes normalmente se observarán más claramente o, al menos, se inferirán. Es cuando una escala Likert es simétrica y equidistante que se comportará más como una medición a nivel de intervalo. Así, si bien una escala Likert es ciertamente ordinal, si está bien presentada puede aproximarse a una medición a nivel de intervalo. Esto puede ser beneficioso ya que, si se tratara simplemente como una escala ordinal, se podría perder información valiosa si la "distancia" se modifica. entre los elementos de Likert no estaban disponibles para su consideración. La idea importante aquí es que el tipo de análisis apropiado depende de cómo se haya presentado la escala Likert.

Las nociones de tendencia central suelen ser aplicables a nivel de ítem, es decir, las respuestas suelen mostrar una distribución casi normal. La validez de tales medidas depende de la naturaleza interválica subyacente de la escala. Si se supone una naturaleza de intervalo para una comparación de dos grupos, la prueba t de muestras emparejadas no es inapropiada. Si se van a realizar pruebas no paramétricas, se recomienda la modificación de Pratt (1959) a la prueba de rangos con signos de Wilcoxon en lugar de la prueba estándar de rangos con signos de Wilcoxon.

Las respuestas a varias preguntas Likert se pueden sumar siempre que todas las preguntas utilicen la misma escala Likert y que la escala sea una aproximación defendible a una escala de intervalo, en cuyo caso el teorema del límite central permite el tratamiento de los datos como datos de intervalo que miden una variable latente. Si las respuestas sumadas cumplen estos supuestos, se pueden aplicar pruebas estadísticas paramétricas como el análisis de varianza. Los límites típicos para pensar que esta aproximación será aceptable son un mínimo de cuatro y preferiblemente ocho elementos en la suma.

Para modelar respuestas binarias Likert directamente, se pueden representar en forma binomial sumando las respuestas de acuerdo y en desacuerdo por separado. La chi-cuadrado, la prueba Q de Cochran o la prueba de McNemar son procedimientos estadísticos habituales que se utilizan después de esta transformación. Pruebas no paramétricas como la prueba de chi cuadrado, la prueba de Mann-Whitney, la prueba de rangos con signos de Wilcoxon o la prueba de Kruskal-Wallis. Se utilizan a menudo en el análisis de datos en escala Likert.

Alternativamente, las respuestas de la escala Likert se pueden analizar con un modelo probit ordenado, preservando el orden de las respuestas sin asumir una escala de intervalo. El uso de un modelo probit ordenado puede evitar errores que surgen al tratar las calificaciones ordenadas como mediciones a nivel de intervalo.

La evaluación basada en el consenso (CBA) se puede utilizar para crear un estándar objetivo para las escalas Likert en dominios donde no existe un estándar objetivo u generalmente aceptado. La evaluación basada en el consenso (CBA) se puede utilizar para perfeccionar o incluso validar los estándares generalmente aceptados.

Presentación visual de datos tipo Likert

Una parte importante del análisis y la presentación de datos es la visualización (o trazado) de los datos. El tema de trazar datos de calificación Likert (y otros) se analiza detalladamente en dos artículos de Robbins y Heiberger. En el primero recomiendan el uso de lo que ellos llaman gráficos de barras apiladas divergentes y los comparan con otros estilos de trazado. El segundo artículo describe el uso de la función Likert en el paquete HH para R y ofrece muchos ejemplos de su uso.

Nivel de medición

A menudo se cree que las cinco categorías de respuesta representan un nivel de medición de intervalo. Pero esto sólo puede ser así si los intervalos entre los puntos de la escala corresponden a observaciones empíricas en un sentido métrico. Reips y Funke (2008) muestran que este criterio se cumple mucho mejor con una escala visual analógica. De hecho, también pueden aparecer fenómenos que incluso cuestionen el nivel de escala ordinal en las escalas Likert. Por ejemplo, en un conjunto de elementos A, B, C califica con relaciones circulares en escala Likert como A > B, B > C y C > Puede aparecer A. Esto viola el axioma de transitividad de la escala ordinal.

La investigación realizada por Labovitz y Traylor proporciona evidencia de que, incluso con distorsiones bastante grandes de las distancias percibidas entre los puntos de la escala, los elementos de tipo Likert funcionan de manera similar a las escalas que se perciben como intervalos iguales. Por lo tanto, estos ítems y otras escalas de apariencia igual en los cuestionarios son resistentes a las violaciones del supuesto de igual distancia que muchos investigadores creen que se requiere para los procedimientos y pruebas estadísticas paramétricas.

Modelo Rasch

Los datos de la escala Likert pueden, en principio, usarse como base para obtener estimaciones de nivel de intervalo en un continuo aplicando el modelo politómico de Rasch, cuando se pueden obtener datos que se ajusten a este modelo. Además, el modelo politómico de Rasch permite probar la hipótesis de que las declaraciones reflejan niveles crecientes de una actitud o rasgo, según lo previsto. Por ejemplo, la aplicación del modelo a menudo indica que la categoría neutral no representa un nivel de actitud o rasgo entre las categorías en desacuerdo y de acuerdo.

Nuevamente, no todos los conjuntos de elementos de escala Likert se pueden utilizar para la medición de Rasch. Los datos deben comprobarse minuciosamente para cumplir los estrictos axiomas formales del modelo. Sin embargo, las puntuaciones brutas son estadísticas suficientes para las medidas de Rasch, una elección deliberada de Georg Rasch, por lo que, si está dispuesto a aceptar las puntuaciones brutas como válidas, también puede aceptar las medidas de Rasch como válidas.

Pronunciación

Rensis Likert, el desarrollador de la escala, pronunció su nombre LIK-ərt. Algunos han afirmado que el nombre de Likert "está entre los más mal pronunciados en [el] campo", porque muchas personas pronuncian el nombre de la escala como LY-kərt.

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save