Legibilidad

Ajustar Compartir Imprimir Citar

La legibilidad es la facilidad con la que un lector puede comprender un texto escrito. En lenguaje natural, la legibilidad del texto depende de su contenido (la complejidad de su vocabulario y sintaxis) y su presentación (como los aspectos tipográficos que afectan la legibilidad, como el tamaño de fuente, la altura de línea, el espacio entre caracteres y la longitud de línea). Los investigadores han utilizado varios factores para medir la legibilidad, como:

Una mayor legibilidad facilita el esfuerzo y la velocidad de lectura para cualquier lector, pero hace una gran diferencia para aquellos que no tienen una comprensión de lectura alta.

La legibilidad existe tanto en el lenguaje natural como en los lenguajes de programación, aunque en diferentes formas. En la programación, cosas como los comentarios del programador, la elección de la estructura del bucle y la elección de los nombres pueden determinar la facilidad con la que los humanos pueden leer el código del programa de computadora.

Las métricas de legibilidad numérica (también conocidas como pruebas de legibilidad o fórmulas de legibilidad) para el lenguaje natural tienden a usar medidas simples como la longitud de la palabra (por letra o sílaba), la longitud de la oración y, a veces, alguna medida de frecuencia de palabras. Pueden integrarse en procesadores de texto, pueden calificar documentos, párrafos u oraciones, y son una alternativa mucho más barata y rápida a una encuesta de legibilidad que involucra a lectores humanos. Son más rápidos de calcular que medidas más precisas de complejidad sintáctica y semántica. En algunos casos, se utilizan para estimar el nivel de grado apropiado.

Definición

La gente ha definido la legibilidad de varias maneras, por ejemplo, en: The Literacy Dictionary, Jeanne Chall y Edgar Dale, G. Harry McLaughlin, William DuBay.

Aplicaciones

La lectura fácil ayuda a aprender y disfrutar, y puede ahorrar dinero.

Gran parte de la investigación se ha centrado en hacer coincidir la prosa con la habilidad de lectura, lo que ha dado como resultado fórmulas para su uso en investigación, gobierno, enseñanza, publicaciones, el ejército, la medicina y los negocios.

Legibilidad y lectores de periódicos

Varios estudios realizados en la década de 1940 mostraron que incluso pequeños aumentos en la legibilidad aumentan en gran medida el número de lectores en los periódicos de gran circulación.

En 1947, Donald Murphy de Wallace's Farmer utilizó una edición dividida para estudiar los efectos de facilitar la lectura del texto. Descubrieron que reducir el nivel de lectura de 9º a 6º grado aumentó el número de lectores en un 43 % para un artículo sobre 'nylon'. El resultado fue una ganancia de 42.000 lectores en una tirada de 275.000. También encontró un aumento del 60 % en el número de lectores de un artículo sobre el maíz, con mejores respuestas de personas menores de 35 años.

Wilber Schramm entrevistó a 1.050 lectores de periódicos. Descubrió que un estilo de lectura más fácil ayuda a determinar cuánto se lee de un artículo. A esto se le llamó persistencia, profundidad o perseverancia en la lectura. También encontró que la gente lee menos artículos largos que cortos. Una historia de 9 párrafos perderá tres de cada 10 lectores en el quinto párrafo. Una historia más corta perderá sólo dos. Schramm también descubrió que el uso de subtítulos, párrafos en negrita y estrellas para dividir una historia en realidad hace perder lectores.

Un estudio realizado en 1947 por Melvin Lostutter mostró que los periódicos generalmente se escribieron a un nivel cinco años superior a la capacidad de los lectores adultos estadounidenses promedio.

No se encontró que la facilidad de lectura de los artículos periodísticos tuviera mucha relación con la educación, la experiencia o el interés personal de los periodistas que escriben las historias. En cambio, tenía más que ver con la convención y la cultura de la industria. Lostutter abogó por más pruebas de legibilidad en la redacción de periódicos. La legibilidad mejorada debe ser un "proceso consciente algo independiente de la educación y la experiencia de los redactores del personal ".

Un estudio realizado por Charles Swanson en 1948 mostró que una mejor legibilidad aumenta el número total de párrafos leídos en un 93 % y el número de lectores que leen cada párrafo en un 82 %.

En 1948, Bernard Feld hizo un estudio de cada artículo y anuncio en el Birmingham News del 20 de noviembre de 1947. Dividió los artículos en los que estaban por encima del nivel de octavo grado y los que estaban en el octavo grado o menos. Eligió el punto de corte de octavo grado, ya que se determinó que era el nivel de lectura promedio de los lectores adultos. Un texto de octavo grado "... llegará a alrededor del 50% de todos los adultos estadounidenses", escribió. Entre las historias de los servicios de cable, el grupo inferior obtuvo dos tercios más de lectores, y entre las historias locales, un 75% más de lectores. Feld también creía en instruir a los escritores en los principios de escritura clara de Flesch.

Tanto Rudolf Flesch como Robert Gunning trabajaron extensamente con periódicos y servicios de cable para mejorar la legibilidad. Principalmente gracias a sus esfuerzos en unos pocos años, la legibilidad de los periódicos estadounidenses pasó del nivel de grado 16 al 11, donde permanece hoy.

Las dos publicaciones con mayor circulación, TV Guide (13 millones) y Readers Digest (12 millones), están escritas en el nivel de noveno grado. Las novelas más populares están escritas en el nivel de séptimo grado. Esto respalda el hecho de que el adulto promedio lee al nivel de noveno grado. También muestra que, por diversión, las personas leen textos que están dos grados por debajo de su nivel de lectura real.

Los estudios de George Klare

George Klare y sus colegas observaron los efectos de una mayor facilidad de lectura en los reclutas de la Fuerza Aérea. Descubrieron que los textos más legibles resultaron en un aprendizaje mayor y más completo. También aumentaron la cantidad leída en un tiempo determinado y facilitaron la aceptación.

Otros estudios de Klare mostraron cómo las habilidades del lector, el conocimiento previo, el interés y la motivación afectan la facilidad de lectura.

Investigación temprana

En la década de 1880, el profesor de inglés LA Sherman descubrió que la oración en inglés se estaba acortando. En la época isabelina, la oración promedio era de 50 palabras. En su época, tenía 23 palabras.

El trabajo de Sherman estableció que:

Sherman escribió: "El inglés literario, en resumen, seguirá las formas del inglés hablado estándar del que proviene. Ningún hombre debería hablar peor de lo que escribe, ningún hombre debería escribir mejor de lo que debería hablar... La oración oral es más clara porque es el producto de millones de esfuerzos diarios para ser claro y fuerte. Representa el trabajo de la raza durante miles de años en perfeccionar un instrumento eficaz de comunicación".

En 1889 en Rusia, el escritor Nikolai A. Rubakin publicó un estudio de más de 10.000 textos escritos por personas comunes. De estos textos, tomó 1.500 palabras que pensó que la mayoría de la gente entendía. Descubrió que los principales obstáculos para la comprensión son las palabras desconocidas y las oraciones largas. Comenzando con su propia revista a la edad de 13 años, Rubakin publicó muchos artículos y libros sobre ciencia y muchos temas para un gran número de nuevos lectores en toda Rusia. En opinión de Rubakin, la gente no era tonta. Simplemente eran pobres y necesitaban libros baratos, escritos en un nivel que pudieran entender.

En 1921, Harry D. Kitson publicó The Mind of the Buyer, uno de los primeros libros en aplicar la psicología al marketing. El trabajo de Kitson mostró que cada tipo de lector compraba y leía su propio tipo de texto. Al leer dos periódicos y dos revistas, descubrió que las oraciones cortas y las palabras cortas eran las que mejor contribuían a la facilidad de lectura.

Nivelación de texto

La primera evaluación de la facilidad de lectura es el juicio subjetivo denominado nivelación del texto. Las fórmulas no abordan completamente los diversos contenidos, propósitos, diseños, entradas visuales y organización de un texto. La nivelación de texto se usa comúnmente para clasificar la facilidad de lectura de textos en áreas donde las dificultades de lectura son fáciles de identificar, como libros para niños pequeños. En niveles más altos, clasificar la facilidad de lectura se vuelve más difícil, ya que las dificultades individuales se vuelven más difíciles de identificar. Esto ha llevado a mejores formas de evaluar la facilidad de lectura.

Listas de frecuencia de vocabulario

En la década de 1920, el movimiento científico en educación buscó pruebas para medir el rendimiento de los estudiantes para ayudar en el desarrollo del plan de estudios. Los maestros y educadores sabían desde hace mucho tiempo que, para mejorar la habilidad de lectura, los lectores, especialmente los lectores principiantes, necesitan material de lectura que se acerque a su capacidad. Los psicólogos universitarios realizaron gran parte de la investigación inicial, que luego fue retomada por los editores de libros de texto.

El psicólogo educativo Edward Thorndike, de la Universidad de Columbia, señaló que, en Rusia y Alemania, los maestros usaban conteos de frecuencia de palabras para hacer coincidir los libros con los estudiantes. La habilidad con las palabras fue el mejor signo de desarrollo intelectual y el predictor más fuerte de la facilidad de lectura. En 1921, Thorndike publicó Teachers Word Book, que contenía las frecuencias de 10.000 palabras. Hizo que fuera más fácil para los maestros elegir libros que coincidieran con las habilidades de lectura de la clase. También proporcionó una base para futuras investigaciones sobre la facilidad de lectura.

Hasta que aparecieron las computadoras, las listas de frecuencia de palabras eran las mejores ayudas para calificar la facilidad de lectura de los textos. En 1981, la World Book Encyclopedia enumeró los niveles de grado de 44.000 palabras.

Fórmulas de legibilidad para niños pequeños

En 1923, Bertha A. Lively y Sidney L. Pressey publicaron la primera fórmula de facilidad de lectura. Les preocupaba que los libros de texto de ciencias de la escuela secundaria tuvieran tantas palabras técnicas. Sintieron que los maestros pasaban todo el tiempo de clase explicando estas palabras. Argumentaron que su fórmula ayudaría a medir y reducir la "carga de vocabulario" de los libros de texto. Su fórmula usó cinco entradas variables y seis constantes. Por cada mil palabras, contó la cantidad de palabras únicas, la cantidad de palabras que no están en la lista de Thorndike y el número de índice medio de las palabras que se encuentran en la lista. Manualmente, tomó tres horas aplicar la fórmula a un libro.

Después del estudio Lively-Pressey, la gente buscó fórmulas que fueran más precisas y fáciles de aplicar. Para 1980, se publicaron más de 200 fórmulas en diferentes idiomas. En 1928, Carleton Washburne y Mabel Vogel crearon la primera fórmula moderna de legibilidad. Lo validaron usando un criterio externo y correlacionaron.845 con puntajes de exámenes de estudiantes que leyeron y les gustaron los libros de criterio. También fue el primero en introducir la variable de interés en el concepto de legibilidad.

Entre 1929 y 1939, Alfred Lewerenz del Distrito Escolar de Los Ángeles publicó varias fórmulas nuevas.

En 1934, Edward Thorndike publicó su fórmula. Escribió que las habilidades con las palabras se pueden aumentar si el maestro introduce nuevas palabras y las repite con frecuencia. En 1939, WW Patty y W. I Painter publicaron una fórmula para medir la carga de vocabulario de los libros de texto. Esta fue la última de las primeras fórmulas que usaban la lista de frecuencia de vocabulario de Thorndike.

Fórmulas de legibilidad para adultos jóvenes

Durante la recesión de la década de 1930, el gobierno de los EE. UU. invirtió en la educación de adultos. En 1931, Douglas Waples y Ralph Tyler publicaron What Adults Want to Read About. Fue un estudio de dos años sobre los intereses de lectura de los adultos. Su libro mostró no solo lo que la gente lee, sino también lo que les gustaría leer. Descubrieron que muchos lectores carecían de materiales de lectura adecuados: les hubiera gustado aprender, pero los materiales de lectura eran demasiado difíciles para ellos.

Lyman Bryson del Teachers College de la Universidad de Columbia descubrió que muchos adultos tenían poca capacidad de lectura debido a la mala educación. A pesar de que las universidades habían tratado durante mucho tiempo de enseñar cómo escribir en un estilo claro y legible, Bryson descubrió que era raro. Escribió que ese lenguaje es el resultado de una "... disciplina y arte que pocas personas que tienen ideas se tomarán la molestia de lograr... Si el lenguaje simple fuera fácil, muchos de nuestros problemas se habrían resuelto hace mucho tiempo". Bryson ayudó a establecer el Laboratorio de Legibilidad en la Universidad. Dos de sus alumnos fueron Irving Lorge y Rudolf Flesch.

En 1934, Ralph Ojemann investigó las habilidades de lectura de los adultos, los factores que afectan más directamente la facilidad de lectura y las causas de cada nivel de dificultad. No inventó una fórmula, sino un método para evaluar la dificultad de los materiales para la educación de los padres. Fue el primero en evaluar la validez de este método utilizando 16 pasajes de revistas probados en lectores reales. Evaluó 14 factores medibles y tres informados que afectan la facilidad de lectura.

Ojemann enfatizó las características reportadas, como si el texto era coherente o indebidamente abstracto. Usó sus 16 pasajes para comparar y juzgar la facilidad de lectura de otros textos, un método que ahora se llama escalar. Demostró que, aunque estos factores no se pueden medir, tampoco se pueden ignorar.

También en 1934, Ralph Tyler y Edgar Dale publicaron la primera fórmula para facilitar la lectura en adultos basada en pasajes sobre temas de salud de una variedad de libros de texto y revistas. De 29 factores que son significativos para los lectores jóvenes, encontraron diez que son significativos para los adultos. Usaron tres de estos en su fórmula.

En 1935, William S. Gray de la Universidad de Chicago y Bernice Leary de Xavier College en Chicago publicaron What Makes a Book Readable, uno de los libros más importantes en la investigación de la legibilidad. Al igual que Dale y Tyler, se centraron en lo que hace que los libros sean legibles para adultos con capacidad de lectura limitada. Su libro incluyó el primer estudio científico de las habilidades de lectura de los adultos estadounidenses. La muestra incluyó a 1.690 adultos de una variedad de entornos y regiones. La prueba utilizó varios pasajes de periódicos, revistas y libros, así como una prueba de lectura estándar. Encontraron una calificación media de 7,81 (octavo mes del séptimo grado). Aproximadamente un tercio lee en el nivel de grado 2 a 6, un tercio en el nivel de grado 7 a 12 y un tercio en el nivel de grado 13 a 17.

Los autores enfatizaron que la mitad de la población adulta en ese momento carecía de materiales de lectura adecuados. Escribieron: "Para ellos, los valores enriquecedores de la lectura se niegan a menos que los materiales que reflejen los intereses de los adultos se adapten a sus necesidades". Los lectores más pobres, una sexta parte de la población adulta, necesitan "materiales más simples para usar en la promoción de la alfabetización funcional y en el establecimiento de hábitos de lectura fundamentales".

Gray y Leary luego analizaron 228 variables que afectan la facilidad de lectura y las dividieron en cuatro tipos:

  1. Contenido
  2. Estilo
  3. Formato
  4. Organización

Descubrieron que el contenido era lo más importante, seguido de cerca por el estilo. El tercero fue el formato, seguido de cerca por la organización. No encontraron forma de medir el contenido, el formato o la organización, pero pudieron medir variables de estilo. Entre las 17 variables de estilo medibles significativas, seleccionaron cinco para crear una fórmula:

Su fórmula tenía una correlación de.645 con la comprensión medida por las pruebas de lectura aplicadas a unos 800 adultos.

En 1939, Irving Lorge publicó un artículo que informaba sobre otras combinaciones de variables que indican dificultad con mayor precisión que las que usaron Gray y Leary. Su investigación también mostró que "la carga de vocabulario es el concomitante más importante de la dificultad". En 1944, Lorge publicó su Índice de Lorge, una fórmula de legibilidad que usaba tres variables y sentó las bases para fórmulas más simples y confiables que siguieron.

Para 1940, los investigadores tenían:

Fórmulas de legibilidad populares

Las fórmulas de Flesch

En 1943, Rudolf Flesch publicó su tesis doctoral, Marks of a Readable Style, que incluía una fórmula de legibilidad para predecir la dificultad del material de lectura para adultos. Los investigadores en muchos campos comenzaron a usarlo para mejorar las comunicaciones. Una de las variables que utilizó fueron las referencias personales, como nombres y pronombres personales. Otra variable fueron los afijos.

En 1948, Flesch publicó su fórmula Reading Ease en dos partes. En lugar de usar niveles de grado, utilizó una escala de 0 a 100, con 0 equivalente al grado 12 y 100 equivalente al grado 4. Abandonó el uso de afijos. La segunda parte de la fórmula predice el interés humano utilizando referencias personales y el número de oraciones personales. La nueva fórmula correlacionó 0,70 con las pruebas de lectura de McCall-Crabbs. La fórmula original es:Puntaje de facilidad de lectura = 206.835 − (1.015 × ASL) − (84.6 × ASW)Donde: ASL = longitud promedio de oración (número de palabras dividido por número de oraciones)ASW = longitud promedio de palabra en sílabas (número de sílabas dividido por número de palabras)

Los editores descubrieron que las fórmulas de Flesch podían aumentar el número de lectores hasta en un 60 %. El trabajo de Flesch también tuvo un enorme impacto en el periodismo. La fórmula Flesch Reading Ease se convirtió en una de las métricas de legibilidad más utilizadas, probadas y confiables. En 1951, Farr, Jenkins y Patterson simplificaron aún más la fórmula al cambiar el conteo de sílabas. La fórmula modificada es:Nuevo puntaje de facilidad de lectura = 1.599nosw − 1.015sl − 31.517Donde: nosw = número de palabras de una sílaba por cada 100 palabras ysl = longitud promedio de oraciones en palabras.

En 1975, en un proyecto patrocinado por la Marina de los EE. UU., se recalculó la fórmula de Reading Ease para dar una puntuación de nivel de grado. La nueva fórmula ahora se llama fórmula de nivel de grado de Flesch-Kincaid. La fórmula Flesch-Kincaid es una de las fórmulas más populares y probadas. Correlaciona 0.91 con la comprensión medida por las pruebas de lectura.

La fórmula de Dale-Chall

Edgar Dale, profesor de educación en la Universidad Estatal de Ohio, fue uno de los primeros críticos de las listas de frecuencia de vocabulario de Thorndike. Afirmó que no distinguían entre los diferentes significados que tienen muchas palabras. Creó dos nuevas listas propias. Uno, su "lista corta" de 769 palabras fáciles, fue utilizado por Irving Lorge en su fórmula. El otro fue su "larga lista" de 3.000 palabras fáciles, que fueron entendidas por el 80% de los estudiantes de cuarto grado. Sin embargo, uno tiene que extender las listas de palabras con plurales regulares de sustantivos, formas regulares del tiempo pasado de los verbos, formas progresivas de los verbos, etc. En 1948, incorporó esta lista en una fórmula que desarrolló con Jeanne S. Chall, quien más tarde fundó el Laboratorio de Lectura de Harvard.

Para aplicar la fórmula:

  1. Seleccione varias muestras de 100 palabras a lo largo del texto.
  2. Calcule la longitud promedio de las oraciones en palabras (divida el número de palabras entre el número de oraciones).
  3. Calcule el porcentaje de palabras que NO están en la lista de palabras Dale-Chall de 3000 palabras fáciles.
  4. Calcule esta ecuación de 1948:Puntuación bruta = 0,1579*(PDW) + 0,0496*(ASL) si el porcentaje de PDW es inferior al 5 %, de lo contrario calcularPuntuación bruta = 0,1579*(PDW) + 0,0496*(ASL) + 3,6365

Dónde:Puntaje bruto = calificación de lectura no corregida de un estudiante que puede responder la mitad de las preguntas de la prueba en un pasaje.PDW = Porcentaje de palabras difíciles que no están en la lista de palabras de Dale-Chall.ASL = Longitud promedio de la oración

Finalmente, para compensar la "curva de calificación equivalente", aplique la siguiente tabla para el puntaje final:

Puntuación brutaPuntuación final
4.9 y por debajoGrado 4 y menos
5,0–5,9Grados 5–6
6,0–6,9Grados 7–8
7,0–7,9Grados 9–10
8,0–8,9Grados 11 y 12
9,0–9,9Grados 13–15 (universidad)
10 y másGrados 16 y superiores.

Al correlacionar 0.93 con la comprensión medida por las pruebas de lectura, la fórmula de Dale-Chall es la fórmula más confiable y se usa ampliamente en la investigación científica.

En 1995, Dale y Chall publicaron una nueva versión de su fórmula con una lista de palabras mejorada, la nueva fórmula de legibilidad de Dale-Chall. Su fórmula es:

Puntuación bruta = 64 - 0,95 *(PDW) - 0,69 *(ASL)

La fórmula de la niebla de Gunning

En la década de 1940, Robert Gunning ayudó a llevar la investigación sobre legibilidad al lugar de trabajo. En 1944, fundó la primera firma consultora de legibilidad dedicada a reducir la "niebla" en los periódicos y la redacción comercial. En 1952, publicó La técnica de la escritura clara con su propio Índice de niebla, una fórmula que correlaciona 0,91 con la comprensión medida por las pruebas de lectura. La fórmula es una de las más fiables y sencillas de aplicar:Nivel de grado = 0.4 * ((longitud promedio de oración) + (porcentaje de palabras difíciles))Dónde: Hard Words = palabras con más de dos sílabas.

Gráfico de legibilidad de freír

En 1963, mientras enseñaba inglés a profesores en Uganda, Edward Fry desarrolló su gráfico de legibilidad. Se convirtió en una de las fórmulas más populares y más fáciles de aplicar. El Fry Graph correlaciona 0.86 con la comprensión medida por las pruebas de lectura.

Fórmula SMOG de McLaughlin

Harry McLaughlin determinó que la longitud de la palabra y la longitud de la oración deben multiplicarse en lugar de sumarse como en otras fórmulas. En 1969, publicó su fórmula SMOG (Simple Measure of Gobbledygook):Calificación SMOG = 3 + √ conteo de polisílabas.Donde: conteo de polisílabas = número de palabras de más de dos sílabas en una muestra de 30 oraciones.

La fórmula SMOG correlaciona 0,88 con la comprensión medida por las pruebas de lectura. A menudo se recomienda su uso en el cuidado de la salud.

La fórmula FORCAST

En 1973, un estudio encargado por el ejército de los EE. UU. sobre las habilidades de lectura requeridas para diferentes trabajos militares produjo la fórmula FORCAST. A diferencia de la mayoría de las otras fórmulas, utiliza solo un elemento de vocabulario, lo que la hace útil para textos sin oraciones completas. La fórmula cumplió con los requisitos de que sería:

La fórmula es:Nivel de grado = 20 − (N / 10)Donde N = número de palabras de una sola sílaba en una muestra de 150 palabras.

La fórmula FORCAST correlaciona 0,66 con la comprensión medida por las pruebas de lectura.

La puntuación de densidad sintáctica de Golub

La puntuación de densidad sintáctica de Golub fue desarrollada por Lester Golub en 1974. Se encuentra entre un subconjunto más pequeño de fórmulas de legibilidad que se concentran en las características sintácticas de un texto. Para calcular el nivel de lectura de un texto, se toma una muestra de varios cientos de palabras del texto. Se cuenta el número de palabras en la muestra, al igual que el número de unidades T. Una unidad T se define como una cláusula independiente y las cláusulas dependientes adjuntas a ella. Luego se cuentan otras unidades sintácticas y se ingresan en la siguiente tabla:

1. Palabras/unidad T.95 X _________ ___
 
 2. Oraciones subordinadas/T-unit.90 X _________ ___
 
 3. Longitud de la palabra de la cláusula principal (media).20 X _________ ___
 
 4. Longitud de la cláusula subordinada (media).50 X _________ ___
 
 5. Número de Modales (will, should, can, may, must, would...).65 X _________ ___
 
 6. Número de formas Be y Have en el auxiliar.40 X _________ ___
 
 7. Número de frases preposicionales.75 X _________ ___
 
 8. Número de sustantivos y pronombres posesivos.70 X _________ ___
 
 9. Número de adverbios de tiempo (cuando, entonces, una vez, mientras...).60 X _________ ___
 
10. Número de gerundios, participios y frases absolutas.85 X _________ ___

Los usuarios suman los números en la columna de la derecha y dividen el total por el número de unidades T. Finalmente, el cociente se ingresa en la siguiente tabla para llegar a una puntuación final de legibilidad.

SDS0.51.32.12.93.74.55.36.16.97.78.59.310.110.9
Calificación1234567891011121314

Medir la coherencia y la organización

Durante siglos, los maestros y educadores han visto la importancia de la organización, la coherencia y el énfasis en la buena redacción. A partir de la década de 1970, los teóricos cognitivos comenzaron a enseñar que la lectura es realmente un acto de pensamiento y organización. El lector construye significado mezclando nuevos conocimientos con conocimientos existentes. Debido a los límites de las fórmulas de facilidad de lectura, algunas investigaciones buscaron formas de medir el contenido, la organización y la coherencia del texto. Aunque esto no mejoró la confiabilidad de las fórmulas, sus esfuerzos mostraron la importancia de estas variables en la facilidad de lectura.

Los estudios de Walter Kintch y otros demostraron el papel central de la coherencia en la facilidad de lectura, principalmente para las personas que están aprendiendo a leer. En 1983, Susan Kemper ideó una fórmula basada en estados físicos y estados mentales. Sin embargo, descubrió que esto no era mejor que la familiaridad con las palabras y la longitud de las oraciones para mostrar facilidad de lectura.

Bonnie Meyer y otros intentaron usar la organización como una medida de la facilidad de lectura. Si bien esto no dio como resultado una fórmula, demostraron que las personas leen más rápido y retienen más cuando el texto está organizado en temas. Descubrió que un plan visible para presentar el contenido ayuda mucho a los lectores a evaluar un texto. Un plan jerárquico muestra cómo se relacionan las partes del texto. También ayuda al lector a combinar nueva información con las estructuras de conocimiento existentes.

Bonnie Armbruster descubrió que la característica más importante para el aprendizaje y la comprensión es la coherencia textual, que se presenta en dos tipos:

Armbruster confirmó el hallazgo de Kintsch de que la coherencia y la estructura son más útiles para los lectores más jóvenes. RC Calfee y R. Curley se basaron en el trabajo de Bonnie Meyer y descubrieron que una estructura subyacente desconocida puede hacer que incluso un texto simple sea difícil de leer. Trajeron un sistema de calificaciones para ayudar a los estudiantes a progresar desde líneas argumentales más simples a otras más avanzadas y abstractas.

Muchos otros estudios analizaron los efectos sobre la facilidad de lectura de otras variables de texto, que incluyen:

Fórmulas de legibilidad avanzada

Las fórmulas de John Bormuth

John Bormuth, de la Universidad de Chicago, analizó la facilidad de lectura utilizando la nueva prueba de eliminación Cloze desarrollada por Wilson Taylor. Su trabajo apoyó investigaciones anteriores, incluido el grado de facilidad de lectura para cada tipo de lectura. El mejor nivel para la "lectura asistida" en el aula es un texto un poco difícil que provoque un "juego para aprender" y para el cual los lectores puedan responder correctamente el 50% de las preguntas de una prueba de opción múltiple. El mejor nivel para la lectura sin ayuda es aquel en el que los lectores pueden responder correctamente el 80% de las preguntas. Estos puntajes de corte fueron confirmados más tarde por Vygotsky y Chall y Conard. Entre otras cosas, Bormuth confirmó que el vocabulario y la longitud de las oraciones son los mejores indicadores de la facilidad de lectura. Mostró que las medidas de facilidad de lectura funcionaron tanto para adultos como para niños. Las mismas cosas que los niños encuentran difíciles son las mismas para los adultos con los mismos niveles de lectura. También desarrolló varias medidas nuevas de puntajes de corte. Uno de los más conocidos fue la fórmula Mean Cloze, que se utilizó en 1981 para producir el sistema de potencia de grado de lectura utilizado por la Junta de examen de ingreso a la universidad.

El marco Lexile

En 1988, Jack Stenner y sus asociados en MetaMetrics, Inc. publicaron un nuevo sistema, Lexile Framework, para evaluar la legibilidad y relacionar a los estudiantes con los textos apropiados.

El marco Lexile utiliza la longitud promedio de las oraciones y la frecuencia promedio de las palabras en el American Heritage Intermediate Corpus para predecir una puntuación en una escala de 0 a 2000. El AHI Corpus incluye cinco millones de palabras de 1045 trabajos publicados que suelen leer los estudiantes de tercer a noveno grado.

La base de datos de libros Lexile tiene más de 100.000 títulos de más de 450 editoriales. Al conocer el puntaje Lexile de un estudiante, un maestro puede encontrar libros que coincidan con su nivel de lectura.

Fórmula de legibilidad ATOS para libros

En 2000, los investigadores del School Renaissance Institute y Touchstone Applied Science Associates publicaron su Advantage-TASA Open Standard (ATOS) Fórmula de facilidad de lectura para libros. Trabajaron en una fórmula que fuera fácil de usar y que pudiera usarse con cualquier texto.

El proyecto fue uno de los proyectos de facilidad de lectura más amplios de todos los tiempos. Los desarrolladores de la fórmula utilizaron 650 textos de lectura normados, 474 millones de palabras de todo el texto en 28.000 libros leídos por los estudiantes. El proyecto también utilizó los registros de lectura de más de 30.000 lectores y fueron evaluados en 950.000 libros.

Descubrieron que tres variables brindan la medida más confiable de la facilidad de lectura de texto:

También encontraron que:

Medidas psicolingüísticas de CohMetrix

Coh-Metrix se puede utilizar de muchas maneras diferentes para investigar la cohesión del texto explícito y la coherencia de la representación mental del texto. "Nuestra definición de cohesión consiste en características del texto explícito que juegan algún papel en ayudar al lector a conectar mentalmente las ideas en el texto". La definición de coherencia es objeto de mucho debate. Teóricamente, la coherencia de un texto se define por la interacción entre las representaciones lingüísticas y las representaciones de conocimiento. Si bien la coherencia se puede definir como características del texto (es decir, aspectos de la cohesión) que probablemente contribuyan a la coherencia de la representación mental, las medidas de Coh-Metrix proporcionan índices de estas características de cohesión.

Otras fórmulas

Enfoque de inteligencia artificial (IA)

A diferencia de las fórmulas tradicionales de legibilidad, los enfoques de inteligencia artificial para la evaluación de la legibilidad (también conocidos como evaluación automática de la legibilidad) incorporan innumerables características lingüísticas y construyen modelos de predicción estadística para predecir la legibilidad del texto. Estos enfoques suelen constar de tres pasos: 1. un corpus de entrenamiento de textos individuales, 2. un conjunto de características lingüísticas que se calcularán a partir de cada texto y 3. un modelo de aprendizaje automático para predecir la legibilidad, utilizando los valores de características lingüísticas calculados.

Corpora

Poquito

En 2012, Sowmya Vajjala de la Universidad de Tübingen creó el corpus WeeBit combinando artículos educativos del sitio web Weekly Reader y el sitio web BBC-Bitesize, que proporcionan textos para diferentes grupos de edad. En total, son 3125 artículos que se dividen en 5 niveles de legibilidad (de 7 a 16 años). Weebit corpus se ha utilizado en varias investigaciones de evaluación de legibilidad basadas en IA.

Newsela

Wei Xu (Universidad de Pensilvania), Chris Callison-Burch (Universidad de Pensilvania) y Courtney Napoles (Universidad Johns Hopkins) introdujeron el corpus de Newsela en el campo académico en 2015. El corpus es una colección de miles de artículos de noticias nivelados profesionalmente para diferentes complejidades de lectura por editores profesionales en Newsela. El corpus se introdujo originalmente para la investigación de simplificación de texto, pero también se usó para evaluar la legibilidad del texto.

Características lingüísticas

Léxico-Semántico

La relación tipo-token es una de las características que se utilizan a menudo para capturar la riqueza léxica, que es una medida del rango y la diversidad del vocabulario. Para medir la dificultad léxica de una palabra, a menudo se utiliza la frecuencia relativa de la palabra en un corpus representativo como el Corpus of Contemporary American English (COCA). A continuación se incluyen algunos ejemplos de características léxico-semánticas en la evaluación de la legibilidad.

Además, Lijun Feng fue pionera en las características motivadas cognitivamente (principalmente léxicas) en 2009. Esto fue durante su estudio de doctorado en la Universidad de la Ciudad de Nueva York (CUNY). Las funciones motivadas cognitivamente se diseñaron originalmente para adultos con discapacidad intelectual, pero se demostró que mejoraban la precisión de la evaluación de la legibilidad en general. Las características motivadas cognitivamente, en combinación con un modelo de regresión logística, pueden corregir el error promedio del nivel de grado de Flesch-Kincaid en más del 70 %. Las características recién descubiertas por Feng incluyen:

Sintáctico

La complejidad sintáctica se correlaciona con tiempos de procesamiento más largos en la comprensión de textos. Es común utilizar un amplio conjunto de estas características sintácticas para predecir la legibilidad de un texto. Las variantes más avanzadas de las funciones de legibilidad sintáctica se calculan con frecuencia a partir del árbol de análisis. Emily Pitler (Universidad de Pensilvania) y Ani Nenkova (Universidad de Pensilvania) son consideradas pioneras en la evaluación de las características sintácticas del árbol de análisis y en su uso generalizado en la evaluación de la legibilidad. Algunos ejemplos incluyen:

Usando las fórmulas de legibilidad

La precisión de las fórmulas de legibilidad aumenta al encontrar la legibilidad promedio de una gran cantidad de obras. Las pruebas generan una puntuación basada en características tales como la longitud media estadística de las palabras (que se utiliza como indicador poco fiable de la dificultad semántica; a veces se tiene en cuenta la frecuencia de las palabras) y la longitud de las oraciones (como indicador poco fiable de la complejidad sintáctica) del trabajo.

La mayoría de los expertos están de acuerdo en que las fórmulas simples de legibilidad como el nivel de grado de Flesch-Kincaid pueden ser muy engañosas. Si bien las características tradicionales como la longitud promedio de las oraciones tienen una alta correlación con la dificultad de lectura, la medida de la legibilidad es mucho más compleja. Se estudió el enfoque basado en datos de Inteligencia Artificial (IA) (ver arriba) para abordar esta deficiencia.

Los expertos en escritura han advertido que un intento de simplificar el texto solo cambiando la longitud de las palabras y oraciones puede resultar en un texto más difícil de leer. Todas las variables están estrechamente relacionadas. Si se cambia uno, también se deben ajustar los demás, incluido el enfoque, la voz, la persona, el tono, la tipografía, el diseño y la organización.

Escribir para una clase de lectores distinta a la propia es muy difícil. Requiere entrenamiento, método y práctica. Entre los que son buenos en esto están los escritores de novelas y libros para niños. Todos los expertos en escritura aconsejan que, además de usar una fórmula, se observen todas las normas de la buena escritura, que son esenciales para escribir textos legibles. Los escritores deben estudiar los textos utilizados por su audiencia y sus hábitos de lectura. Esto significa que para una audiencia de quinto grado, el escritor debe estudiar y aprender materiales de quinto grado de buena calidad.