Prueba estandarizada

AjustarCompartirImprimirCitar
Prueba administrada y anotada de manera predeterminada y estándar
Los adultos jóvenes en Polonia se sientan para sus exámenes de Matura. La Matura está estandarizada para que las universidades puedan comparar fácilmente los resultados de los estudiantes de todo el país.

Una prueba estandarizada es una prueba que se administra y califica de manera consistente o "estándar". Las pruebas estandarizadas están diseñadas de tal manera que las preguntas y las interpretaciones son consistentes y se administran y califican de una manera estándar predeterminada.

Cualquier prueba en la que la misma prueba se administre de la misma manera a todos los examinados y se califique de la misma manera para todos, es una prueba estandarizada. Las pruebas estandarizadas no necesitan ser pruebas de alto riesgo, pruebas de tiempo limitado o pruebas de opción múltiple. Una prueba estandarizada puede ser cualquier tipo de prueba: una prueba escrita, una prueba oral o una prueba de desempeño de habilidades prácticas. Las preguntas pueden ser simples o complejas. El tema entre los estudiantes en edad escolar es con frecuencia las habilidades académicas, pero se puede administrar una prueba estandarizada sobre casi cualquier tema, incluidas las pruebas de manejo, la creatividad, el atletismo, la personalidad, la ética profesional u otros atributos.

Lo opuesto a las pruebas estandarizadas son las pruebas no estandarizadas, en las que se administran pruebas significativamente diferentes a diferentes examinados o se asigna la misma prueba en condiciones significativamente diferentes (p. ej., un grupo es permitió mucho menos tiempo para completar la prueba que el siguiente grupo) o se evaluó de manera diferente (por ejemplo, la misma respuesta se cuenta como correcta para un estudiante, pero incorrecta para otro estudiante).

La mayoría de los cuestionarios y exámenes diarios que realizan los estudiantes durante la escuela cumplen con la definición de una prueba estandarizada: todos en la clase toman el mismo examen, al mismo tiempo, bajo las mismas circunstancias, y todos los estudiantes son calificados por su maestro del mismo modo. Sin embargo, el término prueba estandarizada se usa más comúnmente para referirse a las pruebas que se administran a grupos más grandes, como una prueba realizada por todos los adultos que desean adquirir una licencia para tener un tipo de trabajo en particular, o por todos los alumnos de cierta edad. La mayoría de las pruebas estandarizadas son formas de evaluaciones sumativas, evaluaciones que intentan medir el aprendizaje de los participantes al final de una unidad de instrucción.

Debido a que todos reciben la misma prueba y el mismo sistema de calificación, las pruebas estandarizadas a menudo se perciben como más justas que las pruebas no estandarizadas. Tales pruebas a menudo se consideran más justas y objetivas que un sistema en el que algunos estudiantes obtienen una prueba más fácil y otros obtienen una prueba más difícil. Las pruebas estandarizadas están diseñadas para permitir una comparación confiable de los resultados entre todos los examinados, porque todos están tomando la misma prueba. Sin embargo, algunas personas critican tanto las pruebas en general como las pruebas estandarizadas en particular. Por ejemplo, algunas personas creen que es injusto hacer las mismas preguntas a todos los estudiantes, si algunos estudiantes' las escuelas no tenían los mismos estándares de aprendizaje.

Definición

Two men perform CPR on a CPR doll
Dos hombres toman una prueba estandarizada auténtica y no escrita. Si realizan reanimación cardiopulmonar en el maniquí con la velocidad y presión correctas, pasarán este examen.

La definición de una prueba estandarizada ha cambiado un poco con el tiempo. En 1960, las pruebas estandarizadas se definieron como aquellas en las que las condiciones y el contenido eran iguales para todos los que tomaban la prueba, independientemente de cuándo, dónde o quién la administró o calificó. El propósito de esta estandarización es asegurarse de que los puntajes indiquen de manera confiable las habilidades o destrezas que se están midiendo, y no otras cosas, como instrucciones diferentes sobre qué hacer si el examinado no sabe la respuesta a una pregunta.

A principios del siglo XXI, el enfoque se alejó de una estricta igualdad de condiciones hacia la igualdad de condiciones. Por ejemplo, un examinado con una muñeca rota podría escribir más lentamente debido a la lesión, y sería más equitativo y produciría una comprensión más confiable del conocimiento real del examinado, si a esa persona se le dieran algunos más minutos para escribir las respuestas a una prueba de tiempo limitado. Cambiar las condiciones de la prueba de una manera que mejore la equidad con respecto a una discapacidad permanente o temporal, pero sin socavar el punto principal de la evaluación, se denomina adaptación. Sin embargo, si el propósito de la prueba fuera ver qué tan rápido el estudiante puede escribir, entonces darle tiempo adicional a la persona que rinde la prueba se convertiría en una modificación del contenido y ya no sería una prueba estandarizada.

Ejemplos de pruebas estandarizadas y no estandarizadas
Asunto Formato Prueba estandarizada Prueba no estandarizada
Historia Oral Cada estudiante recibe las mismas preguntas, y sus respuestas son anotadas de la misma manera. El profesor va alrededor de la habitación y hace a cada estudiante una pregunta diferente. Algunas preguntas son más difíciles que otras.
Conducción Prácticas Se pide a cada estudiante conductor que haga las mismas cosas, y todos son evaluados por los mismos estándares. Algunos estudiantes de conducción tienen que conducir en una carretera, pero otros sólo tienen que conducir lentamente alrededor de la manzana. Un empleado despega puntos por "bad attitude".
Matemáticas Escrito Cada estudiante recibe las mismas preguntas, y sus respuestas son anotadas de la misma manera. El profesor da diferentes preguntas a diferentes estudiantes: una prueba fácil para los estudiantes pobres, otra prueba para la mayoría de los estudiantes, y una prueba difícil para los mejores estudiantes.
Música Audición Todos los músicos tocan la misma pieza de música. Los jueces acordaron de antemano cuántos factores como el tiempo, la expresión y la musicalidad cuentan. Cada músico elige una pieza diferente de música para tocar. Los jueces eligen al músico que más les gusta. Un juez le da puntos extra a los músicos que llevan un disfraz.

Historia

China

La evidencia más temprana de pruebas estandarizadas fue en China, durante la dinastía Han, donde los exámenes imperiales cubrían las Seis Artes que incluían música, tiro con arco, equitación, aritmética, escritura y conocimiento de los rituales y ceremonias tanto públicas como privadas. partes. Estos exámenes se utilizaron para seleccionar empleados para la burocracia estatal.

Más tarde, se agregaron a las pruebas secciones sobre estrategias militares, derecho civil, ingresos e impuestos, agricultura y geografía. De esta forma, los exámenes fueron institucionalizados durante más de un milenio.

Hoy en día, las pruebas estandarizadas siguen siendo ampliamente utilizadas, sobre todo en el sistema Gaokao.

Reino Unido

Las pruebas estandarizadas se introdujeron en Europa a principios del siglo XIX, siguiendo el modelo de los exámenes de chino mandarín, a través de la defensa de los administradores coloniales británicos, los más "persistentes" de los cuales fue el cónsul de Gran Bretaña en Guangzhou, China, Thomas Taylor Meadows. Meadows advirtió sobre el colapso del Imperio Británico si las pruebas estandarizadas no se implementaban en todo el imperio de inmediato.

Antes de su adopción, las pruebas estandarizadas tradicionalmente no formaban parte de la pedagogía occidental. Basado en la tradición escéptica y abierta del debate heredada de la antigua Grecia, la academia occidental favoreció las evaluaciones no estandarizadas utilizando ensayos escritos por estudiantes. Es por esto que la primera implementación europea de pruebas estandarizadas no ocurrió en Europa propiamente dicha, sino en la India británica. Inspirándose en el uso chino de las pruebas estandarizadas, a principios del siglo XIX, los "gerentes de empresas británicas contrataron y ascendieron a los empleados sobre la base de exámenes competitivos para prevenir la corrupción y el favoritismo". Esta práctica de pruebas estandarizadas fue adoptada más tarde a fines del siglo XIX por el continente británico. Los debates parlamentarios que siguieron hicieron muchas referencias al "sistema mandarín chino".

Fue desde Gran Bretaña que las pruebas estandarizadas se extendieron, no solo por toda la Commonwealth británica, sino también por Europa y luego por América. Su expansión fue impulsada por la Revolución Industrial. El aumento en el número de estudiantes durante y después de la Revolución Industrial, como resultado de las leyes de educación obligatoria, disminuyó el uso de la evaluación abierta, que era más difícil de producir en masa y evaluar objetivamente debido a su naturaleza intrínsecamente subjetiva.

A man sorts small objects into a wooden tray
Los soldados británicos hicieron pruebas estandarizadas durante la Segunda Guerra Mundial. Este nuevo recluta está clasificando piezas mecánicas para probar su comprensión de la maquinaria. Su uniforme no muestra nombre, rango u otro signo que pueda sesgar el ano de su trabajo.

Las pruebas estandarizadas, como las Juntas de Selección de la Oficina de Guerra, se desarrollaron para el ejército británico durante la Segunda Guerra Mundial para elegir candidatos para la formación de oficiales y otras tareas. Las pruebas observaron a los soldados' habilidades mentales, habilidades mecánicas, habilidad para trabajar con otros y otras cualidades. Los métodos anteriores habían sufrido de sesgo y resultaron en la elección de los soldados equivocados para el entrenamiento de oficiales.

Estados Unidos

Las pruebas estandarizadas han sido parte de la educación estadounidense desde el siglo XIX, pero la dependencia generalizada de las pruebas estandarizadas en las escuelas de EE. UU. es en gran medida un fenómeno del siglo XX.

La inmigración a mediados del siglo XIX contribuyó al crecimiento de las pruebas estandarizadas en los Estados Unidos. Las pruebas estandarizadas se utilizaron cuando las personas ingresaron por primera vez a los EE. UU. para evaluar los roles sociales y encontrar el poder y el estatus social.

La Junta de Examen de Ingreso a la Universidad no ofreció pruebas estandarizadas para la admisión a la universidad y la universidad hasta 1900. Sus primeros exámenes se administraron en 1901, en nueve materias. Esta prueba se implementó con la idea de crear admisiones estandarizadas para los Estados Unidos en las universidades de élite del noreste. Originalmente, la prueba también estaba destinada a los mejores internados, con el fin de estandarizar el plan de estudios. Originalmente, la prueba estandarizada estaba hecha de ensayos y no estaba destinada a pruebas generalizadas.

Durante la Primera Guerra Mundial, se desarrollaron las pruebas Army Alpha y Beta para ayudar a ubicar a los nuevos reclutas en asignaciones adecuadas según sus niveles de inteligencia evaluados. La primera edición de una prueba estandarizada moderna para el coeficiente intelectual, la prueba de inteligencia de Stanford-Binet, apareció en 1916. El College Board diseñó el SAT (Prueba de aptitud académica) en 1926. La primera prueba SAT se basó en las pruebas de coeficiente intelectual del ejército, con el objetivo de determinar la inteligencia, las habilidades para resolver problemas y el pensamiento crítico del examinado. En 1959, Everett Lindquist ofreció el ACT (American College Testing) por primera vez. A partir de 2020, el ACT incluye cuatro secciones principales con preguntas de opción múltiple para evaluar inglés, matemáticas, lectura y ciencias, además de una sección de escritura opcional.

Los estados individuales comenzaron a evaluar a un gran número de niños y adolescentes a través de los sistemas de escuelas públicas en la década de 1970. En la década de 1980, las escuelas estadounidenses evaluaban a nivel nacional. En 2012, 45 estados pagaron un promedio de $27 por estudiante y $669 millones en general, en pruebas académicas anuales a gran escala. Sin embargo, otros costos, como pagar a los maestros para que preparen a los estudiantes para las pruebas y el tiempo de clase dedicado a administrar las pruebas, superan significativamente el costo de la prueba en sí.

La necesidad del gobierno federal de realizar comparaciones significativas en un sistema de educación pública altamente descentralizado (controlado localmente) ha fomentado el uso de pruebas estandarizadas a gran escala. La Ley de Educación Primaria y Secundaria de 1965 requería algunas pruebas estandarizadas en las escuelas públicas. La Ley Que Ningún Niño Se Quede Atrás de 2001 vinculó aún más algunos tipos de financiación de las escuelas públicas a los resultados de las pruebas estandarizadas.

El objetivo de No Child Left Behind era mejorar el sistema educativo en los Estados Unidos al responsabilizar a las escuelas y los maestros por el rendimiento de los estudiantes, incluida la brecha de rendimiento educativo entre los niños pertenecientes a minorías y los que no pertenecen a minorías en las escuelas públicas. Un factor adicional en el sistema educativo de los Estados Unidos es el entorno socioeconómico de los estudiantes que se evalúan. Según el Centro Nacional para Niños en Pobreza, el 41 por ciento de los niños menores de 18 años provienen de familias de bajos ingresos. Estos estudiantes requieren atención especializada para desempeñarse bien en la escuela y en las pruebas estandarizadas.

De acuerdo con estas leyes federales, el plan de estudios escolar aún lo establecía cada estado, pero el gobierno federal requería que los estados evaluaran qué tan bien las escuelas y los maestros estaban enseñando el material elegido por el estado con pruebas estandarizadas. Estudiantes' los resultados de las pruebas estandarizadas a gran escala se utilizaron para asignar fondos y otros recursos a las escuelas y para cerrar las escuelas con bajo rendimiento. La Ley Every Student Succeeds reemplazó a la NCLB a fines de 2015. En ese momento, estas pruebas estandarizadas a gran escala se habían vuelto controvertidas en los Estados Unidos porque eran pruebas de alto riesgo para los sistemas escolares y los maestros.

En los últimos años, muchas universidades y colegios han abandonado el requisito de puntajes de exámenes estandarizados por parte de los solicitantes.

Australia

Las pruebas estandarizadas del Programa Nacional de Evaluación de Australia: alfabetización y aritmética (NAPLAN) se iniciaron en 2008 por la Autoridad Australiana de Currículo, Evaluación e Informes, una autoridad independiente responsable del desarrollo de un currículo nacional, una evaluación nacional programa y un programa nacional de recopilación e informe de datos que apoya el aprendizaje del siglo XXI para todos los estudiantes australianos.

La prueba incluye a todos los estudiantes de los años 3, 5, 7 y 9 en las escuelas australianas para ser evaluados mediante pruebas nacionales. Los temas cubiertos en estas pruebas incluyen lectura, escritura, convenciones del lenguaje (ortografía, gramática y puntuación) y aritmética.

El programa presenta informes de nivel de los estudiantes diseñados para permitir a los padres ver el progreso de sus hijos a lo largo de su vida escolar y ayudar a los maestros a mejorar las oportunidades de aprendizaje individuales para sus estudiantes. Los datos de los estudiantes y del nivel escolar también se proporcionan al sistema escolar apropiado en el entendimiento de que pueden usarse para dirigir apoyos y recursos específicos a las escuelas que más los necesitan. Los maestros y las escuelas usan esta información, junto con otra información, para determinar qué tan bien se están desempeñando sus estudiantes e identificar cualquier área de necesidad que requiera asistencia.

El concepto de evaluar el rendimiento de los estudiantes no es nuevo, aunque se puede decir que el enfoque australiano actual tiene sus orígenes en las estructuras de políticas educativas actuales tanto en los EE. UU. como en el Reino Unido. Hay varias diferencias clave entre el NAPLAN australiano y las estrategias del Reino Unido y los Estados Unidos. A las escuelas que se determine que tienen un desempeño deficiente en el contexto australiano se les ofrecerá asistencia financiera conforme a la política actual del gobierno federal.

Colombia

En 1968 nace el Instituto Colombiano para la Evaluación de la Educación - ICFES para regular la educación superior. Se implementó el anterior sistema de evaluación pública para la autorización de funcionamiento y reconocimiento legal de instituciones y programas universitarios.

Colombia cuenta con varias pruebas estandarizadas que evalúan el nivel educativo del país. Estos exámenes son realizados por el ICFES.

Los alumnos de tercero, quinto y noveno toman el "Saber 3°5°9°" examen. Esta prueba actualmente se presenta en una computadora en muestras controladas y censales.

Al salir estudiantes de secundaria presentan el "Saber 11" que les permita ingresar a diferentes universidades del país. Los estudiantes que estudian en casa pueden tomar este examen para graduarse de la escuela secundaria y obtener su certificado y diploma de grado.

Los estudiantes que salen de la universidad deben tomar el "Saber Pro" examen.

Canadá

Canadá deja la educación y, como resultado, las pruebas estandarizadas, bajo la jurisdicción de las provincias. Cada provincia tiene su propio régimen de pruebas estandarizadas en toda la provincia, que van desde pruebas estandarizadas no requeridas para los estudiantes en Ontario hasta exámenes que valen el 50% de las calificaciones finales de la escuela secundaria en Terranova y Labrador.

Diseño y puntuación

Diseño

Por lo general, una prueba académica importante incluye secciones calificadas por humanos y por computadora.

Una prueba estandarizada puede estar compuesta por preguntas de opción múltiple, preguntas de verdadero o falso, preguntas de ensayo, evaluaciones auténticas o casi cualquier otra forma de evaluación. Las preguntas de opción múltiple y de verdadero o falso a menudo se eligen para las pruebas que toman miles de personas porque se pueden administrar y calificar de manera económica, rápida y confiable mediante el uso de hojas de respuestas especiales que pueden leerse en una computadora o a través de adaptaciones de computadora. pruebas. Algunas pruebas estandarizadas tienen componentes de redacción de respuestas cortas o ensayos a los que evaluadores independientes les asignan una puntuación y usan rúbricas (reglas o pautas) y documentos de referencia (ejemplos de documentos para cada puntaje posible) para determinar la calificación que se otorgará a una respuesta.

Cualquier tema

A blank form with many checkboxes
Forma de cableado para pruebas de conducción en el Reino Unido. Cada persona que quiere una licencia de conducir toma la misma prueba y se marca de la misma manera.

No todas las pruebas estandarizadas implican responder preguntas. Una evaluación auténtica de las habilidades atléticas podría tomar la forma de correr durante un período de tiempo determinado o botar una pelota una cierta distancia. Los profesionales de la salud deben pasar pruebas que demuestren que pueden realizar procedimientos médicos. Los candidatos a las licencias de conducir deben aprobar una prueba estandarizada que demuestre que pueden conducir un automóvil. La prueba estandarizada canadiense de condición física se ha utilizado en la investigación médica para determinar qué tan en forma física están los examinados.

Máquina y puntuación humana

Algunas pruebas estandarizadas utilizan pruebas de selección múltiple, que son relativamente baratas para anotar, pero cualquier forma de evaluación se puede utilizar.

Desde la última parte del siglo XX, las pruebas estandarizadas a gran escala han sido moldeadas en parte por la facilidad y el bajo costo de calificar las pruebas de opción múltiple por computadora. La mayoría de las evaluaciones nacionales e internacionales no son evaluadas completamente por personas.

Las personas están acostumbradas a calificar elementos que no se pueden calificar fácilmente por computadora (como ensayos). Por ejemplo, el Graduate Record Exam es una evaluación adaptativa por computadora que no requiere calificación por parte de las personas, excepto en la parte de escritura.

La puntuación humana es relativamente costosa y, a menudo, variable, por lo que se prefiere la puntuación por computadora cuando es factible. Por ejemplo, algunos críticos dicen que los empleados mal pagados obtendrán malas calificaciones en los exámenes. El acuerdo entre los evaluadores puede variar entre el 60 y el 85 por ciento, según la prueba y la sesión de puntuación. Para las pruebas a gran escala en las escuelas, algunos examinadores pagan para que dos o más evaluadores lean cada examen; si sus puntajes no concuerdan, entonces el trabajo se pasa a otros evaluadores.

Aunque el proceso es más difícil que calificar exámenes de opción múltiple electrónicamente, los ensayos también se pueden calificar por computadora. En otros casos, los ensayos y otras respuestas abiertas se califican de acuerdo con una rúbrica de evaluación predeterminada por calificadores capacitados. Por ejemplo, en Pearson, todos los alumnos que califican ensayos tienen títulos universitarios de cuatro años y la mayoría son maestros actuales o anteriores.

Uso de rúbricas para la equidad

El uso de una rúbrica pretende aumentar la equidad cuando se evalúa el desempeño del estudiante. En las pruebas estandarizadas, el error de medición (un patrón consistente de errores y sesgos al calificar la prueba) es fácil de determinar en las pruebas estandarizadas. En la evaluación no estandarizada, los calificadores tienen más discreción individual y, por lo tanto, es más probable que produzcan resultados injustos a través de un sesgo inconsciente. Cuando la puntuación depende de los calificadores' preferencias individuales, luego los estudiantes' las calificaciones dependen de quién califique la prueba. Las pruebas estandarizadas también eliminan el sesgo de los maestros en la evaluación. La investigación muestra que los maestros crean una especie de profecía autocumplida en su evaluación de los estudiantes, otorgando a aquellos que anticipan que obtendrán puntajes más altos y otorgando calificaciones más bajas a aquellos que esperan que reprueben.

Muestra para la cuestión de la historia abierta: ¿Qué causó la Segunda Guerra Mundial?
Respuestas de los estudiantes Normalización Clasificación no normalizada
Grading rubric: Las respuestas deben ser marcadas correctamente si mencionan al menos una de las siguientes: La invasión alemana de Polonia, la invasión de Japón a China o problemas económicos. Sin estándares de clasificación. Cada maestro califica sin embargo él o ella quiere, teniendo en cuenta los factores que el maestro elija, como la respuesta, la cantidad de esfuerzo, el fondo académico del estudiante, la habilidad del lenguaje o la actitud.
Estudiante #1: La Segunda Guerra Mundial fue causada por Hitler y Alemania invadiendo Polonia.

Maestro #1: Esta respuesta menciona uno de los elementos requeridos, por lo que es correcto.
Maestro #2: Esta respuesta es correcta.

Maestro #1: Siento que esta respuesta es lo suficientemente buena, así que lo marcaré correctamente.
Maestro #2: Esta respuesta es correcta, pero este buen estudiante debe ser capaz de hacer mejor que eso, así que sólo daré crédito parcial.

Estudiante #2: La Segunda Guerra Mundial fue causada por múltiples factores, incluyendo la Gran Depresión y la situación económica general, el aumento del socialismo nacional, el fascismo y el expansionismo imperialista, y resentimientos no resueltos relacionados con la ICM. La guerra en Europa comenzó con la invasión alemana de Polonia.

Maestro #1: Esta respuesta menciona uno de los elementos requeridos, por lo que es correcto.
Maestro #2: Esta respuesta es correcta.

Maestro #1: Siento que esta respuesta es correcta y completa, así que daré pleno crédito.
Maestro #2: Esta respuesta es correcta, así que voy a dar puntos completos.

Estudiante #3: La Segunda Guerra Mundial fue causada por el asesinato de Archduke Ferdinand.

Maestro #1: Esta respuesta no menciona ninguno de los elementos requeridos. Sin puntos.
Maestro #2: Esta respuesta está equivocada. Sin crédito.

Maestro #1: Esta respuesta está equivocada. Sin puntos.
Maestro #2: Esta respuesta es incorrecta, pero este estudiante intentó duramente y la frase es gramáticamente correcta, así que daré un punto para el esfuerzo.

Uso de puntajes para comparaciones

Hay dos tipos de interpretaciones de puntajes de pruebas estandarizadas: una interpretación de puntajes con referencia a normas o una interpretación de puntajes con referencia a criterios.

  • Interpretaciones de puntuación no referenciadas comparar los test-takers con una muestra de pares. El objetivo es clasificar a los estudiantes como mejores o peores que otros estudiantes. Las interpretaciones de puntaje de prueba no referenciadas están asociadas con la educación tradicional. Los estudiantes que realizan mejor que otros pasan la prueba, y los estudiantes que realizan peor que otros fallan la prueba.
  • Interpretaciones de puntaje referenciadas a la crítica comparar los test-takers con un criterio (una definición formal del contenido), independientemente de las puntuaciones de otros exámenes. Estas evaluaciones también pueden describirse como evaluaciones basadas en normas, ya que están alineadas con el movimiento de reforma educativa basado en normas. Las interpretaciones de puntaje referenciadas a la crítica se refieren únicamente a si la respuesta de este estudiante en particular es correcta y completa. Bajo los sistemas de referencia de criterio, es posible que todos los estudiantes aprueben el examen o que todos los estudiantes no lo hagan.

Cualquiera de estos sistemas se puede utilizar en las pruebas estandarizadas. Lo que es importante para las pruebas estandarizadas es si a todos los estudiantes se les hacen preguntas equivalentes, bajo circunstancias equivalentes y se les califica por igual. En una prueba estandarizada, si una respuesta dada es correcta para un estudiante, es correcta para todos los estudiantes. Los calificadores no aceptan una respuesta como lo suficientemente buena para un estudiante, pero rechazan la misma respuesta como inadecuada para otro estudiante.

El término evaluación normativa se refiere al proceso de comparar a un examinado con sus compañeros. Una prueba con referencia a normas (NRT) es un tipo de prueba, valoración o evaluación que produce una estimación de la posición del individuo evaluado en una población predefinida. La estimación se deriva del análisis de los puntajes de las pruebas y otros datos relevantes de una muestra extraída de la población. Este tipo de prueba identifica si el examinado se desempeñó mejor o peor que otros estudiantes que tomaron esta prueba. Una prueba referida a criterios (CRT) es un estilo de prueba que utiliza puntajes de prueba para mostrar si los examinados se desempeñaron bien o no en una tarea determinada, no qué tan bien se desempeñaron en comparación con otros examinados. La mayoría de las pruebas y cuestionarios escritos por maestros de escuela son pruebas con referencia a criterios. En este caso, el objetivo es simplemente ver si el alumno puede responder correctamente las preguntas. El profesor no suele intentar comparar el resultado de cada alumno con el de otros alumnos.

Esto hace que las pruebas estandarizadas sean útiles para fines de admisión en la educación superior, donde una escuela intenta comparar estudiantes de todo el país o del mundo. Ejemplos de tales pruebas comparativas internacionales incluyen el Estudio Internacional de Tendencias en Matemáticas y Ciencias (TIMMS) y el Estudio Internacional de Progreso en la Competencia Lectora (PIRLS). Se ha especulado que el rendimiento en estos exámenes cambiará en función de la forma en que los estándares como los Estándares Estatales Básicos Comunes (CCSS) se alinean con los mejores países del mundo.

Debido a que los resultados pueden compararse entre escuelas diferentes, los resultados de una prueba estandarizada nacional pueden usarse para determinar qué áreas deben mejorarse. Las pruebas que toman todos pueden ayudar al gobierno a determinar qué escuelas y qué estudiantes tienen más dificultades. Con esta información, pueden implementar soluciones para solucionar el problema, lo que permite a los estudiantes aprender y crecer en un entorno académico.

Estándares

Las consideraciones de validez y confiabilidad generalmente se consideran elementos esenciales para determinar la calidad de cualquier prueba estandarizada. Sin embargo, las asociaciones de profesionales y practicantes con frecuencia han colocado estas preocupaciones dentro de contextos más amplios al desarrollar estándares y hacer juicios generales sobre la calidad de cualquier prueba estandarizada como un todo dentro de un contexto dado.

Estándares de evaluación

En el campo de la evaluación, y en particular de la evaluación educativa, el Comité Conjunto de Estándares para la Evaluación Educativa ha publicado tres conjuntos de estándares para las evaluaciones. Los Estándares de evaluación del personal se publicaron en 1988, Los Estándares de evaluación del programa (segunda edición) se publicaron en 1994 y Los Estándares de evaluación de los estudiantes se publicaron en 2003.

Cada publicación presenta y elabora un conjunto de estándares para su uso en una variedad de entornos educativos. Los estándares proporcionan pautas para diseñar, implementar, evaluar y mejorar la forma de evaluación identificada. Cada uno de los estándares ha sido colocado en una de cuatro categorías fundamentales para promover evaluaciones educativas que sean adecuadas, útiles, factibles y precisas. En estos conjuntos de estándares, las consideraciones de validez y confiabilidad se tratan en el tema de la precisión. Sin embargo, las pruebas tienen como objetivo garantizar que las evaluaciones de los estudiantes proporcionen información sólida, precisa y creíble sobre el aprendizaje y el rendimiento de los estudiantes; Las pruebas estandarizadas ofrecen información limitada sobre muchas formas de inteligencia y confiar en ellas perjudica a los estudiantes porque miden de manera incorrecta el potencial de éxito de un estudiante.

Estándares de prueba

En el campo de la psicometría, los Estándares para pruebas educativas y psicológicas establecen estándares sobre validez y confiabilidad, junto con errores de medición y cuestiones relacionadas con la adaptación de personas con discapacidades. El tercer y último tema principal cubre los estándares relacionados con las aplicaciones de prueba, la acreditación, además de las pruebas en la evaluación de programas y las políticas públicas.

Validez estadística

Una de las principales ventajas de las pruebas estandarizadas es que los resultados pueden documentarse empíricamente; por lo tanto, se puede demostrar que los puntajes de las pruebas tienen un grado relativo de validez y confiabilidad, así como resultados que son generalizables y replicables. Esto a menudo se contrasta con las calificaciones en un expediente escolar, que son asignadas por maestros individuales. Puede ser difícil dar cuenta de las diferencias en la cultura educativa entre las escuelas, la dificultad del plan de estudios de un maestro determinado, las diferencias en el estilo de enseñanza y las técnicas y sesgos que afectan la calificación.

Otra ventaja es la agregación. Una prueba estandarizada bien diseñada proporciona una evaluación del dominio de un individuo de un dominio de conocimiento o habilidad que, en algún nivel de agregación, proporcionará información útil. Es decir, si bien las evaluaciones individuales pueden no ser lo suficientemente precisas para fines prácticos, las puntuaciones medias de clases, escuelas, sucursales de una empresa u otros grupos pueden brindar información útil debido a la reducción del error que se logra al aumentar el tamaño de la muestra.

Examinadores

Hay críticas de los propios estudiantes de que las pruebas, aunque estandarizadas, son injustas para el estudiante individual. Algunos estudiantes son "malos para tomar exámenes", lo que significa que se ponen nerviosos y no se concentran en los exámenes. Por lo tanto, si bien la prueba es estándar y debe proporcionar resultados justos, los examinados están en desventaja, pero no tienen forma de probar sus conocimientos de otra manera, ya que no hay otra alternativa de prueba que permita a los estudiantes probar sus conocimientos y habilidades para resolver problemas..

Algunos estudiantes tienen ansiedad ante los exámenes. Entre el diez y el cuarenta por ciento de los estudiantes experimentan este tipo de ansiedad. De hecho, los niños de la pobreza son los más afectados por la ansiedad ante las pruebas. La ansiedad ante los exámenes también se aplica a las pruebas estandarizadas, donde los estudiantes que pueden no tener ansiedad ante los exámenes sienten regularmente una inmensa presión para rendir cuando hay mucho en juego. Las pruebas estandarizadas de alto riesgo incluyen exámenes como el SAT, el PARCC y el ACT, en los que se requiere un buen desempeño para aprobar el grado o la admisión a la universidad.

Exámenes estandarizados anuales en la escuela

Las pruebas estandarizadas son una forma muy común de determinar el rendimiento académico pasado y el potencial futuro de un estudiante. Sin embargo, las pruebas de alto riesgo (ya sean estandarizadas o no) pueden causar ansiedad. Cuando los maestros o las escuelas son recompensados por un mejor desempeño en las pruebas, esas recompensas alientan a los maestros a "enseñar para el examen" en lugar de proporcionar un currículo rico y amplio. En 2007, un estudio cualitativo realizado por Au Wayne demostró que las pruebas estandarizadas reducen el plan de estudios y fomentan la instrucción centrada en el maestro en lugar del aprendizaje centrado en el alumno.

La validez, la calidad o el uso de las pruebas, en particular las pruebas estandarizadas anuales comunes en la educación, han seguido siendo ampliamente respaldadas o criticadas. Al igual que las pruebas en sí, los apoyos y las críticas a las pruebas suelen ser variados y pueden provenir de una variedad de fuentes, como padres, examinados, instructores, grupos empresariales, universidades o organismos de control gubernamentales.

Los partidarios de las pruebas estandarizadas a gran escala en la educación a menudo ofrecen las siguientes razones para promover las pruebas en la educación:

  • Retroalimentación o diagnóstico del rendimiento del receptor de pruebas
  • Fair and efficient
  • Promover la rendición de cuentas
  • Predicción y selección
  • Mejora el rendimiento

Los críticos de las pruebas estandarizadas en educación a menudo dan las siguientes razones para revisar o eliminar las pruebas estandarizadas en educación:

  • Narrows curriculumr format and encourages teaching to the test.
  • Pobre calidad predictiva.
  • Inflación de grado de puntajes de prueba o calificaciones.
  • Sesgada cultural o socioeconómicamente.
  • Psicológicamente dañino.
  • Pobre indicador de inteligencia o habilidad.

Efectos en las escuelas

Un pasado papel de prueba estandarizado utilizando múltiples preguntas de elección y respondiendo en el formulario como se muestra anteriormente.

Las pruebas estandarizadas se utilizan como una estrategia de política pública para establecer medidas de rendición de cuentas más sólidas para la educación pública. Si bien la Evaluación Nacional del Progreso Educativo (NAEP, por sus siglas en inglés) ha servido como un barómetro educativo durante unos treinta años mediante la administración periódica de pruebas estandarizadas a escuelas aleatorias en todo Estados Unidos, los esfuerzos de la última década a nivel estatal y federal han exigido administración de exámenes estandarizados para todas las escuelas públicas del país.

La idea detrás del movimiento de políticas de pruebas estandarizadas es que las pruebas son el primer paso para mejorar las escuelas, la práctica docente y los métodos educativos a través de la recopilación de datos. Los defensores argumentan que los datos generados por las pruebas estandarizadas actúan como una boleta de calificaciones para la comunidad, demostrando qué tan bien se están desempeñando las escuelas locales. Los críticos del movimiento, sin embargo, señalan varias discrepancias que resultan de las prácticas de prueba estandarizadas del estado actual, incluidos problemas con la validez y confiabilidad de la prueba y correlaciones falsas (ver la paradoja de Simpson).

Además de administrar y calificar las pruebas reales, en algunos casos se califica a los maestros según el desempeño de sus propios estudiantes en las pruebas. Los maestros están bajo presión para mejorar continuamente sus puntajes y demostrar que son dignos de mantener sus trabajos. Este enfoque ha sido criticado porque hay tantos factores externos, como la violencia doméstica, el hambre y la falta de vivienda entre los estudiantes, que afectan el desempeño de los estudiantes.

Pago basado en el desempeño es la idea de que a los maestros se les debe pagar más si los estudiantes se desempeñan bien en las pruebas y menos si se desempeñan mal. El gobernador de New Jersey, Chris Christie, propuso una reforma educativa en New Jersey que presiona a los maestros no solo a "enseñar para el examen" pero también hacer que sus estudiantes se desempeñen al costo potencial de su salario y seguridad laboral. La reforma exigía una remuneración basada en el rendimiento que dependiera de los estudiantes' rendimientos en las pruebas estandarizadas y sus ganancias educativas.

Las escuelas que obtienen una puntuación baja terminan siendo programadas para el cierre o la reducción de personal, lo que da una influencia directa en la administración que da lugar a tácticas peligrosas como la intimidación, el engaño y la extracción de información para mejorar las puntuaciones.

El uso acrítico de puntajes de exámenes estandarizados para evaluar el desempeño de los maestros y la escuela es inapropiado, porque los estudiantes' las calificaciones están influenciadas por tres cosas: lo que los estudiantes aprenden en la escuela, lo que los estudiantes aprenden fuera de la escuela y los estudiantes' inteligencia innata. La escuela sólo tiene control sobre uno de estos tres factores. Se han propuesto modelos de valor agregado para hacer frente a esta crítica mediante el control estadístico de la capacidad innata y los factores contextuales fuera de la escuela. En un sistema de valor agregado para interpretar los puntajes de las pruebas, los analistas estiman un puntaje esperado para cada estudiante, en función de factores como los puntajes de exámenes anteriores del estudiante, el idioma principal o el estado socioeconómico. Se supone que la diferencia entre la puntuación esperada del estudiante y la puntuación real se debe principalmente a los esfuerzos del maestro.

Afectando lo que se enseña a los estudiantes

  • Ofrece orientación a los maestros. Las pruebas estandarizadas permitirán a los maestros ver cómo sus estudiantes están realizando comparaciones con otros en el país. Esto les ayudará a revisar sus métodos de enseñanza si es necesario para ayudar a sus estudiantes a cumplir las normas.
  • Permite a los estudiantes ver su propio progreso. Los estudiantes tendrán la oportunidad de reflexionar sobre sus puntajes y ver dónde están sus fortalezas y debilidades.
  • Proporcionar información a los padres sobre su hijo. Las puntuaciones pueden permitir a los padres obtener una idea sobre cómo su hijo está haciendo académicamente en comparación con todos los demás de la misma edad en la nación.

Los críticos también afirman que las pruebas estandarizadas fomentan "enseñar para la prueba" a expensas de la creatividad y la cobertura en profundidad de temas que no están en la prueba. Las pruebas de opción múltiple son criticadas por no evaluar habilidades como la escritura. Además, el éxito de los estudiantes se rastrea hasta el desempeño relativo del maestro, lo que hace que el avance del maestro dependa del éxito del maestro con el desempeño académico del estudiante. Las cuestiones éticas y económicas surgen para los profesores cuando se enfrentan a estudiantes con un rendimiento claramente inferior o poco cualificado y una prueba estandarizada.

Los críticos sostienen que el uso excesivo y el uso indebido de estas pruebas perjudican la enseñanza y el aprendizaje al reducir el plan de estudios. Según el grupo FairTest, cuando las pruebas estandarizadas son el factor principal en la rendición de cuentas, las escuelas usan las pruebas para definir estrictamente el plan de estudios y enfocar la instrucción. La rendición de cuentas crea una inmensa presión para realizar y esto puede conducir al mal uso y la mala interpretación de las pruebas estandarizadas.

Los críticos dicen que enseñar para la prueba desfavorece el aprendizaje de orden superior; transforma lo que los maestros pueden enseñar y limita en gran medida la cantidad de otra información que los estudiantes aprenden a lo largo de los años. Si bien es posible usar una prueba estandarizada sin dejar que su contenido determine el plan de estudios y la instrucción, con frecuencia, lo que no se evalúa no se enseña y la forma en que se evalúa la materia a menudo se convierte en un modelo de cómo enseñar la materia.

Los críticos también se oponen al tipo de material que suelen evaluar las escuelas. Aunque existen pruebas estandarizadas para atributos no académicos como las Pruebas de pensamiento creativo de Torrance, las escuelas rara vez dan pruebas estandarizadas para medir la iniciativa, la creatividad, la imaginación, la curiosidad, la buena voluntad, la reflexión ética o una serie de otras disposiciones y atributos valiosos. En cambio, las pruebas dadas por las escuelas tienden a enfocarse menos en el desarrollo moral o del carácter, y más en las habilidades académicas identificables individuales.

En su libro, Ahora lo ves, Cathy Davidson critica las pruebas estandarizadas. Ella describe a nuestra juventud como "niños de la línea de montaje en un modelo de línea de montaje" es decir, el uso de la prueba estandarizada como parte de un modelo educativo único para todos. También critica la estrechez de las habilidades que se evalúan y etiqueta a los niños sin estas habilidades como fracasados o como estudiantes con discapacidades. El engaño generalizado y organizado ha sido una cultura en crecimiento.

El teórico de la educación Bill Ayers ha comentado sobre las limitaciones de la prueba estandarizada y ha escrito que "las pruebas estandarizadas no pueden medir la iniciativa, la creatividad, la imaginación, el pensamiento conceptual, la curiosidad, el esfuerzo, la ironía, el juicio, el compromiso, matiz, buena voluntad, reflexión ética, o una multitud de otras disposiciones y atributos valiosos. Lo que pueden medir y contar son habilidades aisladas, funciones y hechos específicos, conocimiento del contenido, los aspectos menos interesantes y menos significativos del aprendizaje." En su libro, La vergüenza de la nación, Jonathan Kozol argumenta que los estudiantes sometidos a pruebas estandarizadas son víctimas de "decapitación cognitiva". Kozol se da cuenta de esto después de hablar con muchos niños en escuelas del centro de la ciudad que no tienen memoria espacial de tiempo, períodos de tiempo y eventos históricos. Este es especialmente el caso en las escuelas donde, debido a la escasez de fondos y políticas estrictas de rendición de cuentas, las escuelas han eliminado materias como las artes, la historia y la geografía; con el fin de centrarnos en el concurso de las pruebas encomendadas.

Hay tres métricas por las cuales se miden los países con mejor desempeño en el TIMMS (los "países A+"): enfoque, coherencia y rigor. El enfoque se define como el número de temas cubiertos en cada grado; la idea es que cuantos menos temas se cubran en cada grado, más enfoque se le puede dar a cada tema. La definición de coherencia se adhiere a una secuencia de temas cubiertos que sigue la progresión natural o la estructura lógica de las matemáticas. El CCSSM se comparó tanto con los estándares estatales actuales como con los estándares del país A+. Con la mayoría de los temas cubiertos en promedio, los estándares estatales actuales tuvieron el enfoque más bajo. Los Estándares Básicos Comunes tienen como objetivo corregir esta discrepancia al ayudar a los educadores a concentrarse en lo que los estudiantes necesitan aprender en lugar de distraerse con temas extraños. Fomentan que los materiales educativos pasen de cubrir una amplia gama de temas de manera superficial a unos pocos temas con mucha más profundidad.

Tiempo y dinero

Las pruebas estandarizadas son una forma de medir el nivel educativo de los estudiantes y las escuelas a gran escala. Desde el jardín de infantes hasta el grado 12, la mayoría de los estudiantes estadounidenses participan en pruebas estandarizadas anuales. El estudiante promedio toma alrededor de 10 de estas pruebas por año (por ejemplo, una o dos pruebas de comprensión de lectura, una o dos pruebas de matemáticas, una prueba de escritura, una prueba de ciencias, etc.). La cantidad promedio de pruebas toma alrededor del 2.3% del tiempo total de clase (equivalente a alrededor de cuatro días escolares por año).

Las pruebas estandarizadas son costosas de administrar. Se ha informado que Estados Unidos gasta alrededor de 1700 millones de dólares estadounidenses al año en estas pruebas. En 2001, también se informó que solo tres empresas (Harcourt Educational Measurement, CTB McGraw-Hill y Riverside Publishing) diseñan el 96% de las pruebas realizadas a nivel estatal.

Decisiones educativas

Tipos de pruebas
Prueba de bajo consumo Prueba de tomas altas
Prueba estandarizada Una prueba de personalidad en un sitio web Un examen de ingreso educativo para determinar la admisión universitaria
Prueba no estandarizada El maestro pide a cada estudiante que comparta algo que recuerda de sus deberes. El teatro tiene una audición para determinar quién tendrá un papel protagónico.

La gran dependencia de las pruebas estandarizadas de alto impacto para la toma de decisiones suele ser controvertida. Los críticos a menudo proponen enfatizar medidas acumulativas o incluso no numéricas, como calificaciones en el aula o breves evaluaciones individuales (escritas en prosa) de los maestros. Los partidarios argumentan que los puntajes de las pruebas proporcionan un estándar claro y objetivo que sirve como un control valioso sobre la inflación de calificaciones.

La Academia Nacional de Ciencias recomienda que las decisiones educativas importantes no se basen únicamente en una sola calificación de prueba. El uso de puntajes de corte mínimos para el ingreso o la graduación no implica un estándar único, ya que los puntajes de las pruebas casi siempre se combinan con otros criterios mínimos, como la cantidad de créditos, los cursos de requisitos previos, la asistencia, etc. #34;criterio único" simplemente porque son los más difíciles, o se asume automáticamente el cumplimiento de otros criterios. Una excepción a esta regla es el GED, que ha permitido que se reconozcan las habilidades de muchas personas a pesar de que no cumplían con los criterios tradicionales.

Algunos maestros argumentarían que una sola prueba estandarizada solo mide el conocimiento actual de un estudiante y no refleja el progreso de los estudiantes desde el comienzo del año. Un resultado creado por personas que no son parte de la instrucción regular del estudiante, sino por profesionales que determinan lo que los estudiantes deben saber a diferentes edades. Además, los docentes coinciden en que los mejores creadores y facilitadores de pruebas son ellos mismos. Argumentan que son los más conscientes de las habilidades, capacidades y necesidades de los estudiantes que les permitirían tomar más tiempo en las materias o continuar con el plan de estudios regular.

Efectos en los estudiantes desfavorecidos

Monty Neill, director del Centro Nacional para Pruebas Justas y Abiertas, afirma que a los estudiantes que hablan inglés como segundo idioma, que tienen una discapacidad o que provienen de familias de bajos ingresos se les niega un diploma de manera desproporcionada debido a una puntaje de la prueba, lo cual es injusto y dañino. A fines de la década de 1970, cuando comenzó el examen de graduación en los Estados Unidos, por ejemplo, una demanda afirmó que muchos estudiantes negros no habían tenido una oportunidad justa en el material que se les evaluó en el examen de graduación porque habían asistido a escuelas segregadas por ley. "La interacción de las escuelas con escasos recursos y las pruebas afecta más poderosamente a los estudiantes de color", como argumenta Neill, "Se les niegan de manera desproporcionada los diplomas o la promoción de grado, y las escuelas a las que asisten son las que tienen más probabilidades de salir mal en las pruebas y enfrentarse a sanciones como la reestructuración."

En la revista The Progressive, Barbara Miner explica los inconvenientes de las pruebas estandarizadas mediante el análisis de tres libros diferentes. Como codirectora del Centro de Educación de la Universidad de Rice y profesora de educación, Linda M. McNeil en su libro Contradictions of School Reform: Educational Costs of Standardized Testing escribe "Educational standardization daña la enseñanza y el aprendizaje y, a largo plazo, reestratifica la educación por raza y clase." McNeil cree que la reforma educativa basada en pruebas establece estándares más altos para los estudiantes de color. Según Miner, McNeil "muestra cómo la reforma basada en pruebas centraliza el poder en manos de la élite corporativa y política, un desarrollo particularmente aterrador durante este tiempo de creciente influencia corporativa y conservadora sobre la reforma educativa". Tal reforma basada en pruebas ha simplificado el aprendizaje, especialmente para los estudiantes de color.

FairTest dice que las consecuencias negativas del mal uso de las pruebas incluyen expulsar a los estudiantes de la escuela, expulsar a los maestros de la profesión y socavar la participación de los estudiantes y el clima escolar.

Uso de pruebas estandarizadas en admisiones universitarias en Estados Unidos

Las universidades revisan las pruebas estandarizadas como parte de la solicitud, junto con otra evidencia de respaldo, como declaraciones personales, GPA y cartas de recomendación. Nathan Kuncel, un erudito de educación superior, notó que en la admisión a la universidad, SAT, ACT y otras pruebas estandarizadas 'ayudan a los oficiales de admisiones abrumados a dividir enormes cantidades de solicitantes en grupos para una evaluación adicional. Los puntajes altos no garantizan la admisión en ningún lugar, y los puntajes bajos no lo descartan, pero las escuelas se toman los exámenes con seriedad."

La investigación muestra que las pruebas predicen más que solo las calificaciones del primer año y el nivel de los cursos que probablemente tomará un estudiante. La investigación longitudinal realizada por científicos muestra que los estudiantes con puntajes altos en las pruebas tienen más probabilidades de tomar el camino desafiante hacia la universidad. Las pruebas también pueden indicar los resultados de los estudiantes más allá de la universidad, incluidas las evaluaciones de la facultad, los logros de investigación, la obtención de títulos, el desempeño en exámenes integrales y la obtención de licencias profesionales.

Dado que el GPA tiene diferencias entre las escuelas e incluso para dos estudiantes en la misma escuela, la medida común proporcionada por el puntaje de la prueba es más útil.

Sin embargo, en un "metanálisis" de abril de 1995 publicado en el Journal of Educational and Psychological Measurement, Todd Morrison y Melanie Morrison examinaron dos docenas de estudios de validez de la prueba requerida para ingresar a casi cualquier programa de maestría o doctorado en Estados Unidos: el Graduate Record Examination (GRE). Este estudio abarcó a más de 5,000 examinados en los últimos 30 años. Los autores encontraron que los puntajes GRE representaron solo el 6 por ciento de la variación en las calificaciones en la escuela de posgrado. El GRE parece ser "prácticamente inútil desde el punto de vista de la predicción" escribieron los autores. Los estudios repetidos de la Prueba de Admisión a la Facultad de Derecho (LSAT) encuentran lo mismo.

Existe un debate sobre si la prueba indicará el éxito a largo plazo en el trabajo y en la vida, ya que hay muchos otros factores, pero las habilidades fundamentales como la lectura, la escritura y las matemáticas están relacionadas con el desempeño laboral.

Una investigación longitudinal realizada en 2007 demostró que los principales logros de la vida, como publicar una novela o patentar una tecnología, también están asociados con los puntajes de las pruebas, incluso después de tener en cuenta las oportunidades educativas. Incluso existe una cantidad considerable de evidencia de que estas habilidades están relacionadas con el liderazgo efectivo y los logros creativos en el trabajo. Ser capaz de leer textos y darles sentido y tener un fuerte razonamiento cuantitativo son cruciales en la economía de la información moderna.

Muchos argumentos sugieren que las habilidades de las pruebas son útiles, pero solo hasta cierto punto.

Sin embargo, un notable estudio longitudinal publicado en 2008 en la revista Psychological Science examinó a los estudiantes que obtuvieron puntajes en el 1 % superior a la edad de 13 años. Veinte años después, tenían, en promedio, un rendimiento muy alto, con ingresos altos, importantes premios y logros profesionales que enorgullecerían a cualquier padre.

Los oficiales de admisiones se basan en una combinación de materiales de solicitud, incluidas cartas de recomendación, entrevistas, ensayos de estudiantes, GPA, pruebas y declaraciones personales para evaluar al estudiante de manera integral. Sin embargo, la mayoría de estas herramientas no son garantía de éxito futuro. Los problemas con las entrevistas tradicionales y las cartas de recomendación son tan generalizados que muchas escuelas están buscando mejores opciones.

Existe una correlación entre los puntajes de las pruebas y la clase social, pero el éxito en las pruebas estandarizadas y en la universidad no depende simplemente de la clase. Los estudios muestran que "las pruebas fueron válidas incluso cuando se controló por clase socioeconómica. Independientemente de sus antecedentes familiares, los estudiantes con buenos puntajes en las pruebas y calificaciones de la escuela secundaria obtienen mejores resultados en la universidad que los estudiantes con puntajes más bajos y calificaciones más débiles."

Otra crítica relacionada con la clase social y las pruebas estandarizadas es que solo las personas adineradas reciben preparación y entrenamiento para las pruebas. Sin embargo, "los investigadores han realizado una combinación de estudios experimentales y estudios de campo controlados para probar esta pregunta. En general, han llegado a la conclusión de que las ganancias debidas a la preparación para exámenes son más del orden de 5 a 20 puntos y no los 100 a 200 puntos que afirman algunas empresas de preparación para exámenes."

Más importante aún, muchas personas opinan que las pruebas impiden la diversidad en las admisiones, ya que las minorías tienen puntajes más bajos en las pruebas en comparación con otros grupos representados. Un estudio de 2012 analizó las escuelas donde las pruebas de admisión son opcionales para los solicitantes y las comparó con las escuelas que usan las pruebas, y el resultado muestra que "investigaciones recientes demuestran que las escuelas con pruebas opcionales han estado inscribiendo cuerpos estudiantiles cada vez más diversos". Pero lo mismo ocurre con las escuelas que exigen pruebas."

Los opositores afirman que las pruebas estandarizadas se usan incorrectamente y son juicios acríticos de inteligencia y desempeño, pero los partidarios argumentan que estos no son aspectos negativos de las pruebas estandarizadas, sino críticas a los regímenes de prueba mal diseñados. Argumentan que las pruebas deben centrar los recursos educativos en los aspectos más importantes de la educación, impartir un conjunto predefinido de conocimientos y habilidades, y que otros aspectos son menos importantes o deben agregarse al esquema de pruebas.

La evidencia muestra que, en promedio, los estudiantes negros e hispanos obtienen calificaciones más bajas que los blancos y los asiáticos. Por lo tanto, las pruebas estándar de matemáticas y lectura, como el SAT, se han enfrentado a ataques crecientes de los progresivos. Sin embargo, un informe exhaustivo del senado de la facultad de la UC, encargado por la Sra. Napolitano y publicado en 2020, encontró que las pruebas no son discriminatorias y juegan un papel importante en la protección de la calidad educativa.

El informe sugirió que el empeoramiento de la inflación de calificaciones, especialmente en las escuelas secundarias ricas, hace que una evaluación estándar sea especialmente importante.

Con respecto a las escuelas de la UC' intención de eliminar las pruebas estándar como SAT y ACT en las admisiones universitarias, las pruebas subjetivas y personalizadas como ensayos y extracurriculares pueden adaptarse fácilmente y ser perjudiciales para los estudiantes que no están familiarizados con el proceso. Las admisiones sin pruebas pueden inclinarse aún más a favor de los que tienen buenas conexiones.

En enero de 2020, el cuerpo docente de la Universidad de California recomendó que el sistema de la UC mantuviera las pruebas estandarizadas como requisitos de admisión. El informe dice que las pruebas estandarizadas de matemáticas y lectura son útiles para predecir el rendimiento universitario. Con base en los datos de los estudiantes del sistema de la UC, el informe concluye que "los puntajes de las pruebas actualmente predicen mejor el GPA del primer año que el promedio de calificaciones de la escuela secundaria". El informe continúa: los puntajes también son buenos para predecir el GPA total de la universidad y la posibilidad de que un estudiante se gradúe. Si bien el "poder predictivo de los puntajes de las pruebas ha aumentado," el informe agrega, "el poder predictivo de las calificaciones de la escuela secundaria ha disminuido".

Los puntajes de las pruebas permiten a las escuelas de la UC "seleccionar a aquellos estudiantes de grupos subrepresentados que tienen más probabilidades de obtener calificaciones más altas y graduarse a tiempo". "La intención original del SAT era identificar a los estudiantes que provenían de círculos relativamente privilegiados que pudieran tener el potencial para tener éxito en la universidad" dice el informe. El fabricante del SAT, el Servicio de Pruebas Educativas (ETS), ahora afirma que el SAT no es una prueba de "aptitud" sino más bien una evaluación de las "habilidades desarrolladas".

Exámenes para estudiantes de color, aquellos con discapacidades y aquellos de comunidades de bajos ingresos en los Estados Unidos

Controversia

Las pruebas estandarizadas y el requisito de dichas pruebas para la admisión a la universidad es un tema controvertido. La razón de la controversia es que estas pruebas pueden crear oportunidades desiguales para los estudiantes según su situación económica, raza o incluso su capacidad. Es común que los estudiantes de color, aquellos con discapacidades y aquellos de comunidades de bajos ingresos tengan bajas tasas de rendimiento estudiantil. Lo más probable es que esto se deba a "generaciones de políticas económicas, educativas y de vivienda excluyentes". Estas brechas de rendimiento no son un concepto nuevo. En 1991, la brecha entre las puntuaciones promedio de los estudiantes blancos y las de los estudiantes negros era de 0,91 desviaciones estándar, mientras que en 2020 la brecha había disminuido a 0,79 desviaciones estándar.

Costo de tomar las pruebas

Las pruebas estandarizadas pueden ser costosas para los estudiantes, tanto en los cursos de preparación/tutores como en la realización de la prueba. El ACT y el SAT pueden costar entre $55 y $70 y entre $52 y $68, respectivamente. Muchos estudiantes que pueden darse el lujo de terminar tomando las pruebas varias veces para ver el mejor puntaje que pueden obtener, y enviarán "super puntajes" o una puntuación que consta de sus mejores puntuaciones de cada sección. Los estudiantes de comunidades de bajos ingresos no siempre pueden darse el lujo de tomar el examen varias veces.

Costo de preparación para exámenes

Los estudiantes de comunidades de bajos ingresos a menudo no tienen los mismos recursos para la preparación de exámenes que tienen sus compañeros de entornos más ricos. Esta discrepancia en los recursos disponibles hace que haya una diferencia significativa en los puntajes de los estudiantes de diferentes orígenes raciales. En un análisis realizado por la Institución Brookings, se encontró que el 59 % de los estudiantes blancos y el 80 % de los asiáticos que tomaron el examen se consideran "preparados para la universidad" según los estándares del SAT en comparación con menos del 25 % de los estudiantes negros y menos del 33 % de los estudiantes hispanos/latinos que se consideran "preparados para la universidad". Si bien el College Board informa que los factores socioeconómicos no afectan directamente el desempeño de un estudiante, pueden afectarlo indirectamente a través del curso de acceso a cursos de preparación y una mejor educación, experiencias que pueden tener un gran impacto en los puntajes de las pruebas.

Estudiantes con discapacidades

Cuando se trata de estudiantes con discapacidades y necesidades especiales, estas pruebas no siempre son un método apropiado para medir el conocimiento o la preparación. Para los estudiantes con discapacidades, no siempre es realista esperar que se sienten en un escritorio durante horas y tomen un examen en silencio. Para refutar eso, los estudiantes con discapacidades pueden obtener adaptaciones, como tiempo adicional para trabajar en las pruebas.

Contenido relacionado

Universidad de Ingolstadt

La Universidad de Ingolstadt fue fundada en 1472 por Luis el Rico, entonces duque de Baviera, y su primer canciller fue el obispo de Eichstätt. Constaba de...

Skolelinux

Skolelinux/Debian-Edu es una distribución de Linux destinada a uso educativo y Debian Pure Blend. El proyecto de software libre y de código abierto se...

Universidad del Pacífico de Seattle

Seattle Pacific University es una universidad cristiana privada en Seattle, Washington. Fue fundado en 1891 junto con la Conferencia de Oregon y Washington de...
Más resultados...