Pruebas de usabilidad

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Técnica en diseño de interacción centrado en el usuario

Las pruebas de usabilidad son una técnica utilizada en el diseño de interacción centrado en el usuario para evaluar un producto probándolo en los usuarios. Esto puede verse como una práctica de usabilidad insustituible, ya que brinda información directa sobre cómo los usuarios reales usan el sistema. Está más preocupado por la intuición del diseño del producto y probado con usuarios que no han tenido una exposición previa a él. Dichas pruebas son fundamentales para el éxito de un producto final, ya que una aplicación en pleno funcionamiento que crea confusión entre sus usuarios no durará mucho. Esto contrasta con los métodos de inspección de usabilidad en los que los expertos utilizan diferentes métodos para evaluar una interfaz de usuario sin involucrar a los usuarios.

Las pruebas de usabilidad se centran en medir la capacidad de un producto hecho por humanos para cumplir con los propósitos previstos. Ejemplos de productos que comúnmente se benefician de las pruebas de usabilidad son alimentos, productos de consumo, sitios web o aplicaciones web, interfaces de computadora, documentos y dispositivos. Las pruebas de usabilidad miden la usabilidad, o la facilidad de uso, de un objeto o conjunto de objetos específicos, mientras que los estudios generales de interacción humano-computadora intentan formular principios universales.

Lo que no es

Simplemente recopilar opiniones sobre un objeto o un documento es una investigación de mercado o una investigación cualitativa en lugar de una prueba de usabilidad. Las pruebas de usabilidad generalmente implican la observación sistemática en condiciones controladas para determinar qué tan bien las personas pueden usar el producto. Sin embargo, a menudo, tanto la investigación cualitativa como las pruebas de usabilidad se usan en combinación para comprender mejor a los usuarios. motivaciones/percepciones, además de sus acciones.

En lugar de mostrar a los usuarios un borrador y preguntar "¿Entiendes esto?", las pruebas de usabilidad consisten en observar a las personas que intentan usar algo para el propósito previsto. Por ejemplo, cuando se prueban las instrucciones para ensamblar un juguete, los sujetos de prueba deben recibir las instrucciones y una caja de piezas y, en lugar de pedirles que comenten sobre las piezas y los materiales, se les debe pedir que armen el juguete. La redacción de las instrucciones, la calidad de la ilustración y el diseño del juguete afectan el proceso de ensamblaje.

Métodos

Configurar una prueba de usabilidad implica crear cuidadosamente un escenario, o una situación realista, en la que la persona realiza una lista de tareas utilizando el producto que se está probando mientras los observadores observan y toman notas (verificación dinámica). También se utilizan varios otros instrumentos de prueba, como instrucciones escritas, prototipos en papel y cuestionarios previos y posteriores a la prueba, para recopilar comentarios sobre el producto que se está probando (verificación estática). Por ejemplo, para probar la función de archivo adjunto de un programa de correo electrónico, un escenario describiría una situación en la que una persona necesita enviar un archivo adjunto de correo electrónico y pedirle que realice esta tarea. El objetivo es observar cómo funcionan las personas de manera realista, para que los desarrolladores puedan identificar las áreas problemáticas y solucionarlas. Las técnicas comúnmente utilizadas para recopilar datos durante una prueba de usabilidad incluyen el protocolo de pensar en voz alta, el aprendizaje por descubrimiento conjunto y el seguimiento ocular.

Pruebas de pasillo

Hallway testing, también conocido como usabilidad de guerrilla, es un método rápido y económico de prueba de usabilidad en el que se pregunta a las personas, como las que pasan por el pasillo. para intentar usar el producto o servicio. Esto puede ayudar a los diseñadores a identificar "paredes de ladrillo" problemas tan serios que los usuarios simplemente no pueden avanzar, en las primeras etapas de un nuevo diseño. Se puede utilizar a cualquier persona excepto a los diseñadores e ingenieros de proyectos (suelen actuar como "revisores expertos" porque están demasiado cerca del proyecto).

Este tipo de prueba es un ejemplo de muestreo de conveniencia y, por lo tanto, los resultados pueden estar sesgados.

Pruebas de usabilidad remotas

En un escenario en el que los evaluadores de usabilidad, los desarrolladores y los posibles usuarios se encuentran en diferentes países y zonas horarias, realizar una evaluación de usabilidad de laboratorio tradicional crea desafíos tanto desde el punto de vista logístico como de costos. Estas preocupaciones llevaron a la investigación sobre la evaluación remota de la usabilidad, con el usuario y los evaluadores separados en el espacio y el tiempo. Las pruebas remotas, que facilitan la realización de evaluaciones en el contexto de otras tareas y tecnología del usuario, pueden ser sincrónicas o asincrónicas. El primero implica una comunicación uno a uno en tiempo real entre el evaluador y el usuario, mientras que el segundo implica que el evaluador y el usuario trabajen por separado. Numerosas herramientas están disponibles para abordar las necesidades de estos dos enfoques.

Las metodologías de prueba de usabilidad síncrona implican videoconferencias o emplean herramientas remotas para compartir aplicaciones como WebEx. WebEx y GoToMeeting son las tecnologías más utilizadas para realizar una prueba de usabilidad remota síncrona. Sin embargo, las pruebas remotas síncronas pueden carecer de la inmediatez y la sensación de "presencia" deseado para apoyar un proceso de prueba colaborativo. Además, la gestión de la dinámica interpersonal a través de las barreras culturales y lingüísticas puede requerir enfoques sensibles a las culturas involucradas. Otras desventajas incluyen tener un control reducido sobre el entorno de prueba y las distracciones e interrupciones experimentadas por los participantes en su entorno nativo. Uno de los métodos más nuevos desarrollados para realizar una prueba de usabilidad remota síncrona es mediante el uso de mundos virtuales.

Las metodologías asincrónicas incluyen la recopilación automática de flujos de clics de los usuarios, registros de usuarios de incidentes críticos que ocurren mientras interactúan con la aplicación y comentarios subjetivos sobre la interfaz por parte de los usuarios. Similar a un estudio en el laboratorio, una prueba de usabilidad remota asincrónica se basa en tareas y la plataforma permite a los investigadores capturar clics y tiempos de tareas. Por lo tanto, para muchas grandes empresas, esto permite a los investigadores comprender mejor a los visitantes. intenciones al visitar un sitio web o un sitio móvil. Además, este estilo de prueba de usuario también brinda la oportunidad de segmentar los comentarios por tipo demográfico, de actitud y de comportamiento. Las pruebas se llevan a cabo en el propio entorno del usuario (en lugar de laboratorios), lo que ayuda a simular aún más las pruebas de escenarios de la vida real. Este enfoque también proporciona un vehículo para solicitar fácilmente la retroalimentación de los usuarios en áreas remotas de forma rápida y con gastos generales de organización más bajos. En los últimos años, la realización de pruebas de usabilidad de forma asincrónica también se ha vuelto frecuente y permite a los evaluadores proporcionar comentarios en su tiempo libre y desde la comodidad de su hogar.

Revisión de expertos

La revisión de expertos es otro método general de prueba de usabilidad. Como sugiere el nombre, este método se basa en traer expertos con experiencia en el campo (posiblemente de empresas que se especializan en pruebas de usabilidad) para evaluar la usabilidad de un producto.

Una evaluación heurística o auditoría de usabilidad es una evaluación de una interfaz por parte de uno o más expertos en factores humanos. Los evaluadores miden la usabilidad, la eficiencia y la eficacia de la interfaz según los principios de usabilidad, como las 10 heurísticas de usabilidad definidas originalmente por Jakob Nielsen en 1994.

Las heurísticas de usabilidad de Nielsen, que han seguido evolucionando en respuesta a la investigación de los usuarios y los nuevos dispositivos, incluyen:

Visibilidad del estado del sistema
Coincide entre el sistema y el mundo real
Control de usuario y libertad
Consistencia y normas
Prevención de errores
Reconocimiento en lugar de recordar
Flexibilidad y eficiencia del uso
Diseño estética y minimalista
Ayuda a los usuarios a reconocer, diagnosticar y recuperarse de errores
Ayuda y documentación

Revisión automática de expertos

De manera similar a las revisiones de expertos, las revisiones de expertos automatizadas brindan pruebas de usabilidad, pero a través del uso de programas que establecen reglas para un buen diseño y heurística. Aunque es posible que una revisión automatizada no brinde tantos detalles y conocimientos como las revisiones de personas, se pueden terminar de manera más rápida y consistente. La idea de crear usuarios sustitutos para las pruebas de usabilidad es una dirección ambiciosa para la comunidad de inteligencia artificial.

Pruebas A/B

En marketing y desarrollo web, las pruebas A/B o pruebas divididas son un enfoque experimental del diseño web (especialmente el diseño de la experiencia del usuario), cuyo objetivo es identificar cambios en las páginas web que aumentan o maximizan un resultado de interés (por ejemplo, hacer clic en -tasa de transferencia para un anuncio de banner). Como su nombre lo indica, se comparan dos versiones (A y B), que son idénticas excepto por una variación que podría afectar el comportamiento del usuario. La versión A podría ser la que se usa actualmente, mientras que la versión B se modifica en algún aspecto. Por ejemplo, en un sitio web de comercio electrónico, el embudo de compra suele ser un buen candidato para las pruebas A/B, ya que incluso las mejoras marginales en las tasas de abandono pueden representar una ganancia significativa en las ventas. Se pueden ver mejoras significativas a través de elementos de prueba como copiar texto, diseños, imágenes y colores.

Las pruebas multivariantes o pruebas de cubo son similares a las pruebas A/B, pero prueban más de dos versiones al mismo tiempo.

Número de participantes

A principios de la década de 1990, Jakob Nielsen, en ese momento investigador de Sun Microsystems, popularizó el concepto de usar numerosas pruebas pequeñas de usabilidad, generalmente con solo cinco participantes cada una, en varias etapas del proceso de desarrollo. Su argumento es que, una vez que se descubre que dos o tres personas están totalmente confundidas con la página de inicio, poco se gana viendo a más personas sufrir por el mismo diseño defectuoso. "Las pruebas de usabilidad elaboradas son un desperdicio de recursos. Los mejores resultados provienen de probar no más de cinco usuarios y ejecutar tantas pruebas pequeñas como pueda pagar."

La afirmación de "Cinco usuarios es suficiente" fue descrito más tarde por un modelo matemático que establece la proporción de problemas descubiertos U

$U=1-(1-p)^{n}$

donde p es la probabilidad de que un sujeto identifique un problema específico yn el número de sujetos (o sesiones de prueba). Este modelo se muestra como un gráfico asintótico hacia el número de problemas reales existentes (ver figura a continuación).

En investigaciones posteriores, se cuestionó la afirmación de Nielsen utilizando evidencia empírica y modelos matemáticos más avanzados. Dos desafíos clave a esta afirmación son:

Puesto que la usabilidad está relacionada con el conjunto específico de usuarios, es poco probable que un tamaño de muestra tan pequeño sea representativo de la población total, por lo que los datos de tal pequeña muestra es más probable que reflejen el grupo de muestra que la población que representan
No todo problema de usabilidad es igualmente fácil de detectar. Los problemas intratables resultan desacelerar el proceso general. En estas circunstancias, el progreso del proceso es mucho más profundo que lo previsto por la fórmula Nielsen/Landauer.

Vale la pena señalar que Nielsen no recomienda detenerse después de una sola prueba con cinco usuarios; su punto es que probar con cinco usuarios, solucionar los problemas que descubren y luego probar el sitio revisado con cinco usuarios diferentes es un mejor uso de los recursos limitados que ejecutar una sola prueba de usabilidad con 10 usuarios. En la práctica, las pruebas se ejecutan una o dos veces por semana durante todo el ciclo de desarrollo, utilizando de tres a cinco sujetos de prueba por ronda, y los resultados se entregan dentro de las 24 horas a los diseñadores. El número de usuarios realmente evaluados durante el transcurso del proyecto puede llegar fácilmente a 50 a 100 personas. La investigación muestra que las pruebas de usuarios realizadas por organizaciones suelen implicar el reclutamiento de 5 a 10 participantes.

En la etapa inicial, cuando es más probable que los usuarios encuentren inmediatamente problemas que los detengan en seco, casi cualquier persona de inteligencia normal puede usarse como sujeto de prueba. En la etapa dos, los evaluadores reclutarán sujetos de prueba en un amplio espectro de habilidades. Por ejemplo, en un estudio, los usuarios experimentados no mostraron ningún problema al usar ningún diseño, desde el primero hasta el último, mientras que los usuarios ingenuos y los usuarios avanzados autoidentificados fallaron repetidamente. Más tarde, a medida que el diseño se suaviza, los usuarios deben ser reclutados de la población objetivo.

Cuando el método se aplica a un número suficiente de personas en el transcurso de un proyecto, las objeciones planteadas anteriormente se resuelven: el tamaño de la muestra deja de ser pequeño y se encuentran problemas de usabilidad que surgen con usuarios ocasionales. El valor del método radica en el hecho de que los problemas de diseño específicos, una vez encontrados, nunca se vuelven a ver porque se eliminan de inmediato, mientras que las partes que parecen exitosas se prueban una y otra vez. Si bien es cierto que los problemas iniciales en el diseño pueden ser probados por solo cinco usuarios, cuando el método se aplica correctamente, las partes del diseño que funcionaron en esa prueba inicial pasarán a ser probadas por 50 a 100 gente.

Ejemplo

Un manual de Apple Computer de 1982 para desarrolladores aconsejaba sobre las pruebas de usabilidad:

"Selecciona al público objetivo. Comience su diseño de interfaz humana identificando a su público objetivo. ¿Está escribiendo para empresarios o niños?"
Determina cuántos usuarios de destino saben acerca de las computadoras de Apple, y el tema del software.
Pasos 1 y 2 permiten diseñar la interfaz de usuario para satisfacer las necesidades del público objetivo. El software de preparación fiscal escrito para los contadores puede suponer que sus usuarios no saben nada sobre las computadoras, pero son expertos en el código tributario, mientras que tal software escrito para los consumidores puede suponer que sus usuarios no saben nada sobre impuestos pero están familiarizados con los fundamentos de las computadoras de Apple.

Apple aconsejó a los desarrolladores: "Deben comenzar las pruebas lo antes posible, usando amigos, familiares y nuevos empleados seleccionados":

Nuestro método de prueba es el siguiente. Hemos establecido una habitación con cinco a seis sistemas informáticos. Planificamos dos a tres grupos de cinco a seis usuarios a la vez para probar los sistemas (a menudo sin saber que es el software en lugar del sistema que estamos probando). Tenemos dos de los diseñadores en la habitación. Cada vez menos, y pierden mucho de lo que está pasando. Cada vez más y los usuarios sienten que siempre hay alguien respirando sus cuellos.

Los diseñadores deben ver a la gente usar el programa en persona, porque

El noventa y cinco por ciento de los bloques de tropiezo se encuentran viendo el lenguaje corporal de los usuarios. Cuidado con los ojos inclinados, los hombros acolchados, las cabezas temblantes y los suspiros profundos y de corazón. Cuando un usuario golpea un snag, asumirá que es "porque no es demasiado brillante": no lo reportará; lo esconderá... No haga suposiciones sobre por qué un usuario se confundió. Pregúntale. A menudo te sorprenderá saber lo que el usuario pensó que el programa estaba haciendo en el momento en que se perdió.

Educación

Las pruebas de usabilidad han sido un tema formal de instrucción académica en diferentes disciplinas. Las pruebas de usabilidad son importantes para los estudios de composición y la instrucción de escritura en línea (OWI). El académico Collin Bjork argumenta que las pruebas de usabilidad son "necesarias pero insuficientes para desarrollar OWI efectivo, a menos que también se combinen con las teorías de la retórica digital".

Contenido relacionado

Más resultados...