Cuando desea comparar varias interfaces de usuario en un solo estudio, hay dos formas de asignar a los participantes de la prueba a estas múltiples condiciones:
- Diseño del estudio entre sujetos (o entre grupos): diferentes personas prueban cada condición, de modo que cada persona solo esté expuesta a una única interfaz de usuario.
- Diseño del estudio dentro de los sujetos (o medidas repetidas): la misma persona prueba todas las condiciones (es decir, todas las interfaces de usuario).,
(tenga en cuenta que aquí usamos la palabra «diseño» para referirse al diseño del experimento, y no al diseño del sitio web.)
por ejemplo, si quisiéramos comparar dos sitios de alquiler de coches A y B observando cómo los participantes reservan coches en cada sitio, nuestro estudio podría diseñarse de dos maneras diferentes, ambas perfectamente legítimas:
- Entre temas: cada participante podría probar un solo sitio de alquiler de coches y reservar un coche solo en ese sitio.
- Dentro de los sujetos: cada participante podría probar ambos sitios de alquiler de automóviles y reservar un automóvil en cada uno.,
cualquier tipo de investigación de usuario que involucre más de una sola condición de prueba tiene que determinar si debe ser entre sujetos o dentro de los sujetos. Sin embargo, la distinción es particularmente importante para los estudios cuantitativos.
diseño Experimental en estudios cuantitativos
a diferencia de los estudios cualitativos, los estudios cuantitativos de usabilidad tienen como objetivo dar lugar a hallazgos que son estadísticamente propensos a generalizarse a toda la población de usuarios. La forma en que se analizan los datos de dichos estudios depende de la forma en que se diseñó el estudio (es decir, del diseño experimental del estudio).,
a menudo, el objetivo principal de los estudios cuantitativos de usabilidad es comparar-un sitio con sus competidores, dos iteraciones diferentes de un diseño, o dos grupos diferentes de usuarios (como expertos vs.novatos)., Como en cualquier experimento científico en el que queremos detectar relaciones causales, un estudio cuantitativo involucra dos tipos de variables:
- variables independientes, que son directamente manipuladas por el investigador
- variables dependientes, que son medidas (y se espera que varíen como resultado de la manipulación de la variable independiente)
(si el estudio produce resultados estadísticamente significativos, entonces podemos decir que un cambio en la variable independiente causó un cambio en la variable dependiente.)
volvamos a nuestro ejemplo original de alquiler de coches., Si quisiéramos medir cuál de los dos sitios, A O B, es mejor para la tarea de reservar un automóvil, podríamos elegir el sitio (con dos posibles valores o niveles — A y B) como variable independiente, y el tiempo en la tarea y la precisión para reservar un automóvil podrían ser las variables dependientes. El objetivo del estudio sería ver si las variables dependientes (tiempo y precisión) cambian cuando variamos el sitio o permanecen iguales. (Si se mantienen iguales, entonces ninguno de los sitios es mejor que el otro.,)
para planificar nuestro estudio, la siguiente pregunta que debemos responder es si el diseño del estudio debe ser entre sujetos o dentro de los sujetos, es decir, si un participante en el estudio debe estar expuesto a todas las diferentes condiciones para la variable independiente en nuestro estudio (dentro de los sujetos) o solo a una condición (entre los sujetos). La elección del diseño experimental afectará el tipo de análisis estadístico que se debe utilizar en sus datos.,
es posible que un diseño de experimento es tanto dentro de los sujetos y entre sujetos. Por ejemplo, supongamos que, en el caso de nuestro estudio de alquiler de automóviles, también estábamos interesados en saber cómo se desempeñan los participantes menores de 30 años en comparación con los participantes mayores. En este caso tendríamos dos variables independientes:
- edad, con 2 niveles: menos de 30, más de 30
- sitio, con 2 niveles: a y B
para el estudio, reclutaremos un número igual de participantes en cada grupo de edad., Supongamos que decidimos que cada participante, ya sea menor o mayor de 30 años, hará una reserva de alquiler de automóviles tanto en el sitio a como en el sitio B. en este caso, el estudio está dentro de los sujetos con respecto al sitio variable independiente (porque cada persona ve ambos niveles de esta variable, es decir, tanto el sitio a como el sitio B). Sin embargo, el estudio es entre sujetos con respecto a la edad: una persona solo puede estar en un solo grupo de edad (ya sea menor o mayor de 30 años, no ambos)., (Bueno, técnicamente, se podría elegir un grupo de menores de 30 años y esperar hasta que cumplan 30 para que prueben los sitios de nuevo, pero esta configuración es muy poco práctica para la mayoría de las situaciones del mundo real.)
algunas variables independientes pueden imponer la elección del diseño. La edad es uno de ellos, como se ha visto anteriormente. Otros son la experiencia (si queremos comparar expertos y novatos), el tipo de Usuario (si queremos comparar diferentes grupos de usuarios o personas — por ejemplo, viajero de negocios vs.viajero de ocio), o el género (suponiendo que una persona no puede ser de varios géneros al mismo tiempo)., Fuera de la usabilidad, Los ensayos de medicamentos son un caso común de diseño entre sujetos: los participantes están expuestos a un solo tratamiento: ya sea el medicamento que se está probando o un placebo, no ambos. Y a veces la manipulación misma cambia el estado del participante: por ejemplo, si quieres ver cuál de los dos currículos es más efectivo para enseñar lectura, no podrías tener al mismo estudiante expuesto a ambos, porque una vez que ha aprendido a leer, no puede desaprenderlo.
¿Qué es mejor: entre sujetos o dentro de los sujetos?
Desafortunadamente, no hay una respuesta fácil a esta pregunta., Como se ha visto anteriormente, a veces sus variables independientes dictarán el diseño experimental. Pero en muchas situaciones, ambos diseños pueden ser posibles.
- Between-subjects minimiza el aprendizaje y la transferencia entre Condiciones. Después de que una persona ha completado una serie de tareas en un sitio de alquiler de automóviles, ella está más informada sobre el dominio de lo que estaba antes. Por ejemplo, ahora puede saber que los sitios de alquiler de autos cobran una tarifa adicional para los conductores menores de 21 años, o lo que es una exención de daños por colisión., Ese conocimiento probablemente la ayudará a ser más eficiente en un segundo sitio de alquiler de automóviles, a pesar de que ese segundo sitio puede ser muy diferente del primero.
con el diseño entre sujetos, esta transferencia de conocimiento no es un problema: los participantes nunca están expuestos a varios niveles de la misma variable independiente.
- Los estudios entre sujetos tienen sesiones más cortas que dentro de los sujetos. Un participante que pruebe un solo sitio de alquiler de autos tendrá una sesión más corta que uno que pruebe dos., Las sesiones más cortas son menos agotadoras (o aburridas) para los usuarios, y también pueden ser más apropiadas para pruebas remotas no moderadas (especialmente porque herramientas como UserZoom generalmente requieren una duración de sesión bastante corta).
- Los experimentos entre sujetos son más fáciles de configurar, especialmente cuando tiene múltiples variables independientes. Cuando el estudio está dentro de los sujetos, tendrá que usar la aleatorización de sus estímulos para asegurarse de que no haya efectos de orden. Por ejemplo, en nuestro estudio de alquiler de autos, necesitamos asegurarnos de que los participantes no siempre comiencen con el sitio A y luego pasen al sitio B., El orden de los sitios debe ser aleatorio para cada participante. Esto es fácil con solo dos sitios: asignar aleatoriamente el 50% de los usuarios para comenzar con cada sitio. Pero a medida que aumenta el número de variables independientes y de niveles para una variable independiente, la aleatorización se vuelve más difícil de implementar dentro de algunas de las plataformas existentes para pruebas de usabilidad cuantitativas.
- Los diseños dentro de la asignatura requieren menos participantes y son más baratos de ejecutar., Para detectar una diferencia estadísticamente significativa entre dos condiciones, a menudo necesitará un número justo de puntos de datos (a menudo por encima de 30) en cada condición. Si tiene un diseño dentro de la asignatura, cada participante proporcionará un punto de datos para cada nivel de la variable independiente. Para nuestro estudio de alquiler de coches, 30 participantes proporcionarán puntos de datos para ambos sitios. Pero si el estudio es entre sujetos, necesitará el doble para obtener el mismo número de puntos de datos. Eso significa el doble de costo.
- El diseño dentro de los sujetos minimiza el ruido aleatorio., Tal vez la ventaja más importante de los diseños dentro del sujeto es que hacen que sea menos probable que una diferencia real que existe entre sus condiciones permanezca sin ser detectada o sea cubierta por ruido aleatorio.
los participantes individuales aportan a la prueba su propia historia, conocimiento de fondo y contexto. Uno puede estar cansado después de una larga noche de fiesta, otro puede estar aburrido, otro puede haber recibido una gran noticia justo antes del estudio y ser feliz. Si el mismo participante interactúa con todos los niveles de una variable, Los afectará de la misma manera., La persona feliz será feliz en ambos sitios, el cansado estará cansado en ambos. Pero si el estudio es entre sujetos, el participante feliz solo interactuará con un sitio y puede afectar los resultados finales. Tendrás que asegurarte de tener una participante feliz similar en el otro grupo para contrarrestar sus efectos.
en la práctica, los investigadores no podrán evaluar tales diferencias entre los participantes; aunque pueden coincidir con el género, la experiencia y la edad de los grupos, será difícil predecir o detectar otros factores específicos de cada participante.,
aleatorización: esencial para ambos tipos de diseño
ya sea que su diseño experimental sea dentro de los sujetos o entre sujetos, tendrá que preocuparse por la aleatorización, aunque de maneras ligeramente diferentes.
anteriormente, discutimos por qué la aleatorización es importante en los diseños dentro del sujeto: contrarresta los posibles efectos de orden y minimiza la transferencia y el aprendizaje a través de las condiciones.,
para los diseños entre asignaturas, debe asegurarse de que los participantes se asignen aleatoriamente a las condiciones, porque desea asegurarse de que su asignación de participante no afecte los resultados de su estudio., Por lo tanto, si un investigador decide que todos los participantes que le gustan deben interactuar con el sitio a y luego encuentra que el sitio a se desempeñó mejor que el sitio B, no sabrá si ha descubierto una verdadera diferencia entre los sitios o si el resultado simplemente refleja su asignación (por ejemplo, porque las personas que sienten que les gusta tienden a devolver el favor, y pueden ser más pacientes o tener una mentalidad positiva durante la prueba).
incluso sin un sesgo tan obvio como tus preferencias personales, es fácil equivocarse en la aleatorización., Digamos que realizas un estudio durante cuatro días, de sábado a martes. Es posible que decida que la primera mitad de los usuarios de prueba comiencen con el sitio A y que la segunda mitad de los usuarios comiencen con el sitio B. Sin embargo, esto no es una verdadera aleatorización, porque es muy probable que ciertos tipos de personas tengan más probabilidades de estar de acuerdo con un estudio durante el fin de semana y otros tipos de personas tienen más probabilidades de inscribirse en sus ranuras de prueba de días laborables.,
conclusión
La investigación del usuario puede ser entre sujetos o dentro de sujetos (o ambos), dependiendo de si cada participante está expuesto a una sola condición o a todas las condiciones que varían dentro de un estudio. Cada uno de estos tipos de diseño experimental tiene sus propias ventajas y desventajas; el diseño dentro de las asignaturas requiere menos participantes y aumenta la posibilidad de descubrir una verdadera diferencia entre sus condiciones; los diseños entre asignaturas minimizan los efectos de aprendizaje a través de las condiciones, conducen a sesiones más cortas y pueden ser más fáciles de configurar y analizar.