Medición de actitudes en niños: más allá de la escala Likert

Por: José Ignacio García Pinilla
egresado en psicología
Universidad Nacional de Colombia

Una preocupación transversal dentro de las ciencias sociales, específicamente dentro de la psicología, es la replicabilidad de las investigaciones y por ende la confiabilidad de las conclusiones a las que llegan diversos estudios sobre un mismo tema (Ioannidis, 2012). Dichas conclusiones están atadas directamente, entre otras, a la calidad de los instrumentos utilizados para la medición de las variables bajo análisis.

Una de las propuestas más recientes que busca mejorar la confiabilidad de los resultados de investigaciones que miden el comportamiento de los niños, cuando se trata de reportes dados por ellos, como en el caso de las actitudes, es la presentada por Burton et al. (2021), quienes plantean una actualización de la escala utilizada para responder a cuestiones como preferencias, impresiones, aceptabilidad de consecuencias de dilemas morales, aplicabilidad de descriptores de personalidad sobre ellos, atractivo entre diferentes estímulos, confianza en las expresiones faciales de una persona, etc., variables relacionadas con las actitudes de manera general, como ya lo indicaban Padua y Ahman (1979) en su ahora clásico texto sobre técnicas de investigación aplicadas a las ciencias sociales.

En Psicología, una de las escalas más utilizadas para medir impresiones subjetivas entre los participantes de una investigación es la denominada Likert, la cual mide el grado de acuerdo o desacuerdo sobre un ítem presentado, permitiéndole al participante comunicar su impresión mediante su cuantificación en un intervalo que suele ir de 1 a 3, 5, 7, 10, 50 o 100, entre los más usuales (Burton et al., 2021). Tal como señalan Burton y sus colaboradores (2021), a pesar de la popularidad de la escala, su uso tiene algunos potenciales problemas al ser usada con niños, por ejemplo, al exigir la comprensión del concepto de recta numérica puede ser inconveniente para los más jóvenes o la tendencia de esta población a ser más extrema en sus respuestas prefiriendo los polos de la escala presentada, lo cual afecta la discriminación (como concepto psicométrico, esta se refiere a la capacidad que tiene un reactivo de diferenciar a dos personas cuyas magnitudes en la variable medida son intrínsecamente distintas, es decir, deberían obtener resultados diferentes después de la medición). Para más detalles sobre este último concepto se recomienda consultar el segundo acápite del cuarto capítulo del libro de Muñiz (2018) o el trabajo de Hurtado (2018).

La literatura presenta muy diversas escalas para medir preferencias o juicios, diferentes a la de Likert, como las de actitudes de Thurstone o la de Guttman, el diferencial semántico de Osgood o la escala de distancia social de Bogardus (Padua y Ahman, 1979), sin embargo ninguna de estas logra resolver adecuadamente las limitaciones que se han señalado en la aplicación de instrumentos entre niños.

La alternativa que estudian Burton et al. (2021) se trata de la Escala de Máximas Diferencias de Louviere (también conocida como Best-Worst Scaling o BWS), la cual es un desarrollo del tradicional Método de comparación por pares de Thurstone (Finn y Louviere, 1992; Padua y Ahman, 1979), pues implica la presentación de un subconjunto de los estímulos totales disponibles al participante, entre los que debe seleccionar el mejor y el peor frente a una instrucción dada, lo cual se repite en varias ocasiones asegurando que todos los ítems del instrumento se presentan la misma cantidad de veces para eliminar la necesidad de ponderación por número de presentaciones, y por medio de la cual se obtiene un resultado que indica para cada estímulo cuántas veces fue seleccionado como el mejor o el peor.

Este tipo de escala exige una menor carga para la memoria de trabajo de los niños, así como que permite eliminar el problema sobre la discriminación cuando se eligen solo los extremos en una escala Likert, sumado a que ha demostrado ser más consistente en aplicaciones repetidas del mismo instrumento con la misma población, incluso entre niños (Burton et al., 2021). De hecho, el estudio de Burton y sus colegas (2021) comparó la consistencia de las valoraciones realizadas por adultos y niños de entre 5 y 6 años en una tarea específica, la confianza percibida entre distintos rostros, en dos sesiones consecutivas diferentes (un ejercicio de confiabilidad test-retest). Los resultados evidencian que la Escala de Máximas Diferencias de Louviere resulta más fiable que la de Likert, con una diferencia estadísticamente significativa y un tamaño del efecto medio (0,5).

Para finalizar, la Escala de Máximas Diferencias de Louviere es recomendable no solo para niños sino también para poblaciones con dificultades cognitivas u otras discapacidades psicológicas, en tanto la carga de trabajo en atención y memoria, especialmente en lo que se refiere a la calibración de la escala durante toda la tarea, es menor y por lo tanto facilita una respuesta más consistente, al trasladar dicha carga a la fase de calificación posteriormente (Burton et al., 2021). En suma, es necesario profundizar aún más en las diversas alternativas que presentan los desarrollos metodológicos, asociados entre otras a la crisis de replicabilidad dentro de las ciencias sociales en general y dentro de la psicología en particular, ya que retomar dichos avances puede resultar clave para mejorar la confiabilidad de las mediciones de variables psicológicas, las conclusiones derivadas del análisis estadístico de dichos resultados, así como mejorar la confianza pública en los resultados de la ciencia.

Referencias

Burton, N., Burton, M., Fisher, C., González-Peña, P., Rhodes, G. y Ewing, L. (2021).  Beyond Likert ratings: Improving the robustness of developmental research measurement using best–worst scaling. Behavior Research Methods, 53(5), 2273-2279. https://doi.org/10.3758/s13428-021-01566-w

Finn, A. y Louviere, J. J. (1992). Determining the appropriate response to evidence of public concern: the case of food safety. Journal of Public Policy & Marketing, 11(2), 12-25. https://www.jstor.org/stable/30000270

Hurtado, L. (2018). Relación entre los índices de dificultad y discriminación. Revista Digital de Investigación en Docencia Universitaria, 12(1), 273-300. http://dx.doi.org/10.19083/ridu.12.614

Ioannidis, J. (2012). Why science is not necessarily self-correcting. Perspectives on Psychological Science, 7(6) 645-654. https://doi.org/10.1177/1745691612464056

Muñiz, J. (2018). Introducción a la Psicometría. Pirámide.Padua, J. y Ahman, I. (1979). Escalas para la medición de actitudes. En J. Padua (Coord.) Técnicas de investigación aplicadas a las ciencias sociales (pp. 154-230). Fondo de Cultura Económica.

Add Comment

Your email address will not be published. Required fields are marked *