<strong>Banco de ítems: Qué son, para qué sirven y cómo hacerlos</strong>

Banco de ítems: Qué son, para qué sirven y cómo hacerlos

.

Por: Sara Valentina Vásquez Riaño

Existen varias herramientas que facilitan no solo la construcción rigurosa de instrumentos, sino también su administración eficiente. Estas son especialmente valiosas si nos permiten ensamblar las pruebas según las particularidades de una muestra, ¿sabías que esta es una de las principales características de los bancos de ítems? Si te interesa conocer un poco más sobre qué son los bancos de ítems, para qué sirven dentro de la medición y qué características se deben tener en cuenta a la hora de realizar un banco de ítems, estás en el lugar indicado.

¿Qué son los bancos de ítems?

Se encuentran diferentes definiciones a la hora de responder a la pregunta “¿Qué son los bancos de ítems?”, un factor común encontrado es que estos son conjuntos de reactivos organizados diseñados para medir el nivel de rasgo o el dominio sobre un tema que tiene una persona. Se afirma también que la importancia de los bancos de ítems radica en que facilita la creación y revisión de los ítems, al ser herramientas automatizadas que permiten el acceso a un ítem, su identificación y sus propiedades estadísticas (Barbero, 1996; Barrios Araya et al., 2017; Uy et al., 2020), otros autores los plantean también como la base de un instrumento de evaluación, al ser el conjunto inicial de ítems que aseguran una prueba representativa, relevante y comprensible (Muñiz y Fonseca-Pedrero, 2019). Los bancos de ítems son una colección extensa de reactivos, que supera el número de ítems necesarios para una sola aplicación, permitiendo así seleccionar los que resulten más adecuados según las características particulares de cada aplicación (AERA et al., 2014).

Siguiendo lo dicho en os Standards for Educational and Psychological Testing (AERA et al., 2014) los bancos de ítems son conjuntos que integran la información detallada de cada ítem, dentro de estos se incluye el contenido del ítem, la información psicométrica y un indicador alfanumérico que permita encontrar el ítem fácilmente. Esta información va a facilitar la revisión y selección de ítems, asegurando un proceso riguroso y seguro. Por otro lado, Attorresi et al. (2009) incluye la importancia de tener varios ítems correspondientes a los distintos niveles de habilidad o de rasgo del evaluado, esto para hacer el test más versátil a la hora de evaluar diferentes tipos de personas.

¿Para qué sirven los bancos de ítems?

            Los bancos de ítems representan un avance significativo en diversos tipos de evaluación. Algunos ejemplos de pruebas que se realizan a partir de bancos de ítems son los siguientes: en el ámbito educativo, se emplean en pruebas estandarizadas como la prueba Saber 11 aplicada por el ICFES (Instituto Colombiano para la Evaluación de la Educación). En el sector organizacional son útiles para la selección de personal, con pruebas como el Cuestionario de Personalidad Ocupacional (OQP) de SHL. En el contexto clínico, se aplican en cuestionarios de diagnóstico como el Test Adaptativo Computarizado para la Salud Mental (CAT-MH) (Graham et al., 2019).

Algunos de sus beneficios son:

  • Flexibilidad en la evaluación: se refiere a que permiten adecuar un test según características específicas de la aplicación, como el nivel de habilidad de los evaluados para evitar frustración por preguntas muy difíciles o aburrimiento por preguntas muy fáciles (Attorresi et al., 2009). Los bancos de ítems también son muy útiles al permitir seleccionar un conjunto de ítems según la sub habilidad específica dentro de un atributo que se quiera medir (Barrios Araya et al., 2017). Igualmente, gracias a los procesos de selección de los ítems, es posible modificar la extensión de un instrumento, sin afectar la validez de la medición.
  • Seguridad: En la mayoría de evaluaciones es fundamental que los ítems no hayan sido conocidos previamente por los evaluados, con el fin de asegurar la validez de los resultados, es por esto que los bancos de ítems, al ser dinámicos, generan que los evaluados no sepan las preguntas a las que se van a enfrentar, incrementando la seguridad al evitar respuestas preparadas (Barbero, 1996).
  • Optimización del tiempo: Una de las aplicaciones de los bancos de ítems son los Test Adaptativos Informatizados (TAI), mencionados en Uy et al. (2020), estos ajustan las preguntas en tiempo real según las respuestas del evaluado, reduciendo el tiempo necesario para obtener resultados fiables. Sin embargo, para que se puedan utilizar los ítems de un banco en TAI, los ítems deben estar rigurosamente calibrados, lo que implica un proceso más exigente en comparación con pruebas más tradicionales. Por otro lado, en cuanto a los test clásicos, los bancos de ítems serán útiles al facilitar la construcción de pruebas a partir de ítems previamente validados, lo que va a permitir adaptar los test con mayor velocidad a las diferentes necesidades de cada aplicación.
  • Generación de test paralelos: Debido a que en los bancos de ítems se agregan ítems que ya han sido calibrados, es posible crear pruebas diferentes con igual validez y confiabilidad para aplicarlas a dos muestras diferentes y que sus resultados puedan ser comparados (Attorresi et al., 2009).

¿Cómo hacer un banco de ítems?

            Un banco de ítems debe construirse con un proceso riguroso que asegure la calidad psicométrica, es decir, que las preguntas sean válidas y confiables, de modo que las pruebas resulten precisas y útiles. Para lograr esto, se suelen seguir las siguientes etapas:

  1. Definir el marco general del banco: Muñiz y Fonseca-Pedrero (2019) hablan de la importancia de tener un marco general a la hora de desarrollar un instrumento, es comprender el motivo para desarrollar el instrumento, la población objetivo y las circunstancias en que se debe aplicar. Además, es importante tener claridad acerca de la teoría psicométrica que se empleará para analizar la prueba (Barbero, 1996). La Teoría Clásica de los Test (TCT) ha sido utilizada para evaluar las propiedades generales de las pruebas que se aplican, suponiendo que el error de medición es constante en todos los niveles de habilidad, resultando útil en estudios exploratorios. Sin embargo, cuando se requiere analizar la prueba con mayor precisión, podría ser de mayor utilidad la Teoría de Respuesta al Ítem (TRI) puesto que a partir de esta se podrá estimar el error de medición para cada ítem y según los diferentes niveles de habilidad de los evaluados, lo que permite una mayor exactitud en la interpretación de los resultados y tomar decisiones particulares para cada contexto con mayor seguridad.
  2. Creación y selección de los ítems: se considera que inicialmente el número de ítems que se creen debe ser al menos el doble de los que se planea tener en la versión final de la prueba, dado que es posible descartar varios de estos ítems (Muñiz y Fonseca-Pedrero, 2019). Es necesario que, tras crear los ítems, estos sean sometidos a un juicio de expertos que garantice la pertinencia y relevancia que tiene el ítem dentro del constructo que se quiere medir.
  3. Análisis psicométrico: Una vez comprobada la validez teórica y la coherencia de los ítems con el objetivo de la prueba, es necesario realizar un análisis psicométrico que permita ver el funcionamiento de los ítems en condiciones reales. Para lograr esto, se calculan indicadores como la dificultad, la discriminación y el error de medición, buscando identificar la calidad de cada ítem. Dependiendo de la teoría que se utilice, se van a aplicar diferentes estadísticos, el punto es lograr identificar qué ítems cumplen con los criterios establecidos, cuáles deben ser corregidos y cuáles eliminados.
  4. Calibración: Tras realizar el análisis psicométrico para cada ítem, se lleva a cabo esta etapa en la que se seleccionarán los ítems que cumplen con los criterios de calidad previamente establecidos y se eliminan o modifican los que no. Junto con esto, se realiza un proceso de equiparación de los puntajes, especialmente cuando el banco se construye con varios conjuntos de ítems aplicados en muestras diferentes, para esto, se ponen todos los puntajes en una misma escala. Realizar esto, va a permitir realizar combinaciones de los ítems para cada aplicación sin que el test pierda validez (Barbero, 1996).
  5. Almacenamiento: Finalmente, se debe asignar un indicador alfanumérico a cada ítem acorde con su contenido y sus características psicométricas, este debe permitir el acceso rápido a cada ítem cuando sea necesario (AERA et al., 2014). Junto con cada ítem y su indicador, es útil almacenar también información como la respuesta correcta, el rasgo evaluado y sus características psicométricas (Barbero, 1996).

Herramientas para la creación y análisis de bancos de ítems

            Existen diferentes herramientas que permiten analizar y almacenar los ítems de tu evaluación junto a su contenido e información estadística, una de estas herramientas es FastTest que ofrece diferentes funciones muy útiles al querer crear un banco de ítems, sin embargo, estas suelen de paga. Una alternativa gratuita es Lertap, que aunque no sirve para gestionar bancos de ítems, es útil para analizar las propiedades psicométricas de los ítems para luego organizar la información en otro programa que nos sirva para almacenar. Cada quien puede seleccionar el método que mejor se ajuste a sus necesidades y posibilidades.

FastTest

Esta es una herramienta que va a facilitar la creación y análisis de bancos de ítems, dentro esta es posible cumplir con los pasos mencionados anteriormente; es posible almacenar los ítems de manera completa (información general, contenido del ítem, estadísticas, comentarios y objetivos) y revisarlos junto a un equipo de trabajo. Este programa tiene una ventaja adicional y es permitir aplicar las pruebas en línea directamente desde la aplicación. Para utilizar esta herramienta es necesario comprar la licencia. Una vez realizado esto, una vez se ingresa al programa, aparecen una opción llamada “Item Explorer” con diferentes opciones relacionadas con la edición de los ítems, entre estas podemos encontrar New, View, Edit, Delete, sync, Import

(Imagen tomada de FastTest – Online Exam Software et al., 2024)racterística del Ítem (CCI) adaptada para ilustrar el ejemplo de DIF uniforme, se utiliza en el contexto de la Teoría de Respuesta al Ítem (TRI). Fuente: elaboración propia.

Igualmente, el administrador de la prueba va a tener acceso a otras opciones además de “Item Explorer”, entre estas: Test Assembler (para unir los ítems y crear pruebas), Asset Manager (para gestionar diferentes recursos a ser incluidos en cada ítem), Test Scheduler (para administrar la aplicación de pruebas mediante la misma aplicación).

Para el uso del sistema FastTest es necesario contar con alguno de los siguientes navegadores, preferiblemente en su última versión: Mozilla Firefox, Google Chrome, Apple Safari y Microsoft Edge. Adicionalmente, deben estar habilitadas las cookies en el navegador que se utilice y contar con mínimo una pantalla de resolución 1024*768 o superior.

Para comprender en profundidad esta herramienta y obtener mayor información, se recomienda visitar la página oficial: https://www.fasttestweb.com/manual/

Lertap

En cuanto a la otra alternativa, se utilizará el complemento de Excel, Lertap 5, que se puede instalar en: https://lertap5.com/HTMLHelp/HTML/index.html?how_to_get_lertap.htm. Este programa nos ayudará a procesar y analizar los resultados de las pruebas, lo que será útil dentro de los bancos de ítems para comprender cómo se están comportando los ítems.

            Para realizar el análisis de los ítems se deben seguir los siguientes pasos: Abrir Lertap e iniciar una página en blanco, en donde se pondrá la base de datos. Se debe poner la base de datos en la hoja llamada “Data”. En la hoja llamada “CCs” es donde irán las instrucciones de la forma en que se analizarán los datos.

2.  La hoja “CCs” se utiliza para configurar un análisis. CCs son Tarjetas de control (Control Cards), en este caso se utilizan tres tarjetas principales:

*col: Implica las columnas que se deben analizar. En el ejemplo se indica que el análisis debe ir de la columna 2 a la 16.

*sub: res= Indica el tipo de respuestas que contiene la base de datos, title= el nombre de la prueba

*key: Es la respuesta correcta en cada uno de los ítems.

3. Tras tener arreglada la base de datos y las tarjetas de control que se utilizarán, se debe ejecutar el análisis. Primero en la pestaña “interpret” se generará una hoja de nombre “Freqs”, en donde debemos verificar la frecuencia de respuesta de cada uno de los ítems, allí aparece la cantidad de personas que respondieron cada opción y el porcentaje que estas personas representan. Tras verificar que esta información sea correcta, sigue la pestaña “Elmillon”, donde se desplegarán una serie de hojas con los análisis estadísticos.

4. Finalmente, podemos generar gráficas sobre el comportamiento de los ítems dentro de cada cuartil de los datos, esto nos va a ser muy útil en caso de querer dividir los ítems según el nivel de habilidad o rasgo de cada evaluado, pues nos dirá que ítems son más adecuados para niveles bajos, medios o altos (según la cantidad de cuartiles que decidamos). Esto se podrá generar si a partir de la hoja Stats1ul (que contiene los análisis de las respuestas según los grupos) se da clic en la pestaña Res.charts.

Si quieres mayor profundidad en cómo realizar el análisis te recomiendo visitar la página de Lertap 5 (https://lertap5.com/HTMLHelp/HTML/index.html?how_to_get_lertap.htm) donde hallarás instrucciones e incluso ejemplos de cómo utilizar esta extensión.

Se debe recordar que Lertap será útil, ya que genera estadísticos clave para evaluar la calidad de cada ítem, sin embargo, esto no es suficiente, es necesario encontrar otro programa que permita almacenar los ítems junto a su información relevante y organizarlos por tema, por dificultad u otra categoría relevante para tu banco de ítems, además de esto, se debe asignar un código que facilite su búsqueda.

Desafíos al usar bancos de ítems

            La construcción de bancos de ítems presenta diversos desafíos, estos son algunos elementos importantes que deben ser tenidos en cuenta para asegurarse que los ítems que se seleccionan sean los adecuados para cada situación. En primer lugar, se debe evitar el sesgo en los ítems para garantizar que no se afecta injustamente a ciertos grupos examinados. Attorresi et al. (2009) mencionan la importancia de garantizar que los ítems no tengan funcionamiento diferencial, es decir que la probabilidad de dar una respuesta no sea diferente para personas de grupos distintos, pero con el mismo nivel de rasgo.

Para profundizar en este tema, te invito a leer el blog completo sobre el Funcionamiento Diferencial de los Ítems (DIF) publicado en SIEPSI. [https://siepsi.com.co/2026/01/30/funcionamiento-diferencial-de-los-items-dif/]

            Otro riesgo al que hay que estar muy atento es a la forma en que se está garantizando la seguridad del banco de ítems. Hay dos puntos que considerar en este aspecto, primero, se debe proteger la información que se recoge de las personas al responder los test, es por esto que se recomienda tener cifrada la identidad de cada respuesta. Segundo, en muchos casos para asegurar el funcionamiento de los ítems es necesario que los evaluados no conozcan las preguntas, para esto se debe contar con procesos informáticos que regulen y limiten la exposición de los ítems.

            Debemos recordar que el éxito principal de los bancos de ítems se basa en estar continuamente revisando las propiedades de cada ítem, la coherencia entre todos los ítems y el test en general y las mejoras que se podrían hacer. Además de esto, es importante que el banco de ítems se actualice constantemente con nueva información, por ejemplo, sobre la dificultad, la capacidad que tiene la prueba de discriminación y el desempeño de las preguntas en diferentes grupos, lo que permite asegurar que los ítems mantengan un funcionamiento adecuado.

Conclusiones

            Los bancos de ítems han demostrado ser útiles para la evaluación en diversos contextos, como el clínico, educativo y organizacional, pues permiten construir diferentes versiones equivalentes de una misma prueba, asegurando mediciones precisas y comparables. Esto va a permitir adaptar los instrumentos a diferentes contextos y poblaciones, dependiendo de sus particularidades. Igualmente, permite mantener la seguridad del proceso de evaluación al reducir la posibilidad de que los evaluadores conozcan los ítems antes de la aplicación. Otra ventaja que tenemos al utilizar los bancos de ítems es que, cuando tiene un amplio número de reactivos, es posible ajustar la prueba al nivel de habilidad de los evaluados.

            Sin embargo, se pueden utilizar los bancos de ítems cuando el evaluador tiene claridad sobre la base teórica y el contexto en el que se va a utilizar los bancos de ítems. Es crucial garantizar que los ítems sean adecuados para la población evaluada, evitando interpretaciones erróneas o sesgos involuntarios. El hacer un uso adecuado de los bancos de ítems mejorará la calidad de las evaluaciones y fortalecerá la validez y la fiabilidad de los procesos de medición.

Referencias

American Educational Research Association, American Psychological Association, y National Council on Measurement in Education. (2014). Standards for educational and psychological testing. AERA.

Attorresi, H. F., Lozzia, G. S., Abal, F. J., Galibert, M. S. y Aguerri, M. E. (2009). Teoría de Respuesta al Ítem. Conceptos básicos y aplicaciones para la medición de constructos psicológicos. Revista Argentina de Clínica Psicológica, XVIII(2), 179-188.        

Barbero, I. (1996). Bancos de ítems. En Muñiz, J. (Coord.) Psicometría. (p. 140-170). Editorial Universitas S.A.

Barrios Araya, S., Urrutia Egaña, M., y Catoni Salamanca, M. I. (2017). Validez de contenido de un banco de ítemes en el área de salud del niño. Educación Médica Superior, 31(4), 1-9. http://scielo.sld.cu/pdf/ems/v31n4/a13_1171.pdf

FastTest – Online Exam Software, Issayeva, L., y Thompson, N. (2024, 19 marzo). FastTest Overview – FastTest – Online exam software. FastTest – Online Exam Software. https://www.fasttestweb.com/manual/fasttest-overview/

Graham, A. K., Minc, A., Staab, E., Beiser, D. G., Gibbons, R. D., y Laiteerapong, N. (2019). Validation of the Computerized Adaptive Test for Mental Health in Primary Care. The Annals Of Family Medicine, 17(1), 23-30. https://doi.org/10.1370/afm.2316

Muñiz, J. y Fonseca-Pedrero, E. (2019). Diez pasos para la construcción de un test. Psicothema, 31(1), 7.

Uy, E. J. B., Xiao, L. Y. S., Xin, X., Yeo, J. P. T., Pua, Y. H., Lee, G. L., Kwan, Y. H., Teo, E. P. S., Vaingankar, J. A., Subramaniam, M., Chan, M. F., Kumar, N., Ang, A. L. C., Bautista, D. C., Cheung, Y. B., y Thumboo, J. (2020). Developing item banks to measure three important domains of health-related quality of life (HRQOL) in Singapore. Health And

Quality Of Life Outcomes, 18(1). https://doi.org/10.1186/s12955-019-1255-1

Add Comment

Your email address will not be published. Required fields are marked *