12.07.2015 Views

Introducción al análisis de la Teoría de Respuesta al Ítem

Introducción al análisis de la Teoría de Respuesta al Ítem

Introducción al análisis de la Teoría de Respuesta al Ítem

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Introducción</strong> <strong>al</strong> <strong>análisis</strong> <strong>de</strong> <strong>la</strong> <strong>Teoría</strong> <strong>de</strong> <strong>Respuesta</strong> <strong>al</strong> <strong>Ítem</strong>Antonio Matas TerrónEdiciciones Ai<strong>de</strong>soc 2010


<strong>Introducción</strong> <strong>al</strong> <strong>análisis</strong> <strong>de</strong> <strong>la</strong> <strong>Teoría</strong> <strong>de</strong> <strong>Respuesta</strong> <strong>al</strong> <strong>Ítem</strong>Antonio Matas TerrónEdita: Ai<strong>de</strong>soc.netLicencia:Esta obra está bajo una licencia Attribution-NonCommerci<strong>al</strong> <strong>de</strong> Creative Commons. Para ver unacopia <strong>de</strong> esta licencia, visite http://creativecommons.org/ o envie una carta a Creative Commons,171 Second Street, Suite 300, San Francisco, C<strong>al</strong>ifornia 94105, USA.


ventaja <strong>de</strong> <strong>la</strong> TRI es que no se necesita especificar su distribución <strong>de</strong> forma que no es necesario, porejemplo, garantizar <strong>la</strong> norm<strong>al</strong>idad <strong>de</strong> los datos.De forma resumida, t<strong>al</strong> como escribíamos en otro documento (Matas, 2001), <strong>la</strong> TRI tiene tresventajas:• Invarianza <strong>de</strong> los parámetros <strong>de</strong> los ítemes respecto a <strong>la</strong> muestra que se c<strong>al</strong>cu<strong>la</strong>. Es <strong>de</strong>cir,que los parámetros <strong>de</strong>l ítem no cambian aunque <strong>la</strong>s personas que contesten sean distintas.• Invarianza <strong>de</strong>l parámetro <strong>de</strong>l rasgo <strong>de</strong>l sujeto respecto <strong>al</strong> instrumento utilizado paraestimarlo. Es <strong>de</strong>cir, que el nivel <strong>de</strong> habilidad <strong>de</strong> <strong>la</strong> persona no <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l test.• Proporciona medidas loc<strong>al</strong>es <strong>de</strong> precisión a través <strong>de</strong> <strong>la</strong> función <strong>de</strong> precisión. Es <strong>de</strong>cir, queofrece un indicador <strong>de</strong> <strong>la</strong> precisión <strong>de</strong> <strong>la</strong>s estimaciones para niveles concretos.Supuestos <strong>de</strong>l TRILos supuestos básicos que exige el mo<strong>de</strong>lo <strong>de</strong> rasgo <strong>la</strong>tente son básicamente tres:– El princip<strong>al</strong> supuesto es que se asume <strong>la</strong> existencia <strong>de</strong> una variable no observada, <strong>la</strong>tente,que explicaría <strong>la</strong>s respuestas <strong>de</strong> <strong>la</strong>s personas a una prueba o ítem.– Unidimension<strong>al</strong>idad, es <strong>de</strong>cir, el ítem o prueba mi<strong>de</strong> un solo rasgo.– Por otra <strong>la</strong>do <strong>de</strong>be cumplirse <strong>la</strong> in<strong>de</strong>pen<strong>de</strong>ncia loc<strong>al</strong>, es <strong>de</strong>cir, que <strong>la</strong> respuesta a un ítem noinfluye en <strong>la</strong> respuesta dada a ningún otro. Esto permite afirmar que <strong>la</strong> probabilidad <strong>de</strong>respon<strong>de</strong>r correctamente a un conjunto <strong>de</strong> ítemes es el producto <strong>de</strong> <strong>la</strong>s probabilida<strong>de</strong>s <strong>de</strong>contestar correctamente a cada ítem por separado.En ciertas ocasiones es difícil comprobar <strong>la</strong> in<strong>de</strong>pen<strong>de</strong>ncia loc<strong>al</strong> <strong>de</strong> los ítems, por t<strong>al</strong> motivo, eshabitu<strong>al</strong> comprobar so<strong>la</strong>mente <strong>la</strong> unidimension<strong>al</strong>idad a través <strong>de</strong> un <strong>análisis</strong> factori<strong>al</strong> o <strong>al</strong>gunaprueba simi<strong>la</strong>r.Mo<strong>de</strong>los <strong>de</strong> <strong>la</strong> TRIEn <strong>la</strong> TRI se suelen distinguir tres mo<strong>de</strong>los distintos en función <strong>de</strong>l número <strong>de</strong> parámetros que seestiman:– Mo<strong>de</strong>lo <strong>de</strong> un parámetro, también l<strong>la</strong>mado mo<strong>de</strong>lo <strong>de</strong> Rasch. Se estima <strong>la</strong> dificultad <strong>de</strong>l ítem(b).– Mo<strong>de</strong>lo <strong>de</strong> dos parámetros. Se estima <strong>la</strong> dificultad (b) y <strong>la</strong> discriminación <strong>de</strong>l ítem (a).– Mo<strong>de</strong>lo <strong>de</strong> tres parámetros, o mo<strong>de</strong>lo <strong>de</strong> Birnbaum. Este mo<strong>de</strong>lo se incluye en <strong>la</strong> TRIaunque en esencia pue<strong>de</strong> consi<strong>de</strong>rarse como un enfoque <strong>al</strong>ternativo a <strong>la</strong> TRI. El mo<strong>de</strong>lo <strong>de</strong>Birnbaum estima <strong>la</strong> dificultad (b), <strong>la</strong> discriminación (a) y el pseudoazar o adivinación (c).También se pue<strong>de</strong> hab<strong>la</strong>r <strong>de</strong> mo<strong>de</strong>los en función <strong>de</strong>l número <strong>de</strong> respuesta <strong>de</strong> los ítems, asítendremos:– Mo<strong>de</strong>lo dicotómico, don<strong>de</strong> <strong>la</strong>s respuestas a los ítems tienen dos opciones, norm<strong>al</strong>mente2


v<strong>al</strong>oradas como 1 y 0.– Mo<strong>de</strong>los politómicos. En este caso los ítems tiene más <strong>de</strong> dos opciones, siendogener<strong>al</strong>mente esc<strong>al</strong>as <strong>de</strong> apreciación graduadas. Por ejemplo <strong>de</strong>l tipo “Indique en qué gradoestá <strong>de</strong> acuerdo con <strong>la</strong>s afirmaciones, siendo 1 nada <strong>de</strong> acuerdo, 2 <strong>al</strong>go <strong>de</strong> acuerdo y 3 muy<strong>de</strong> acuerdo”.Por último, hay que tener en cuenta también el <strong>al</strong>goritmo <strong>de</strong> estimación <strong>de</strong>l nivel <strong>de</strong> habilidad orasgo. En este sentido, <strong>la</strong>s funciones habitu<strong>al</strong>es para re<strong>la</strong>cionar <strong>la</strong>s respuestas <strong>al</strong> test y el nivel <strong>de</strong>habilidad suelen ser <strong>la</strong> función logística y <strong>la</strong> función norm<strong>al</strong>.Resultados <strong>de</strong> <strong>la</strong> TRILa TRI genera una serie <strong>de</strong> resultados <strong>de</strong> especi<strong>al</strong> interés:– Parámetros . Como se ha comentado anteriormente, tanto <strong>la</strong> dificultad, como <strong>la</strong>discriminación son dos elementos esenci<strong>al</strong>es en <strong>la</strong> v<strong>al</strong>oración <strong>de</strong> un ítem. Lo mismo pue<strong>de</strong><strong>de</strong>cirse sobre el pseudoazar. Estos elementos tienen implicaciones directas en <strong>la</strong>construcción <strong>de</strong> test y pruebas académicas.– Curva característica <strong>de</strong>l ítem . Es un elemento fundament<strong>al</strong> en <strong>la</strong> TRI porque, por un <strong>la</strong>do,ofrece una representación gráfica <strong>de</strong> <strong>la</strong>s características <strong>de</strong>l ítem, y por otra parte muestra <strong>la</strong>re<strong>la</strong>ción entre el nivel <strong>de</strong> habilidad y <strong>la</strong> repuesta <strong>al</strong> ítem, en términos probabilísticos.– Puntuación verda<strong>de</strong>ra en el test. Se i<strong>de</strong>ntifica con <strong>la</strong> suma <strong>de</strong> <strong>la</strong>s probabilida<strong>de</strong>s estimadascon re<strong>la</strong>ción <strong>al</strong> nivel <strong>de</strong> habilidad, para el tot<strong>al</strong> <strong>de</strong> ítems <strong>de</strong>l test.– Curva características <strong>de</strong>l test . Permite ver <strong>de</strong> manera gráfica, <strong>la</strong> re<strong>la</strong>ción entre puntuaciónverda<strong>de</strong>ra y habilida<strong>de</strong>s. La Curva Característica <strong>de</strong>l Test (CCT) muestra <strong>la</strong> re<strong>la</strong>ciónexistente entre <strong>la</strong> puntuación tot<strong>al</strong> en un test (no so<strong>la</strong>mente en un ítem como suce<strong>de</strong> con <strong>la</strong>CCI) y el nivel <strong>de</strong> habilidad <strong>de</strong> una persona.– Nivel <strong>de</strong> información . Es un indicador <strong>de</strong> <strong>la</strong> precisión <strong>de</strong> <strong>la</strong> estimación.Curva Característica <strong>de</strong>l <strong>Ítem</strong> (CCI)La TRI afirma que si una persona tiene un nivel n <strong>de</strong> conocimiento sobre geografía, por ejemplo,tendrá asociado a dicho v<strong>al</strong>or una probabilidad <strong>de</strong> que conteste correctamente a una pregunta <strong>de</strong>geografía. Expresado a <strong>la</strong> inversa, si una persona que respon<strong>de</strong> correctamente a un ítem, es posiblesuponer que esta persona posee un <strong>de</strong>terminado nivel <strong>de</strong> conocimiento.Para cada nivel <strong>de</strong> conocimiento, aptitud, habilidad o rasgo existe una probabilidad asociada <strong>de</strong>contestar correctamente <strong>al</strong> ítem. Esta probabilidad es pequeña para sujetos con bajo nivel <strong>de</strong> rasgo,y <strong>al</strong>ta para sujetos con <strong>al</strong>tos niveles <strong>de</strong> rasgo. La re<strong>la</strong>ción entre el nivel <strong>de</strong> aptitud y <strong>la</strong> probabilidad<strong>de</strong> respuesta correcta <strong>al</strong> ítem se representa con <strong>la</strong> curva características <strong>de</strong>l ítem (CCI). En <strong>la</strong> práctic<strong>al</strong>a CCI se suele representar en una esc<strong>al</strong>a situada entre –3 y +3 puntos <strong>de</strong> habilidad. En el eje x sesitúan los v<strong>al</strong>ores <strong>de</strong> <strong>la</strong> habilidad y en el eje y <strong>la</strong>s probabilida<strong>de</strong>s asociadas.La CCI <strong>de</strong>pen<strong>de</strong> <strong>de</strong> tres parámetros básicos, o parámetros <strong>de</strong>l ítem. Estos son el índice <strong>de</strong> dificultad,el índice <strong>de</strong> discriminación y el índice <strong>de</strong> azar (o pseudo-azar).3


Gráfico 1. Curva característica <strong>de</strong> un ítemParámetros <strong>de</strong>l ítemComo se ha indicado, los parámetros son tres: dificultad, discriminación y pseudo-azar. El índice <strong>de</strong>dificultad se suele indicar con <strong>la</strong> letra “b” y se <strong>de</strong>fine como el punto <strong>de</strong> <strong>la</strong> esc<strong>al</strong>a <strong>de</strong> habilidad don<strong>de</strong><strong>la</strong> probabilidad <strong>de</strong> respon<strong>de</strong>r correctamente el ítem es igu<strong>al</strong> a 0,5. Es <strong>de</strong>cir, que coinci<strong>de</strong> con elgrado <strong>de</strong> habilidad don<strong>de</strong> <strong>la</strong> curva “señ<strong>al</strong>a” una probabilidad <strong>de</strong> 0,5. Dicho <strong>de</strong> otra forma, con esenivel <strong>de</strong> habilidad, <strong>la</strong> persona tienen una probabilidad <strong>de</strong>l 50% <strong>de</strong> contestar correctamente <strong>al</strong> ítem.El índice <strong>de</strong> discriminación indica hasta que punto <strong>la</strong> pregunta pue<strong>de</strong> discriminar entre sujetos quetienen un nivel <strong>al</strong>to <strong>de</strong> habilidad <strong>de</strong> aquellos que tienen un nivel bajo. El índice <strong>de</strong> discriminación sesuele representar con <strong>la</strong> letra “a”. Esta propiedad se refleja en <strong>la</strong> pendiente <strong>de</strong> <strong>la</strong> curva, así, unamayor pendiente indicará una mayor discriminación y viceversa.El coeficiente <strong>de</strong> azar o pseudoazar, se representa con <strong>la</strong> letra “c” e indica <strong>la</strong> probabilidad <strong>de</strong>contestar correctamente un ítem sin tener el nivel <strong>de</strong> habilidad exigido. Este parámetro trata <strong>de</strong>representar el efecto <strong>de</strong>l azar.Función <strong>de</strong> informaciónLa función <strong>de</strong> información es un <strong>al</strong>goritmo que indica <strong>la</strong> precisión con que se re<strong>al</strong>iza <strong>la</strong> estimación<strong>de</strong> los parámetros Así, para cada nivel <strong>de</strong> habilidad se atribuye un v<strong>al</strong>or <strong>de</strong> error en <strong>la</strong> estimación.Partiendo <strong>de</strong> <strong>la</strong> i<strong>de</strong>a <strong>de</strong> que <strong>la</strong> varianza <strong>de</strong> un estimador es un indicador <strong>de</strong> su grado <strong>de</strong> precisión oimprecisión (<strong>de</strong> forma que una mayor varianza sugiere una menor precisión) entonces, <strong>la</strong> cantidad<strong>de</strong> información se pue<strong>de</strong> c<strong>al</strong>cu<strong>la</strong>r como <strong>la</strong> inversa <strong>de</strong> dicha varianza. De esta forma a mayorprecisión, mayor información, y <strong>al</strong> contrario.Por un <strong>la</strong>do se pue<strong>de</strong> c<strong>al</strong>cu<strong>la</strong>r <strong>la</strong> función <strong>de</strong> información <strong>de</strong> un ítem y <strong>la</strong> función <strong>de</strong> información <strong>de</strong>ltest completo:– Función <strong>de</strong> información <strong>de</strong>l ítem (FII). Aunque se pue<strong>de</strong> c<strong>al</strong>cu<strong>la</strong>r para todos los niveles <strong>de</strong>habilidad, en los mo<strong>de</strong>los <strong>de</strong> uno y dos parámetros, los ítems mi<strong>de</strong>n con mayor precisión<strong>al</strong>re<strong>de</strong>dor <strong>de</strong>l v<strong>al</strong>or <strong>de</strong> dificultad.– Función <strong>de</strong> información <strong>de</strong>l test (FIT). C<strong>al</strong>cu<strong>la</strong> <strong>la</strong> cantidad <strong>de</strong> información proporcionada enel test tot<strong>al</strong> para los distintos niveles <strong>de</strong> habilidad. Se c<strong>al</strong>cu<strong>la</strong> sumando <strong>la</strong>s funciones <strong>de</strong>información <strong>de</strong> todos los ítems para cada nivel <strong>de</strong> habilidad.4


A partir <strong>de</strong> <strong>la</strong> función <strong>de</strong> información es posible comparar <strong>la</strong> eficacia re<strong>la</strong>tiva (ER) <strong>de</strong> un test conre<strong>la</strong>ción a otro test sobre cada nivel <strong>de</strong> habilidad. Si <strong>la</strong> ER <strong>de</strong> un test con re<strong>la</strong>ción a otro tien<strong>de</strong> a 1para un nivel <strong>de</strong> habilidad, indicaría que ambos son simi<strong>la</strong>res en cuanto a precisión en dicho nivel.Procedimiento para el <strong>análisis</strong> <strong>de</strong> un test por medio <strong>de</strong> <strong>la</strong> TRIDe forma esquemática los pasos a seguir para an<strong>al</strong>izar <strong>la</strong>s características <strong>de</strong> un test según <strong>la</strong> TRI, yestimar los niveles <strong>de</strong> rasgo <strong>de</strong> <strong>la</strong>s personas que contesten <strong>al</strong> test son los siguientes:a) Preparar los datos para su <strong>análisis</strong>.b) An<strong>al</strong>izar si los datos cumplen los supuestos básicos <strong>de</strong> <strong>la</strong> TRI.c) Estimar los parámetros <strong>de</strong>l mo<strong>de</strong>lo elegido (uno, dos o tres parámetros). E<strong>la</strong>borar losresúmenes y gráficas correspondientes.d) An<strong>al</strong>izar el ajuste <strong>de</strong>l mo<strong>de</strong>lo a los datos. Si el ajuste no es a<strong>de</strong>cuado volver a <strong>la</strong> faseanterior recurriendo a otro mo<strong>de</strong>lo.e) Estimar los niveles <strong>de</strong> habilidad <strong>de</strong> los participantes.Para re<strong>al</strong>izar los cálculos se utiliza el paquete “ltm” (Rizopoulos, 2006) que es una librería <strong>de</strong>lprograma R (R Development core Team, 2011).ConclusionesLa TRI aporta un enfoque <strong>al</strong>ternativo a <strong>la</strong> <strong>Teoría</strong> Clásica <strong>de</strong> los Test para an<strong>al</strong>izar <strong>la</strong>s características<strong>de</strong> los ítems. En otras características, permite an<strong>al</strong>izar <strong>la</strong> dificultad y discriminación <strong>de</strong> los ítems, asícomo <strong>la</strong> posibilidad <strong>de</strong> contestar correctamente un ítem <strong>de</strong> forma azarosa. Junto con estoselementos, <strong>la</strong> TRI permite conocer <strong>la</strong> estructura <strong>de</strong> un ítem a través <strong>de</strong> su Curva Característica.A<strong>de</strong>más, <strong>de</strong>termina <strong>la</strong> función <strong>de</strong> información, que permite v<strong>al</strong>orar <strong>la</strong> precisión <strong>de</strong> <strong>la</strong> estimación quere<strong>al</strong>iza el test.Estos elementos son especi<strong>al</strong>mente útiles en el ámbito <strong>de</strong> <strong>la</strong> educación y <strong>la</strong> person<strong>al</strong>idad, cuando setrabajan con pruebas objetivas <strong>de</strong> ev<strong>al</strong>uación y diagnóstico. En estos campos es útil tenerinformación tanto <strong>de</strong>l <strong>la</strong> eficacia <strong>de</strong>l instrumento <strong>de</strong> ev<strong>al</strong>uación, como <strong>de</strong>l resultado <strong>de</strong> <strong>la</strong> propiaev<strong>al</strong>uación en <strong>la</strong>s personas.ReferenciasRizopoulos, D. (2006). ltm:An R package for <strong>la</strong>tent variables mo<strong>de</strong>lin and item reponse theoryan<strong>al</strong>ysis. Journ<strong>al</strong> of statistic<strong>al</strong> software, 17(5), 1-25. (http://www.google.es/url?sa=t&source=web&cd=1&ved=0CBwQFjAA&url=http%3A%2F%2Frsirt.googleco<strong>de</strong>.com%2Ffiles%2FltmPackage.pdf&rct=j&q=Rizopoulos%2C%20D.%20(2006).%20ltm%3AAn%20R%20package%20for%20<strong>la</strong>tent%20variables%20mo<strong>de</strong>lin%20and%20item%20reponse%20theory%20an<strong>al</strong>ysis.%20Journ<strong>al</strong>%20of%20statistic<strong>al</strong>%20software&ei=yLwQToTQBcnHsgbD_NzgDg&usg=AFQjCNHrwYYit6aDrNw-1_dWlKq6WinPeg&sig2=u0T7V1JMPjGes_SgKOq79Q&cad=rja)R Development Core Team (2011). R: A <strong>la</strong>nguage and environment for statistic<strong>al</strong> computing. R5


Foundation for Statistic<strong>al</strong> Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.Rproject.org/.Matas, A. (2001). Medición y Diagnóstico. <strong>Introducción</strong> a <strong>la</strong> medición educativa aplicada <strong>al</strong>Diagnóstico en Educación. Sevil<strong>la</strong>: Kronos.6


GlosarioPuntuación verda<strong>de</strong>ra: <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> teoría clásica <strong>de</strong> los test, es el v<strong>al</strong>or <strong>de</strong>l rasgo que se preten<strong>de</strong>medir re<strong>al</strong>mente. Es <strong>la</strong> puntuación que se obtendría si no existiesen errores en <strong>la</strong> medida.Dificultad <strong>de</strong> un ítem: es un indicador <strong>de</strong>l nivel <strong>de</strong> exigencia <strong>de</strong> un ítem para que <strong>la</strong> persona consigaun <strong>de</strong>terminado v<strong>al</strong>or. Por ejemplo, un ítem <strong>de</strong> un examen es difícil si exige un elevado nivel <strong>de</strong>conocimiento <strong>de</strong> <strong>la</strong> materia para se contestados correctamente.Discriminación <strong>de</strong> un ítem: capacidad que tiene el ítem <strong>de</strong> diferenciar entre personas con distintonivel <strong>de</strong> habilidad.Fiabilidad: estabilidad o constancia <strong>de</strong> <strong>la</strong>s medidas obtenidas con un mismo test. También indica <strong>la</strong>precisión o exactitud <strong>de</strong> <strong>la</strong>s medidas <strong>de</strong>l test.V<strong>al</strong>i<strong>de</strong>z: indicador <strong>de</strong> que el test mi<strong>de</strong> re<strong>al</strong>mente aquello que preten<strong>de</strong> medir.Homocedasticidad: igu<strong>al</strong>dad <strong>de</strong> varianza (es una p<strong>al</strong>abra que no se recoge en el diccionario <strong>de</strong> <strong>la</strong>Re<strong>al</strong> Aca<strong>de</strong>mia <strong>de</strong> <strong>la</strong> Lengua Españo<strong>la</strong>).Variable in<strong>de</strong>pendiente: variable (fenómeno o suceso) que contro<strong>la</strong> el investigador con <strong>la</strong> intención<strong>de</strong> provocar una respuesta o un cambio en el sistema.Variable <strong>de</strong>pendiente: fenómeno que se preten<strong>de</strong> medir para i<strong>de</strong>ntificar posibles cambios.Curva característica <strong>de</strong>l test (CCT): representación que muestra <strong>la</strong> re<strong>la</strong>ción entre <strong>la</strong> ejecución <strong>de</strong> unapersona en un test y su nivel <strong>de</strong> habilidad.7


iiihttp://www.uam.es/person<strong>al</strong>_pdi/psicologia/fjabad/cv/tai.htmlhttp://hum369.uma.es

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!