Concurrent Unidimensional and Multidimensional Calibration within Item Response Theory
Calibración concurrente unidimensional y multidimensional dentro de la teoría de respuesta del Ítem
Author
Brandt, Steffen
Full text
http://pensamientoeducativo.uc.cl/index.php/pel/article/view/2490310.7764/PEL.54.2.2017.4
Abstract
Today, important educational achievement studies, particularly large-scale assessments, use item response theory (IRT) as the method for their analyses. An important and basic assumption of IRT is on the dimensionality of a test: In order to be interpreted unidimensionally a test has to be unidimensional and hence cannot be multidimensional. Though, this basic assumption is very often neglected. The Programme for International Student Assessment (PISA), for example, applies a unidimensional IRT-Model for the analysis of the mathematics achievement and at the same time applies a multidimensional IRT-model for the analysis of the four subscales of mathematics. This contradiction to one of the basic assumptions of IRT is not unique to PISA. This work, at first, discusses the currently used approaches, and presents a new approach: the generalized subdimension model (GSM). It allows the calculation of a weighted mean score within the IRT framework. The model’s characteristics are compared to those of other models, particularly hierarchical models. Beyond the comparison of model fit, that is, the reliability of the results, the discussion particularly focuses on the difference in their interpretation, that is, on their validity. Actualmente, importantes estudios sobre logros educacionales, particularmente a gran escala, usan la Teoría de Respuesta al Ítem (TRI) como método para sus análisis. Uno de los supuestos más importantes y básicos de esta teoría es en la dimensionalidad de los test: Para ser interpretados unidimensionalmente los test deben ser unidimensionales y por lo mismo no pueden ser multidimensional. Aunque este supuesto pareciese muy básico, usualmente es ignorado. El Programa para la Evaluación Internacional de Estudiantes (PISA), por ejemplo, aplica un modelo TRI unidimensional para el análisis de logros matemáticos y a su vez aplica un modelo TRI multidimensional para analizar cuatro sub-escalas de matemáticas. Esta contradicción de uno de los supuestos más básicos del modelo TRI no es exclusivo de PISA. Este trabajo discute los acercamientos recientemente usados y presenta un nuevo planteamiento: el modelo de sub-dimensión generalizada. Este modelo permite el cálculo de calificaciones ponderadas dentro del marco TRI. Las características del modelo son comparadas a otros modelos, particularmente los de orden jerárquico. Más allá de las comparaciones sobre fiabilidad de resultados, la discusión se concentra particularmente en la diferencia de interpretaciones, quiere decir, en su validez.