Blömeke, S., Zlatkin-Troitschanskaia, O., Kuhn, C., & Fege, J. (2013). Modeling and Measuring Competencies in Higher Education (S. 1–10).

Bond, T., Yan, Z., & Heene, M. (2020). Applying the Rasch Model: Fundamental Measurement in the Human Sciences. Routledge.

Breitschuh, J., Sonnenschein, E., Fuchs, J., & Albers, A. (2016). Fachliches Problemlösen in der Maschinenkonstruktion—Untersuchung von Struktur und Erlernbarkeit mittels multimodaler Technikmodelle. Journal of Technical Education (JOTED), 4(2), Article 2. https://www.journal-of-technical-education.de/index.php/joted/article/view/86

Bunea, A., & Ibenskas, R. (2015). Quantitative text analysis and the study of EU lobbying and interest groups. European Union Politics, 16(3), 429–455. https://doi.org/10.1177/1465116515577821

Choi, Y.-J., & Asilkalkan, A. (2019). R Packages for Item Response Theory Analysis: Descriptions and Features. Measurement: Interdisciplinary Research and Perspectives, 17(3), 168–175. https://doi.org/10.1080/15366367.2019.1586404

Elliott, M., & Buttery, P. (2021). Non-iterative Conditional Pairwise Estimation for the Rating Scale Model. Educational and Psychological Measurement, 1–31. https://doi.org/10.1177/00131644211046253

Finch, H., & French, B. F. (2019). A Comparison of Estimation Techniques for IRT Models With Small Samples. Applied Measurement in Education, 32(2), 77–96. https://doi.org/10.1080/08957347.2019.1577243

Gebhardt, M., DeVries, J. M., Jungjohann, J., Casale, G., Gegenfurtner, A., & Kuhn, J.-T. (2019). Measurement Invariance of a Direct Behavior Rating Multi Item Scale across Occasions. Social Sciences, 8(2), 46. https://doi.org/10.3390/socsci8020046

Gebhardt, M., Diehl, K., & Mühling, A. (2016). Online-Lernverlaufsmessung für alle Schülerinnen und Schüler in inklusiven Klassen. In Zeitschrift für Heilpädagogik (Bd. 66, Nummer 10, S. 444–453).

Gebhardt, M., Heine, J.-H., Zeuch, N., & Förster, N. (2015). Lernverlaufsdiagnostik im Mathematikunterricht der zweiten Klasse: Raschanalysen und Empfehlungen zur Adaptation eines Testverfahrens für den Einsatz in inklusiven Klassen. Empirische Sonderpädagogik, 7(3), 206–222. https://doi.org/urn:nbn:de:0111-pedocs-113833

Gebhardt, M., Schwab, S., Hessels, M. G. P., & Nusser, L. (2015). Einstellungen und Selbstwirksamkeit von Lehrerinnen und Lehrern zur schulischen Inklusion in Deutschland—Eine Analyse mit Daten des Nationalen Bildungspanels Deutschlands (NEPS). Empirische Pädagogik, 29(2), 211–229.

Gebhardt, M., & Voß, S. (2017). Verlaufsmessung des Verhaltens mit dem SDQ? Erste Ergebnisse einer adaptierten Fragebogenversion. AESF Frühjahrstagung, Rostock. https://doi.org/10.13140/RG.2.2.17932.92805

Geiger, K., Breitschuh, J., & Matthiesen, S. (2016). Denken wie ein Ingenieur—Unterrichtseinheit für Schulen zum Erleben technischen Problemlösens. 11, 7.

Heine, J. H., & Reiss, K. (2019). PISA 2018 – die Methodologie. In K. Reiss, M. Weis, E. Klieme, & O. Köller (Hrsg.), PISA 2018 Grundbildung im internationalen Vergleich. (S. 241–258). Waxmann.

Heine, J.-H. (2020). Untersuchungen zum Antwortverhalten und zu Modellen der Skalierung bei der Messung psychologischer Konstrukte [Monographie, Universität der Bundeswehr]. https://athene-forschung.unibw.de/132861

Heine, J.-H., Gebhardt, M., Schwab, S., Neumann, P., Gorges, J., & Wild, E. (2018). Testing psychometric properties of the CFT 1-R for students with special educational needs. Psychological Test and Assessment Modeling, 60(1), 3–27.

Heine, J.-H., & Sälzer, C. (2015, April 16). Subject-Specific Truancy: Dimensionality of the Truancy Scale and Associations with Subject Specific Achievement. AERA 2015, Chicago, IL.

Heine, J.-H., & Tarnai, C. (2015). Pairwise rasch model item parameter recovery under sparse data conditions. Psychological Test and Assessment Modeling, 57(1), 3–36.

Heine, J.-H., & Tarnai, Ch. (2016, November 16). Personen-Klassifikation nach impliziten Antwortmodellen—Überprüfung einer Hypothese zur Struktur von Fragebogendaten. [Vortrag]. 22. Workshop Angewandte Klassifikationsanalyse, Kloster Irsee, St. Virgil, Salzburg. https://www.uni-bielefeld.de/soz/personen/reinecke/workshop_rothenberge/2016/AKA22_Abstracts.pdf

Heine, J.-H., & Tarnai, Ch. (2017, November 8). Q -- Rechnerische Implementation eines konditionalen Personen-Fit-Index in R [Vortrag]. 23. Workshop Angewandte Klassifikationsanalyse Landhaus Rothenberge, St. Virgil, Salzburg. https://www.uni-bielefeld.de/soz/personen/reinecke/workshop_rothenberge/2017.html

Heine, J.-H., Tarnai, Ch., & Hartmann, F. G. (2011, September). Eine Methode zur Parameterbestimmung im Rasch-Modell bei fehlenden Werten. 10. Tagung der Fachgruppe Methoden & Evaluation der DGPs, Bamberg. https://www.uni-bamberg.de/psymethodenbf/fachgruppentagung-methoden-evaluation-2011/

Heine, J.-H., Tarnai, Ch., & Tarnai, Ch. (2011, November). Item-Parameter Bestimmung im Rasch-Modell bei unterschiedlichen Datenausfallmechanismen [Vortrag]. 17. Workshop Angewandte Klasifikationsanalyse (AKA), Landhaus Rothenberge, Münster. http://www.uni-bielefeld.de/soz/personen/reinecke/workshop_rothenberge/2011.html

Musekamp, F., Spöttl, G., Mehrafza, M., Heine, J.-H., & Heene, M. (2014). Modeling of Competences for Students of Engineering Mechanics. International Journal of Engineering Pedagogy (iJEP), 4(1), 4–12. https://doi.org/10.3991/ijep.v4i1.2917

Sälzer, C., & Heine, J.-H. (2016). Students’ skipping behavior on truancy items and (school) subjects and its relation to test performance in PISA 2012. International Journal of Educational Development, 46, 103–113. https://doi.org/10.1016/j.ijedudev.2015.10.009

Schurig, M., Jungjohann, J., & Gebhardt, M. (2021). Minimization of a Short Computer-Based Test in Reading. Frontiers in Education, 6:684595. https://doi.org/10.3389/feduc.2021.684595

Schürmann, M., & Grebe, C. (2016, September 19). Wie kompetent sind S(s)ie? 50. Kongress der Deutschen Gesellschaft für Psychologie, Leipzig.

Schwab, S., & Gebhardt, M. (2016). Stufen der sozialen Partizipation nach Einschätzung von Regel- und Integrationslehrkräften. Empirische Pädagogik, 30(1), 43–66.

Schwab, S., Helm, C., & others. (2015). Überprüfung von Messinvarianz mittels CFA und DIF-Analysen. Empirische Sonderpädagogik, 7(3), 175–193.

Sikora, S., & Voß, S. (2017). Konzeption und Güte curriculumbasierter Messverfahren zur Erfassung der arithmetischen Leistungsentwicklung in den Klassenstufen 3 und 4. Empirische Sonderpädagogik, 9(3), 236–257.

Voß, S., & Blumenthal, Y. (2020). Assessing the Word Recognition Skills of German Elementary Students in Silent Reading—Psychometric Properties of an Item Pool to Generate Curriculum-Based Measurements. Education Sciences, 10(2), 35. https://doi.org/10.3390/educsci10020035

Voß, S., & Gebhardt, M. (2017). Monitoring der sozial-emotionalen Situation von Grundschülerinnen und Grundschülern. Ist der SDQ ein geeignetes Verfahren? Empirische Sonderpädagogik, 9(1), 19–35.

Voß, S., Sikora, S., & Mahlau, K. (2017). Vorschlag zur Konzeption eines curriculumbasierten Messverfahrens zur Erfassung der Rechtschreibleistungen im Grundschulbereich. Empirische Sonderpädagogik, 9(2), 184–194.

Walkowiak, M. (2019). Konzeption und Evaluation von universell designten Lernumgebungen und Assessments zur Förderung und Erfassung von Nature of Science Konzepten [DoctoralThesis, Hannover : Institutionelles Repositorium der Leibniz Universität Hannover]. https://doi.org/10.15488/5145

Weis, M., & Heine, J.-H. (2020). Assessing Emotion Regulation Strategies in Chile: A Spanish Language Adaptation of the German SSKJ 3-8 Scales. Frontiers in Psychology, 10:2870. https://doi.org/10.3389/fpsyg.2019.02870