- Universitas Negeri Yogyakarta

ABSTRAK
RAHMAWATI: Penyetaraan Skor Tes dan Deteksi Item Parameter Drift
Menggunakan Metode Robust Z yang Dimodifikasi. Disertasi. Yogyakarta:
Program Pascasarjana Universitas Negeri Yogyakarta, 2014.
Studi ini bertujuan untuk: (1) memperbaiki kriteria yang digunakan metode
Robust Z dalam mendeteksi item parameter drift(IPD), (2) mengetahui kelebihan
serta kelemahan hasil modifikasi metode Robust Z, dan (3) mengimplementasikan
hasil modifikasi pada data empirik untuk mengetahui pengaruh IPD terhadap
konsistensi klasifikasi kelulusan.
Penelitian ini merupakan penelitian deskriptif yang mencakup deskripsi proses
modifikasi metode dan deskripsi implementasi hasil modifikasi. Penelitian ini
menggunakan dua jenis data, yaitu: data bangkitan dan data empirik. Data bangkitan
berupa respon 20.000 siswa terhadap 40 butir soal dikotomus dengan memanipulasi 6
variabel berikut: (1) bentuk distribusi kemampuan peserta, (2) perbedaan kemampuan
antar kelompok, (3) jenis drifting, (4) magnitude drifting, (5) panjang set soal anchor,
dan (6) jumlah soal drifting. Setiap kondisi manipulasi direplikasi sejumlah 50 kali
sehingga total digunakan 18.800 dataset pada studi simulasi. Populasi data empirik
adalah siswa peserta ujian nasional SD/MI tahun 2011 pada paket utama baik pada
bidang studi Bahasa Indonesia, matematika, dan IPA. Total digunakan 41 paket tes
untuk setiap bidang studi dan respon dari 4.187.444 peserta ujian. Modifikasi metode
Robust Z digunakan untuk mendeteksi IPD dan mendapatkan konstanta penskalaan.
Konsistensi klasifikasi kelulusan dianalisis dengan menggunakan metode penyetaraan
IRT true score.
Hasil penelitian menunjukkan: (1) kriteria selisih 0,5 rawscore pada test
characteristic curve menghasilkan konsistensi kelulusan 100%, (2) akurasi metode
Robust Z modifikasi baik untuk mendeteksi drifting tingkat kesukaran dan drifting
campuran pada kondisi jumlah soal anchor minimal 25% namun tidak akurat pada
kondisi jumlah soal IPD 40% dari total soal anchor, (3) IPD yang muncul pada tes
UN SD/MI 2011 berpengaruh terhadap status kelulusan lebih dari 2000 siswa peserta
ujian. Hasil deteksi IPD dapat digunakan sebagai indikator perbedaan hasil
pembelajaran antar wilayah.
Kata Kunci: Metode Robust Z, Item Parameter Drift, Penyetaraan IRT True Score
ABSTRACT
RAHMAWATI: Equating Score and Detecting Item Parameter Drift Using the
Modified Robust Z Method. Dissertation. Yogyakarta: Graduate School,
Yogyakarta State University, 2014.
This study aims at: (1) revising the criterion used in Robust Z Method for
detecting item parameter drift (IPD), (2) identifying the strengths and weaknesses of
the modified Robust Z Method, and (3) implementing the modified method on
empirical data in order to investigate the effect of IPD on examinees’ classification
consistency.
This study was a descriptive research which described the modification
process and results of the modification implementation. This study used two types of
data: simulated data and empirical data. The simulated data were in the form of
responses of 20,000 students on 40 dichotomous items generated by simulating six
variables including: (1) ability distribution, (2) differences of ability between groups,
(3) type of drifting, (4) magnitude of drifting, (5) anchor test length, and (6) number
of drifting items. Each condition was replicated 50 times and thus resulted in 18,800
datasets for the simulation study. The population of the empirical data was examinees
of UN SD/MI 2011 who administered the main test of Indonesian language,
mathematics, and science. In total, 41 test forms for each subject were used and
4,187,444 students responses were analyzed. Modified Robust Z method was used to
detect IPD and the IRT true score equating method was used to analyze the
classification consistency.
The results of this study show that: (1) the criterion of 0.5 poin raw score TCC
difference leads to 100% consistency on passing classification, (2) the modified
Robust Z is accurate to detect the item difficulty drifting and mixed drifting when the
minimal length of anchor test is 25%, but less accurate to detect IPD when the
number of IPD is 40% of the anchor test’s length, (3) IPD occurring in on empirical
data affected the passing status of more than 2,000 students. In addition, IPD
detection results on empirical data can be used as an indicator of differences of
opportunity to learn accross provinces.
Keywords: Robust Z Method, Item Parameter Drift, IRT True Score Equating