Wakhinuddin’s Weblog


TEORI RESPON BUTIR (TEORI PENGUKURAN MODERN)

TEORI RESPONS BUTIR (Teori Pengukuran Modern Hasil Belajar)

Variabel terpendam (latent) adalah konsep yang mempunyai nilai, namun tidak dapat diukur langsung. Variabel terpendam memiliki konstruk, dan mempunyai parameter-parameter (indikator) yang membangun variabel tersebut. Pengukuran terhadap variabel terpendam dapat dilakukan melalui parameter-parameter ini. Dalam pendidikan, kemampuan (ability) merupakan variabel terpendam. Kemampuan siswa merupakan hasil dari proses-proses pembelajaran di kelas. Dalam pendidikan kejuruan hasil pembelajaran lebih cenderung disebut kompetensi. Lebih jauh dapat dikatakan, hasil pembelajaran pada program keahlian mekanik otomotif SMK adalah kompetensi siswa pada bidang otomotif. Pengukuran kompetensi mekanik otomotif dapat dilakukan melalui tugas-tugas yang membentuk kompetensi. Para ahli telah banyak menemukan metode dan teknik analisis yang dapat mengungkapkan parameter-parameter dari suatu variabel terpendam, seperti: model persamaan struktural , analisis komponen utama . Perkembangan teknik analisis multivariat menjanjikan dapat lebih mengungkapkan sekor-sekor parameter dari suatu variabel terpendam. Teori respons butir tergolong teknik analisis yang dapat mengungkapkan variabel terpendam. Teori respons butir (TRB) banyak dipakai dalam evaluasi pembelajaran terutama membahas kaitan butir dengan respons siswa, dan teori respons butir dapat mengukur kombinasi kemampuan siswa dengan kesukaran aktivitas (butir) melalui parameter siswa dan parameter aktivitas. Ada dua dalil teori respons butir, yaitu: (a) Performansi siswa pada satu aktivitas dapat diprediksi melalui satu kumpulan faktor kemampuan; (b) hubungan antara performansi siswa dan kesukaran aktivitas dapat disampaikan melalui suatu kurva karakteristik aktivitas. Ke-dua dalil ini merupakan suatu alasan untuk membuktikan kebenaran teori respons butir. Kurva karakteristik aktivitas (butir) biasanya diiringi kurva probabilitas, kurva kategorikal, kurva fungsi informasi aktivitas dan kurva fungsi informasi tugas. Parameter siswa adalah sekor nilai siswa, cerminan kemampuan siswa, makin tinggi kemampuan siswa, seharusnya makin tinggi sekor nilai siswa. Parameter kemampuan siswa (siswa dalam konteks lain disebut responden) dinotasikan (Θ). Parameter aktivitas ada dalam bentuk tingkat kesukaran aktivitas, ada aktivitas yang sukar dan ada aktivitas yang mudah, dan makin tinggi taraf sukar aktivitas diperlukan kemampuan siswa makin tinggi untuk mengerjakan (menjawab) betul. Taraf sukar aktivitas dinotasikan (bi). Kaitan kemampuan siswa dengan taraf sukar butir dapat dirumuskan sebagai berikut, Pi (Θ) = f (Θ – bi), persamaan ini disebut model 1 Parameter. Selain itu, butir juga mempunyai karakteristik daya beda, dinotasikan (ai); Karakteristik ini tampak dalam kondisi, ada butir (aktivitas) dapat dijawab (dikerjakan) dengan betul oleh siswa berkemampuan tinggi, namun butir yang sama dijawab salah oleh siswa berkemampuan rendah. Artinya, butir mempunyai daya pembeda kemampuan siswa. Kaitan kemampuan siswa, taraf sukar butir, dan daya pembeda dirumuskan Pi (Θ) = f (ai (Θ – bi)), persamaan disebut model 2 Parameter. Gambar berikut menyampaikan, ada dua butir mempunyai daya pembeda berbeda. Pi (θ) j i Θ1 b θ2 θ a j > ai Gambar 2.1 : Daya beda dari dua butir (i dan j) digambar secara kurva karakteristik butir Pada proses pengujian siswa, terutama pada tes objektif pilihan ganda, ada kemungkinan siswa melakukan tebakan, yaitu ada butir yang terjawab betul hanya karena kebetulan. Hubungan kemampuan siswa dengan taraf sukar butir, daya pembeda, dan tingkat kebetulan dirumuskan sebagai berikut, Pi (Θ) = ci + (1 – ci). f (ai (Θ – bi)). Bila bi = Θ, maka Pi (Θ) = ci +0,5 . (1 – ci), persamaan ini dikenal dengan model 3 Parameter. Pada ketiga model karakteristik butir di atas, probabilitas jawaban betul butir berhubungan dengan kemampuan siswa (Θ), ai, bi, dan ci. Dalam konteks ini, teori repons butir (TRB) mempunyai sebutan sebagai teori tes probabilistik (probabilistic test theory), karena teori respons butir mengadopsi model probabilitas untuk melacak parameter-parameter variabel terpendam. Teori respons butir menggunakan distribusi probabilitas dalam bentuk kumulatif, dan secara empiris menunjukkan bahwa probabilitas jawaban betul pada butir ke–i berhubungan dengan kemampuan siswa, andaikata data-data hubungan keduanya digambarkan akan terbentuk grafik ojaif normal. Dari data probabilitas jawaban betul dan kemampuan responden dapat membuat bentuk grafik ojaif beraneka, ada yang landai dan adapula yang curam. Setiap grafik (kurva) menggambarkan bagaimana keadaan nilai parameter butir (b, а, c) dan parameter kemampuan (θ) responden. Model ideal atau skala sempurna suatu variabel terpendam ada dalam kondisi Θ < bi dimana Pi(Θ) = 0 dan Θ ≥ dimana Pi (Θ) = 1, digambarkan; P (θ) 1,00 Probabilitas respons positif 0,00 bi (Karakteristik latent ) Gambar 2.2: Kaitan antara probabilitas respons positif dan karakteristik terpendam dengan model sempurna. Gambar 2.2 di atas merupakan model sempurna pengukuran variabel terpendam, sangat jarang hasil pengukuran memenuhi persyaratan model ideal. Gambar 2.2 diatas merupakan tampilan penskalaan Guttman yang mengukur variabel latent sikap. Secara empirik (data siswa dan data butir) sesuai dengan teori respons butir modern. Karakter skala Guttman adalah penskalaan teknik kumulatif, pengukuran tunggal-matra (unidimensional), menggunakan sekor individu dan sekor total . Oleh karena itu, penskalaan Guttman dianggap memenuhi syarat teori respons butir (TRB). Suatu jawaban dianggap berdimensi tunggal hanya kalau jawaban itu menghasilkan skala yang kumulatif, yaitu skala yang butir-butirnya berkaitan satu sama lain sedemikian rupa sehingga siswa yang mampu mengerjakan butir nomor 2 (dua), juga mampu mengerjakan butir nonor 1 (satu).Jadi siswa yang mampu mengerjakan butir nomor lebih tinggi, sudah tentu dia mampu mengejakan butir nomor lebih rendah. Karakter penskalaan demikian dapat dipakai pada skala penilaian tes performansi. Awalnya model teori respons butir (TRB) hanya dipakai pada pensekoran dikotomi, dalam perkembangannya, sekarang telah digunakan pada pensekoran polikotomi (politomi). Model TRB format respons butir dikotomi ada tiga jenis, yaitu: Rasch model (model logistik satu parameter), model logistik dua parameter, model logistik tiga parameter. Model TRB dengan format respons butir politomi, mencakup: model bertingkat, model nominal, model kredit parsial, dan model skala penilaian. Penggunaan TRB pada pensekoran politomi menunjukkan bahwa TRB dapat dipakai pada skala penilaian tes performansi. Deskripsi karakteristik TRB pada ke tujuh model dapat disampaikan pada tabel 2.1. Tabel 2.1 : Karakteristik model Teori respons butir Model Format Respons Butir Karakteristik Model Model Rasch/ Model Logistik satu parameter Dikotomi Daya beda untuk menjelasan semua butir. Keragaman batas lulus untuk menjelaskan semua butir Model Logistik dua parameter Dikotomi Keragaman pembeda dan batas lulus menjelaskan butir-butir. Model Logistik dua parameter Dikotomi Termasuk psuedo – parameter tebakan Model tingkat Politomi Respons ordinal. Keragaman pembeda menjelaskan butir Model nominal Politomi Bukan untuk butir ordinal. Keragaman diskriminan menjelaskan butir. Model kredit partial Politomi Daya beda paksa sama dengan menjelaskan butir Model skala penilaian Politomi Pembeda sama dengan penjelasan butir. Batas lulus pilihan butir sama dengan penjelasan butir Pada model logistik sedikit ada perbedaan dari model teori respon butir umum, perbedaan pada posisi grafik ojaif, yaitu memotong garis sumbu vertikal. Sehingga sumbu absis pada model logistik berada antara skala bernilai (-4) yang diposisikan disebelah kiri sumbu vertikal dan skala nilai (+4) berada pada sebelah kanan sumbu vertikal. Pada penelitian ini dipakai pendekatan model perluasan Rasch, model ini menawarkan interpretasi sederhana untuk analisis butir dan pensekoran skala. Keuntungan model Rasch, karakteristik butir dan responden lebih stabil dengan sampel kecil. b. Perluasan Rasch Model Rasch merupakan bagian teori respon butir, dan pada model Rasch hanya parameter taraf kesukaran butir (bi) dimasukan ke dalam model. Model Rasch adalah suatu metode pengukuran untuk mendapatkan hal yang fundamental dari pengukuran linear dan pengamatan respons kategori (Wright & Master, 1982; dalam Charles T. Sherron, 2000) . Model pengukuran Rasch mempunyai formulasi matematik, dimana observasi tentang kedudukan relatif responden dan butir dihubungan satu sama lainnya. Sehingga, ketidakaturan data diproses menjadi suatu kemungkinan (probability), pengurutan (order), dan pemilahan (independent) dua atau lebih butir dan dua atau lebih responden. Inilah keistimewaan model Rasch, dapat menghindari campur baur kemampuan respon dengan kesukaran butir. Pemasukan sekumpulan data ke model Rasch harus terlebih dahulu memenuhi tiga persyaratan, yaitu invarian, unidimensi, dan independensi lokal. Invarian dapat diartikan taraf sukar butir tidak tergantung pada kemampuan responden. Unidimensional didefinisikan sebagai satu dimensi, yaitu semua butir mengukur satu konstruk, unidimensi berarti hanya satu kemampuan yang diukur oleh sejumlah butir dalam ujian. Indepedensi lokal dapat diartikan tampilan seorang peserta tes pada satu butir tidak mempengaruhi unjuk kerjanya pada butir yang lain. Sifat lain dari model Rasch adalah aditifiti, dimana sifat dari unit pengukuran sama pada garis kontinum. Satuan ukuran kemampuan dan kesukaran butir dalam model Rasch disebut unit logits (Log-odd units). Bertalian dengan peluang sukses, rumus Rasch skala dikotomi ditulis : Pi(θ) Os = ———- Qi(θ) Logit sukses adalah logaritma natural dari kesempatan sukses, yaitu: Logit (s) = Ln Os = D (θ – bi) atau Log (Pni/(1-Pni)) = Bn – Di Keterangan : Bn = kemampuan responden, Di = taraf sukar butir. Pola probabilitas jawaban terjadi sesuai karakteristik siswa dan karakteristik butir tersebut. Jika kemampuan siswa sama persis dengan tingkat kesukaran butir, nilai kemungkinan siswa tersebut menjawab butir dengan benar adalah 0,50. Untuk mengestimasi parameter kemampuan siswa (θ) dan parameter taraf kesukaran butir (bi) dapat dilakukan dengan beberapa prosedur, antara lain: Unconditional Maximum Likelihood (UCON), Uniform Aproximation (UFORM), Newton-Raphson, Joint Maximum Likelihood (JML), Normal Approximation (PROX), prosedur iterasi, dan lainnya. Metode estimasi Prox dan iterasi dipakai mengestimasi parameter secara serentak. Pada kedua metode estimasi hanya mengetahui kemampuan Pi(θ), sedang parameter lain diestimasi sekornya. Kedua pendekatan lebih sederhana dalam pemakaian, tidak terlalu rumit seperti metode Newton-Raphson yang sangat matematis. Di samping itu, ketersediaan program komputer, dan komputer berkapasitas memori besar serta kecepatan tinggi membuat kedua metode estimasi ini semakin mudah pemakaiannya dalam mencari parameter. Setelah estimasi sekor-sekor parameter diketahui besar dan sebarannya, kemudian sekor-sekor tersebut dapat digunakan melihat kecocokan antara apa yang diprediksi oleh model dan apa yang diperoleh dari responden, perbedaan harapan model dengan kenyataan dapat dicari dengan statistik kecocokan. Pada awalnya model Rasch berkecimpung hanya pada bentuk tes dikotomi, belakangan ini model Rasch telah berkembang untuk jenis tes bersifat multiaspek (multifacets), seperti interaksi responden dengan butir. Situasi multiaspek terjadi pada proses penjurian (penilaian indirect), selain aspek responden (siswa) dan tugas (butir), aspek lain ikut berinteraksi adalah aspek penilai (juri). Untuk suatu situasi penjurian, biasanya dipakai alat ukur politomi, seperti skala penilaian (rating scale). Model perluasan Rasch untuk multiaspek dan pengguna skala penilaian adalah, Log (Pnijk/Pnij(k-1)) = Bn – Di – Cj – Fk Keterangan : Bn = kemampuan responden, n = 1 Di = taraf sukar butir, i = 1 Cj = kepelikan penilai, j = 1 Fk = kategori kesukaran skala observasi, k = 1-6 Pnijk = Probabilitas responden dinilai pada butir (i) oleh penilai (j), dengan kategori nilai (k). Pnij(k-1) = Probabilitas responden dinilai pada butir (i) oleh penilai (j), dengan kategori nilai (k-1). (John M Linacre., Benjamin D.Wright., Mary E Lunz, 1990:2) . Rumus di atas digunakan untuk menilai tampilan kompetensi seseorang yang dinilai semua Penilai (juri) pada semua butir (aktivitas). Formula untuk penilaian dengan butir sama namun penilai berubah menjadi : Log (Pnijk/Pnij(k-1)) = Bn – Di – Cj – Fjk Keterangan: Fjk = kategori kesukaran skala observasi dengan Penilai (juri) berbeda dan pilihan berbeda. Model perluasan Rasch (rasch extended) dapat mengolah data politomi, seperti data berasal dari tes kompetensi mekanik otomotif. Semua persyaratan dan sifat yang dimiliki model Rasch pensekor dikotomi juga berlaku pada model perluasan Rasch pensekoran politomi. Penggunaan model Rasch dapat meningkatkan kualitas pengukuran, diantaranya analisis konsistensi respons responden terhadap butir. Kualitas pengukuran seperti tingkat ketepatan suatu ujian dapat diketahui melalui fungsi informasi ujian.

MAAF, tulisan ini lari dari settingnya, tadinya ada tabel dan grafik, namun tidak tampil, mungkin saya belum mengetahui bagaimana menampilkannya. Kalau Bapak/ibu ingin tulisan lengkap, respon melalui WordPress, dan akan saya emailkan. Thank U for komunitas wordpress

Iklan