Ketika guru atau peneliti mengadakan suatu asesmen (baik dengan tes atau pengamatan), maka salah satu aspek yang harus dimiliki oleh asesmen tersebut adalah reliabilitas. Tes disebut reliabel jika tes tersebut bersifat konsisten atau ajeg, artinya akan memberikan hasil yang relatif sama jika dikerjakan oleh orang yang sama pada kondisi yang berbeda. Sebuah tes yang memberikan hasil yang sangat berbeda ketika dikerjakan pada pagi dan sore hari, maka tes tersebut tidaklah reliabel. Demikian juga ketika tes menghasilkan nilai yang sangat berbeda ketika dikerjakan pada dua waktu yang tidak terlalu lama menunjukkan bahwa tes tersebut tidak konsisten atau reliabel.
Bagaimana cara kita mengetahui reliabilitas suatu tes? Terdapat empat cara yaitu:
- Test-retest Reliability. Pada cara pertama ini seperangkat tes diberikan dua kali di waktu yang berbeda kepada sekelompok siswa yang sama. Hasil tes kemudian dihitung koefisien korelasinya. Nilai koefisien korelasi mulai dari 0 hingga 1. Salah satu kelemahan teknik ini adalah pada penentuan waktu antara kedua tes, jika terlalu lama kemungkinan hasil dipengaruhi oleh berbagai peristiwa dan pelajaran yang diterima oleh siswa. Jika terlalu singkat maka hasilnya akan dipengaruhi ingatan siswa akan tes yang pertama.
- Equivalent-form Reliability. Pada cara yang kedua ini guru atau peneliti tidak hanya membuat satu perangkat tes, tetapi dua perangkat dengan tingkat kesulitan yang setara. Kedia tes dikerjakan pada satu waktu (walaupun ada jeda waktu tetapi singkat). Hasil keduanya kemudian diukur koefisien korelasinya. Kelemahan dari teknik ini adalah menyusun butir-butir tes yang setara (membutuhkan ketelitian dan penguasaan materi yang baik). Selain itu mengadakan dua tes di waktu yang sama akan membuat siswa mengalami stres (sehingga teknik ini sangat jarang digunakan).
- Internal Consistency Reliability. Pada cara ketiga ini perangkat tes hanya satu dan dilakukan juga hanya satu kali. Kepraktisannya membuat teknik ketiga ini yang paling banyak digunakan. Nilai konsistensi internal menunjukkan seberapa terkait masing-masing butir soal dengan konstruk tertentu. Misalnya kita membuat soal-soal untuk mengukur kemampuan mengingat dan memecahkan permasalahan, maka kita dapat melakukan dua analisis reliabilitas untuk masing-masing jenis konstruk soal tersebut. Hasil dari tes diukur koefisien alfanya. Butir dengan koefisien alfa lebih dari 0,7 adalah butir yang reliabel.
- Interscorer (interrater) reliability. Teknik keempat ini digunakan untuk mengukur reliabilitas pada dua pemberi skor (umumnya dua pengamat) yang berbeda. Hasil skor dari kedua pengamat tersebut kemudia dianalisis korelasinya (koefisien korelasi). Selain itu dapat juga menggunakan formula percentage of interrater agreement.
- Christensen, L.B., Johnson, R.B. & Turner, L.A. (2015). Research Methods, Design and Analysis. Twelfth Edition. Essex CM20 2JE: Pearson Education Limited
- Johnson, R.B. & Christensen, L.B. (2017). Educational Research: Quantitative, Qualitative and Mix Approaches. Sixth Edition. Thousand Oaks California: Sage Publications, Inc.
https://pixabay.com
No comments:
Post a Comment