Tingkat Kesukaran
Tingkat kesukaran soal berfungsi untuk mengelompokan soal ke dalam kategori mudah, sedang, atau sukar. Butir-butir dalam soal dapat dinyatakan baik jika tidak terlalu mudah dan tidak terlalu sukar atau dalam kategori sedang. Tiap butir soal dapat dikatakan sukar atau tidaknya dilihat berdasarkan indeks kesukaran dalam persamaan berikut:
P = B/Js
Keterangan:
P = indeks kesukaran untuk setiap butir soal
B = banyaknya peserta didik yang menjawab benar setiap butir soal
JS = jumlah peserta didik peserta tes
Nilai indeks kesukaran soal dapat diketahui dengan cara membandingkan nilai tersebut dengan Tabel berikut:
Interval Indeks Kesukaran | Kriteria |
0,00-0,29 | Sukar |
0,30-0,70 | Sedang |
0,71-1,00 | Mudah |
(Arikunto, 2012)
Semakin tinggi indeks kesukaran maka butir soal dinyatakan semakin mudah, dan sebaliknya semakin kecil indeks kesukaran maka butir soal dinyatakan semakin sukar. Soal dengan kategori sedang merupakan tipe soal diagnostik yang baik dikarenakan soal tes tidak terlalu sukar maupun terlalu mudah. Artinya peserta didik yang memiliki penguasaan konsep rendah tidak terlalu kesulitan dalam mengerjakan tes dan peserta didik dengan tingkat penguasaan konsep tinggi tidak kemudahan mengerjakan soal.
Daya Pembeda
Daya pembeda ini berfungsi untuk membedakan antara peserta didik yang pandai dengan peserta didik yang berkemampuan rendah. Butir soal yangmempunyai daya beda positif dan tinggi berarti butir tersebut dapat membedakan dengan baik peserta didik kelompok atas dan bawah. Daya pembeda soal ini dapat ditentukan menggunakan persamaan berikut:
Keterangan:
PT = proporsi peserta didik yang menjawab benar pada kelompok peserta didik yang mempunyai kemampuan tinggi
PR = proporsi peserta didik yang menjawab benar pada kelompok peserta didik yang mempunyai kemampuan rendah
∑TB = jumlah peserta yang menjawab benar pada kelompok peserta didik yang mempunyai kemampuan tinggi
∑T = jumlah kelompok peserta didik yang mempunyai kemampuan tinggi
∑RB = jumlah peserta yang menjawa benar pada kelompok peserta didik yang mempunyai kemampuan rendah
∑R = jumlah peserta didik yang mempunyai kemampuan rendah
(Miterianifa & Zien, 2016)
Nilai daya beda soal dapat diketahui dengan cara membandingkan nilai tersebut dengan Tabel berikut:
Koefisien daya pembeda | Kriteria |
0,40-1,00 | Sangat baik |
0,30-0,39 | Baik |
0,20-0,29 | Cukup |
0,00-0,19 | Jelek |
Validitas Soal (Korelasi Skor Butir dengan Skor Total)
Validitas pada suatu instrumen soal dapat ditentukan oleh validitas butir-butir soalnya. Instrumen soal bersifat valid apabila butir-butir soalnya valid. Validitas butir ditunjukkan berdasarkan seberapa jauh hasil ukur butir yang konsisten dengan hasil ukur tes secara keseluruhan. Korelasi skor butir dengan skor total dapat terlihat berdasarkan besaran koefisien korelasi antara skor butir dengan skor total tes. Jika koefisien korelasi skor butir dengan skor total tes positif dan signifikan maka butir tersebut valid berdasarkan ukuran validitas internal. Koefisien korelasi yang tinggi antara skor butir dengan skor total menunjukkan konsistensi yang tinggi antara hasil ukur keseluruhan tes dengan hasil ukur butir tes atau dapat dikatakan bahwa butir tes tersebut konvergen dengan butir-butir lain dalam mengukur suatu konsep atau konstruk yang hendak diukur (Matondang, 2009). Korelasi skor butir dengan skor total ditentukan menggunakan koefisien korelasi biserial (rpbi) pada persamaan.
Keterangan:
rpbi = Koefisien korelasi poin biserial
Mp = Rata-rata skor dari subjek yang menjawab benar bagi item yang dicari Validitasnya
Mt = Rata-rata skor total
SDt = Standar deviasi dari skor proporsi
p = Proporsi peserta didik yang menjawab benar, dengan rumus:
p = Banyaknya siswa yang benar/jumlah seluruh siswa
q = Proporsi peserta didik yang menjawab salah, dengan rumus: (q = 1-P)
Nilai koefisien korelasi dibandingkan dengan nilai koefisien korelasi yang ada di tabel-r pada alpha = 0,05. Jika koefisien korelasi skor butir dengan skor total lebih besar dari koefisien korelasi dari tabel-r, koefisien korelasi butir signifikan dan butir tersebut valid secara empiris.
Estimasi Reliabilitas
Reliabilitas berasal dari kata reliability yang mempunyai asal kata rely yang artinya percaya dan reliabel yang artinya dapat dipercaya. Keterpercayaan berhubungan dengan ketepatan dan konsistensi. Tes hasil belajar dikatakan dapat dipercaya apabila memberikan hasil pengukuran hasil belajar yang relatif tetap secara konsisten (Miterianifa & Zien, 2016). Estimasi reliabilitas instrumen yang digunakan adalah rumus KR 20. Instrumen dikatakan reliabel ketika nilai r11 yang didapatkan ≥ 0,7. Rumus Kuder Richardson 20 yaitu pada persamaan berikut:
Keterangan:
r11 = reliabilitas
p = proporsi subjek yang menjawab item dengan benar
q = proporsi subjek yang menjawab item dengan salah (q = 1-p)
∑pq = jumlah hasil perkalian antara p dan q
N = banyaknya item
S = standar deviasi tes
Referensi
Arikunto, S. (2012). Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Akasar.
Matondang, Z. (2009). Validitas Dan Reliabilitas Suatu Instrumen Penelitian. Jurnal Tabularsa PPS Unimed, 6(1), 87–97.
Miterianifa, & Zien, M. (2016). Evaluasi Pembelajaran Kimia (Model integrasi Sains Dengan Islam). Pekanbaru: Cahaya Firdaus.