48
BAB IV
HASIL PENELITIAN DAN PEMBAHASAN
A. Hasil Penelitian
1. Hasil Pengembangan Instrumen
Pada rancangan awal, instrumen terdiri dari 4 paket yang setiap
paket terdiri dari 10 soal uraian, kisi-kisi, kunci jawaban, dan panduan
penskoran. Paket instrumen tersebut kemudian diberi nama “Paket 1”,
“Paket 2”, “Paket 3”, dan “Paket 4”. Rancangan awal instrumen
evaluasi dapat dilihat pada Lampiran 2 halaman 83-133. Paket
instrumen disusun dengan mempertimbangkan 4 indikator kemampuan
berpikir kritis yang harus ada di masing-masing paket. Namun, satu soal
tidak memuat keempat indikator kemampuan berpikir kritis. Oleh karena
itu, muatan indikator kemampuan berpikir kritis dilihat berdasarkan
ketercukupannya pada masing-masing paket. Rincian indikator yang
termuat dalam masing-masing paket disajikan pada tabel berikut:
Tabel 9. Muatan Indikator Kemampuan Berpikir Kritis Pada Instrumen
Awal Penelitian
Indikator Kemampuan Berpikir Kritis
Paket Interpretasi Analisis Menjelaskan Evaluasi
Paket 1 V V V V
Paket 2 V V V V
Paket 3 V V V V
Paket 4 V V V V
Keterangan: V = ada; rincian indikator yang termuat pada masing-masing
soal disajikan secara lengkap pada Lampiran 2 halaman 83-86.
Validasi dilakukan dengan menyerahkan lembar validasi ahli, kisi-
kisi, soal, kunci jawaban dan panduan penskoran. Kemudian ahli diminta
49
untuk menilai kesesuaian instrumen dengan indikator yang ada pada
lembar validasi ahli. Aspek yang dinilai meliputi 3 hal, yaitu: (1) materi;
(2) konstruksi; dan (3) bahasa. Hasil penilaian ahli/validator disajikan
dalam tabel 10, 11, dan 12. Selain hasil ketiga aspek penilaian tersebut,
ahli menyatakan bahwa keempat paket instrumen evaluasi tersebut dapat
diujicobakan setelah dilakukan revisi. Dokumentasi hasil penilaian
ahli/validator dapat dilihat pada Lampiran 6 halaman 195-218.
Tabel 10. Hasil Penilaian Indikator Materi Instrumen
No. Indikator Skor (%) Kriteria
1 Materi soal sesuai dengan tujuan
pengukuran
88,33 Sangat Baik
2 Butir soal sesuai dengan indikator 81,67 Baik
3 Materi soal sesuai dengan
tingkat/jenjang pendidikan siswa
80,00 Baik
4 Hanya ada satu jawaban yang benar 80,00 Baik
5 Masalah yang disajikan menarik
bagi siswa
75,00 Baik
Rata-rata 81,00 Baik
Tabel 11. Hasil Penilaian Indikator Konstruksi Instrumen
No. Indikator Skor (%) Kriteria
1 Setiap butir soal tidak bergantung
satu sama lain
93,33 Sangat Baik
2 Penyelesaian soal lebih dari satu
langkah
90,00 Sangat Baik
3 Merangsang kemampuan berpikir
kritis siswa
83,33 Sangat Baik
4 Merangsang rasa ingin tahu siswa 83,33 Sangat Baik
5 Rumusan pertanyaan soal
menggunakan kata tanya atau
perintah yang menuntut siswa
menguraikan jawaban
80,00 Baik
6 Penyajian gambar, grafik, tabel,
atau sejenisnya disajikan secara
jelas dan dapat dipahami
78,33 Baik
7 Petunjuk mengerjakan soal jelas
dan dapat dipahami
78,33 Baik
8 Terdapat pedoman penskoran 85,00 Baik
Rata-rata 83,96 Baik
50
Tabel 12. Hasil Penilaian Indikator Bahasa Instrumen
No. Indikator Skor (%) Kriteria
1 Penggunaan bahasa sesuai dengan
EYD
80,00 Baik
2 Bahasa yang digunakan
komunikatif
78,33 Baik
3 Tidak menggunakan bahasa yang
berlaku setempat
86,67 Baik
4 Rumusan soal tidak menimbulkan
penafsiran ganda
73,33 Baik
5 Rumusan soal tidak mengandung
kata-kata yang dapat menyinggung
perasaan siswa
85,00 Baik
Rata-rata 80,67 Baik
Selanjutnya, skor yang diperoleh dari penilaian ahli digunakan untuk
menghitung koefisien validitas isi instrumen. Besarnya koefisien
validitas ditentukan berdasarkan indeks Aiken. Berdasarkan hasil
penghitungan, diperoleh hasil sebagai berikut:
Tabel 13. Perolehan Indeks Aiken Instrumen Evaluasi
No. Instrumen Indeks Aiken Keterangan
1. Paket 1 0,75 Cukup valid (sedang)
2. Paket 2 0,78 Cukup valid (sedang)
3. Paket 3 0,80 Cukup valid (sedang)
4. Paket 4 0,78 Cukup valid (sedang)
Rata-rata 0,78 Cukup valid (sedang)
Berdasarkan tabel di atas, keempat paket instrumen evaluasi
memiliki nilai rata-rata indeks Aiken sebesar 0,78. Hasil ini
menunjukkan bahwa instrumen memiliki validitas yang cukup (sedang)
dalam mengukur kemampuan berpikir kritis. Sehingga, instrumen dapat
dinyatakan layak untuk diujicobakan setelah dilakukannya revisi.
51
2. Hasil Revisi Produk
Revisi instrumen dilakukan berdasarkan masukan dari ahli/validator.
Secara umum, saran atau masukan yang diperoleh selama proses validasi
dari ahli disajikan pada Tabel 14 halaman 52.
Pada lembar kisi-kisi instrumen awal penelitian (lihat Lampiran 2
halaman 83-86) terdapat beberapa kata kerja operasional yang diganti.
Seperti Indikator Soal 1.1 pada Paket 1 yang tertulis “Siswa dapat
memahami konsep untung dalam proses jual beli”. Ahli mengatakan
bahwa “memahami” tidak dapat digunakan sebagai kata kerja
operasional pada indikator soal. Karena, kata tersebut sangat sulit diukur.
Oleh karena itu, kalimat tersebut diganti menjadi “Siswa dapat
memecahkan masalah terkait konsep untung dalam proses jual beli”.
Selain itu, terdapat kesalahan pemahaman terkait sistem persamaan
linear. Pada Indikator Soal 2.2 Paket 1 tertulis “Siswa dapat menentukan
solusi dari soal cerita yang berkaitan dengan sistem persamaan linear
satu variabel”. Persamaan linear satu variabel tidak dapat dikatakan
suatu sistem. Sehingga, kata “sistem” dihilangkan menjadi “Siswa dapat
menentukan solusi dari soal cerita yang berkaitan dengan persamaan
linear satu variabel”. Sedangkan pada semua paket penulisan
“aritmatika” diubah menjadi “aritmetika”. Informasi perbaikan instrumen
disajikan secara lengkap pada Lampiran 3 halaman 135-144.
Selain mempertimbangkan saran/masukan ahli di atas, revisi
dilakukan dengan mempertimbangkan soal yang dibuang dan muatan 4
52
indikator kemampuan berpikir kritis yang ada pada masing-masing paket
soal. Apabila terdapat paket soal yang kekurangan salah satu atau
beberapa indikator kemampuan berpikir kritis, maka diambil soal dari
paket lain atau soal baru yang memuat indikator tersebut sehingga
masing-masing paket soal memuat 4 indikator kemampuan berpikir
kritis.
Tabel 14. Perbaikan Instrumen Evaluasi Secara Umum
No. Saran/Masukan Perbaikan
1. Jumlah soal terlalu banyak Mengurangi jumlah soal agar sesuai
dengan alokasi waktu yang ada
2. Kata kerja operasional yang
digunakan dalam kisi-kisi
soal kurang jelas
Mengganti kata kerja operasional
pada kisi-kisi dengan kata kerja yang
lebih mudah diukur
3. Kalimat soal tidak sesuai
dengan kaidah penulisan
yang baku
Mengganti kalimat soal agar sesuai
dengan kaidah penulisan yang baku
4. Konteks yang digunakan
dalam soal terlalu
mengada-ada
Menghapus atau memperbaiki soal
dengan masalah yang lebih realistik
atau kontekstual
5. Kalimat soal bermakna
ambigu
Mengganti atau melengkapi kalimat
soal agar tidak bermakna ambigu
6. Pemilihan kata pada soal
tidak tepat
Mengganti kata pada soal yang
sesuai dengan konteksnya
7. Soal atau kunci jawaban
yang disusun tidak sesuai
dengan aturan matematika
yang baik dan benar
Menghapus atau memperbaiki soal
serta kunci jawaban agar sesuai
dengan aturan matematika yang baik
dan benar
Pada lembar soal juga terdapat beberapa perbaikan. Instrumen
rancangan awal terdiri dari 10 soal uraian untuk setiap paket. Setelah
revisi, setiap paket hanya terdiri 8 soal disebabkan oleh ketersediaan
waktu pelaksanaan tes. Oleh karena itu, terdapat beberapa soal yang
dibuang tanpa penggantian. Soal yang dibuang tanpa penggantian
disajikan pada Tabel 15 halaman 53. Sedangkan, soal yang tidak dibuang
53
namun dengan perbaikan dapat dilihat pada Lampiran 3 halaman 135-
144.
Tabel 15. Soal yang Dibuang pada Instrumen Rancangan Awal
No. Soal yang Dibuang Keterangan
1 Paket 2 nomor 2 Soal rutin/tidak mengukur kemampuan
berpikir kritis
2 Paket 3 nomor 1
Maksud soal tidak jelas & terjadi
kesalahan konsep dalam penyusunan soal
3 Paket 3 nomor 4
Soal rutin/tidak mengukur kemampuan
berpikir kritis
4 Paket 3 nomor 5
Soal rutin/tidak mengukur kemampuan
berpikir kritis
5 Paket 3 nomor 6
Soal rutin/tidak mengukur kemampuan
berpikir kritis
6 Paket 3 nomor 9
Soal rutin/tidak mengukur kemampuan
berpikir kritis
7 Paket 4 nomor 9
Soal rutin/tidak mengukur kemampuan
berpikir kritis
8 Paket 4 nomor 10 Soal terlalu mudah
Setelah dilakukan revisi, dihasilkan instrumen evaluasi baru dengan
nama “Paket A”, “Paket B”, “Paket C”, dan “Paket D” yang masing-
masing paket terdiri dari 8 soal uraian, kisi-kisi soal, kunci jawaban dan
panduan penskorannya. Sebagaimana instrumen awal penelitian, setiap
soal pada paket tersebut tidak memuat keempat indikator kemampuan
berpikir kritis. Oleh karena itu, muatan indikator kemampuan berpikir
kritis dilihat berdasarkan ketercukupannya pada masing-masing paket.
Muatan indikator kemampuan berpikir kritis pada instrumen akhir
penelitian disajikan pada Tabel 16 halaman 54.
54
Tabel 16. Muatan Indikator Kemampuan Berpikir Kritis Pada Instrumen
Akhir Penelitian
Indikator Kemampuan Berpikir Kritis
Paket Interpretasi Analisis Menjelaskan Evaluasi
Paket A V V V V
Paket B V V V V
Paket C V V V V
Paket D V V V V
Keterangan: V = ada; rincian indikator yang termuat pada masing-
masing soal disajikan secara lengkap pada Lampiran 4 halaman 146-
149.
3. Hasil Uji Coba Produk
Uji coba instrumen dilakukan di SMA N 1 Boyolali yang beralamat
di Jalan Kates No. 8 Boyolali. Sebelum melakukan uji coba, peneliti
berkoordinasi dengan kepala sekolah beserta guru matematika di sekolah.
Selanjutnya, untuk memperoleh izin penelitian, peneliti menyiapkan
beberapa syarat administrasi berupa surat-surat yang disajikan pada
Lampiran 1 halaman 73-81. Sebagai hasilnya, peneliti dapat melakukan
penelitian pada hari Kamis dan Jum’at, tanggal 17-18 Maret 2016.
Paket soal yang diujicobakan pada tahap ini adalah Paket A dari
instrumen akhir penelitian. Namun, Paket B, C, dan D dapat dinyatakan
sebagai instrumen yang valid berdasarkan hasil validasi ahli terhadap
Paket 1, 2, 3, dan 4 pada instrumen awal penelitian. Selain itu, masing-
masing paket disusun secara paralel dengan mempertimbangkan
indikator kemampuan berpikir kritis yang dimuat. Oleh karena itu, hal ini
diharapkan tidak berpengaruh secara siginifikan pada validitas paket
yang tidak diujicobakan.
55
Tabel 17. Hasil Perolehan Nilai Siswa Keseluruhan
No. Interval Nilai Banyak Siswa
1 13 – 21 1
2 22 – 30 15
3 31 – 39 39
4 40 – 48 31
5 49 – 57 24
6 58 – 66 28
7 67 – 75 7
8 76 – 84 1
TOTAL 146
Rata-rata 46,03
Dari 7 kelas XI kelompok matematika dan ilmu alam (MIA),
penelitian dilakukan pada 5 kelas XI MIA, yaitu MIA 2, MIA 3, MIA 4,
MIA 6, dan MIA 7. Banyak siswa dari kelima kelas yang mengikuti tes
adalah 146 orang. Saat pelaksanaan tes, banyak siswa dari masing-
masing kelas mengikuti Pekan Olahraga Pelajar Daerah (POPDA),
sehingga jumlah siswa yang seharusnya ada di kelas lebih dari 146 orang.
Dua kelas lain, yaitu XI MIA 1 dan 5 memiliki jadwal mata pelajaran
matematika yang sama dengan kelas yang dikenakan uji coba, sehingga
tidak dapat dikenakan uji coba pada saat bersamaan. Sedangkan, pada
pekan setelah pelaksanaan uji coba, kelas XII melaksanakan ujian,
sehingga hampir semua ruang kelas digunakan dan kelas X serta XI
diliburkan. Hasil perolehan nilai siswa disajikan pada Tabel 17.
Kemudian, penentuan kelulusan siswa yang ditentukan berdasarkan rata-
rata/mean aktual sebagai batas kelulusan disajikan pada Tabel 18
halaman 56. Hasil lengkap perolehan nilai siswa dapat dilihat pada
56
Lampiran 5 halaman 188-192, sedangkan contoh jawaban siswa dapat
dilihat pada Lampiran 6 halaman 219-224.
Tabel 18. Hasil Kelulusan Siswa Berdasarkan Mean
No. Keterangan Interval Nilai Banyak Siswa
1 Tidak Lulus (TL) < 46 75
2 D 46 – 56 35
3 C 57 – 66 28
4 B 67 - 75 7
5 A > 75 1
TOTAL 146
4. Hasil Analisis Data
a. Validitas konstruk instrumen evaluasi
1) Pengujian KMO and Bartlett’s Test
Pada tahap ini, diperoleh nilai Chi-kuadrat pada uji Bartlet
menggunakan program SPSS 16.0 sebesar 63,028 dengan
derajat kebebasan 28 dan nilai signifikan 0,000. Hasil
selengkapnya disajikan pada Tabel 19.
Tabel 19. KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. 0,572
Bartlett's Test of Sphericity Approx. Chi-Square 63,028
df 28
Sig. 0,000
Hasil ini menunjukkan bahwa sampel sebanyak 146 pada
analisis faktor ini telah cukup dan dapat dilakukan analisis lebih
lanjut. Hal ini diperkuat dengan Kaiser-Meyer-Olkin measure of
sampling adequacy (KMO) sebesar 0,572 yang melebihi 0,5.
Dari analisis tersebut juga diperoleh nilai signifikansi Barlett’s
Test yang kurang dari 0,01 Artinya, pada penelitian ini terdapat
57
korelasi yang sangat signifikan antar variabel dan hasil
penghitungan KMO.
2) Pengujian Total Variance Explained
Hasil penghitungan menggunakan SPSS yang disajikan
pada Tabel 20 menunjukkan bahwa data respons siswa terhadap
soal matematika yang dikembangkan terdapat 3 nilai Eigen yang
lebih besar dari 1. Hasil selengkapnya disajikan pada tabel
berikut:
Tabel 20. Total Variance Explained
Component Initial Eigenvalues
Total % of Variance Cumulative %
1 1,731 21,641 21,641
2 1,300 16,248 37,890
3 1,106 13,827 51,716
4 0,921 11,516 63,232
5 0,872 10,904 74,136
6 0,782 9,780 83,916
7 0,712 8,896 92,812
8 0,575 7,188 100,000
Hasil ini menunjukkan bahwa tiga faktor dengan total faktor
mampu menjelaskan variabel sebesar 51,716%. Dengan kata
lain, instrumen yang dikembangkan memiliki kemampuan untuk
mengukur berpikir kritis sebesar 51,716%.
3) Pengujian Scree Plot
Banyaknya faktor yang termuat dalam instrumen dapat
diketahui dari Scree plot yang disajikan pada Gambar 1 halaman
58. Banyaknya faktor ditandai dengan curamnya grafik
58
perolehan nilai Eigen. Gambar tersebut menunjukkan bahwa ada
3 faktor yang terukur dalam instrumen evaluasi yang
dikembangkan. Dengan 3 faktor tersebut, instrumen telah dapat
menjelaskan 51,716% varians hasil pengukuran sebagaimana
yang terdapat pada Tabel 20 halaman 57.
Gambar 1.
Hasil Analisis Faktor Exploratory
Dari hasil Scree plot tersebut nampak bahwa nilai Eigen
mulai landai pada faktor ke-4. Ini menunjukkan bahwa terdapat
1 faktor dominan pada instrumen evaluasi, 2 faktor lainnya
memberikan sumbangan yang cukup besar terdapat terhadap
komponen varians yang dapat dijelaskan. Mulai faktor ke-4 dan
seterusnya pada grafik menunjukkan mulai mendatar. Hal ini
menunjukkan bahwa perangkat tes matematika mengukur paling
tidak 3 faktor dengan faktor pertama merupakan faktor dominan.
59
4) Pengujian Rotated Component Matrix
Tahap analisis faktor selanjutnya adalah memperhatikan
hasil pada tabel Rotated Component Matrix. Dengan hasil ini,
dapat ditentukan variabel mana saja yang termasuk faktor 1, 2,
dan 3. Hasil selengkapnya disajikan pada Tabel 21.
Tabel 21. Rotated Component Matrixa
Component
1 2 3
soal8 0,641 0,227 0,188
soal7 0,623 0,031 0,160
soal4 0,548 -0,032 -0,077
soal3 0,130 0,839 -0,219
soal6 0,005 0,735 0,270
soal2 0,110 -0,008 0,719
soal1 0,411 -0,312 -0,563
soal5 0,370 -0,040 0,536
Hasil ini menunjukkan bahwa soal yang termasuk dalam
“faktor 1” adalah soal nomor 4, 7, dan 8. Sedangkan soal yang
termasuk dalam “faktor 2” adalah soal nomor 3 dan 6. Soal
nomor 1, 2, dan 5 termasuk dalam “faktor 3”.
Berdasarkan kisi-kisi soal Paket A yang terdapat pada
Lampiran 4 halaman 144, soal 4, 7, dan 8 memuat indikator
“analisis” sebagai indikator yang dominan, sehingga “faktor 1”
dapat dinamai dengan “analisis”. Soal 3 dan 6 memuat indikator
“interpretasi” sebagai indikator yang dominan, sehingga “faktor
2” dapat dinamai dengan “interpretasi”. Sedangkan, soal 1, 2,
60
dan 5 memuat indikator “evaluasi” sebagai indikator yang
dominan, sehingga “faktor 3” dapat dinamai dengan “evaluasi”.
b. Indeks kesukaran instrumen evaluasi
Berdasarkan hasil penghitungan indeks Aiken instrumen
evaluasi menggunakan program Microsoft Excel 2010, diperoleh
data sebagai berikut:
Tabel 22. Perolehan Indeks Kesukaran Butir Soal
Nomor Soal Indeks Kesukaran Keterangan
1 0,3288 Sedang
2 0,4425 Sedang
3 0,7260 Mudah
4 0,5027 Sedang
5 0,3753 Sedang
6 0,5500 Sedang
7 0,3329 Sedang
8 0,4658 Sedang
Rata-rata 0,4655 Sedang
Berdasarkan tabel di atas, soal yang masuk kategori mudah
adalah nomor 3. Sedangkan soal yang masuk kategori sedang (baik)
adalah nomor 1, 2, 4, 5, 6, 7, dan 8. Hal ini menunjukkan bahwa
tidak ada soal yang masuk kategori sulit. Namun, tingkat kesukaran
yang tergolong mudah tidak bernilai 1 (terlalu mudah) sehingga soal
nomor 3 masih bisa dipakai untuk mengukur kemampuan siswa
(Allen & Yen, 1979: 121).
c. Indeks daya beda instrumen evaluasi
Berdasarkan hasil penghitungan indeks daya beda butir soal,
diperoleh bahwa instrumen evaluasi yang dikembangkan memiliki
koefisien point biserial sebesar 0,838. Hal ini menunjukkan bahwa
61
kemampuan instrumen dalam membedakan antara siswa
berkemampuan tinggi dan siswa berkemampuan rendah adalah
sangat baik.
d. Reliabilitas instrumen evaluasi
Berdasarkan hasil penghitungan, diperoleh bahwa instrumen
evaluasi yang dikembangkan memiliki reliabilitas sebesar 0,417.
Setelah dikonsultasikan dengan pada signifikansi 5%,
diperoleh bahwa lebih besar daripada .
Hal ini menunjukkan bahwa instrumen tersebut dapat dikatakan
reliabel. Sedangkan, jika diinterpretasikan menggunakan Tabel 8
halaman 47, maka instrumen dapat dikatakan memiliki reliabilitas
yang cukup.
B. Pembahasan
1. Instrumen evaluasi yang dikembangkan cukup valid untuk
mengukur kemampuan berpikir kritis
Berdasarkan pembuktian validitas isi pada instrumen awal
penelitian, Paket 1 memperoleh indeks Aiken sebesar 0,75, Paket 2 dan
Paket 4 sebesar 0,78, serta Paket 3 sebesar 0,80. Secara keseluruhan,
rata-rata indeks Aiken yang diperoleh instrumen awal penelitian adalah
0,78 yang masuk kategori cukup valid. Selain itu, berdasarkan Tabel 9
halalam 48, setiap paket instrumen awal memuat 4 indikator kemampuan
62
berpikir kritis, sehingga dapat dikatakan bahwa instrumen tersebut dapat
mengukur kemampuan berpikir kritis.
Sedangkan, berdasarkan hasil pembuktian validitas konstruk
terhadap instrumen Paket A dengan menggunakan analisis faktor
didapatkan nilai Kaiser-Meyer-Olkin (KMO) sebesar 0,572. Nilai
tersebut menandakan bahwa jumlah sampel yang digunakan dalam
penelitian sudah mencukupi. Dari hasil analisis faktor juga diperoleh
nilai signifikansi Barlett’s Test sebesar 0,000. Artinya, pada penelitian ini
terdapat korelasi yang sangat signifikan antar variabel.
Selain itu, berdasarkan nilai Eigen yang lebih dari 1, diperoleh
bahwa terdapat 3 faktor yang mampu menjelaskan variabel sebesar
51,716%. Lalu, dari hasil Rotated Component Matrixa didapatkan
pengelompokkan butir soal dalam 3 faktor dengan ketentuan “faktor 1”
sebagai “analisis”, “faktor 2” sebagai “interpretasi”, dan “faktor 3”
sebagai “evaluasi”. Instrumen Paket A juga memuat keempat indikator
kemampuan berpikir kritis berdasarkan Tabel 16 halaman 54.
Berdasarkan hasil tersebut, dapat dikatakan bahwa instrumen Paket A
valid untuk mengukur kemampuan berpikir kritis pada indikator analisis,
interpretasi, dan evaluasi.
Sedangkan, berdasarkan Tabel 16 halaman 54, Paket B, C dan D
juga memuat keempat indikator kemampuan berpikir kritis, sehingga
dapat dikatakan paket tersebut dapat mengukur kemampuan berpikir
kritis. Secara umum, dapat disimpulkan bahwa instrumen evaluasi yang
63
telah dikembangkan cukup valid dalam mengukur kemampuan berpikir
kritis.
2. Instrumen evaluasi yang dikembangkan reliabel dalam mengukur
kemampuan berpikir kritis
Berdasarkan hasil penghitungan, diperoleh bahwa soal yang
diujicobakan memiliki indeks kesukaran butir soal sebesar 0,417. Hal ini
menunjukkan bahwa instrumen tersebut dapat dikatakan cukup reliabel
dalam mengukur kemampuan berpikir kritis.
3. Soal matematika yang dikembangkan memenuhi kriteria butir soal
yang baik
Berdasarkan Tabel 22 halaman 60, diperoleh bahwa paket soal yang
diujicobakan memiliki nilai rata-rata indeks kesukaran butir soal sebesar
0,4655 yang masuk kategori baik. Sedangkan, berdasarkan hasil
penghitungan indeks daya beda butir soal, diperoleh bahwa paket soal
tersebut memiliki koefisien point biserial sebesar 0,838 yang masuk
kategori sangat baik. Sehingga, dapat disimpulkan bahwa paket soal yang
dikembangkan memenuhi kriteria sebagai soal yang baik.
C. Keterbatasan Penelitian
Penelitian memiliki beberapa keterbatasan pada pengembangan
instrumen evaluasi berbentuk tes tertulis. Keterbatasan yang dimiliki antara
lain:
64
1. Pengembangan instrumen evaluasi terbatas pada penggunaan soal tes
berbentuk uraian dengan menggunakan topik aritmetika dan aljabar
sederhana yang diujicobakan kepada siswa kelas XI SMA.
2. Uji coba perangkat soal hanya dilakukan satu kali dan menggunakan 1
paket hasil revisi berdasarkan dari 4 paket yang divalidasi oleh ahli.
3. Jumlah responden yang digunakan pada tahap uji coba soal hanya 146
siswa dari 5 kelas kelompok MIA dan dari satu sekolah.