1 PROPOSAL PENELITIAN A. JUDUL Pengembangan dan Validasi Virtual Test Untuk Mengukur Kemampuan Berpikir Kritis Siswa pada Materi Kesetimbangan Kimia B. LATAR BELAKANG Kualitas pembelajaran ditentukan salah satunya oleh kualitas penilaian yang dilakukan oleh guru dalam proses pembelajaran. Kegiatan penilaian dapat membantu guru memahami kekuatan dan kelemahan yang dialami oleh siswa dalam belajar. Semakin berkualitas kegiatan penilaian pembelajaran, pemahaman guru akan kelemahan dan kekuatan siswa dalam mempelajari materi tertentu semakin baik. Penilaian merupakan suatu proses pengumpulan, pengolahan, dan penyimpulan informasi dalam rangka pembuatan keputusan (McMillan, 2008). Penilaian pendidikan menurut Peraturan Menteri Pendidikan dan Kebudayaan Nomor 66 Tahun 2013 didefinisikan sebagai proses pengumpulan dan pengolahan informasi untuk mengukur pencapaian hasil belajar peserta didik. Salah satu bentuk evaluasi pendidikan yang diselenggarakan oleh Pemerintah adalah Ujian Nasional (UN). Berdasarkan Permendikbud No.3 Tahun 2013 Bab I pasal 1 Ayat 5 Ujian Nasional merupakan kegiatan pengukuran dan penilaian pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu pengetahuan dan teknologi.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
PROPOSAL PENELITIAN
A. JUDUL
Pengembangan dan Validasi Virtual Test Untuk Mengukur
Kemampuan Berpikir Kritis Siswa pada Materi
Kesetimbangan Kimia
B. LATAR BELAKANG
Kualitas pembelajaran ditentukan salah satunya oleh
kualitas penilaian yang dilakukan oleh guru dalam
proses pembelajaran. Kegiatan penilaian dapat membantu
guru memahami kekuatan dan kelemahan yang dialami oleh
siswa dalam belajar. Semakin berkualitas kegiatan
penilaian pembelajaran, pemahaman guru akan kelemahan
dan kekuatan siswa dalam mempelajari materi tertentu
semakin baik. Penilaian merupakan suatu proses
pengumpulan, pengolahan, dan penyimpulan informasi
dalam rangka pembuatan keputusan (McMillan, 2008).
Penilaian pendidikan menurut Peraturan Menteri
Pendidikan dan Kebudayaan Nomor 66 Tahun 2013
didefinisikan sebagai proses pengumpulan dan pengolahan
informasi untuk mengukur pencapaian hasil belajar
peserta didik. Salah satu bentuk evaluasi pendidikan
yang diselenggarakan oleh Pemerintah adalah Ujian
Nasional (UN). Berdasarkan Permendikbud No.3 Tahun 2013
Bab I pasal 1 Ayat 5 Ujian Nasional merupakan kegiatan
pengukuran dan penilaian pencapaian kompetensi lulusan
secara nasional pada mata pelajaran tertentu dalam
kelompok mata pelajaran ilmu pengetahuan dan teknologi.
2
Tujuan UN adalah untuk mengukur pencapaian hasil
belajar peserta didik melalui pemberian tes kepada
siswa. Selain itu UN juga bertujuan untuk mengukur mutu
pendidikan dan mempertanggungjawabkan penyelenggaraan
pendidikan di tingkat nasional, provinsi, kabupaten,
sampai di tingkat sekolah.
Berdasarkan hal tersebut pada dasarnya esensi dari
UN adalah untuk melihat kondisi mutu pendidikan di
Indonesia dan diharapkan terjadi pemerataan kualitas
yang sama di seluruh daerah di Indonesia dengan
memberikan standar nilai kelulusan yang sama di seluruh
Indonesia. Jika berpegang pada esensi UN tersebut, UN
bukanlah sesuatu yang salah bahkan adanya UN menjadi
acuan yang tepat bagi pemerintah untuk mengetahui
kondisi pendidikan di Indonesia. Namun, selama ini UN
masih diyakini oleh para guru sebagai tujuan dan
sasaran akhir kelulusan siswa tanpa memberikan pengaruh
berarti terhadap upaya pembinaan, pengelolaan, dan
pelaksanaan pendidikan pada tingkat sekolah untuk
memperbaiki dan meningkatkan kualitas pendidikan.
Masukan berupa informasi pendidikan yang diperoleh
lewat UN juga hanya diperlakukan sebagai barang
pajangan dan menjadi dokumen mati. Untuk itu, salah
satu hal yang perlu dievaluasi dari pelaksanaan UN
adalah kualitas teknis pada soal-soal dalam UN yang
perlu diuji oleh para peneliti ahli yang berada di luar
struktur pemerintah atau Kemendiknas RI. Instrumen UN
3
yang dibuat harus didasarkan pada empat aspek utama,
yaitu konsistensi, validitas, kesetaraan, serta aspek
bias agar dapat mengukur kemampuan siswa yang
sesungguhnya. Selain itu soal-soal UN seharusnya dapat
memotret kompetensi siswa secara utuh dan komprehensif.
Walaupun kenyataannya belum semua kompetensi siswa bisa
terpotret melalui UN. Selama ini soal-soal UN khususnya
pada pelajaran kimia kebanyakan mengukur kemampuan
berpikir tingkat rendah dan hanya mengukur kemampuan
peserta didik secara kognitif dan berdasarkan dari segi
isi dan konstruksi, soal UN penekanannya lebih besar
pada hafalan daripada keahlian berpikir dan memecahkan
masalah.
Satrisman (2013) dalam penelitiannya menganalisis
soal UN kimia tahun 2013. Hasil penelitiannya
menunjukkan bahwa hanya enam butir soal dengan
persentase 15% yang dikategorikan ke dalam soal pada
jenjang analisis (C4), selebihnya 22,5% pada jenjang
mengingat (C1), memahami (C2), dan 35% pada jenjang
tersebut dijelaskan lebih rinci lagi sebagai berikut.
Tabel 2.1 kemampuan berpikir kritis menurut EnnisKelompok indikator subindikator
Memberikanpenjelasansederhana
Memfokuskan pertanyaan
Mengidentifikasi/ merumuskanpertanyaanMengidentifikasi/merumuskan kriteria untuk mempertimbangkanMenjaga kondisi berpikir
Menganalisisargumen
Mengidentifikasi kesimpulanMengidentifikasi kalimat-kalimat pertanyaanMengidentifikasi dan menangani ketidaktepatanMelihat struktur dari suatu argumenMembuat ringkasan
Bertanya danmenjawab
Memberikan penjelasan sederhana
17
pertanyaan Menyebutkan contohMembangun keterampilan dasar
Mempertimbangkan apakah sumber dapatdipercaya atau tidak
Mempertimbangkan keahlianMempertimbangkan kemenarikankonsepMempertimbangkan kesesuaian sumberMempertimbangkan reputasiMempertimbangkan penggunaan prosedur yang tepatMempertimbangkan resiko untuk reputasiKemampuan untuk memberikan alasanKebiasaan untuk berhati-hati
Mengobservasi dan mempertimbangkan laporanobservasi
Melibatkan sedikit dugaanMenggunakan waktu yang singkat antara observasi danlaporanMelaporkan hasil observasiMerekam hasil observasiMenggunakan bukti-bukti yangbenarMenggunakan akses yang baikMenggunakan teknologiMempertanggung jawabkan hasil observasi
a. Mengemukakan hipotesisb. Merancang eksperimenc. Menarik kesimpulan
sesuai faktad. Menarik kesimpulan dari
hasil menyelidikiMembuat dan Membuat dan menentukan hasil
18
menentukan hasil pertimbangan
pertimbangan berdasarkan latar belakang fakta-faktaMembuat dan menentukan hasilpertimbangan berdasarkan akibatMembuat dan menentukan hasilpertimbangan berdasarkan penerapan fakta
Membuat dan menentukan hasilpertimbangan keseimbangan dan masalah
Memberikanpenjelasanlanjut
Mengidentifikasi istilahdan mempertimbangkan
Membuat bentuk definisiStrategi membuat definisi
a. Bertindak dengan memberikan penjelasan lanjut
b. Mengidentifikasi dan menangani ketidakbenaran yang disengaja
Membuat isi definisiMengidentifikasi asumsi-asumsi
Penjelasan bukan pernyataanMengkonstruksi argument
Mengatur strategi dan taktik
Menentukan suatu tindakan
Mengungkap masalahMemilih kriteria untuk mempertimbangkan solusi yangmungkinMerumuskan solusi alternatifMenentukan tindakan sementaraMengulang kembaliMengamati penerapannya
Berinteraksidengan oranglain
Menggunakan argumenMenggunakan startegi logikaMenggunakan strategi retorikaMenunjukkan posisi, orasi atau tulisan
19
Keterampilan berpikir kritis perlu dikembangkan
karena melalui keterampilan berpikir kritis siswa dapat
lebih mudah memahami konsep dengan lebih mendalam, peka
akan masalah yang terjadi sehingga dapat memahami dan
menyelesaikan masalah dan mampu mengaplikasikan konsep-
konsep dalam situasi yang berbeda. Tabel 2.1 merupakan
acuan dalam pembuatan soal virtual test untuk mengukur
kemampuan berpikir kritis. Butir soal dalam virtual tes
yang dibuat sesuai dengan kelompok, indikator dan
subindikator yang disajikan dalam tabel. Kelompok,
indikator dan subindikator yang dipilih disesuaikan
dengan pokok bahasan.
Burke (1949) menyatakan bahwa asesmen untuk
mengukur keterampilan berpikir kritis dapat saja
terkait materi subjek, dengan pertimbangan kehadiran
konsepnya yang baru harus dikurangi. Lebih lanjut
Renaud dan Murray (2008) menunjukkan bahwa pengukuran
keterampilan berpikir kritis dengan tes yang terkait
materi subjek lebih signifikan dibanding tes yang
bersifat umum. Hal tersebut disebabkan siswa lebih
akrab dengan istilah yang bersifat khusus dibandingkan
yang umum.
Adapun karakteristik khusus soal yang dapat
mengukur keterampilan berpikir kritis adalah sebagai
berikut: 1) informasi berupa komik sains, 2) informasi
berupa grafik, 3) informasi berupa tabel, 4) informasi
berupa gambar, 5) informasi berupa artikel, 6)
20
informasi berupa gambar dan artikel, 7) informasi
berupa role play, dan 8) informasi berupa metode ilmiah
(Inch & Tudor, 2006).
3. Standarisasi Virtual Test Berpikir Kritis
Standarisasi mengimplikasikan keseragaman cara
dalam penyelenggaraan dan penskoran tes. Tujuan/ fungsi
dari proses standarisasi alat ukur adalah untuk
mendapatkan tingkat reliabilitas dan validitas serta
menentukan norma dari tes yang baru dikembangkan.
Biasanya proses standarisasi suatu tes dilakukan
melalui suatu proses ujicoba pada sampel yang luas dan
representatif dari jenis orang yang memang menjadi
sasaran perancangan tes tersebut (Anastasi, 1988).
Dalam pengembangan virtual tes ini digunakan
kriteria-kriteria untuk menentukan apakah instrumen
yang telah dibuat dan diujicobakan masih perlu
diperbaiki atau sudah dianggap cukup baik. Kriteria-
kriteria yang dimaksud meliputi validitas instrumen
secara keseluruhan, analisis item yang meliputi
validitas setiap butir soal dalam instrumen, dan
reliabilitas instrumen secara keseluruhan.
a. Validitas Instrumen
Validitas atau kesahihan berasal dari kata validity
yang berarti sejauh mana ketetapan dan kecermatan suatu
alat ukur dalam melakukan fungsi ukurnya (Sudaryono,
2012). Sebuah instrument dikatakan valid apabila mampu
mengukur apa yang diinginkan dan dapat mengungkap data
21
dari variabel yang diteliti secara tepat. Tinggi
rendahnya validitas instrument menunjukkan sejauh mana
data yang terkumpul tidak menyimpang dari gambaran
tentang validitas yang dimaksud (Arikunto, 2013). Suatu
tes dapat dikatakan mempunyai validitas yang tinggi
apabila tes tersebut menjalankan fungsi ukurnya, atau
memberikan hasil ukur yang tepat dan akurat sesuai
dengan maksud dikenakannya tes tersebut. Suatu alat
ukur yang tinggi validitasnya akan memiliki eror
pengukuran yang kecil, artinya skor setiap subjek yang
diperoleh alat ukur tersebut tidak jauh beda dengan
skor yang sesungguhnya.
Nunnaly (dalam Surapranata, 2009) menyatakan bahwa
validitas senantiasa dikaitkan dengan penelitian
empiris dan pembuktian-pembuktiannya bergantung kepada
macam validitas yang digunakan. Proses validasi
meliputi pengumpulan bukti-bukti untuk menunjukkan
dasar saintifis penafsiran skor yang direncanakan.
Kesahihan isi dilihat dari kisi-kisi tes, yaitu matrik
yang menunjukkan bahan tes serta tingkat berpikir yang
terlibat dalam mengerjakan tes. Hasil estimasi
validitas suatu pengukuran pada umumnya dinyatakan
secara empirik oleh suatu koefisien yang disebut
koefisien validitas.
Didalam penelitian pendidikan ada empat tipe
validitas yang begitu penting, yaitu face validity, content
validity, construct validity and criterion-related validity. Namun,
22
menurut konsep baru jenis-jenis validitas hanya
dibedakan menjadi tiga macam yaitu, content validity,
criterion-related validity dan construct validity (Basuki, 2014).
Sama halnya dengan yang diungkapkan Firman (2013) bahwa
validitas dibedakan menjadi beberapa macam, yaitu :
Gambar 3.1. Jenis-Jenis Validitas (Firman, 2013)
Berdasarkan penjelasan diatas maka, jenis-jenis
validitas yang akan diuraikan pada penelitian ini
diantaranya adalah :
1) Validitas Isi
Validitas isi berkenaan dengan kesanggupan alat
penilaian dalam mengukur isi yang seharusnya. Artinya,
suatu tes mampu mengungkapkan isi suatu konsep atau
variabel yang hendak diukur (Sudjana, 2014). Validitas
isi sering digunakan dalam penilaian hasil belajar.
Tujuan utamanya adalah untuk mengetahui sejauh mana
peserta didik menguasai materi pelajaran yang telah
disampaikan, dan perubahan-perubahan psikologis apa
Type of validity
Content Validity
Criterion-related Validity
Predictive Validity
Concurrent validity
Construct Validity
23
yang timbul pada diri peserta didik tersebut setelah
mengalami proses pembelajaran tertentu (Arifin, 2013).
Pengujian validitas isi tidak melalui analisis
statistika tetapi menggunakan analisis rasional
terhadap isi tes yang penilaiannya didasarkan atas
pertimbangan subyektif individual. Walaupun subjektif,
namun yang terlibat adalah beberapa pakar pada bidang
yang diukurnsehingga hasilnya dapat dipertanggung
jawabkan. Menurut Guion (Surapranata, 2009), validitas
isi hanya dapat ditentukan berdasarkan judgement para
ahli. Prosedur yang dapat digunakan antara lain : (1)
mendefinisikan domain yang hendak diukur; (2)
menentukan domain yang akan diukur oleh masing-masing
soal; (3) membandingkan masing-masing soal dengan
domain yang sudah ditetapkan. Sedangkan Arifin (2013)
menyatakan bahwa validitas kurikuler atau validitas isi
dapat dilakukan dengan beberapa cara, antara lain
mencocokkan materi tes dengan silabus dan kisi-kisi,
melakukan diskusi dengan sesama pendidik, atau
mencermati kembali substansi konsep yang akan diukur.
2) Validitas Konstrak
Validitas konstruk adalah tipe validitas yang
menunjukkan sejauh mana tes mengungkap suatu trait atau
konstruk teoritik yang hendak diukurnya (Allen & Yen,
1979). Validitas konstruk mengandung arti bahwa suatu
alat dikatakan valid apabila telah cocok dengan
konstruksi teoritik dimana tes itu dibuat, yakni
24
apabila soal-soalnya mengukur setiap aspek berpikir
seperti yang diuraikan dalam standar kompetensi,
kompetensi dasar, maupun indikator yang terdapat dalam
kurikulum (Surapranata, 2009). Menurut Sudaryono (2012)
validitas konstruk bukanlah dimaksudkan bahwa tes yang
bersangkutan dipandang sudah baik susunan kalimat
soalnya, atau urut-urutan nomor butir soalnya sudah
runtut, melainkan bahwa tes hasil belajar baru dapat
dikatakan telah memiliki validitas susunan atau
konstruk apabila butir-butir soal atau item yang
membangun tes tersebut benar-benar telah dapat dengan
secara tepat mengukur aspek-aspek berpikir (Seperti
aspek kognitif, afektif dan psikomotorik dan
sebagainya.
3) Validitas Berdasarkan Kriteia
Validitas empiris atau validitas kriteria suatu
instrument atau tes ditentukan berdasarkan data hasil
ukur instrument yang bersangkutan, baik melalui uji
coba maupun melalui tes atau pengukuran yang
sesungguhnya (Sudaryono, 2012). Menurut Firman (2013)
tinggi rendahnya validitas kriteria dapat diestimasi
dari besarnya korelasi antara hasil tes yang sedang
dinilai dengan hasil tes yang dijadikan kriteria. Jika
korelasinya tinggi maka kesimpulannya validitas tinggi.
Sebaliknya jika korelasinya rendah maka berarti bahwa
tes tersebut mempunyai validitas yang rendah. Arifin
(2013) menyatakan bahwa ada tiga macam validitas
25
empiris, yaitu : validitas prediktif, validitas
bandingan, dan validitas sejenis.
a) Validitas prediktif (predictive validity),
Validitas prediktif menunjukkan kepada hubungan
antara skor tes yang diperoleh peserta tes dengan
keadaan yang akan terjadi diwaktu yang akan datang.
Sebuah tes dikatakan memiliki validitas prediksi
apabila mempunyai kemampuan untuk memprediksikan apa
yang terjadi di masa yang akan datang (Surapranata,
2009). Validitas ramalan mengandung dua makna, yaitu :
validitas jangka pendek dan validitas jangka panjang.
Validitas jangka pendek berarti daya ramal alat
penilaian tersebut hanya untuk masa yang tidak lama.
Sedangkan validitas jangka panjang mengandung makna
skor akan berkorelasi juga dikemudian hari (Sudjana,
2014). Valid atau tidaknya suatu tes dilihat dengan
membandingkan kesesuaiannya dalam praktik. Sesuai atau
tidak hal-hal yang telah diramalkan (diprediksikan)
oleh tes tersebut dengan prestasi yang dicapai si testee
sesudah pengukuran melalui tes tersebut (Basuki, 2014).
Contoh sederhana misalnya apa yang terjadi pada
penerimaan peserta tes berdasarkan hasil tes seleksi
setelah mereka lulus SMA. Peserta tes yang memiliki
nilai yang bagus di tes seleksi tersebut lalu diterima
di perguruan tinggi, diperkirakan akan berhasil ketika
mereka belajar diperguruan tinggi. Apabila hal itu
26
terjadi, maka tes masuk perguruan tinggi tersebut
dikatakan memiliki validitas prediksi yang bagus.
b) Validitas bandingan (concurrent validity),
Validitas bandingan merupakan suatu proses teknik
yang memungkinkan kita untuk mengevaluasi kemampuan tes
dalam membedakan antara peserta tes yang menguasai dan
yang tidak menguasai kompetensi-kompetensi yang dinilai
(Basuki, 2014). Dalam membandingkan suatu tes maka
diperlukan suatu kriterium atau alat banding. Maka
hasil tes merupakan sesuatu yang dibandingkan
(Suharsimi, 2009). Concurrent validity menunjuk pada
hubungan antara tes skor yang dicapai dengan keadaan
sekarang. Sebuah tes dikatakan memiliki concurrent validity
apabila hasilnya sesuai dengan pengalaman (Surapranata,
2006). Validitas konkuren adalah jika kriteria
standarnya berlainan (Arifin, 2013). Misalnya, suatu
tes kimia buatan guru dapat dikatakan mempunyai
validitas kongkuren tinggi jika hasilnya berkorelasi
tinggi dengan hasil tes kimia “baku” (sudah terbukti
tinggi validitasnya).
c) Validitas sejenis (congruent validity),
Validitas sejenis adalah jika kriteria standarnya
sejenis (Arifin, 2013). Misalnya, mengkorelasikan hasil
sebuah tes intelegensi yang baru dengan hasil tes
intelegensi yang sudah ada. Atau misalnya skor tes
Kimia dikorelasikan dengan skor tes kimia.
27
b. Reliabilitas
Reliabilitas dan validitas adalah dua karakteristik
penting, baik untuk tes acuan norma (TAN) atau tes
acuan kriteria (TAK), serta untuk tes kertas dan pena
(paper-and pencil test) maupun tes kinerja (performance test)
reliabilitas dan validitas menggambarkan kualitas yang
harus dimiliki oleh setiap tes yang baik. Seperti yang
dinyatakan sebelumnya, validitas mengacu pada akurasi
tes dalam hasil mengukur apa yang harus diukur,
sedangkan reliabilitas mengacu pada konsistensi dalam
hasil pengujian (Basuki & Haryanto, 2014). Reliabilitas
merupakan penerjemahan dari kata reliability yang mempunyai
asal kata rely dan ability. Pengukuran yang memiliki
reliabilitas tinggi disebut sebagai pengukuran yang
reliabel (reliable). Walaupun reliabilitas mempunyai
berbagai nama lain seperti kepercayaan, keterandalan,
keajegan, kestabilan, konsistensi, dan sebagainya,
namun ide pokok yang terkandung dalam konsep
reliabilitas adalah sejauhmana hasil suatu pengukuran
dapat dipercaya (Azwar, 2011).
Menurut Surapranata (2006), tujuan utama
mengestimasi reliabilitas adalah untuk menentukan
seberapa besar variabilitas yang terjadi akibat adanya
kesalahan pengukuran dan seberapa besar variabilitas
skor tes sebenarnya. Reliabilitas tes merujuk kepada
konsistensi skor yang dicapai seorang siswa sekiranya
siswa itu diuji berulang kali dengan tes yang sama
28
dalam waktu yang berbeda (Kartadinata, 1992). Menurut
Nitko dan Brookhart (2007) :
“Reliability then is the degree to which students’ results remain
consistent over replications of an assesment procedure. That is,
reliability is the degree to which students’ assesment results are the
same when (a) they complete the same task(s) on two or more
different occasions; (b) two or more teachers mark their performance
on the same task; or (c) they complete two or more different but
equivalent tasks on the same or different occasions”
Suatu instrumen evaluasi dikatakan mempunyai nilai
reliabilitas tinggi apabila tes yang dibuat mempunyai
hasil yang konsisten dalam mengukur yang hendak diukur
(Sukardi, 2010). Tinggi-rendahnya reliabilitas secara
empirik ditunjukkan oleh suatu angka yang disebut
koefisien reliabilitas. Semakin tinggi koefisien
korelasi antara hasil ukur dari dua tes yang paralel,
maka konsistensi diantara keduanya semakin baik dan
kedua alat ukur itu sebagai alat ukur yang reliabel.
Apabila korelasi antara hasil dari dua alat ukur yang
paralel ternyata tidak tinggi maka disimpulkan bahwa
reliabilitasnya rendah (Azwar, 2011).
4. Analisis Konsep Kesetimbangan Kimia
Untuk menentukan karakteristik konsep-konsep yang
tercakup dalam materi kesetimbangan Kimia, digunakan
metode analisis konsep berdasarkan Heron (1997).
Analisis konsep yang dilakukan mencakup penentuan label
konsep, definisi konsep, atribut kritis dan atribut
29
variabel, hirarki konsep dan jenis konsep. Analisis
terhadap konsep-konsep yang tercakup pada materi
kesetimbangan kimia disajikan pada lampiran 1.
Berdasarkan analisis konsep terlihat bahwa materi
kesetimbangan kimia memiliki karakteristik jenis konsep
berdasarkan prinsip dengan atribut kritis dengan contoh
abstrak sehingga materi kesetimbangan kimia dapat dapat
mengakomodasi kebutuhan evaluasi dalam mengukur
kemampuan berpikir kritis siswa.
Berdasarkan kurikulum 2013, Kompetensi Dasar (KD)
pada materi kesetimbangan kimia memiliki dua kompetensi
dasar pada KI 3 yaitu KD 3.8 dan KD 3.9 yaitu:
3.8 : Menganalisis faktor-faktor yang mempengaruhi
pergeseran arah kesetimbangan yang diterapkan
dalam industri.
3.9 : Menentukan hubungan kuantitatif antara pereaksi
dengan hasil reaksi dari suatu reaksi kesetimbanga
pada kesetimbangan
Pada sub bab ini diuraikan penjelasan terkait
materi kesetimbangan kimia yang diajarkan di kelas XI
semester ganjil. Adapun konsep yang terkait yaitu:
Berdasarkan uraian materi yang telah dipaparkan di
atas, materi kesetimbangan kimia dipetakan seperti
gambar 2.2.
Dipercepat dengandalam Atas
memilik
mematuhi mengalam
Terdiri
Gambar 2.2. Peta Konsep Kesetimbangan Kimia
berhubungan
dipengarmeliput
36
G. KERANGKA BERPIKIR
Penelitian ini dilakukan untuk menghasilkan virtual
test yang dapat mengukur kemampuan berpikir kritis siswa
pada materi kesetimbangan kimia. Peneliti menuangkan
ide penelitiannya dalam kerangka berpikir pada gambar
2.3 berikut ini:
Gambar 2.3 Kerangka Pemikiran
Penelitian ini didasari dari penilaian pembelajaran
kimia yang kebanyakan masih mengukur kemampuan berpikir
Penilaian Pembelajaran Kimia
Kesulitan dalam menguji kemampuan berpikir tingkat tinggi siswa dengan
pencil and paper test
Virtual Test:Dapat mengukur kemampuan berpikir tingkat tinggi siswa yang sulit diuji dengan pencil and paper testSesuai dengan tuntutan UN yang akan datangPokok uji akan lebih mudah dipahami
Pengembangan Virtual Test
Kesetimbangan Kimia:Materi bersifat abstrak dengan contoh yang nyata dalam kehidupan sehari-hariMenyatakan proses sehingga membutuhkan visualisasi agar siswa dapat dengan lebih mudah memahami pokok uji
Kemampuan Berpikir Kritis
Virtual Test
37
tingkat rendah dan hanya mengukur kemampuan peserta
didik secara kognitif seperti terlihat pada soal UN
Kimia . Hal ini disebabkan karena adanya kesulitan
dalam menguji kemampuan berpikir tingkat tinggi siswa
dengan pencil and paper test. Karena pada umumnya pernyataan
pokok uji yang mengukur kemampuan berpikir tingkat
tinggi lebih panjang dibandingkan pernyataan pokok uji
yang mengukur kemampuan berpikir tingkat rendah. Selain
itu permasalahan juga muncul ketika pernyataan pokok
uji mengandung konsep-konsep yang abstrak, yang sulit
dideskripsikan dengan kata-kata sehingga siswa akan
mengalami kesulitan memahami pernyataan pokok uji.
Selain itu, adanya komitmen pemerintah untuk
melaksanakan UN dengan CBT baik online maupun offline
maka peneliti merasa pengembangan virtual test yang dapat
mengukur kemampuan berpikir tingkat tinggi seperti
kemampuan berpikir kritis perlu dilakukan. Adapun
kmateri yang dapat digunakan dalam mengakomodasi
kebutuhan evaluasi dalam mengukur kemampuan berpikir
kritis siswa yaitu materi kesetimbangan kimia.
H. METODE PENELITIANMetode penelitian yang digunakan dalam penelitian
ini adalah Development
and Validation (Pengembangan dan Validasi). Metode
pengembangan dan validasi digunakan seperti alat
penilaian (Adams dan Wieman, 2010). Metode ini akan
digunakan untuk menghasilkan virtual test yang dapat
38
mengukur kemampuan berpikir kritis siswa pada materi
kesetimbangan kimia.
I. SUBJEK PENELITIAN
Populasi dalam penelitian ini adalah siswa di salah
satu SMA Negeri di kota Bandung pada tahun ajaran
2014/2015, Sedangkan sampel yang digunakan dalam
penelitian ini adalah siswa kelas XI IPA tahun ajaran
2014/2015.
J. PROSEDUR PENELITIAN
Terdapat tiga tahapan utama dalam penelitian ini
yaitu: 1) tahapan pengembangan; 2) tahap validasi dan
uji coba; 3) tahap analisis dan penarikan kesimpulan.
Penelitian ini dimulai dengan tahap pengembangan yang
meliputi penyusunan kisi-kisi virtual tes kemampuan
berpikir kritis dan perancangan virtual test untuk mengukur
kemampuan berpikir kritis, Tahap validasi dan uji coba
meliputi validasi isi virtual tes oleh para ahli, menguji
virtual test terhadap siswa SMA kelas XI IPA Kota Bandung,
pelaksanaan paper based test kemampuan berpikir kritis
yang baku untuk validitas konkuren, dan melakukan
wawancara kepada guru dan siswa terhadap pelasksanaan
virtual test. Kemudian pada tahap akhir dilakukan analisis
data dan membuat kesimpulan. Adapun alur penelitian
disajikan pada gambar 3.1.
39
TAHAP VALIDASIDAN UJI COBA
TAHAPPENGEMBANGAN
Gambar 3.1 AlurPenelitian
TAHAP ANALISISDAN KESIMPULAN
40
Berdasarkan alur penelitian pada gambar 3.1 maka
secara terperinci prosedur penelitian meliputi tahapan-
tahapan berikut.
1. Menyusun kisi-kisi virtual tes untuk mengukur
kemampuan berpikir kritis pada materi kesetimbangan
kimia. Dalam kisi-kisi yang dikembangkan memuat
gambaran proporsi antara indikator kemampuan
berpikir kritis, sub-indikator kemampuan berpikir
kritis, konsep dan butir soal. Tabel kisi-kisi
virtual tes kemampuan berpikir kritis pada materi
kesetimbangan kimia dapat dilihat di Lampiran 2.
2. Pengembangan butir soal virtual tes kemampuan
berpikir kritis. Pengembangan butir soal virtual tes
kemampuan berpikir kritis mengacu pada kisi-kisi
butir soal yang telah diselaraskan sesuai dengan
indikator kemampuan berpikir kritis.
3. Validasi isi alat ukur kemampuan berpikir kritis.
Proses validasi isi dilakukan berdasarkan
pertimbangan profesional oleh kelompok pakar
untuk menentukan validasi isi butir soal baik dari
segi materi, konstruksi soal maupun dari segi
kejelasan bahasa yang disusun. Instrumen validasi
diberikan kepada 5 validator yaitu dua orang pakar
alat ukur, satu orang pakar kemampuan berpikir
kritis dan satu orang pakar konsep kimia, dan satu
orang guru kimia. Validasi dilakukan pakar dengan
cara mengisi format yang telah disediakan dengan
41
cara membubuhkan tanda checklist (√) pada kolom yang
telah disediakan, dan memberikan komentar/saran
perbaikan untuk soal yang perlu direvisi di kolom
keterangan. Akhir dari proses validasi yaitu
menganalisis perolehan hasil validasi yang
selanjutnya dihitung dengan menggunakan CVR (Content
Validity Ratio). Format validasi isi dapat dilihat pada
Lampiran 3.
4. Revisi draft produk. Setelah divalidasi oleh ahli,
alat ukur yang dikembangkan dilakukan revisi sesuai
dengan masukan dan saran-saran pakar, kemudian hasil
revisi siap diujicobakan. Perbaikan alat ukur yang
dikembangkan meliputi perbaikan kesesuaian indikator
berpikir kritis dengan soal, penulisan yang kurang
tepat, pertanyaan yang kurang menuntun ataupun hal-
hal lain yang perlu diperbaiki
5. Uji coba. Uji coba dilakukan untuk mengetahui apakah
produk yang dibuat layak digunakan atau tidak. Uji
coba juga melihat sejauh mana produk yang dibuat
dapat mencapai sasaran dan tujuan. Melalui uji coba
maka kualitas produk yang dikembangkan akan teruji
secara empiris.
6. Pengolahan dan anlisis hasil uji coba. Hasil ujicoba
produk dilakukan analisis terhadap butir soal
meliputi validitas empiris, reliabilitas, tingkat
kesukaran dan daya pembeda setiap butir soal. Hasil
yang diperoleh setelah melakukan uji coba terbatas
42
berupa skor perolehan siswa. Skor ini akan
menentukan kualitas dari alat ukur yang
dikembangkan. Kualitas suatu tes dapat dilihat dari
validitas empiris, reliabilitas, tingkat kesukaran
dan daya pembeda. Selanjutnya dilakukan pembuatan
keputusan berdasarkan hasil analisis statistik.
Berdasarkan analisis data, maka ditentukan alat ukur
yang tidak valid dan tidak reliabel. Alat ukur yang
tidak valid dan tidak reliabel tidak diikutsertakan
dalam pengembangan alat ukur berikutnya.
7. Analisis data dan penarikan kesimpulan. Hasil dari
tahapan validasi dan uji coba telah dilaksanakan
dianalisis dan dibahas secara keseluruh untuk
kemudian disimpulkan.
K. DEFINISI OPERASIONAL
1. Virtual test yang dimaksud dalam penelitian ini adalah
suatu bentuk tes dengan bantuan multimedia berupa
video, gambar, animasi, tabel dan grafik melalui
komputer yang digunakan untuk mengukur kemampuan
berpikir kritis siswa pada materi kesetimbangan
kimia.
2. Berpikir kritis yang dimaksud dalam penelitian ini
yaitu proses terorganisasi dalam memecahkan masalah
yang melibatkan aktivitas mental yang mencakup
kemampuan: memberikan penjelasan sederhana,
merumuskan masalah, memberikan argumentasi,
43
melakukan deduksi dan induksi, melakukan evaluasi,
dan mengambil keputusan. Setiap soal disusun
berdasarkan indikator berpikir kritis yang
dikembangkan oleh Ennis.
3. Validitas adalah suatu alat ukur yang menunjukkan
sejauh mana ketetapan dan kecermatan suatu alat ukur
dalam melakukan fungsi ukurnya. Pada penelitian ini
ada dua validitas yang diuji, yaitu validitas isi
oleh ahli dan validitas konkuren.
4. Reliabilitas adalah ukuran sejauh mana suatu alat
ukur memberikan gambaran yang benar-benar dapat
dipercaya tentang kemampuan seseorang.
5. Kepraktisan adalah kemudahan suatu tes, baik dalam
mempersiapkan, menggunakan, mengolah, menafsirkan
dan mengadministrasikan.
L. INSTRUMEN YANG DIKEMBANGKAN
Instrumen yang dikembangkan dalam penelitian ini
adalah virtual test yang dapat digunakan untuk mengukur
kemampuan berpikir kritis siswa. Selain itu, digunakan
tes kemampuan berpikir kritis yang sudah
terstandarisasi dan pedoman wawancara sebagai
instrumen pendukung dalam penelitian ini.
1. Virtual test
Untuk mengetahui validitas dan reliabilitas virtual
tes yang dikembangkan maka perlu dilakukan tes
terhadap subyek penelitian. Tes adalah instrumen yang
44
harus direspon oleh subyek penelitian dengan
menggunakan penalaran dan pengetahuannya. Item virtual
test dalam penelitian ini berupa simple multiple-choice.
Item virtual test yang dikembangkan bertujuan untuk
mengukur kemampuan berpikir kritis siswa.
Virtual test diberikan kepada seluruh siswa yang
terpilih sebagai sampel penelitian. Respon yang
diharapkan dari pelaksanaan tes ini berupa jawaban
siswa pada setiap butir item virtual test. Virtual test yang
dikembangkan selanjutnya diuji validitas,
reliabilitas, kepraktisannya (kelayakannya), dan
efektifitas virtual tes dalam mengukur kemampuan berpikir
kritis siswa. Blue Print soal virtual tes disajikan pada
gambar 3.2.
2. Paper Based Test Kemampuan berpikir kritis Terstandar
Paper based Test kemampuan berpikir kritis yang
terstandarisasi (baku) dalam penelitian ini akan
digunakan sebagai pembanding untuk memvalidasi virtual
test yang telah dikembangkan. Tes terstandar adalah tes
yang telah diujicobakan berkali-kali sehingga dapat
dijamin kebaikannya. Tes terstandar ini sudah memiliki
koefisien validitas, reliabilitas, taraf kesukaran,
daya pembeda, dan lain-lain (Suharsimi, 2009). Paper
based test terstandar diberikan kepada seluruh siswa yang
terpilih sebagai sampel penelitian.
Slide pembuka dalam Virtual Test
45
Gambar 3.2 Blue Print Virtual test Kesetimbangan
3. Pedoman wawancara
Pedoman wawancara yang digunakan tergolong
wawancara tidak terstruktur karena wawancara bersifat
bebas dan tidak menggunakan pedoman wawancara yang
Indikator menyimpulkan
Indikator mengatur strategidan taktik
Indikator memberikanpenjelasan lanjut
Slide Tampilan Penutup
46
telah tersusun secara sistematis dan lengkap. Pedoman
wawancara yang digunakan hanya berupa garis-garis
besar permasalahan yang akan ditanyakan. Pedoman
wawancara ini bertujuan untuk memperoleh informasi
yang mendalam mengenai respon/tanggapan guru dan siswa
mengenai virtual test yang telah dikembangkan. Kisi-
kisi pedoman wawancara disajikan pada tabel 3.1.
Tabel 3.1.Kisi-Kisi Pedoman Wawancara
No Pernyataan1 Apakah sebelumnya sudah pernah melakukan
penilaian dengan menggunakan virtual tes?2 Apakah tes yang baru saja dilakukan berbeda
dengan tes yang biasanya Anda lakukan?3 Apakah anda/siswa merasa kesulitan ketika
memahami butir soal yang terdapat pada virtualtes?
4 Apakah butir soal pada virtual tes mendorongAnda/siswa untuk berpikir kritis?
5 Apakah penggunaan multimedia yang terdapat padavirtual test mempermudah Anda/siswa memahamipokok uji (butir soal)?
6 Apakah anda merasa kesulitan ketikamengoperasikan virtual test ?
7 Bagaimana tanggapan Anda tentang virtual tes yangdikembangkan oleh peneliti?
M. TEKNIK PENGUMPULAN DATA
Teknik pengumpulan data dalam penelitian ini
melalui teknik tes dan teknik non tes. Dalam
pengumpulan data dilakukan penentuan sumber data, jenis
47
data, instrumen yang digunakan dan waktu pelaksanaan.
Teknik tes berupa virtual test dan paper based test yang
digunakan untuk mengukur kemampuan berpikir kritis
siswa. Teknik non tes berupa wawancara dengan pedoman
wawancara. Virtual test dan paper based test diberikan kepada
seluruh siswa yang terpilih sebagai sampel penelitian.
Wawancara dilakukan kepada guru dan siswa setelah
pelaksanaan tes. Tujuan dilakukan wawancara untuk
memperoleh tanggapan guru dan siswa terhadap virtual tes
yang telah dikembangkan. Data yang diperoleh dalam
penelitian ini berupa hasil jawaban siswa pada tes dan
hasil wawancara berupa recorder.
N. PENGOLAHAN DAN ANALISIS DATA
Dalam penelitian ini diperoleh dua jenis data yaitu
data kuantitatif dari hasil tes dengan menggunakan
virtual test dan paper based test, dan data kualitatif dari
data hasil wawancara guru dan siswa. Data kuantitaif
yang diperoleh dari hasil uji coba kemudian dianalisis.
Pengolahan data hasil uji coba dilakukan untuk
mengetahui kualitas dari tes yang dikembangkan dan
untuk mengetahui sejauh mana tes tersebut dapat
digunakan untuk mengukur keterampilan berpikir kritis
siswa.
Analisis data dalam penelitian ini meliputi
penentuan validitas instrumen secara keseluruhan,
analisis item yang meliputi penentuan validitas setiap
butir soal dalam instrumen, penentuan indeks kesukaran
48
setiap butir soal instrumen, penentuan daya pembeda
setiap butir soal, penentuan reliabilitas instrumen
secara keseluruhan. Data kualitatif diperoleh dari
hasil analisis wawancara terstruktur kepada responden.
Berikut tahapan yang dilakukan dalam menganalisis
data kuantitatif dan kualitatif yang telah dikumpulkan.
1. Data kuantitatif
Langkah-langkah dalam mengolah data kuantitatif
yaitu a) Memberikan score pada hasil uji coba, b)
Menganalisis butir soal terkait validitas, indeks
kesukaran, daya pembeda, dan reliabilitas dilakukan
dengan menggunakan program Microsoft Excel.
a) Validitas
Uji validitas yang dilakukan pada penelitian ini
meliputi uji validitas isi dan validitas konkuren.
Firman, (2013) menyatakan bahwa validitas isi adalah
validitas suatu alat ukur dipandang dari segi “isi”
bahan yang dicakup oleh alat ukur tersebut. Cara
menilai atau menyelidiki validitas isi suatu alat ukur
ialah dengan mengundang judgement (timbangan) kelompok
ahli dalam bidang yang diukur. Perolehan hasil validasi
selanjutnya dihitung dengan menggunakan CVR (Content
Validity Ratio) dan diinterpretasikan berdasarkan Wilson,
(2012).
CVR (Content Validity Ratio) digunakan untuk mengukur
indeks keshahihan berdasarkan validasi isi secara
kuantitatif. Validasi isi berkenaan dengan kevalidan
49
suatu alat ukur dipandang dari segi isi (content) materi
pelajaran yang melibatkan para ahli untuk menilai.
Adapun rumus CVR adalah :
CVR = Keterangan :ne : jumlah ahli yang setujuN : jumlah semua ahli yang memvalidasi(Lawshe, 1975)
Berdasarkan persamaan Lawshe, dapat dihitung nilai
CVR untuk setiap butir soal. Nilai CVR yang diperoleh
dari perhitungan dibandingkan dengan nilai minimum CVR
berdasarkan jumlah validator seperti yang tercantum
Kriteria: Bila r hitung > r tabel, maka butir soal
dikatakan reliabel
c) Indeks kesukaran
Indeks kesukaran soal adalah peluang menjawab benar
suatu soal pada tingkat kemampuan tertentu yang
biasanya dinyatakan dalam bentuk indeks. Penentuan
tingkat kesukaran soal dalam penelitian ini digunakan
rumus (Nitko, 1996) yaitu:
IK=Jumlahsiswayangmenjawabbenarbutirsoal
JumlahsiswayangmengikutitesKlasifikasi indeks kesukaran soal dapat menggunakan
kriteria Suherman (2003) dalam tabel berikut:
Tabel 3.5. Klasifikasi Indeks Kesukaran SoalRange Tingkat
KesukaranKategori
0,0 Terlalu Sulit0,10 < IK ≤ 0,30 Sukar0,30 < IK ≤ 0,70 Sedang0,70 < IK ≤ 1,00 Mudah
52
Range TingkatKesukaran
Kategori
1,00 Sangat Mudah
d) Daya Pembeda
Daya pembeda soal adalah kemampuan suatu butir soal
dapat membedakan antara siswa yang telah menguasai
materi yang ditanyakan dan siswa yang belum menguasai
materi yang diujikan. Penentuan daya pembeda butir soal
dalam penelitian ini digunakan rumus Suherman (2003)
yaitu:
DP=SA−SB
JA
Keterangan:
DP = Daya pembeda suatu butir soalSA = Jumlah skor kelompok atasSB = Jumlah skor kelompok bawahJA = Jumlah skor ideal kelompok atasKriteria penafsiran daya pembeda suatu butir soal
a. Membuat transkrip wawancara yang sistematis dan
hasil wawancara setiap guru dan siswa yang menjadi
responden
b. Menentukan data yang penting sesuai dengan tujuan
yang ingin dicapai
c. Mengelompokkan respon yang sama
d. Mendeskripsikan hasil wawancara
e. Menarik kesimpulan
54
DAFTAR PUSTAKA
Adams, W. K. & Wieman, C. E. (2010) Development andValidation of Instruments to Measure Learning ofExpert-Like Thinking. International Journal of Science Education,33(9), 1-24
Allen, M. J & Yen, W.M. (1979). Introduction to MeasurementTheory. Montery: Brooks Cole Publishing Company
Amir, E., Siswaningsih, W., & Hana, M. N. (2013)Pengembangan Web Assessment dengan HOT Potatoespada Materi Reduksi dan Oksidasi. Jurnal Riset danPraktik Pendidikan Kimia, 1(1), 84-90
Anastasi, A. & Urbina, S. (1997). Collaborative testing (7thed). New Jersey: Prentice Hall, Inc
Anderson, L. W. & Krathwohl. (2010) . Kerangka LandasanUntuk Pembelajaran, Pengajaran, dan Asesmen (Revisi TaksonomiBloom). Yogyakarta: Pustaka Pelajar
Arifin, M., Sudja, W. A., Ismail, A. K.., & Wahyu, W.(2003). Strategi Belajar Mengajar Kimia. Bandung: JurusanKimia FMIPA UPI.
Arikunto, S. (2009). Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi).Jakarta: Bumi Aksara
Azwar, S. (2011). Reliabilitas dan Validitas. Yogyakarta:Pustaka Pelajar
Bertolo, E & Lambert, G. (2007). Implementing CAA inchemistry: a case study. Dalam Proceedings of theConference at Loughborough University. Loughborough, 73-84
Brookhart, S. M. (2010). How to Assess High Order Thingking SkillsIn Your Classroom. Virginia: ASCD Alexandria [Online].
55
Tersedia di: http://:www.jalt.org/test/bro 12.htm.Diakses 12 Desember 2010.
Burke, P. (1949) Testing Critical Thingking in Physics.American Journal of Physics, 7(9), 527-532
Cassady, J.C & Gridley, B.E. (2005) The Effects ofOnline Formative and Summative Assessment on TestAnxiety and Performance. JTLA: The Journal of technology,learning, and Assessment, 4 (1)
Chang, R. (2005). Kimia Dasar Konsep-Konsep Inti Jilid 2 (Edisiketiga). Jakarta: Erlangga
Cifaldi, C. (2008). Virtual Test and Engineering Simulation inAerospace & Defence [Online]. Tersedia diweb.mscsoftware.com/aero/pdf/PresVT.pdf . Diakses28 Februari 2015
Conole, G & Warburton, B. (2005) A review of computer-assisted assessment. ALT-J, Research in Learning Technology, 13 (1), 17–31
Departemen Pendidikan dan Kebudayaan. (2013). LampiranPeraturan Menteri Pendidikan dan Kebudayaan Republik IndonesiaNomor 66 Tahun 2013 tentang Standar Penilaian Pendidikan.Jakarta : Depdikbud
Departemen Pendidikan dan Kebudayaan. (2013). PeraturanMenteri Pendidikan dan Kebudayaan Republik Indonesia Nomor 3Tahun 2013 tentang Kriteria Kelulusan Peserta Didik dari satuanPendidikan dan Penyelenggaraan UjianSekolah/Madrasah/Pendidikan Kesetaraan dan Ujian Nasional.Jakarta : Depdikbud
Ennis, R. H. (1996). Critical Thingking. Illionis: PrenticeHall
56
Ennis, R.H. (2011) The Nature of Critical Thingking: AnOutline of Critical Thingking Disposition andAbilities. Dalam Revision of a presentation at the SixthInternational Conference on Thingking at MIT, Cambridge
Filsaime, D. K. (2008). Menguak Rahasia Berpikir Kritis danKreatif. Jakarta: Prestasi Pustakaraya
Firman, H. (2013). Evaluasi Pembelajaran Kimia. Bandung :Jurusan Pendidikan Kimia FPMIPA UniversitasPendidikan Indonesia
Firman, H & Rusyati, L. (2014). Virtual Test: Sebuah StudentCentre Software Sebagai Alat Ukur Berpikir Kritir Siswa SMP PadaTema Penyakit Manusia (Laporan PPKBK). Bandung:Universitas Pendidikan Indonesia
Gulo, W. (2005). Strategi Belajar Mengajar. Jakarta: Gramedia
Herron, J. D. (1977) Problems associated with conceptanalysis. Journal of Science Education, 61(2), 185-199
Holifield, P., Brown, M., & Sim, G. (2004)Implementation of computer assisted assessment:lessons from the literature. ALT-J: Research in LearningTechnology, 12 (3), 215-228
Inch, E. S & Tudor K. H. (2006). Critical Thingking andCommunication: The Use of Reason in Argument edisi kelima.Boston: Pearson Education, Inc
Jamil, M., Topping, K.J., Tariq, R.H. (2012) PerceptionsOf University Students Regarding Computer AssistedAssessment. TOJET: The Turkish Online Journal of EducationalTechnology, 11 (3), 267-277
Johnson, E. B. (2011). CTL Contextual Teaching Learning.Bandung: Kaifa Learning
Kartadinata, S. (1992). Teknik Pengukuran dan Penilaian HasilBelajar. Bandung: Penerbit CV Andira
King, T & Duke-William, E. (2001). Using Computer AidedAssessment To Test Higher Level Learning Outcomes
57
[Online]. Proceedings of 5th International Computere AssistedAssessment Conference, Univ. of Loughborough, 177-178.Diakses melaluihttp://www.caaconference.com/pastConferences/2001/proceedings/p1.pnf . Diakses 19 Januari 2015
Kompas. (2015, 18 januari). Upaya Mendikbud Ubah PandanganSiswa tentang UN yang Menakutkan. Tersedia dihttp://nasional.kompas.com/read/2015/01/18/18030011/Upaya.Mendikbud.Ubah.Pandangan.Siswa.tentang.UN.yang.Menakutkan . Diakses pada 19 januari 2015
Lawse, C. H. (1975) A Quantitative Approach To CntentValidity. Content Validity II. A Conference Held atBowling Green State University, 28, 563-575
Liliasari (2009). Berpikir Kritis dalam PembelajaranKimia Menuju Profesionalitas Guru [Online]. Tersediadi http://file.upi.edu/ai.php. Diakses pada 14Februari 2015
Lowry, R. (2005) Computer aided self assessment: Aneffective tool. Chemistry Education Research and Practice,6 (4), 198-203
Mushonev, K. (2014). Pengembangan gambar konsep sebagai alatevalaluasi pada konsep ekosistem. Tesis Magister pada SPsUPI Bandung: tidak diterbitkan
Oluwatayo, J. A. (2012) Validity and Reliability Issuesin Educational Research. Journal of Educational and SocialResearch, 2(2), 391-400
Renaud, R. D. & Murray, H. G. (2008) A Comparison of asubject specific and general measure of criticalthingking. Procedia - Thingking Skills and Creativity, 3(2), 85-93
Republika. (2015, 21 Januari). Pembuat Soal UN akanDidatangkan dari Luar Negeri. di akses melaluihttp://www.republika.co.id/berita/pendidikan/eduaction/15/01/07/nhszzr-pembuat-soal-un-akan-didatangkan-dari-luar-negeri . Diakses 9 januari2015
Robinson, W & Lyle, K. S. (2001) Teaching ScienceProblem Solving: An Overview of Experimental Work.Journal of Chemical Education 78 (9), hal. 1662-1663
Santoso, A., Aprijani, D.A., Sufandi, U.U., & Maalik, I.(2010). Pengembangan Model Sistem Ujian BerdasarkanComputerized Adative Testing Sebagai Upaya EfisiensiPenyelenggaraan Ujian Universitas terbuka (Laporan PenelitianLanjut Bidang Kelembagaan dan Pengembangan Sistem.Jakarta: Universitas Terbuka
Satrisman, A. (2013). Analisis Soal Ujian Nasional Kimia SMA Tahun2013 Berdasarkan Taksonomi Bloom Dua Dimensi. (Skripsi).Universitas Pendidikan Indonesia Bandung: tidakditerbitkan
Schafersman, S.D. 1991. Introduction to criticalthinking [Online]. Tersedia dihttp://www.freeinquiry.com / critical-thinking.html.Diakses pada 19 Februaru 2015
Sudaryono. (2012). Dasar-dasar Evaluasi Pembelajaran.Yogyakarta : Graha Ilmu
Surapranata, S. (2006). Analisis, Validitas, Reliabilitas danInterpretasi Hail Tes. Bandung: PT Remaja Rosda Karya
Tim Bahasa Departemen Pendidikan Nasional. (2005). KamusBesar Bahasa Indonesia. Jakarta: Balai Pustaka
Wilson, F.R., Pan, W., & Schumsky, D.A. (2012)Recalculation of The Critical Values for Lawshe’sContent Validity Ratio. Measurement and Evaluation inCounseling and Development, 45(3), 197-210
Tuysuz, C. (2009) development of two-tier diagnosticinstrumen and assess students’ understanding inchemistry. Scientific research and essay, 4(6),626-631
Jacobs, L.C dan Chase, C.I 1992. Development and usingtest effectively. San fransisco:jossey-basspublisher