proposal tesis

1

PROPOSAL PENELITIAN

A. JUDUL

Pengembangan dan Validasi Virtual Test Untuk Mengukur

Kemampuan Berpikir Kritis Siswa pada Materi

Kesetimbangan Kimia

B. LATAR BELAKANG

Kualitas pembelajaran ditentukan salah satunya oleh

kualitas penilaian yang dilakukan oleh guru dalam

proses pembelajaran. Kegiatan penilaian dapat membantu

guru memahami kekuatan dan kelemahan yang dialami oleh

siswa dalam belajar. Semakin berkualitas kegiatan

penilaian pembelajaran, pemahaman guru akan kelemahan

dan kekuatan siswa dalam mempelajari materi tertentu

semakin baik. Penilaian merupakan suatu proses

pengumpulan, pengolahan, dan penyimpulan informasi

dalam rangka pembuatan keputusan (McMillan, 2008).

Penilaian pendidikan menurut Peraturan Menteri

Pendidikan dan Kebudayaan Nomor 66 Tahun 2013

didefinisikan sebagai proses pengumpulan dan pengolahan

informasi untuk mengukur pencapaian hasil belajar

peserta didik. Salah satu bentuk evaluasi pendidikan

yang diselenggarakan oleh Pemerintah adalah Ujian

Nasional (UN). Berdasarkan Permendikbud No.3 Tahun 2013

Bab I pasal 1 Ayat 5 Ujian Nasional merupakan kegiatan

pengukuran dan penilaian pencapaian kompetensi lulusan

secara nasional pada mata pelajaran tertentu dalam

kelompok mata pelajaran ilmu pengetahuan dan teknologi.

2

Tujuan UN adalah untuk mengukur pencapaian hasil

belajar peserta didik melalui pemberian tes kepada

siswa. Selain itu UN juga bertujuan untuk mengukur mutu

pendidikan dan mempertanggungjawabkan penyelenggaraan

pendidikan di tingkat nasional, provinsi, kabupaten,

sampai di tingkat sekolah.

Berdasarkan hal tersebut pada dasarnya esensi dari

UN adalah untuk melihat kondisi mutu pendidikan di

Indonesia dan diharapkan terjadi pemerataan kualitas

yang sama di seluruh daerah di Indonesia dengan

memberikan standar nilai kelulusan yang sama di seluruh

Indonesia. Jika berpegang pada esensi UN tersebut, UN

bukanlah sesuatu yang salah bahkan adanya UN menjadi

acuan yang tepat bagi pemerintah untuk mengetahui

kondisi pendidikan di Indonesia. Namun, selama ini UN

masih diyakini oleh para guru sebagai tujuan dan

sasaran akhir kelulusan siswa tanpa memberikan pengaruh

berarti terhadap upaya pembinaan, pengelolaan, dan

pelaksanaan pendidikan pada tingkat sekolah untuk

memperbaiki dan meningkatkan kualitas pendidikan.

Masukan berupa informasi pendidikan yang diperoleh

lewat UN juga hanya diperlakukan sebagai barang

pajangan dan menjadi dokumen mati. Untuk itu, salah

satu hal yang perlu dievaluasi dari pelaksanaan UN

adalah kualitas teknis pada soal-soal dalam UN yang

perlu diuji oleh para peneliti ahli yang berada di luar

struktur pemerintah atau Kemendiknas RI. Instrumen UN

3

yang dibuat harus didasarkan pada empat aspek utama,

yaitu konsistensi, validitas, kesetaraan, serta aspek

bias agar dapat mengukur kemampuan siswa yang

sesungguhnya. Selain itu soal-soal UN seharusnya dapat

memotret kompetensi siswa secara utuh dan komprehensif.

Walaupun kenyataannya belum semua kompetensi siswa bisa

terpotret melalui UN. Selama ini soal-soal UN khususnya

pada pelajaran kimia kebanyakan mengukur kemampuan

berpikir tingkat rendah dan hanya mengukur kemampuan

peserta didik secara kognitif dan berdasarkan dari segi

isi dan konstruksi, soal UN penekanannya lebih besar

pada hafalan daripada keahlian berpikir dan memecahkan

masalah.

Satrisman (2013) dalam penelitiannya menganalisis

soal UN kimia tahun 2013. Hasil penelitiannya

menunjukkan bahwa hanya enam butir soal dengan

persentase 15% yang dikategorikan ke dalam soal pada

jenjang analisis (C4), selebihnya 22,5% pada jenjang

mengingat (C1), memahami (C2), dan 35% pada jenjang

mengaplikasi (C3). Berikut diagram komposisi dimensi

kognitif soal-soal UN kimia SMA tahun 2013.

4

Gambar 1.1 Diagram komposisi dimensi kognitif soalUN kimia SMA tahun 2013 (Satrisman, 2013)

Berdasarkan kenyataan tersebut, maka secara khusus

proses pembelajaran di kelas juga harus berubah, oleh

karena itu, paradigma pembelajaran sudah seharusnya

bergeser dari pembelajaran konvensional yang menekankan

pada keterampilan berpikir tingkat rendah ke arah

pembelajaran yang menekankan pada pembelajaran

keterampilan berpikir tingkat tinggi. Lebih lanjut,

Baswedan dalam Republika (2015) menyatakan "berharap

UN bisa mendorong siswa memiliki high order thinking. Kalau

UN hanya menghasilkan low order thinking, ini sama saja

tidak ada peningkatan, makanya kualitas soal UN perlu

ditingkatkan". Berpikir tingkat tinggi adalah kemampuan

berpikir yang dapat ditransfer pada konteks lain dan

kemampuan pemecahan masalah (Anderson & Krathwohl,

2010). Ada empat pola berpikir tinggi, yaitu berpikir

kritis, berpikir kreatif, pemacahan masalah, dan

pengambilan keputusan. Diantara empat pola berpikir

tingkat tinggi tersebut, berpikir kritis mendasari tiga

pola berpikir yang lain. Artinya berpikir kritis perlu

dikuasai lebih dahulu sebelum mencapai ke tiga pola

berpikir tingkat tinggi yang lain (Liliasari, 2009).

Oleh karena itu, kemampuan berpikir kritis perlu

dikembangkan pada setiap materi namun demikian ada

beberapa materi dalam mata pelajaran kimia yang dapat

mengakomodasi kebutuhan evaluasi dalam mengukur

kemampuan berpikir kritis siswa, salah satunya yaitu

5

kesetimbangan kimia. Dilihat dari karakter konsepnya,

kesetimbangan kimia memiliki jenis konsep berdasarkan

prinsip dengan atribut kritis yang abstrak tetapi

contoh konkrit. Berdasarkan hal tersebut diketahui

bahwa bahwa dalam materi kesetimbangan kimia memerlukan

tingkat pemahaman yang cukup tinggi, sehingga dapat

digunakan dalam mengembangkan butir soal yang dapat

mendorong siswa untuk berpikir kritis.

Di sisi lain, kemajuan teknologi modern merupakan

salah satu faktor yang turut menunjang keberhasilan

pendidikan. Teknologi Informasi dan Komunikasi (TIK)

menawarkan banyak kemungkinan baru dalam keberhasilan

penilaian hasil belajar seperti. Computer Aided Assessment

(CAA), Computer Assist Assessment (CAA), Computerized Adative

Testing (CAT) ataupun Computer Based Test (CBT). Hal ini

sejalan dengan adanya rencana pemerintah mulai tahun

2015 akan melaksanakan UN untuk SMA/MA/SMK dengan

computer-based test (CBT). Seperti yang diberitakan dalam

kompas (2015) Baswedan menyatakan bahwa sistem UN ke

depannya akan dibuat seperti tes TOEFL dengan basis

teknologi komputer, bukan lagi ujian di atas kertas.

Dengan begitu, para murid bisa kapan saja mengajukan

jadwal ujian di saat mereka sudah siap.

Penggunaan media komputer sebagai alat evaluasi

sangat memungkinkan terlaksananya proses evaluasi yang

efektif dan efisien jika dibandingkan dengan paper and

pencil test. Kelemahan paper and pencil test adalah kerahasiaan

6

tes tidak dapat dijamin karena dapat saja dibaca oleh

orang yang tidak berwenang Selain itu, karena harus

memberikan semua butir soal, maka diperlukan waktu

penyelenggaraan yang lebih lama. Penggunaan kertas

menjadi masalah tersendiri, misalnya dibutuhkan ruang

untuk penyimpanan data perangkat tes (Santoso et al,

2010). Keterbatasan informasi pada soal juga menjadi

pertimbangan tersendiri dalam pelaksanaan ujian dengan

paper and pencil test.

Penggunaan Computer Aided Assessment (CAA) disimpulkan

dapat menimbulkan dampak positif pada pengalaman

belajar siswa (Lowry, 2005). Data menunjukkan bahwa

penggunaan CAA sebagai asesmen mandiri berdampak

positif pada siswa. Bagi guru, CAA sangat berperan

dalam menghemat waktu. Sementara bagi siswa, sistem CAA

ini dapat memberikan beberapa keuntungan. (1)

memberikan umpan balik pada siswa, (2) membimbing

usaha-usaha siswa, (3) mendiagnosa permasalahan dalam

pembelajaran, dan (4) memberikan pengalaman pada siswa

dalam kegiatan asesmen mandiri.

Santoso et al (2010) dalam penelitiannya menunjukkan

bahwa sistem ujian akhir dengan menggunaan CAT di

Universitas Terbuka lebih efisien dan lebih reliabel

dari pada tes konvensional dengan paper and pencil test

maupun CBT, karena kesalahan pengukuran akan lebih

kecil karena setiap individu hanya mendapatkan butir

soal yang sesuai dengan kemampuannya. Selain itu, CAT

7

lebih fleksibel dalam pelaksanaan, keamanan tes pun

lebih terkendali. Namun demikian, desaian Constrained-CAT

(CCAT) lebih disarankan untuk diterapkan pada sistem

ujian Universitas Terbuka dibandingkan desain CAT murni

karena desain ini mempertimbangkan keseimbangan isi.

Telah banyak upaya besar yang telah dilakukan untuk

memperkenalkan CAA di pendidikan kimia. Bertolo dan

Lambert (2007) juga menyebutkan bahwa sistem CAA

memberikan dampak positif dalam pengalaman belajar

siswa. Dalam penelitian ini sistem CAA yang digunakan

yaitu Question Mark Computing, yang terdiri dari dua

komponen penilaian yaitu formatif dan sumatif. Tes

formatif bisa diakses kapan saja dan tersedia umpan

balik sebagai panduan belajar lebih lanjut

sedangkan komponen sumatif telah ada umpan baliknya dan

bisa dilakukan sekali. Adams et al (2002) telah

mengembangkan serangkaian bank soal secara online

menggunakan sistem Question mark. Lowry (2005)

menggunakan sistem CAA untuk penilaian formatif dengan

penilaian diri, untuk memberikan dukungan kimia pada

siswa dalam ilmu lingkungan. Studinya menyimpulkan

bahwa sistem CAA memberikan dampak positif terhadap

pengalaman belajar siswa.

Studi mengenai pengembangan virtual test masih sangat

jarang ditemui di Indonesia terutama di bidang

pendidikan kimia. Firman dan Rusyati (2014) telah

mengembangkan virtual test sebagai alat ukur berpikir

8

kritis. Setiap soal disusun berdasarkan elemen berpikir

kritis yang dikembangkan oleh Inch namun fokus

penelitiannya terhadap siswa SMP dan pada mata

pelajaran IPA. Amir et al (2013) menunjukkan bahwa Web

assessment yang dikembangkan melalui Hot potatoes pada

materi redoks dapat membantu guru dalam pelaksanaan tes

formatif akan tetapi fokus penelitian masih sebatas

pemahaman konsep.

Selama ini pelaksanaan pengukuran berpikir kritis

lebih kepada penggunaan paper and pancil test dan hanya

dilengkapi gambar sehingga kurang bisa mengungkapkan

hal yang otentik. Permasalahan seperti pernyataan pokok

uji yang mengandung konsep-konsep yang abstrak dan

sulit dideskripsikan dengan kata-kata menyebabkan

siswa akan mengalami kesulitan memahami pernyataan

pokok uji. Karena pada umumnya pernyataan pokok uji

dalam mengukur kemampuan berpikir tingkat tinggi lebih

panjang dibandingkan pernyataan pokok uji yang mengukur

kemampuan berpikit tingkat rendah. Padahal penggunaan

virtual test dapat membuat jenis pertanyaan lebih

interaktif. Dengan menggunakan virtual test memungkinkan

untuk pembuat soal menggunakan gambar, grafik, animasi,

dan video dalam pebuatan soal sehingga dapat

memperjelas maksud dari pernyataan pokok uji. Berpijak

dari hal tersebut, pengembangan virtual test untuk mengukur

kemampuan berpikir kritis siswa menjadi suatu wilayah

yang menarik dan menantang untuk diteliti. Oleh karena

9

itu, Isu seperti kesesuaian virtual tes dalam mengukur

kemampuan berpikir kritis siswa SMA pada materi kimia

menjadi dasar dalam penelitian ini. Sehingga peneliti

bermaksud untuk mengembangkan dan memvalidasi virtual test

untuk mengukur kemampuan berpikir kritis siswa pada

materi kesetimbangan kimia.

C. RUMUSAN MASALAH

Berdasarkan latar belakang yang sudah dipaparkan,

mengenai komitmen pemerintah dalam memperbaiki kualitas

soal UN dari yang biasanya mengukur kemampuan berpikir

tingkat rendah menjadi lebih menekankan pada kemampuan

berpikir tingkat tinggi seperti kemampuan berpikir

kritis. Selain itu, adanya rencana penyelenggaraan UN

dengan menggunakan computer-based test baik online maupun

offline juga menjadi dasar dari penelitian ini, maka

rumusan masalah utama dalam penelitian ini adalah

“Apakah virtual test yang dikembangkan untuk mengukur

kemampuan berpikir kritis siswa pada materi

kesetimbangan kimia telah memenuhi validitas dan

reliabilitas?“. Bertolak dari rumusan masalah di atas,

maka masalah utama di atas dapat diurai menjadi

beberapa pertanyaan penelitian sebagai berikut:

1. Apakah virtual test yang dikembangkan sudah valid untuk

mengukur kemampuan berpikir kritis siswa SMA?

2. Apakah virtual tes yang dikembangkan sudah reliabel

untuk mengukur kemampuan berpikir kritis siswa SMA?

10

3. Apakah virtual tes yang dikembangkan sudah layak untuk

digunakan dalam mengukur kemampuan berpikir kritis

pada siswa SMA?

4. Apakah virtual test yang dikembangkan efektif dalam

mengukur kemampuan berpikir kritis pada siswa SMA?

D. TUJUAN PENELITIAN

Berdasarkan latar belakang masalah dan rumusan

masalah yang diuraikan di atas maka tujuan umum

penelitian ini adalah untuk mendapatkan virtual test yang

sudah valid dan reliabel dalam mengukur kemampuan

berpikir kritis siswa. Untuk memperjelas tujuan

penelitian maka sub-sub tujuan penelitian diuraikan

menjadi:

1. Untuk mendapatkan instrumen virtual tes yang sudah

memenuhi validitas .

2. Untuk mendapatkan instrumen virtual tes yang sudah

memenuhi reliabilitas.

3. Untuk mendapatkan instrumen virtual tes yang sudah layak

digunakan untuk mengukur kemampuan berpikir kritis

siswa SMA.

4. Untuk mengetahui efektivitas virtual test yang

dihasilkan dalam mengukur kemampuan berpikir kritis

siswa SMA.

E. MANFAAT PENELITIAN

11

Berdasarkan tujuan penelitian dan jawaban atas

permasalahan yang dirumuskan, maka terdapat sejumlah

manfaat yang dapat diperoleh, yaitu:

1. Tersedianya instrumen virtual test yang valid dan

reliabel untuk mengukur kemampuan berpikir kritis

siswa SMA.

2. Sebagai masukan bagi guru mengenai gambaran bentuk

soal virtual test yang dapat mengukur kemampuan berpikir

kritis siswa, dan

3. Menjadikan bahan rujukan bagi peneliti lain dalam

melanjutkan penelitian tentang penilaian dalam

bentuk virtual test.

F. KAJIAN PUSTAKA

1. Virtual Test Sebagai Alat Ukur Penilaian

Virtual berasal dari kata visual, yang artinya proses

pengubahan suatu konsep dan pengungkapan suatu gagasan

atau perasaan dengan menggunakan bentuk gambar,

tulisan, drafik dan lain-lain agar dapat dilihat dengan

indra penglihatan (mata) untuk disajikan (KBBI, 2005)

sedangkan tes merupakan salah satu upaya pengukuran

terencana yang digunakan oleh guru untuk mencoba

menciptakan kesempatan bagi siswa dalam memperlihatkan

prestasi mereka yang berkaitan dengan tujuan yang telah

ditentukan (Calongesi, 1995). Menurut Firman dan

Rusyati (2014) Virtual test yaitu tes menggunakan software

(perangkat lunak) yang dapat dilaksanakan baik secara

12

online maupun offline. Cifaldi (2008) mendefinisikan

virtual test sebagai metode pengujian berbasis pada

penggunaan simulasi bukan tes fisik dan penggunaan dari

pemodelan tertulis. Dari definisi di atas, dapat

disimpulkan virtual tes merupakan suatu bentuk tes dengan

menggunakan multimedia berupa gambar, tulisan, drafik,

animasi, video, dan lain-lain dengan bantuan komputer.

Lebih lanjut Mushonev (2014) menyatakan bahwa

penggunaan bentuk-bentuk visual dalam soal tes akan

dapat membantu evaluator dalam mengukur kemampuan

kognitif siswa yang lebih tinggi dibandingkan

dengan hanya menggunakan pernyataan atau pertanyaan

saja dan penggunaan bentuk-bentuk visual juga dapat

melatih sekaligus mengukur kemampuan proses sains siswa

tersebut.

Secara umum virtual tes dikenal sebagai Computer Aided

Assessment (CAA), Computer Assist Assessment (CAA), Computerized

Adative Testing (CAT) ataupun Computer Based Test (CBT).

Computer assisted or computer aided assessment (CAA) adalah

teknik umum penilaian di lembaga pendidikan tinggi di

Negara-negara Barat. CAA mengacu pada penggunaan

komputer dalam penilaian (Bertolo & Lambert, 2007).

Menurut Conole dan Warburton (2005), penilaian berbasis

komputer melibatkan program komputer, jawaban ditandai

langsung dimasukkan ke dalam komputer, sedangkan optical

mark membaca dengan menggunakan komputer untuk menandai

script yang awalnya berupa kertas. Penilaian berbasis

13

komputer dapat dibagi lagi menjadi aplikasi yang

berdiri sendiri yang hanya membutuhkan satu komputer,

applikasi yang bekerja pada jaringan pribadi dan mereka

merancang untuk disampaikan melalui jaringan publik

seperti web (assessment online).

Kategori penilaian dalam CAA dapat berupa Item

pilihan ganda yang terdiri dari empat bagian yaitu

batang pertanyaan, pilihan, jawaban yang benar dan

distraktor. Tes adalah koleksi subjek yang merupakan

item spesifik dan diambil dari bank soal Ada berbagai

jenis pertanyaan berbeda (misalnya pilihan ganda,

multiple response, hotspot, matching, ranking, drag and drop, multiple

steps and open ended) dan mekanisme umpan balik (termasuk

umpan balik otomatis dalam pengujian obyektif, Model

jawaban, tes beranotasi, atau campuran dengan

intervensi dari guru). Penilaian dapat dikategorikan

sebagai sumatif (diberikan untuk tujuan penilaian) atau

formatif (untuk memberikan umpan balik untuk membantu

proses belajar) (Conole & Warburton, 2005).

Holifield dan Brown (2004) dalam penelitiannya

mendefinisikan CAA sebagai penggunaan media komputer

untuk menyampaikan, tanda atau menganalisis tugas atau

ujian. CAA digunakan untuk memberikan penilaian yang

tepat, sebagai bagian dari keseimbangan metode

penilaian yang jelas berhubungan dengan keterampilan,

kemampuan dan pengetahuan yang perlu diuji. CAA dapat

memberikan kesempatan kepada staf akademik untuk

14

meninjau dan memperbaiki strategi penilaian mereka

secara holistik.

Cassady dan Gridley (2005) dalam penelitiannya

menyebutkan kelebihan penilaian formatif dan sumatif

online adalah fleksibilitas dalam memberikan tes

kepada siswa dan efisiensi dalam menghasilkan tujuan.

Dengan pengirima ntes secara online siswa tidak selalu

terikat dan kendala oleh penjadwalan akademik. Secara

khusus, mereka bisa menyelesaikan ujian pada waktu yang

berbeda dari hari sesuai dengan kenyamanan mereka dan

bisa menyelesaikan tes di lokasi yang berbeda.

King dan Duke (2001) dalam penelitiannya

menyebutkan terdapat tiga pembelajaran level tinggi

yang menarik untuk membangun pertanyaan CAA yaitu:

Analyse, meliputi membedakan, mengorganisir atau

penataan, dan mendekonstruksi (yang menyangkut

menentukan nilai-nilai yang mendasari disajikannya

materi); Evaluate , yang terurai menjadi dua proses

yaitu memeriksa internkonsistensi, dan mengkritisi yang

melibatkan menilai kriteria eksternal; Create, yang

melibatkan proses generatif seperti hipotesa,

perencanaan, merancang, memproduksi dan atau

membangun.

2. Penilaian Kemampuan Berpikir Kritis

keterampilan berpikir kritis merupakan kemampuan

berpikir bagi seseorang dalam membuat keputusan yang

dapat dipercaya dan bertanggung jawab yang mempengaruhi

15

hidup seseorang. Keterampilan berpikir kritis juga

merupakan inkuiri kritis sehingga seorang yang berpikir

kritis akan menyelidiki masalah, mengajukan pertanyaan,

mengajukan jawaban baru yang menantang status quo,

menemukan informasi baru, dan menentang dogma dan

dokrin (Schafersman, 1991). Lebih lanjut Ennis (1996)

mendefinisikan berpikir kritis sebagai cara berpikir

reflektif yang berdasarkan nalar yang difokuskan untuk

menentukan apa yang harus diyakini dan dilakukan.

Seseorang yang berpikir kritis adalah orang yang

terampil penalarannya, memiliki kecendrungan untuk

mempercayai dan bertindak sesuai dengan penalarannya.

Orang yang memiliki keterampilan berpikir kritis akan

mampu mengevaluasi, membedakan, dan menentukan apakah

suatu informasi, buah pikiran orang lain ataupun

pikirannya sendiri itu benar atau salah. Ia juga akan

mampu mencari alternatif penyelesaian atas masalah yang

dihadapi (Ennis, 1996). Dengan demikian berpikir kritis

adalah proses terorganisasi dalam memecahkan masalah

yang melibatkan aktivitas mental yang mencakup

kemampuan: memberikan penjelasan sederhana, merumuskan

masalah, memberikan argumentasi, melakukan deduksi dan

induksi, melakukan evaluasi, dan mengambil keputusan.

Terdapat tiga kemampuan dasar berpikir kritis yang

mula-mula diperkenalkan kepada siswa, yaitu: (1)

Memahami argumen dan keyakinan orang lain, (2) Secara

kritis mengevaluasi argumen dan keyakinan tersebut, (3)

16

Mengembangkan dan mempertahankan argumen dan keyakinan

seseorang yang dianggap baik ( Inch & Tudor, 2006).

Ennis (2011) membagi ranah berpikir kritis menjadi dua,

yaitu keterampilan kognitif dan watak. Para pemikir

kritis yang ideal diharapkan memiliki watak peduli

bahwa apa yang mereka yakini adalah benar dan bahwa

keputusan mereka dibenarkan, bersedia untuk mengerti

dan memberi suatu keadaan dengan jujur dan jelas, serta

peduli terhadap setiap orang. Sedangkan keterampilan

berpikir kritis dapat digolongkan menjadi lima aspek

keterampilan, yaitu memberikan penjelasan sederhana,

membangun dasar untuk membuat keputusan, menyimpilkan,

memberikan penjelasan lanjut, serta memperkirakan dan

menggabungkan (mampu mengintegralkan). Kelima aspek

tersebut dijelaskan lebih rinci lagi sebagai berikut.

Tabel 2.1 kemampuan berpikir kritis menurut EnnisKelompok indikator subindikator

Memberikanpenjelasansederhana

Memfokuskan pertanyaan

Mengidentifikasi/ merumuskanpertanyaanMengidentifikasi/merumuskan kriteria untuk mempertimbangkanMenjaga kondisi berpikir

Menganalisisargumen

Mengidentifikasi kesimpulanMengidentifikasi kalimat-kalimat pertanyaanMengidentifikasi dan menangani ketidaktepatanMelihat struktur dari suatu argumenMembuat ringkasan

Bertanya danmenjawab

Memberikan penjelasan sederhana

17

pertanyaan Menyebutkan contohMembangun keterampilan dasar

Mempertimbangkan apakah sumber dapatdipercaya atau tidak

Mempertimbangkan keahlianMempertimbangkan kemenarikankonsepMempertimbangkan kesesuaian sumberMempertimbangkan reputasiMempertimbangkan penggunaan prosedur yang tepatMempertimbangkan resiko untuk reputasiKemampuan untuk memberikan alasanKebiasaan untuk berhati-hati

Mengobservasi dan mempertimbangkan laporanobservasi

Melibatkan sedikit dugaanMenggunakan waktu yang singkat antara observasi danlaporanMelaporkan hasil observasiMerekam hasil observasiMenggunakan bukti-bukti yangbenarMenggunakan akses yang baikMenggunakan teknologiMempertanggung jawabkan hasil observasi

menyimpulkan

Mendeduksi dan mempertimbangkan hasil deduksi

Siklus logika euleurMengondisikan logikaMenyatakan tafsiran

Menginduksi dan mempertimbangkan hasil induksi

Mengemukakan kesimpulan dan hipotesis

a. Mengemukakan hipotesisb. Merancang eksperimenc. Menarik kesimpulan

sesuai faktad. Menarik kesimpulan dari

hasil menyelidikiMembuat dan Membuat dan menentukan hasil

18

menentukan hasil pertimbangan

pertimbangan berdasarkan latar belakang fakta-faktaMembuat dan menentukan hasilpertimbangan berdasarkan akibatMembuat dan menentukan hasilpertimbangan berdasarkan penerapan fakta

Membuat dan menentukan hasilpertimbangan keseimbangan dan masalah

Memberikanpenjelasanlanjut

Mengidentifikasi istilahdan mempertimbangkan

Membuat bentuk definisiStrategi membuat definisi

a. Bertindak dengan memberikan penjelasan lanjut

b. Mengidentifikasi dan menangani ketidakbenaran yang disengaja

Membuat isi definisiMengidentifikasi asumsi-asumsi

Penjelasan bukan pernyataanMengkonstruksi argument

Mengatur strategi dan taktik

Menentukan suatu tindakan

Mengungkap masalahMemilih kriteria untuk mempertimbangkan solusi yangmungkinMerumuskan solusi alternatifMenentukan tindakan sementaraMengulang kembaliMengamati penerapannya

Berinteraksidengan oranglain

Menggunakan argumenMenggunakan startegi logikaMenggunakan strategi retorikaMenunjukkan posisi, orasi atau tulisan

19

Keterampilan berpikir kritis perlu dikembangkan

karena melalui keterampilan berpikir kritis siswa dapat

lebih mudah memahami konsep dengan lebih mendalam, peka

akan masalah yang terjadi sehingga dapat memahami dan

menyelesaikan masalah dan mampu mengaplikasikan konsep-

konsep dalam situasi yang berbeda. Tabel 2.1 merupakan

acuan dalam pembuatan soal virtual test untuk mengukur

kemampuan berpikir kritis. Butir soal dalam virtual tes

yang dibuat sesuai dengan kelompok, indikator dan

subindikator yang disajikan dalam tabel. Kelompok,

indikator dan subindikator yang dipilih disesuaikan

dengan pokok bahasan.

Burke (1949) menyatakan bahwa asesmen untuk

mengukur keterampilan berpikir kritis dapat saja

terkait materi subjek, dengan pertimbangan kehadiran

konsepnya yang baru harus dikurangi. Lebih lanjut

Renaud dan Murray (2008) menunjukkan bahwa pengukuran

keterampilan berpikir kritis dengan tes yang terkait

materi subjek lebih signifikan dibanding tes yang

bersifat umum. Hal tersebut disebabkan siswa lebih

akrab dengan istilah yang bersifat khusus dibandingkan

yang umum.

Adapun karakteristik khusus soal yang dapat

mengukur keterampilan berpikir kritis adalah sebagai

berikut: 1) informasi berupa komik sains, 2) informasi

berupa grafik, 3) informasi berupa tabel, 4) informasi

berupa gambar, 5) informasi berupa artikel, 6)

20

informasi berupa gambar dan artikel, 7) informasi

berupa role play, dan 8) informasi berupa metode ilmiah

(Inch & Tudor, 2006).

3. Standarisasi Virtual Test Berpikir Kritis

Standarisasi mengimplikasikan keseragaman cara

dalam penyelenggaraan dan penskoran tes. Tujuan/ fungsi

dari proses standarisasi alat ukur adalah untuk

mendapatkan tingkat reliabilitas dan validitas serta

menentukan norma dari tes yang baru dikembangkan.

Biasanya proses standarisasi suatu tes dilakukan

melalui suatu proses ujicoba pada sampel yang luas dan

representatif dari jenis orang yang memang menjadi

sasaran perancangan tes tersebut (Anastasi, 1988).

Dalam pengembangan virtual tes ini digunakan

kriteria-kriteria untuk menentukan apakah instrumen

yang telah dibuat dan diujicobakan masih perlu

diperbaiki atau sudah dianggap cukup baik. Kriteria-

kriteria yang dimaksud meliputi validitas instrumen

secara keseluruhan, analisis item yang meliputi

validitas setiap butir soal dalam instrumen, dan

reliabilitas instrumen secara keseluruhan.

a. Validitas Instrumen

Validitas atau kesahihan berasal dari kata validity

yang berarti sejauh mana ketetapan dan kecermatan suatu

alat ukur dalam melakukan fungsi ukurnya (Sudaryono,

2012). Sebuah instrument dikatakan valid apabila mampu

mengukur apa yang diinginkan dan dapat mengungkap data

21

dari variabel yang diteliti secara tepat. Tinggi

rendahnya validitas instrument menunjukkan sejauh mana

data yang terkumpul tidak menyimpang dari gambaran

tentang validitas yang dimaksud (Arikunto, 2013). Suatu

tes dapat dikatakan mempunyai validitas yang tinggi

apabila tes tersebut menjalankan fungsi ukurnya, atau

memberikan hasil ukur yang tepat dan akurat sesuai

dengan maksud dikenakannya tes tersebut. Suatu alat

ukur yang tinggi validitasnya akan memiliki eror

pengukuran yang kecil, artinya skor setiap subjek yang

diperoleh alat ukur tersebut tidak jauh beda dengan

skor yang sesungguhnya.

Nunnaly (dalam Surapranata, 2009) menyatakan bahwa

validitas senantiasa dikaitkan dengan penelitian

empiris dan pembuktian-pembuktiannya bergantung kepada

macam validitas yang digunakan. Proses validasi

meliputi pengumpulan bukti-bukti untuk menunjukkan

dasar saintifis penafsiran skor yang direncanakan.

Kesahihan isi dilihat dari kisi-kisi tes, yaitu matrik

yang menunjukkan bahan tes serta tingkat berpikir yang

terlibat dalam mengerjakan tes. Hasil estimasi

validitas suatu pengukuran pada umumnya dinyatakan

secara empirik oleh suatu koefisien yang disebut

koefisien validitas.

Didalam penelitian pendidikan ada empat tipe

validitas yang begitu penting, yaitu face validity, content

validity, construct validity and criterion-related validity. Namun,

22

menurut konsep baru jenis-jenis validitas hanya

dibedakan menjadi tiga macam yaitu, content validity,

criterion-related validity dan construct validity (Basuki, 2014).

Sama halnya dengan yang diungkapkan Firman (2013) bahwa

validitas dibedakan menjadi beberapa macam, yaitu :

Gambar 3.1. Jenis-Jenis Validitas (Firman, 2013)

Berdasarkan penjelasan diatas maka, jenis-jenis

validitas yang akan diuraikan pada penelitian ini

diantaranya adalah :

1) Validitas Isi

Validitas isi berkenaan dengan kesanggupan alat

penilaian dalam mengukur isi yang seharusnya. Artinya,

suatu tes mampu mengungkapkan isi suatu konsep atau

variabel yang hendak diukur (Sudjana, 2014). Validitas

isi sering digunakan dalam penilaian hasil belajar.

Tujuan utamanya adalah untuk mengetahui sejauh mana

peserta didik menguasai materi pelajaran yang telah

disampaikan, dan perubahan-perubahan psikologis apa

Type of validity

Content Validity

Criterion-related Validity

Predictive Validity

Concurrent validity

Construct Validity

23

yang timbul pada diri peserta didik tersebut setelah

mengalami proses pembelajaran tertentu (Arifin, 2013).

Pengujian validitas isi tidak melalui analisis

statistika tetapi menggunakan analisis rasional

terhadap isi tes yang penilaiannya didasarkan atas

pertimbangan subyektif individual. Walaupun subjektif,

namun yang terlibat adalah beberapa pakar pada bidang

yang diukurnsehingga hasilnya dapat dipertanggung

jawabkan. Menurut Guion (Surapranata, 2009), validitas

isi hanya dapat ditentukan berdasarkan judgement para

ahli. Prosedur yang dapat digunakan antara lain : (1)

mendefinisikan domain yang hendak diukur; (2)

menentukan domain yang akan diukur oleh masing-masing

soal; (3) membandingkan masing-masing soal dengan

domain yang sudah ditetapkan. Sedangkan Arifin (2013)

menyatakan bahwa validitas kurikuler atau validitas isi

dapat dilakukan dengan beberapa cara, antara lain

mencocokkan materi tes dengan silabus dan kisi-kisi,

melakukan diskusi dengan sesama pendidik, atau

mencermati kembali substansi konsep yang akan diukur.

2) Validitas Konstrak

Validitas konstruk adalah tipe validitas yang

menunjukkan sejauh mana tes mengungkap suatu trait atau

konstruk teoritik yang hendak diukurnya (Allen & Yen,

1979). Validitas konstruk mengandung arti bahwa suatu

alat dikatakan valid apabila telah cocok dengan

konstruksi teoritik dimana tes itu dibuat, yakni

24

apabila soal-soalnya mengukur setiap aspek berpikir

seperti yang diuraikan dalam standar kompetensi,

kompetensi dasar, maupun indikator yang terdapat dalam

kurikulum (Surapranata, 2009). Menurut Sudaryono (2012)

validitas konstruk bukanlah dimaksudkan bahwa tes yang

bersangkutan dipandang sudah baik susunan kalimat

soalnya, atau urut-urutan nomor butir soalnya sudah

runtut, melainkan bahwa tes hasil belajar baru dapat

dikatakan telah memiliki validitas susunan atau

konstruk apabila butir-butir soal atau item yang

membangun tes tersebut benar-benar telah dapat dengan

secara tepat mengukur aspek-aspek berpikir (Seperti

aspek kognitif, afektif dan psikomotorik dan

sebagainya.

3) Validitas Berdasarkan Kriteia

Validitas empiris atau validitas kriteria suatu

instrument atau tes ditentukan berdasarkan data hasil

ukur instrument yang bersangkutan, baik melalui uji

coba maupun melalui tes atau pengukuran yang

sesungguhnya (Sudaryono, 2012). Menurut Firman (2013)

tinggi rendahnya validitas kriteria dapat diestimasi

dari besarnya korelasi antara hasil tes yang sedang

dinilai dengan hasil tes yang dijadikan kriteria. Jika

korelasinya tinggi maka kesimpulannya validitas tinggi.

Sebaliknya jika korelasinya rendah maka berarti bahwa

tes tersebut mempunyai validitas yang rendah. Arifin

(2013) menyatakan bahwa ada tiga macam validitas

25

empiris, yaitu : validitas prediktif, validitas

bandingan, dan validitas sejenis.

a) Validitas prediktif (predictive validity),

Validitas prediktif menunjukkan kepada hubungan

antara skor tes yang diperoleh peserta tes dengan

keadaan yang akan terjadi diwaktu yang akan datang.

Sebuah tes dikatakan memiliki validitas prediksi

apabila mempunyai kemampuan untuk memprediksikan apa

yang terjadi di masa yang akan datang (Surapranata,

2009). Validitas ramalan mengandung dua makna, yaitu :

validitas jangka pendek dan validitas jangka panjang.

Validitas jangka pendek berarti daya ramal alat

penilaian tersebut hanya untuk masa yang tidak lama.

Sedangkan validitas jangka panjang mengandung makna

skor akan berkorelasi juga dikemudian hari (Sudjana,

2014). Valid atau tidaknya suatu tes dilihat dengan

membandingkan kesesuaiannya dalam praktik. Sesuai atau

tidak hal-hal yang telah diramalkan (diprediksikan)

oleh tes tersebut dengan prestasi yang dicapai si testee

sesudah pengukuran melalui tes tersebut (Basuki, 2014).

Contoh sederhana misalnya apa yang terjadi pada

penerimaan peserta tes berdasarkan hasil tes seleksi

setelah mereka lulus SMA. Peserta tes yang memiliki

nilai yang bagus di tes seleksi tersebut lalu diterima

di perguruan tinggi, diperkirakan akan berhasil ketika

mereka belajar diperguruan tinggi. Apabila hal itu

26

terjadi, maka tes masuk perguruan tinggi tersebut

dikatakan memiliki validitas prediksi yang bagus.

b) Validitas bandingan (concurrent validity),

Validitas bandingan merupakan suatu proses teknik

yang memungkinkan kita untuk mengevaluasi kemampuan tes

dalam membedakan antara peserta tes yang menguasai dan

yang tidak menguasai kompetensi-kompetensi yang dinilai

(Basuki, 2014). Dalam membandingkan suatu tes maka

diperlukan suatu kriterium atau alat banding. Maka

hasil tes merupakan sesuatu yang dibandingkan

(Suharsimi, 2009). Concurrent validity menunjuk pada

hubungan antara tes skor yang dicapai dengan keadaan

sekarang. Sebuah tes dikatakan memiliki concurrent validity

apabila hasilnya sesuai dengan pengalaman (Surapranata,

2006). Validitas konkuren adalah jika kriteria

standarnya berlainan (Arifin, 2013). Misalnya, suatu

tes kimia buatan guru dapat dikatakan mempunyai

validitas kongkuren tinggi jika hasilnya berkorelasi

tinggi dengan hasil tes kimia “baku” (sudah terbukti

tinggi validitasnya).

c) Validitas sejenis (congruent validity),

Validitas sejenis adalah jika kriteria standarnya

sejenis (Arifin, 2013). Misalnya, mengkorelasikan hasil

sebuah tes intelegensi yang baru dengan hasil tes

intelegensi yang sudah ada. Atau misalnya skor tes

Kimia dikorelasikan dengan skor tes kimia.

27

b. Reliabilitas

Reliabilitas dan validitas adalah dua karakteristik

penting, baik untuk tes acuan norma (TAN) atau tes

acuan kriteria (TAK), serta untuk tes kertas dan pena

(paper-and pencil test) maupun tes kinerja (performance test)

reliabilitas dan validitas menggambarkan kualitas yang

harus dimiliki oleh setiap tes yang baik. Seperti yang

dinyatakan sebelumnya, validitas mengacu pada akurasi

tes dalam hasil mengukur apa yang harus diukur,

sedangkan reliabilitas mengacu pada konsistensi dalam

hasil pengujian (Basuki & Haryanto, 2014). Reliabilitas

merupakan penerjemahan dari kata reliability yang mempunyai

asal kata rely dan ability. Pengukuran yang memiliki

reliabilitas tinggi disebut sebagai pengukuran yang

reliabel (reliable). Walaupun reliabilitas mempunyai

berbagai nama lain seperti kepercayaan, keterandalan,

keajegan, kestabilan, konsistensi, dan sebagainya,

namun ide pokok yang terkandung dalam konsep

reliabilitas adalah sejauhmana hasil suatu pengukuran

dapat dipercaya (Azwar, 2011).

Menurut Surapranata (2006), tujuan utama

mengestimasi reliabilitas adalah untuk menentukan

seberapa besar variabilitas yang terjadi akibat adanya

kesalahan pengukuran dan seberapa besar variabilitas

skor tes sebenarnya. Reliabilitas tes merujuk kepada

konsistensi skor yang dicapai seorang siswa sekiranya

siswa itu diuji berulang kali dengan tes yang sama

28

dalam waktu yang berbeda (Kartadinata, 1992). Menurut

Nitko dan Brookhart (2007) :

“Reliability then is the degree to which students’ results remain

consistent over replications of an assesment procedure. That is,

reliability is the degree to which students’ assesment results are the

same when (a) they complete the same task(s) on two or more

different occasions; (b) two or more teachers mark their performance

on the same task; or (c) they complete two or more different but

equivalent tasks on the same or different occasions”

Suatu instrumen evaluasi dikatakan mempunyai nilai

reliabilitas tinggi apabila tes yang dibuat mempunyai

hasil yang konsisten dalam mengukur yang hendak diukur

(Sukardi, 2010). Tinggi-rendahnya reliabilitas secara

empirik ditunjukkan oleh suatu angka yang disebut

koefisien reliabilitas. Semakin tinggi koefisien

korelasi antara hasil ukur dari dua tes yang paralel,

maka konsistensi diantara keduanya semakin baik dan

kedua alat ukur itu sebagai alat ukur yang reliabel.

Apabila korelasi antara hasil dari dua alat ukur yang

paralel ternyata tidak tinggi maka disimpulkan bahwa

reliabilitasnya rendah (Azwar, 2011).

4. Analisis Konsep Kesetimbangan Kimia

Untuk menentukan karakteristik konsep-konsep yang

tercakup dalam materi kesetimbangan Kimia, digunakan

metode analisis konsep berdasarkan Heron (1997).

Analisis konsep yang dilakukan mencakup penentuan label

konsep, definisi konsep, atribut kritis dan atribut

29

variabel, hirarki konsep dan jenis konsep. Analisis

terhadap konsep-konsep yang tercakup pada materi

kesetimbangan kimia disajikan pada lampiran 1.

Berdasarkan analisis konsep terlihat bahwa materi

kesetimbangan kimia memiliki karakteristik jenis konsep

berdasarkan prinsip dengan atribut kritis dengan contoh

abstrak sehingga materi kesetimbangan kimia dapat dapat

mengakomodasi kebutuhan evaluasi dalam mengukur

kemampuan berpikir kritis siswa.

Berdasarkan kurikulum 2013, Kompetensi Dasar (KD)

pada materi kesetimbangan kimia memiliki dua kompetensi

dasar pada KI 3 yaitu KD 3.8 dan KD 3.9 yaitu:

3.8 : Menganalisis faktor-faktor yang mempengaruhi

pergeseran arah kesetimbangan yang diterapkan

dalam industri.

3.9 : Menentukan hubungan kuantitatif antara pereaksi

dengan hasil reaksi dari suatu reaksi kesetimbanga

pada kesetimbangan

Pada sub bab ini diuraikan penjelasan terkait

materi kesetimbangan kimia yang diajarkan di kelas XI

semester ganjil. Adapun konsep yang terkait yaitu:

kesetimbangan kimia; kesetimbangan homogen dan

heterogen; tetapan kesetimbangan Kc; kuosien reaksi;

dan faktor-faktor yang memepengaruhi kesetimbangan.

Uraian materi kesetimbangan kimia sebagai berikut:

a. Konsep Kesetimbangan Kimia

30

Hanya sedikit reaksi kimia yang berlangsung satu

arah. Kebanyakan merupakan reaksi reversibel. Pada awal

proses reversibel, reaksi berlangsung maju ke arah

pembentukan produk. Segera setelah beberapa molekul

produk terbentuk, proses balik mulai berlangsung, yaitu

pembentukan molekul reaktan dari molekul produk. Bila

laju reaksi maju dan laju reaksi balik sama besar dan

konsentrasi reaktan dan produk tidak lagi berubah

seiring berjalannya waktu, maka tercapailah

kesetimbangan kimia (Chang, R, 2005).

Setiap reaksi kimia yang dilakukan dalam wadah

tertutup akan mencapai keadaan kesetimbangan. Untuk

beberapa reaksi, posisi kesetimbangan sangat dekat ke

arah produk atau konsentrasi produk mendekati sempurna.

Keadaan ini dapat dikatakan bahwa posisi reaksi

terletak jauh ke arah kanan menuju arah produk

(Sunarya, 2005). Kesetimbangan kimia merupakan proses

dinamik. Secara makroskopik suatu sistem reaksi

setimbang memang tidak memperlihatkan perubahan, namun

ditinjau secara mikroskopik sebenarnya terjadi

perubahan, yaitu setiap saat terjadi pembentukan produk

yang diimbangi dengan pembentukan pereaksi. Dengan

demikian secara mikroskopik dalam sistem reaksi

setimbang masih terjadi pergerakan molekul-molekul yang

bereaksi yang tidak tampak secara mikroskopik (Sunarya

& Setiabudi, 2009).

31

Keadaan kesetimbangan dinamik ini ditandai dari

hanya ada satu konstanta kesetimbangan. Bergantung pada

jenis spesi yang bereaksi, konstanta kesetimbangan

dapat dinyatakan dalam molaritas (untuk larutan) atau

tekanan parsial (untuk gas). Konstanta kesetimbangan

memberi informasi tentang arah akhir dari suatu reaksi

reversibel dan konsentrasi-konsentrasi dari campuran

kesetimbangannya (Chang, R, 2005).

b. Tetapan Kesetimbangan Kimia

Jika ke dalam suatu reaktor tertutp dicampurkan gas

N2, O2, dan NO (reaksinya dapat balik) maka tidak dapat

ditentukan mana yang bertindak sebagai pereaksi maupun

hasil reaksi. Arah reaksipun tidak dapat ditentukan

secara pasti sebab reaksi dapat balik (reversibel)

dapat berlangsung dua arah. Untuk mengetahui arah

reaksi reaksi reversibel maka didefinisikan

perbandingan reaksi (quotient of reaction), yang

dilambangkan dengan Q, yaitu perbandingan konsentrasi

zat-zat yang bereaksi. Jika persamaan reaksi untuk

campuran gas N2, O2, dan NO dituliskan sebgai

N2 (g) + O2(g) 2NO (g) maka perbandingan

reaksinya adalah

Q=¿¿

Pada saat reaksi mencapai kesetimbangan, harga Q

tidak lagi bergantung pada konsentrasi awal, tetapi

hanya bergantung pada suhu sistem reaksi. Besaran Q

memiliki makna penting sebab memberikan nilai yang

32

tidak bergantung pada konsentrasi awal pereaksi. Pada

saat harga Q tetap, dinamakan tetapan kesetimbangan

(dilambangkan dengan Kc). Secara umum, tetapan

kesetimbangan untuk reaksi hipotetik:

a A + b B c C + d D dapat dinyatakan

dengan:

Kc=¿¿

Hubungan Q dan Kc dapat dinyatakan sebagai berikut:

Jika nilai Q lebih besar daripada nilai Kc, reaksi

sedang berlangsung kearah kiri persamaan reaksi.

Jika nilai Q lebih kecil daripada nilai Kc, reaksi

sedang berlangsung kearah kanan persamaan reaksi.

Jika nilai Q lebih kecil daripada nilai Kc, reaksi

sedang berlangsung kearah kanan persamaan reaksi

Jika nilai Q sama dengan nilai Kc, reaksi dikatakan

telah mencapai keadaan setimbang.

Nilai Kc selalu tetap walaupun konsentrasi awal

zat-zat dalam sistem kesetimbangan diubah-ubah. Nilai

Kc akan berubah jika suhu sistem reaksi berubah. Oleh

karena itu, nilai Kc hanya dipengaruhi oleh suhu

sistem reaksi (Sunarya, 2005).

c. Azas Le Chatelier

Le Chatelier menyatakan bahwa jika suatu tekanan

eksternal diberikan kepada suatu sistem yang setimbang,

sistem ini akan menyesuaikan diri sedemikian rupa untuk

mengimbangi sebagian tekanan ini pada saat sistem

mencoba setimbang kembali. Kata “tekanan” (stress)

33

disini berarti perubahan konsentrasi, tekanan, volume,

atau suhu yang menggeser sistem dari keadaan

setimbangannya (Chang, 2005). Dengan kata lain, jika

sistem yang berada dalam keadaan kesetimbangan

diganggu, sistem akan berusaha mengurangi gangguan

dengan cara menggeser posisi kesetimbangan, baik kearah

pereaksi maupun hasil reaksi sehingga gangguan tersebut

minimum dan tercapai keadaan kesetimbangan yang baru.

Asas Le Chatelier digunakan untuk menilai pengaruh dari

perubahan tersebut.

1) Pengaruh konsentrasi

Jika pada sistem kesetimbangan dilakukan penambahan

atau pengurangan salah satu pereaksi atau hasil reaksi,

sistem akan mengadakan reaksi untuk mengurangi gangguan

tersebut. Dengan kata lain jika konsentrasi zat

diperbesar, maka kesetimbangan bergeser dari zat itu

dan jika konsentrasi zat diperkecil, maka kesetimbangan

bergeser ke zat tersebut.

2) Pengaruh tekanan dan Volume

Pada sistem kesetimbangan yang melibatkan fasa

padat atau cair, gangguan tekanan atau volume tidak

berpengaruh, tetapi untuk sistem yang melibatkan fasa

gas, gangguan tekanan terhadap sistem kesetimbangan

sangat berpengaruh, sebab cairan dan padatan pada

dasarnya tidak dapat dimampatkan. Untuk menaikkan

tekanan dapat dilakukan dengan cara memperkecil volume

ruang sistem dan begitu juga sebaliknya untuk

34

menurunkan tekanandilakukan dengan memperbesar volume.

Berdasarkan asas Le Chatelier, untuk mengatasi naiknya

tekanan maka sistem harus mengurangi jumlah molekul.

Dengan kata lain jika tekanan diperbesar, maka

kesetimbangan bergeser kearah yang jumlah molekulnya

sedikit. Sedangkan jika tekanan diperkecil

kesetimbangan bergeser kearah yang jumlah molekulnya

banyak.

3) Pengaruh Suhu

Jika sistem kesetimbangan diubah suhunya maka

sistem akan bereaksi dengan cara yang berbeda dengan

gangguan konsentrasi. Reaksi terhadap gangguan suhu

sangat bergantung pada sifat-sifat termokimia dari

spesi yang terdapat dalam sistem kesetimbangan. Telah

diketahui bahwa setiap reaksi melibatkan perubahan

kalor. Jika reaksi ke arah kanan bersifat eksoterm maka

reaksi baliknya adalah endoterm. Demikian juga yang

terjadi pada reaksi kesetimbangan.

Berdasarkan asas Le chatelier apabila suhu

dinaikkan (memberikan kalor pada sistem) maka untu

mengatasi pengaruh ini sistem melakukan penyerapan

kalor tersebut dengan cara melakukan reaksi yang

endoterm. Dengan kata lain jika suhu dinaikkan maka

kesetimbangan bergeser ke arah reaksi endoterm.

Sedangkan jika suhu diturunkan maka kesetimbangan

bergeser kearah reaksi eksoterm (Sunarya & Setiabudi,

2009).

35

Berdasarkan uraian materi yang telah dipaparkan di

atas, materi kesetimbangan kimia dipetakan seperti

gambar 2.2.

Dipercepat dengandalam Atas

memilik

mematuhi mengalam

Terdiri

Gambar 2.2. Peta Konsep Kesetimbangan Kimia

berhubungan

dipengarmeliput

36

G. KERANGKA BERPIKIR

Penelitian ini dilakukan untuk menghasilkan virtual

test yang dapat mengukur kemampuan berpikir kritis siswa

pada materi kesetimbangan kimia. Peneliti menuangkan

ide penelitiannya dalam kerangka berpikir pada gambar

2.3 berikut ini:

Gambar 2.3 Kerangka Pemikiran

Penelitian ini didasari dari penilaian pembelajaran

kimia yang kebanyakan masih mengukur kemampuan berpikir

Penilaian Pembelajaran Kimia

Kesulitan dalam menguji kemampuan berpikir tingkat tinggi siswa dengan

pencil and paper test

Virtual Test:Dapat mengukur kemampuan berpikir tingkat tinggi siswa yang sulit diuji dengan pencil and paper testSesuai dengan tuntutan UN yang akan datangPokok uji akan lebih mudah dipahami

Pengembangan Virtual Test

Kesetimbangan Kimia:Materi bersifat abstrak dengan contoh yang nyata dalam kehidupan sehari-hariMenyatakan proses sehingga membutuhkan visualisasi agar siswa dapat dengan lebih mudah memahami pokok uji

Kemampuan Berpikir Kritis

Virtual Test

37

tingkat rendah dan hanya mengukur kemampuan peserta

didik secara kognitif seperti terlihat pada soal UN

Kimia . Hal ini disebabkan karena adanya kesulitan

dalam menguji kemampuan berpikir tingkat tinggi siswa

dengan pencil and paper test. Karena pada umumnya pernyataan

pokok uji yang mengukur kemampuan berpikir tingkat

tinggi lebih panjang dibandingkan pernyataan pokok uji

yang mengukur kemampuan berpikir tingkat rendah. Selain

itu permasalahan juga muncul ketika pernyataan pokok

uji mengandung konsep-konsep yang abstrak, yang sulit

dideskripsikan dengan kata-kata sehingga siswa akan

mengalami kesulitan memahami pernyataan pokok uji.

Selain itu, adanya komitmen pemerintah untuk

melaksanakan UN dengan CBT baik online maupun offline

maka peneliti merasa pengembangan virtual test yang dapat

mengukur kemampuan berpikir tingkat tinggi seperti

kemampuan berpikir kritis perlu dilakukan. Adapun

kmateri yang dapat digunakan dalam mengakomodasi

kebutuhan evaluasi dalam mengukur kemampuan berpikir

kritis siswa yaitu materi kesetimbangan kimia.

H. METODE PENELITIANMetode penelitian yang digunakan dalam penelitian

ini adalah Development

and Validation (Pengembangan dan Validasi). Metode

pengembangan dan validasi digunakan seperti alat

penilaian (Adams dan Wieman, 2010). Metode ini akan

digunakan untuk menghasilkan virtual test yang dapat

38

mengukur kemampuan berpikir kritis siswa pada materi

kesetimbangan kimia.

I. SUBJEK PENELITIAN

Populasi dalam penelitian ini adalah siswa di salah

satu SMA Negeri di kota Bandung pada tahun ajaran

2014/2015, Sedangkan sampel yang digunakan dalam

penelitian ini adalah siswa kelas XI IPA tahun ajaran

2014/2015.

J. PROSEDUR PENELITIAN

Terdapat tiga tahapan utama dalam penelitian ini

yaitu: 1) tahapan pengembangan; 2) tahap validasi dan

uji coba; 3) tahap analisis dan penarikan kesimpulan.

Penelitian ini dimulai dengan tahap pengembangan yang

meliputi penyusunan kisi-kisi virtual tes kemampuan

berpikir kritis dan perancangan virtual test untuk mengukur

kemampuan berpikir kritis, Tahap validasi dan uji coba

meliputi validasi isi virtual tes oleh para ahli, menguji

virtual test terhadap siswa SMA kelas XI IPA Kota Bandung,

pelaksanaan paper based test kemampuan berpikir kritis

yang baku untuk validitas konkuren, dan melakukan

wawancara kepada guru dan siswa terhadap pelasksanaan

virtual test. Kemudian pada tahap akhir dilakukan analisis

data dan membuat kesimpulan. Adapun alur penelitian

disajikan pada gambar 3.1.

39

TAHAP VALIDASIDAN UJI COBA

TAHAPPENGEMBANGAN

Gambar 3.1 AlurPenelitian

TAHAP ANALISISDAN KESIMPULAN

40

Berdasarkan alur penelitian pada gambar 3.1 maka

secara terperinci prosedur penelitian meliputi tahapan-

tahapan berikut.

1. Menyusun kisi-kisi virtual tes untuk mengukur

kemampuan berpikir kritis pada materi kesetimbangan

kimia. Dalam kisi-kisi yang dikembangkan memuat

gambaran proporsi antara indikator kemampuan

berpikir kritis, sub-indikator kemampuan berpikir

kritis, konsep dan butir soal. Tabel kisi-kisi

virtual tes kemampuan berpikir kritis pada materi

kesetimbangan kimia dapat dilihat di Lampiran 2.

2. Pengembangan butir soal virtual tes kemampuan

berpikir kritis. Pengembangan butir soal virtual tes

kemampuan berpikir kritis mengacu pada kisi-kisi

butir soal yang telah diselaraskan sesuai dengan

indikator kemampuan berpikir kritis.

3. Validasi isi alat ukur kemampuan berpikir kritis.

Proses validasi isi dilakukan berdasarkan

pertimbangan profesional oleh kelompok pakar

untuk menentukan validasi isi butir soal baik dari

segi materi, konstruksi soal maupun dari segi

kejelasan bahasa yang disusun. Instrumen validasi

diberikan kepada 5 validator yaitu dua orang pakar

alat ukur, satu orang pakar kemampuan berpikir

kritis dan satu orang pakar konsep kimia, dan satu

orang guru kimia. Validasi dilakukan pakar dengan

cara mengisi format yang telah disediakan dengan

41

cara membubuhkan tanda checklist (√) pada kolom yang

telah disediakan, dan memberikan komentar/saran

perbaikan untuk soal yang perlu direvisi di kolom

keterangan. Akhir dari proses validasi yaitu

menganalisis perolehan hasil validasi yang

selanjutnya dihitung dengan menggunakan CVR (Content

Validity Ratio). Format validasi isi dapat dilihat pada

Lampiran 3.

4. Revisi draft produk. Setelah divalidasi oleh ahli,

alat ukur yang dikembangkan dilakukan revisi sesuai

dengan masukan dan saran-saran pakar, kemudian hasil

revisi siap diujicobakan. Perbaikan alat ukur yang

dikembangkan meliputi perbaikan kesesuaian indikator

berpikir kritis dengan soal, penulisan yang kurang

tepat, pertanyaan yang kurang menuntun ataupun hal-

hal lain yang perlu diperbaiki

5. Uji coba. Uji coba dilakukan untuk mengetahui apakah

produk yang dibuat layak digunakan atau tidak. Uji

coba juga melihat sejauh mana produk yang dibuat

dapat mencapai sasaran dan tujuan. Melalui uji coba

maka kualitas produk yang dikembangkan akan teruji

secara empiris.

6. Pengolahan dan anlisis hasil uji coba. Hasil ujicoba

produk dilakukan analisis terhadap butir soal

meliputi validitas empiris, reliabilitas, tingkat

kesukaran dan daya pembeda setiap butir soal. Hasil

yang diperoleh setelah melakukan uji coba terbatas

42

berupa skor perolehan siswa. Skor ini akan

menentukan kualitas dari alat ukur yang

dikembangkan. Kualitas suatu tes dapat dilihat dari

validitas empiris, reliabilitas, tingkat kesukaran

dan daya pembeda. Selanjutnya dilakukan pembuatan

keputusan berdasarkan hasil analisis statistik.

Berdasarkan analisis data, maka ditentukan alat ukur

yang tidak valid dan tidak reliabel. Alat ukur yang

tidak valid dan tidak reliabel tidak diikutsertakan

dalam pengembangan alat ukur berikutnya.

7. Analisis data dan penarikan kesimpulan. Hasil dari

tahapan validasi dan uji coba telah dilaksanakan

dianalisis dan dibahas secara keseluruh untuk

kemudian disimpulkan.

K. DEFINISI OPERASIONAL

1. Virtual test yang dimaksud dalam penelitian ini adalah

suatu bentuk tes dengan bantuan multimedia berupa

video, gambar, animasi, tabel dan grafik melalui

komputer yang digunakan untuk mengukur kemampuan

berpikir kritis siswa pada materi kesetimbangan

kimia.

2. Berpikir kritis yang dimaksud dalam penelitian ini

yaitu proses terorganisasi dalam memecahkan masalah

yang melibatkan aktivitas mental yang mencakup

kemampuan: memberikan penjelasan sederhana,

merumuskan masalah, memberikan argumentasi,

43

melakukan deduksi dan induksi, melakukan evaluasi,

dan mengambil keputusan. Setiap soal disusun

berdasarkan indikator berpikir kritis yang

dikembangkan oleh Ennis.

3. Validitas adalah suatu alat ukur yang menunjukkan

sejauh mana ketetapan dan kecermatan suatu alat ukur

dalam melakukan fungsi ukurnya. Pada penelitian ini

ada dua validitas yang diuji, yaitu validitas isi

oleh ahli dan validitas konkuren.

4. Reliabilitas adalah ukuran sejauh mana suatu alat

ukur memberikan gambaran yang benar-benar dapat

dipercaya tentang kemampuan seseorang.

5. Kepraktisan adalah kemudahan suatu tes, baik dalam

mempersiapkan, menggunakan, mengolah, menafsirkan

dan mengadministrasikan.

L. INSTRUMEN YANG DIKEMBANGKAN

Instrumen yang dikembangkan dalam penelitian ini

adalah virtual test yang dapat digunakan untuk mengukur

kemampuan berpikir kritis siswa. Selain itu, digunakan

tes kemampuan berpikir kritis yang sudah

terstandarisasi dan pedoman wawancara sebagai

instrumen pendukung dalam penelitian ini.

1. Virtual test

Untuk mengetahui validitas dan reliabilitas virtual

tes yang dikembangkan maka perlu dilakukan tes

terhadap subyek penelitian. Tes adalah instrumen yang

44

harus direspon oleh subyek penelitian dengan

menggunakan penalaran dan pengetahuannya. Item virtual

test dalam penelitian ini berupa simple multiple-choice.

Item virtual test yang dikembangkan bertujuan untuk

mengukur kemampuan berpikir kritis siswa.

Virtual test diberikan kepada seluruh siswa yang

terpilih sebagai sampel penelitian. Respon yang

diharapkan dari pelaksanaan tes ini berupa jawaban

siswa pada setiap butir item virtual test. Virtual test yang

dikembangkan selanjutnya diuji validitas,

reliabilitas, kepraktisannya (kelayakannya), dan

efektifitas virtual tes dalam mengukur kemampuan berpikir

kritis siswa. Blue Print soal virtual tes disajikan pada

gambar 3.2.

2. Paper Based Test Kemampuan berpikir kritis Terstandar

Paper based Test kemampuan berpikir kritis yang

terstandarisasi (baku) dalam penelitian ini akan

digunakan sebagai pembanding untuk memvalidasi virtual

test yang telah dikembangkan. Tes terstandar adalah tes

yang telah diujicobakan berkali-kali sehingga dapat

dijamin kebaikannya. Tes terstandar ini sudah memiliki

koefisien validitas, reliabilitas, taraf kesukaran,

daya pembeda, dan lain-lain (Suharsimi, 2009). Paper

based test terstandar diberikan kepada seluruh siswa yang

terpilih sebagai sampel penelitian.

Slide pembuka dalam Virtual Test

45

Gambar 3.2 Blue Print Virtual test Kesetimbangan

3. Pedoman wawancara

Pedoman wawancara yang digunakan tergolong

wawancara tidak terstruktur karena wawancara bersifat

bebas dan tidak menggunakan pedoman wawancara yang

Indikator menyimpulkan

Indikator mengatur strategidan taktik

Indikator memberikanpenjelasan lanjut

Slide Tampilan Penutup

46

telah tersusun secara sistematis dan lengkap. Pedoman

wawancara yang digunakan hanya berupa garis-garis

besar permasalahan yang akan ditanyakan. Pedoman

wawancara ini bertujuan untuk memperoleh informasi

yang mendalam mengenai respon/tanggapan guru dan siswa

mengenai virtual test yang telah dikembangkan. Kisi-

kisi pedoman wawancara disajikan pada tabel 3.1.

Tabel 3.1.Kisi-Kisi Pedoman Wawancara

No Pernyataan1 Apakah sebelumnya sudah pernah melakukan

penilaian dengan menggunakan virtual tes?2 Apakah tes yang baru saja dilakukan berbeda

dengan tes yang biasanya Anda lakukan?3 Apakah anda/siswa merasa kesulitan ketika

memahami butir soal yang terdapat pada virtualtes?

4 Apakah butir soal pada virtual tes mendorongAnda/siswa untuk berpikir kritis?

5 Apakah penggunaan multimedia yang terdapat padavirtual test mempermudah Anda/siswa memahamipokok uji (butir soal)?

6 Apakah anda merasa kesulitan ketikamengoperasikan virtual test ?

7 Bagaimana tanggapan Anda tentang virtual tes yangdikembangkan oleh peneliti?

M. TEKNIK PENGUMPULAN DATA

Teknik pengumpulan data dalam penelitian ini

melalui teknik tes dan teknik non tes. Dalam

pengumpulan data dilakukan penentuan sumber data, jenis

47

data, instrumen yang digunakan dan waktu pelaksanaan.

Teknik tes berupa virtual test dan paper based test yang

digunakan untuk mengukur kemampuan berpikir kritis

siswa. Teknik non tes berupa wawancara dengan pedoman

wawancara. Virtual test dan paper based test diberikan kepada

seluruh siswa yang terpilih sebagai sampel penelitian.

Wawancara dilakukan kepada guru dan siswa setelah

pelaksanaan tes. Tujuan dilakukan wawancara untuk

memperoleh tanggapan guru dan siswa terhadap virtual tes

yang telah dikembangkan. Data yang diperoleh dalam

penelitian ini berupa hasil jawaban siswa pada tes dan

hasil wawancara berupa recorder.

N. PENGOLAHAN DAN ANALISIS DATA

Dalam penelitian ini diperoleh dua jenis data yaitu

data kuantitatif dari hasil tes dengan menggunakan

virtual test dan paper based test, dan data kualitatif dari

data hasil wawancara guru dan siswa. Data kuantitaif

yang diperoleh dari hasil uji coba kemudian dianalisis.

Pengolahan data hasil uji coba dilakukan untuk

mengetahui kualitas dari tes yang dikembangkan dan

untuk mengetahui sejauh mana tes tersebut dapat

digunakan untuk mengukur keterampilan berpikir kritis

siswa.

Analisis data dalam penelitian ini meliputi

penentuan validitas instrumen secara keseluruhan,

analisis item yang meliputi penentuan validitas setiap

butir soal dalam instrumen, penentuan indeks kesukaran

48

setiap butir soal instrumen, penentuan daya pembeda

setiap butir soal, penentuan reliabilitas instrumen

secara keseluruhan. Data kualitatif diperoleh dari

hasil analisis wawancara terstruktur kepada responden.

Berikut tahapan yang dilakukan dalam menganalisis

data kuantitatif dan kualitatif yang telah dikumpulkan.

1. Data kuantitatif

Langkah-langkah dalam mengolah data kuantitatif

yaitu a) Memberikan score pada hasil uji coba, b)

Menganalisis butir soal terkait validitas, indeks

kesukaran, daya pembeda, dan reliabilitas dilakukan

dengan menggunakan program Microsoft Excel.

a) Validitas

Uji validitas yang dilakukan pada penelitian ini

meliputi uji validitas isi dan validitas konkuren.

Firman, (2013) menyatakan bahwa validitas isi adalah

validitas suatu alat ukur dipandang dari segi “isi”

bahan yang dicakup oleh alat ukur tersebut. Cara

menilai atau menyelidiki validitas isi suatu alat ukur

ialah dengan mengundang judgement (timbangan) kelompok

ahli dalam bidang yang diukur. Perolehan hasil validasi

selanjutnya dihitung dengan menggunakan CVR (Content

Validity Ratio) dan diinterpretasikan berdasarkan Wilson,

(2012).

CVR (Content Validity Ratio) digunakan untuk mengukur

indeks keshahihan berdasarkan validasi isi secara

kuantitatif. Validasi isi berkenaan dengan kevalidan

49

suatu alat ukur dipandang dari segi isi (content) materi

pelajaran yang melibatkan para ahli untuk menilai.

Adapun rumus CVR adalah :

CVR = Keterangan :ne : jumlah ahli yang setujuN : jumlah semua ahli yang memvalidasi(Lawshe, 1975)

Berdasarkan persamaan Lawshe, dapat dihitung nilai

CVR untuk setiap butir soal. Nilai CVR yang diperoleh

dari perhitungan dibandingkan dengan nilai minimum CVR

berdasarkan jumlah validator seperti yang tercantum

pada tabel 3.3.

Tabel 3.2. Nilai minimum CVR Uji Satu Pihak, α =

0,05

JumlahValidator

Nilai minimumCVR

5 0,876 0,807 0,748 0,699 0,6510 0,6211 0,6012 0,56

Butir soal diterima jika butir soal memiliki nilai

sama atau lebih tinggi dari nilai minimum CVR. Butir

soal ditolak apabila memiliki nilai di bawah nilai

minimum CVR (Wilson, 2012).

Untuk menguji validitas tes konkuren digunakan

rumus korelasi product-moment.

50

Keterangan:rxy = Koefisien antara variabel X dengan variabel YX = Nilai rata-rata dari XY = Nilai rata-rata dari YN = Banyak responden uji coba

Untuk mengetahui tingkat validitas instrumen,

interpretasi mengenai besarnya koefisien validitas

ditunjukkan pada Tabel 3.4 .

Tabel 3.3. Klasifikasi Koefisien ValiditasKoefisien Validitas Interpretasi0,80 ≤ rxy ≤ 1,00 Validitas sangat

tinggi0,60 ≤ rxy < 0,80 Validitas tinggi0,40 ≤ rxy < 0,60 Validitas cukup0,20 ≤ rxy < 0,40 Validitas rendah0,00 ≤ rxy < 0,20 Validitas sangat

rendah(Arikunto, 2009)

b) Reliabilitas

Penentuan reliabilitas yang digunakan dalam

penelitian ini dengan menggunakan rumus belah ganjil

dan genap, sebagai berikut:

r11=2ρab

1+ρabKeterangan:r11 = Reliabilitas tes secara keseluruhann = Banyak butir soal (item)ρab = Korelasi tiap item soal ganjil dan genap

Tolak ukur untuk menginterprestasikan derajat

reliabilitas alat evaluasi digunakan kriteria menurut

51

Suherman (2003). Penafsiran harga korelasi reliabilitas

sebagai berikut:

Tabel 3.4. Klasifikasi Reliabilitas

KoefisienReliabilitas

Interpretasi

0,90 < rxy ≤ 1,00 Reliabilitas sangattinggi

0,70 < rxy ≤ 0,90 Reliabilitas tinggi0,40 < rxy ≤ 0,70 Reliabilitas sedang0,20 < rxy ≤ 0,40 Reliabilitas rendah

r11 ≤ 0,20 Reliabilitas sangatrendah

Kriteria: Bila r hitung > r tabel, maka butir soal

dikatakan reliabel

c) Indeks kesukaran

Indeks kesukaran soal adalah peluang menjawab benar

suatu soal pada tingkat kemampuan tertentu yang

biasanya dinyatakan dalam bentuk indeks. Penentuan

tingkat kesukaran soal dalam penelitian ini digunakan

rumus (Nitko, 1996) yaitu:

IK=Jumlahsiswayangmenjawabbenarbutirsoal

JumlahsiswayangmengikutitesKlasifikasi indeks kesukaran soal dapat menggunakan

kriteria Suherman (2003) dalam tabel berikut:

Tabel 3.5. Klasifikasi Indeks Kesukaran SoalRange Tingkat

KesukaranKategori

0,0 Terlalu Sulit0,10 < IK ≤ 0,30 Sukar0,30 < IK ≤ 0,70 Sedang0,70 < IK ≤ 1,00 Mudah

52

Range TingkatKesukaran

Kategori

1,00 Sangat Mudah

d) Daya Pembeda

Daya pembeda soal adalah kemampuan suatu butir soal

dapat membedakan antara siswa yang telah menguasai

materi yang ditanyakan dan siswa yang belum menguasai

materi yang diujikan. Penentuan daya pembeda butir soal

dalam penelitian ini digunakan rumus Suherman (2003)

yaitu:

DP=SA−SB

JA

Keterangan:

DP = Daya pembeda suatu butir soalSA = Jumlah skor kelompok atasSB = Jumlah skor kelompok bawahJA = Jumlah skor ideal kelompok atasKriteria penafsiran daya pembeda suatu butir soal

adalah sebagai berikut:

Tabel 3.6. Klasifikasi Nilai Daya Pembeda

Nilai DP KlasifikasiDP ≤ 0,0 Sangat Jelek

0,00 < DP ≤ 0,20 Jelek0,20 < DP ≤ 0,40 Cukup0,40 < DP ≤ 0,70 Baik0,70 < DP ≤ 1,00 Sangat Baik

2. Data Kualitatif

Analisis Hasil Wawancara. Langkah-langkah dalam

menganalisis hasil wawancara:

53

a. Membuat transkrip wawancara yang sistematis dan

hasil wawancara setiap guru dan siswa yang menjadi

responden

b. Menentukan data yang penting sesuai dengan tujuan

yang ingin dicapai

c. Mengelompokkan respon yang sama

d. Mendeskripsikan hasil wawancara

e. Menarik kesimpulan

54

DAFTAR PUSTAKA

Adams, W. K. & Wieman, C. E. (2010) Development andValidation of Instruments to Measure Learning ofExpert-Like Thinking. International Journal of Science Education,33(9), 1-24

Allen, M. J & Yen, W.M. (1979). Introduction to MeasurementTheory. Montery: Brooks Cole Publishing Company

Amir, E., Siswaningsih, W., & Hana, M. N. (2013)Pengembangan Web Assessment dengan HOT Potatoespada Materi Reduksi dan Oksidasi. Jurnal Riset danPraktik Pendidikan Kimia, 1(1), 84-90

Anastasi, A. & Urbina, S. (1997). Collaborative testing (7thed). New Jersey: Prentice Hall, Inc

Anderson, L. W. & Krathwohl. (2010) . Kerangka LandasanUntuk Pembelajaran, Pengajaran, dan Asesmen (Revisi TaksonomiBloom). Yogyakarta: Pustaka Pelajar

Arifin, M., Sudja, W. A., Ismail, A. K.., & Wahyu, W.(2003). Strategi Belajar Mengajar Kimia. Bandung: JurusanKimia FMIPA UPI.

Arikunto, S. (2009). Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi).Jakarta: Bumi Aksara

Azwar, S. (2011). Reliabilitas dan Validitas. Yogyakarta:Pustaka Pelajar

Basuki, I & Haryanto. (2014). Assesment Pembelajaran.Bandung : PT Remaja Rosda Karya.

Bertolo, E & Lambert, G. (2007). Implementing CAA inchemistry: a case study. Dalam Proceedings of theConference at Loughborough University. Loughborough, 73-84

Brookhart, S. M. (2010). How to Assess High Order Thingking SkillsIn Your Classroom. Virginia: ASCD Alexandria [Online].

55

Tersedia di: http://:www.jalt.org/test/bro 12.htm.Diakses 12 Desember 2010.

Bull, J. (1999) Computer-Assisted Assessment: Impact onHigher Education Institutions. Educational Technology &Society, 2(3) , 123-126

Burke, P. (1949) Testing Critical Thingking in Physics.American Journal of Physics, 7(9), 527-532

Cassady, J.C & Gridley, B.E. (2005) The Effects ofOnline Formative and Summative Assessment on TestAnxiety and Performance. JTLA: The Journal of technology,learning, and Assessment, 4 (1)

Chang, R. (2005). Kimia Dasar Konsep-Konsep Inti Jilid 2 (Edisiketiga). Jakarta: Erlangga

Cifaldi, C. (2008). Virtual Test and Engineering Simulation inAerospace & Defence [Online]. Tersedia diweb.mscsoftware.com/aero/pdf/PresVT.pdf . Diakses28 Februari 2015

Conole, G & Warburton, B. (2005) A review of computer-assisted assessment. ALT-J, Research in Learning Technology, 13 (1), 17–31

Dahar, R.W. (1989).Teori-Teori Belajar. Jakarta: Erlangga

Departemen Pendidikan dan Kebudayaan. (2013). LampiranPeraturan Menteri Pendidikan dan Kebudayaan Republik IndonesiaNomor 66 Tahun 2013 tentang Standar Penilaian Pendidikan.Jakarta : Depdikbud

Departemen Pendidikan dan Kebudayaan. (2013). PeraturanMenteri Pendidikan dan Kebudayaan Republik Indonesia Nomor 3Tahun 2013 tentang Kriteria Kelulusan Peserta Didik dari satuanPendidikan dan Penyelenggaraan UjianSekolah/Madrasah/Pendidikan Kesetaraan dan Ujian Nasional.Jakarta : Depdikbud

Ennis, R. H. (1996). Critical Thingking. Illionis: PrenticeHall

56

Ennis, R.H. (2011) The Nature of Critical Thingking: AnOutline of Critical Thingking Disposition andAbilities. Dalam Revision of a presentation at the SixthInternational Conference on Thingking at MIT, Cambridge

Filsaime, D. K. (2008). Menguak Rahasia Berpikir Kritis danKreatif. Jakarta: Prestasi Pustakaraya

Firman, H. (2013). Evaluasi Pembelajaran Kimia. Bandung :Jurusan Pendidikan Kimia FPMIPA UniversitasPendidikan Indonesia

Firman, H & Rusyati, L. (2014). Virtual Test: Sebuah StudentCentre Software Sebagai Alat Ukur Berpikir Kritir Siswa SMP PadaTema Penyakit Manusia (Laporan PPKBK). Bandung:Universitas Pendidikan Indonesia

Gulo, W. (2005). Strategi Belajar Mengajar. Jakarta: Gramedia

Herron, J. D. (1977) Problems associated with conceptanalysis. Journal of Science Education, 61(2), 185-199

Holifield, P., Brown, M., & Sim, G. (2004)Implementation of computer assisted assessment:lessons from the literature. ALT-J: Research in LearningTechnology, 12 (3), 215-228

Inch, E. S & Tudor K. H. (2006). Critical Thingking andCommunication: The Use of Reason in Argument edisi kelima.Boston: Pearson Education, Inc

Jamil, M., Topping, K.J., Tariq, R.H. (2012) PerceptionsOf University Students Regarding Computer AssistedAssessment. TOJET: The Turkish Online Journal of EducationalTechnology, 11 (3), 267-277

Johnson, E. B. (2011). CTL Contextual Teaching Learning.Bandung: Kaifa Learning

Kartadinata, S. (1992). Teknik Pengukuran dan Penilaian HasilBelajar. Bandung: Penerbit CV Andira

King, T & Duke-William, E. (2001). Using Computer AidedAssessment To Test Higher Level Learning Outcomes

57

[Online]. Proceedings of 5th International Computere AssistedAssessment Conference, Univ. of Loughborough, 177-178.Diakses melaluihttp://www.caaconference.com/pastConferences/2001/proceedings/p1.pnf . Diakses 19 Januari 2015

Kompas. (2015, 18 januari). Upaya Mendikbud Ubah PandanganSiswa tentang UN yang Menakutkan. Tersedia dihttp://nasional.kompas.com/read/2015/01/18/18030011/Upaya.Mendikbud.Ubah.Pandangan.Siswa.tentang.UN.yang.Menakutkan . Diakses pada 19 januari 2015

Lawse, C. H. (1975) A Quantitative Approach To CntentValidity. Content Validity II. A Conference Held atBowling Green State University, 28, 563-575

Liliasari (2009). Berpikir Kritis dalam PembelajaranKimia Menuju Profesionalitas Guru [Online]. Tersediadi http://file.upi.edu/ai.php. Diakses pada 14Februari 2015

Lowry, R. (2005) Computer aided self assessment: Aneffective tool. Chemistry Education Research and Practice,6 (4), 198-203

Mushonev, K. (2014). Pengembangan gambar konsep sebagai alatevalaluasi pada konsep ekosistem. Tesis Magister pada SPsUPI Bandung: tidak diterbitkan

Nitko, J.A & Brookhart, S.M. (2007). Educational assessmentof student (fifth edition). New Jersey: pearson educationinc

Oluwatayo, J. A. (2012) Validity and Reliability Issuesin Educational Research. Journal of Educational and SocialResearch, 2(2), 391-400

Renaud, R. D. & Murray, H. G. (2008) A Comparison of asubject specific and general measure of criticalthingking. Procedia - Thingking Skills and Creativity, 3(2), 85-93

http://file.upi.edu/ai.php

http://nasional.kompas.com/read/2015/01/18/18030011/Upaya.Mendikbud.Ubah.Pandangan.Siswa.tentang.UN.yang.Menakutkan



58

Republika. (2015, 21 Januari). Pembuat Soal UN akanDidatangkan dari Luar Negeri. di akses melaluihttp://www.republika.co.id/berita/pendidikan/eduaction/15/01/07/nhszzr-pembuat-soal-un-akan-didatangkan-dari-luar-negeri . Diakses 9 januari2015

Robinson, W & Lyle, K. S. (2001) Teaching ScienceProblem Solving: An Overview of Experimental Work.Journal of Chemical Education 78 (9), hal. 1662-1663

Santoso, A., Aprijani, D.A., Sufandi, U.U., & Maalik, I.(2010). Pengembangan Model Sistem Ujian BerdasarkanComputerized Adative Testing Sebagai Upaya EfisiensiPenyelenggaraan Ujian Universitas terbuka (Laporan PenelitianLanjut Bidang Kelembagaan dan Pengembangan Sistem.Jakarta: Universitas Terbuka

Satrisman, A. (2013). Analisis Soal Ujian Nasional Kimia SMA Tahun2013 Berdasarkan Taksonomi Bloom Dua Dimensi. (Skripsi).Universitas Pendidikan Indonesia Bandung: tidakditerbitkan

Schafersman, S.D. 1991. Introduction to criticalthinking [Online]. Tersedia dihttp://www.freeinquiry.com / critical-thinking.html.Diakses pada 19 Februaru 2015

Sudaryono. (2012). Dasar-dasar Evaluasi Pembelajaran.Yogyakarta : Graha Ilmu

Suherman. (2003). Petunjuk Praktis Untuk Melaksanakan EvaluasiPendidikan Matematika. Bandung: Wijaya Kusuma

Sukardi. (2010). Evaluasi Pendidikan; Prinsip dan Operasionalnya.Jakarta: Bumi Aksara.

Sunarya, Y. (2005). Kimia Dasar Jilid 1. Bandung: CV. GraciaIndah Bestari

Sunarya, Y. & Setiabudi, A. (2009). Mudah dan Aktif BelajarKimia 2. Jakarta: Pusat Perbukuan DepartemenPendidikan Nasional

http://www.freeinquiry.com/

http://www.republika.co.id/berita/pendidikan/eduaction/15/01/07/nhszzr-pembuat-soal-un-akan-didatangkan-dari-luar-negeri



59

Surapranata, S. (2006). Analisis, Validitas, Reliabilitas danInterpretasi Hail Tes. Bandung: PT Remaja Rosda Karya

Tim Bahasa Departemen Pendidikan Nasional. (2005). KamusBesar Bahasa Indonesia. Jakarta: Balai Pustaka

Wilson, F.R., Pan, W., & Schumsky, D.A. (2012)Recalculation of The Critical Values for Lawshe’sContent Validity Ratio. Measurement and Evaluation inCounseling and Development, 45(3), 197-210

Tuysuz, C. (2009) development of two-tier diagnosticinstrumen and assess students’ understanding inchemistry. Scientific research and essay, 4(6),626-631

Jacobs, L.C dan Chase, C.I 1992. Development and usingtest effectively. San fransisco:jossey-basspublisher

proposal tesis

Documents