EVALUASI HASIL BELAJAR
EVALUASI HASIL BELAJAR FISIKA
1. Evaluasi, Pengukuran, dan Tes
Masih sering kita jumpai bahwa para guru fisika kurang benar
dalam menafsirkan istilah evaluasi, pengukuran, dan tes. Ketiganya
sering digunakan secara sinonim. Pada kenyataannya, ketiganya
mempunyai hubungan dekat, tetapi berbeda dalam proses. Untuk
menghindari kesalahtafsiran ketiga istilah tersebut, maka
masing-masing istilah perlu didefinisikan.
Evaluasi atau penilaian didefinisikan sebagai suatu proses untuk
mengambilt keputusan terhadap kriteria yang dipilih sebagai nilai
tentang benda-benda atau ide-ide, didasarkan pada data yang relevan
(Farmer dan Farrell, 1979). Zainul dan Nasoetion (1996)
mendefinisikan peilaian sebagai proses untuk mengambil keputusan
dengan menggunakan informasi yang diperoleh melalui pengukuran
hasil belajar, baik yang menggunakan instrumen tes maupun
non-tes.
Pengukuran diartikan sebagai pemberian angka kepada suatu
atribut atau karakteristik tertentu yang dimiliki oleh orang, hal,
atau obyek tertentu menurut aturan atau formulasi yang jelas
(Zainul dan Nasoetion, 1996). Ketika kita mengukur kemampuan siswa
kelas I SMU dalam menggunakan jangka sorong, yang kita ukur bukan
siswa tetapi atribut atau karakteristik siswa, yaitu: kemampuannya
menggunakan jangka sorong. Pengukuran pendidikan adalah salah satu
pekerjaan profesional guru, instruktur, dan guru. Sehingga apabila
ada guru yang tidak dapat melakukan pengukuran pendikan dapat
dikatakan guru yang kurang atau tidak profesional.
Tes yang dimaksud di sini didefinisikan sebagai suatu pertanyaan
atau tugas atau seperangkat tugas yang direncanakan untuk
memperoleh informasi tentang trait atau atribut pendidikan atau
psikologik yang setiap butir pertanyaan atau tugas mempunyai
jawaban atau ketentuan yang dianggap benar (Zainul dan Nasoetion,
1996). Hasil belajar fisika merupakan salah satu contoh atribut
pendidikan. Kematangan seseorang adalah salah satu contoh atribut
psikologik. Pedoman wawancara dan observasi merupakan contoh-contoh
dari instrumen non-tes.
Dari uraian di atas dapat kita pahami bahwa tes atau non-tes
merupakan instrumen atau alat untuk mengukur atribut pendidikan.
Tes Hasil Belajar (THB) Siswa Kelas I SMU tentang Besaran, Satuan,
dan Angka Penting merupakan contoh alat atau instrumen untuk
mengukur kemampuan konsep besaran, satuan, dan angka penting siswa.
Di sini kita hanya akan belajar tentang tes, sedangkan instrumen
non-tes akan kita pelajari pada bahasan berikutnya. Pembahasan
tentang tes meliputi: bagaimana merencanakan tes, mengkonstruksi
butir soal, mengolah hasil tes, dan menganalisis soal.
2. Merencanakan Tes
Beberapa hal yang perlu dipikirkan dalam merencanakan tes adalah
pengambilan sampel dan pemilihan butir soal, tipe tes yang
digunakan, aspek yang akan diuji, format butir soal, jumlah butir
soal, dan distribusi tingkat kesukaran butir soal.
a. Pengambilan sampel dan pemilihan butir soal
THB terdiri atas butir-butir soal yang terpilih, yang secara
akademik dapat dipertanggungjawabkan sebagai sampel yang
representatif dari ilmu atau bidang studi yang diuji dengan
perangkat tes tersebut. Pemilihan sampel ini didasarkan pada
pertimbangan pentingnya konsep, generalisasi, dalil, atau teori
yang diuji dalam hubungannya dengan peranannya terhadap bidang
studi tersebut secara keseluruhan. Untuk mendapatkan sampel yang
representatif, biasanya bidang studi itu dipilah-pilah menjadi
beberapa pokok bahasan dan sub pokok bahasan. Jumlah pokok bahasan
atau sub pokok bahasan tidak ada batasan, yang penting adalah
tingkat kontribusinya terhadap keluasan pokok dan atau sub pokok
bahasan itu.
b. Tipe-tipe Tes
Menurut Ebel dan Frisbie (1986), tes dibagi menjadi tiga, yakni:
obyektif, esai, dan problematika. Selain itu juga dikenal tes lisan
dan tes penampilan. Anggapan bahwa tipe soal satu lebih baik dari
yang lain adalah tidak benar. Pemilihan tipe tes tergantung pada
kemampuan dan waktu yang tersedia pada penyusunan tes, bukan aspek
yang akan diukur.
c. Aspek kemampuan yang akan diukur/diuji
Aspek yang akan diuji ini merupakan kemampuan apa yang
ditargetkan dalam rumusan tujuan pembelajaran. Jika menggunakan
taksonomi Bloom, kemampuan ini bisapada ranah kognitif, psikomotor,
atau afektif. Setiap kemampuan inipun masih dipilah dalam
tingkat-tingkat. Misalnya untuk ranah kognitif pada tingkat c1, c2,
c3, c4, c5, atau c6. Begitupula untuk ranah psikomotor dan
afektif.
d. Format butir soal
Baik tipe soal obyektif maupun esai mengenal berbagai format
biasa. Misalnya pada tes obyektif, format A untuk pilihan ganda
biasa; format B untuk pilihan ganda nalisis hubungan antar hal, dan
lain-lain.Perbedaan antar format tidak terletak pada efektivitasnya
mengukur tingkat kemampuan, tetapi pada penerkaannya (peserta tes
kurang menguasai materi yang diteskan).
e. Jumlah butir soal
Tidak ada ketentuan berapa jumlah butir soal yang harus dibuat
dalam suatu perangkat tes. Jumlah butir soal berkaitan dengan
reliabilitas dan representasi isi bidang studi yang diteskan.
Walaupun tidak ada ketentuan tentang jumlah butir soal, tetapi
jumlahnya harus direncanakan, yaitu: berapa jumlah keseluruhan,
jumlah untuk setiap pokok/sub pokok bahasan, jumlah setiap format,
jumlah tiap kategori tingjat kesukaran, dan jumlah untuk setiap
tingkat pada setiap ranah. Selain itu juga perlu mempertimbangkan
waktu, biaya yang tersedia, dan kekpmpleksitasan yang dituntut
dalam tes.
f. Distribusi tingkat kesukaran
Tingkat kesukaran butir soal pertimbangannya ada pada penulis
soal.Tes yang baik adalah tes yang mampu membedakan antara siswa
yang belajar dan yang tidak belajar. Para ahli berpendapat bahwa
tes yang baik mempunyai tingkat kesukaran di sekitar 0,5. Ada
pertimbangan bahwa butir soal yang tingkat kesukaran rendah
sebaiknya diletakkan pada awal tes dan yang tingkat kesukarannya
tinggi pada akhir perangkat tes. Pertimbangan ini dimaksudkan agar
siswa termotivasi untuk mengerjakan seluruh butir soal.
g. Kisi-kisi tes
Untuk menggambarkan proporsi banyaknya butir soal pada setiap
pokok/sub pokok bahasan dan setiap kategori untuk setiap ranah
(kognitif, afektif, dan/atau psikomotor) dapat dibuat dalam bentuk
kisi-kisi, baik untuk tipe tes obyektif maupun esai. Kisi-kisi
(tabel spesifikasi) tes memuat pokok/sub pokok bahasan/materi,
kemampuan yang diuji, dan tingkat kesukaran butir soal (menurut
petimbangan guru). Beikut ini diberikan contoh model membuat
kisi-kisi untuk tes obyektif dan esai.
KISI-KISI TES OBYEKTIF
Mata Pelajaran:Fisika
Kelas:I SMU
Cawu/Tahun:I/2002
Waktu:
Tipe Tes:
Jumlah Butir Tes:
No.I/TB//Pokok/SubJenjang Kemampuan & Tingkat
Kesukaran(%
Pokok BahasanC1C2C3C4,5,6butir soal
MdSdSkMdSdSkMdSdSkMdSdSk
( butir soal
%
Catatan: Jika perangkat tes memuat ranah afektif dan psikomotor,
maka kisi-kisi ini bisa dikembangkan dengan menambah kolom atau
baris untuk Jenjang Kemampuan & Tingkat Kesukaran.
KISI-KISI TES ESAI
Mata Pelajaran:Fisika
Kelas:I SMU
Cawu/Tahun:I/2002
Waktu:
Tipe Tes:
Jumlah Butir Tes:
No.Tipe soal
Jenjang Kemapuan/ Tk. Kesukaran( butir soal%
I/TP/MateriTerbatasBebas
( butir soal
%
3. Mengkonstruksi Butir Soal
Kualitas suatu butir soal tidak ditentukan oleh tipe atau bentuk
tes, tetapi tergantung pada bagaimana butir soal itu dikonstruk
oleh guru dengan baik. Tipe dan bentuk tes apapun dapat digunakan
untuk mengukur hasil belajar bila butir soal itu dikonstruk dengan
baik dan sesuai dengan tujuan pembelajaran yang ingin dicapai. Tes
semacam ini disebut tes hasil belajar karena berfungsi untuk
mengukur keberhasilan belajar siswa atau mahasiswa.
Kemampuan guru untuk menyusun butir soal dengan baik tidak hanya
dibutuhkan kemampuan yang bersifat pengetahuan dan pemahaman,
tetapi perlu keterampilan dan kiat. Agar mempunyai kemampuan
mengkonstruksi soal pada taraf mahir diperlukan latihan secara
terus menerus. Untuk mengkonstruk THB harus memahami dasar-dasar
penyusunannya, dan bagaimana cara menulis butir soal esai dan
obyektif tersebut.
3.1 Dasar-dasar menyususn THB
Ada beberapa dasar yang perlu diperhatikan dalam menyususn THB,
yaitu: (a) THB harus sesuai dengan indikator atau tujuan
pembelajaran yang dirumuskan, (b) THB harus mewakili bahan yang
dipelajari, (c) THB hendaknya sesuai dengan penggunaan tes itu
sendiri (untuk pre dan post-tes, menentukan ketuntasan penguasaan
materi, diagnostik, tes formatif, atau untuk tes sumatif), (d) THB
disesuaikan dengan pendekatan pengukuran yang dianut, yaitu: PAP
atau PAN., dan (e) THB hendaknya dapat digunakan untuk memperbaiki
PBM.
3.2 Cara Penulisan Butir Soal Esai
Butir soal esai atau uraian adalah butir soal yang mengandung
pertanyaan atau tugas yang jawaban atau pengerjaan soal tes
tersebut harus dilakukan dengan cara mengekspresikan pikiran
peserta tes, dan jawaban tidak disediakan oleh orang yang
mengkonstruk butir soal. Tes tipe ini secara umum dibagi menjadi
dua jenis, yaitu: tes uraian bebas (extended response) dan tes
uraian terbatas (restricted response).
3.2.1 Tes Uraian Bebas
Ciri dari tes uraian bebas adalah hampir tidak ada pembatasan
terhadap peserta tes dalam memberikan jawabannya. Jawaban peserta
tes bersifat terbuka, luwes, dan tidak terstruktur. Contoh tes ini
dapat kita pada butir soal nomor E-35, yaitu:
E-35 Jelaskan secara singkat dan jelas bagamana cara menentukan
ukuran suatu kertas (misalnya A4) yang meliputi pengukuran panjang,
lebar, dan tebalnya?
3.2.2 Tes Uraian Terbatas
Ciri tes uraian terbatas adalah jawaban peserta tes dibatasi
dengan berbagai rambu-rambu yang ditentukan dalam butir soal.
Keterbatasan itu mencakup format, isi, dan ruang lingkup jawaban.
Soal tes uraian terbatas ini harus menentukan batas jawaban yang
dikehendaki, meliputi konteks jawaban yang diinginkan, jumlah butir
jawaban yang diharapkan, keluasan uraian jawaban, arah dan luas
jawaban yang diminta. Tes uraian terbatas ada beberapa ragam,
antara lain ragam tes melengkapi dan ragam tes jawaban singkat.
Butir soal melengkapi adalah butir soal yang meminta atau
memerintah peserta tes untuk melengkapi suatu kalimat (pernyataan)
dengan satu frasa, satu angka, atau satu formula. Butir soal
melengkapi dapat kita lihat pada contoh butir soal nomor E-31 dan
32, masing-masing adalah:
E-31 Dalam fisika ada besaran pokok.
E-32 Gaya termasuk besaran ..
Ada beberapa petunjuk untuk mengkonstruksi butir soal
melengkapi, yaitu: (1) konstruksilah butir soal yang mengukur hasil
belajar yang penting saja; (2) butir soal harus spesifik, artinya
harus dapat dijamin bahwa butir soal hanya dapat dijawab oleh
peserta tes yang menguasai degan baik isi pelajaran; (3)
konstruksilah butir soal yang mengharuskan peserta tes memberi
jawaban yang secara faktual benar; (4) gunakan bahasa yang jelas
(tidak mendua arti); (5) Bila yang ditanyakan menyangkut angka atau
jumlah dari satu satuan tertentu, sebaiknya nyatakan satuan
tersebut dalam soal, misalnya luas bidang tanah yang panjangnya 12
m dan lebarnya 7 m adalah m2; (6) setiap butir soal sebaiknya hanya
berisi satu jawaban, misalnya butir soal E-31 dan E-32.
Butir soal jawaban singkat adalah butir soal berbentuk
pertanyaan yang dapat dijawab dengan satu kata, frasa, angka, atau
formula. Butir soal ini dapat dicontohkan pada butir soal nomor
E-33 dan 34, yaitu:
E-33 Apakah dimensi dari kecepatan?
E-32 Berapakah orde dari bilangan 2078605 J?
Ada beberapa petunjuk untuk mengkonstruk bentuk tes jawaban
singkat, yaitu: (1) gunakan kalimat tanya yang menuntut jawaban
satu kata, frasa, angka, atau simbol; (2) hindari kalimat yang
langsung diambil dari buku atau catatan; (3) pertanyaan jangan
sampai menjadi tes bahasa, maksud tes adalah untuk menguji materi
pelajaran; (4) untuk menanyakan definisi atau istilah sebaiknya
digunakan kalimat tanya secara lansung, misalnya soal E-33 akan
tidak tepat bila ditulis: Setiap besaran fisika yang bersatuan
dapat dinyatakan dengan dimensi. Dimensi besaran kecepatan itu apa?
(5) untuk menanyakan masalah hitungan, harus ditentukan tingkat
ketepatannya, terutama untuk agka desimal; (6) sebaiknya hanya satu
jawaban untuk satu pertanyaan, misalnya: Apakah dimesi dari besaran
pokok? adalah pertanyaan yang jawabannya bisa lebih dari satu
simbol (bisa M, L, atau T).
3.2.3 Pedoman Penskoran Butir Soal Esai
Butir soal esai atau uraian memeriksanya tidak mudah dan lama
karena jawabannya bervariasi, hasil penilainnya cenderung
subyektif. Untuk mengurangi subyektivitas dan meningkatkan
obyektivitas dalam penilain tes esai ada beberapa hal yang perlu
diperhatikan, yakni: (1) apakah jawaban yang terbaik untuk satu
butir pertanyaan esai; (2) butir apa saja yang harus terdapat dalam
jawaban pertanyaan esai; (3) apakah ada butir yang leih penting di
antara butir-butir jawaban yang diharapkan. Dalam mengkonstruk tes
penyusun tes sudah harus menyediakan jawaban tiga pertanyaan
tersebut. Dengan kata lain penyusun tes ketika mengembangkan butir
tes sekaligus juga harus menyusun jawabannya yang berpedoman pada
tiga buah pertanyaan di atas. Jawaban yang ditulis tidak perlu
dinarasikan tetapi cukup dengan mencantumkan butir-butir penting
yang harus termuat pada jawaban peserta tes. Penentuan skor pada
setiap butir tidak tentu sama, tergantung pada bobot konsep pada
butir jawaban tersebut. Konsep yang bobotnya lebih penting diberi
bobot lebih besar. Jika setiap konsep memiliki bobot sama maka
diberi skor yang sama. Skor maksimum tidak perlu dikonverskan pada
skor 10 atau 100, biarkan sebagaimana adanya.
Contoh pembuatan pedoman penskoran butir soal esai untuk
butir-butir soal nomor E-31 sampai dengan E-35 dapat dilihat
sebagai berikut:
Butir soal E-31 sampai dengan E-35 (lihat Lampiran)
Pedoman Penskoran
No. SoalAspek/Kata KunciSkor
E-317 (tujuh)1
E-32Turunan1
E-33[LT-1]2
E-3410-62
E-35Panjang dan lebar diukur dengan mistar. Massa diukur dengan
neraca.
Hasil pegukuran panjang (p) = .. cm
Hasil pengukuran lebar (l) = cm
Hasil pengukuran massa (m) = gr
Jadi ukuran kertas adalah .. x cm, gram6
3
Skor maksimum15
3.3 Cara Penulisan Butir Soal Obyektif
Butir soal obyektif adalah butir soal yang telah mengandung
kemungkinan jawaban yang harus dipilih atau dikerjakan oleh peserta
tes. Jadi jawaban telah disediakan atau dipasok oleh pembuat soal.
Sehingga pemeriksaan atau penskoran jawaban peserta tes dapat
dilakukan secara obyektif oleh pemeriksa. Karena sifat obyektif
ini, maka pemeriksaan tidak harus dilakukan oleh manusia, tetapi
bisa dengan mesin.
Secara umum tes obyektif dibedakan menjadi tiga tipe, yakni
tipe: benar-salah (true-false), menjodohkan (matching), dan pilihan
ganda (multiple choice). Tes pilihan ganda dapat dimodifikasi dalam
lima bentuk, yaitu pilihan ganda biasa, analisis hubungan antar
hal, analisis kasus, kompleks, dan pilihan ganda yang menggunakan
diagram, grafik, tabel, atau gambar.
Semua bentuk tes pilihan ganda tersebut mempunyai struktur
(format) yang sama, yaitu ada pokok soal (stem) dan sejumlah
pilihan (options). Di antara pilihan itu ada satu pilihan yang
benar disebut kunci (key) dan pilihan lainnya disebut pengecoh
(distractors). Penulisan setiap tipe tes obyektif dapat diuraikan
seperti berikut.
3.3.1 Penulisan Tes Benar-Salah
Jika ujian dibatasi pada pertanyaan-pertanyaan benar-salah,
statistik menunjukkan bahwa 75 item atau lebih adalah perlu untuk
mengatasi faktor menebak (guessing). Dalam tes 100 pertanyaan
benar-salah, siswa harus dapat menjawab sekitar 50 pertanyaan tepat
dengan menebak. Beberapa instruksi mengeliminasi masalah ini dengan
mengurangi jumah jawaban-jawaban salah dari jumlah jawaban benar
untuk menentukan skor; mereka menghukum untuk menebak. Prosedur ini
tidak direkomendasi karena siswa biasanya berpikir bahwa instruktur
mengunakan teknik ini secara dendam/dengki. Hal ini juga tidak
dapat diinginkan karena siswa dihukum untuk menebak; dalam sains
umumnya dan fisika khususnya kita ingin mempunyai siswa membuat
hipotesis, yaitu, tebakan-tebakan yang baik.
Hindari ketidak-seimbangan tes dengan cukup banyak pertanyaan
benar-salah. Coba membuatnya agak baik rata dalam jumlah, sehingga
siswa yang mengetahui sedikit tentang bahan tidak dapat memperoleh
skor tinggi dengan sederhana dengan berasumsi bahwa lebih banyak
pertanyaan adalah benar (atau salah).
Hindari menggunakan pernyataan-pernyatan yang dapat menipu
siswa. Jangan menggunakan bahasa yang sama seperti dalam teks atau
siswa cenderung untuk mengingat. Hindari pernyataan-pernyataan yang
mendua-arti. Misalnya, jangan menulis, panjang bidang diukur dengan
pengukur panjang. Hindari menggunakan kalimat-kalimat kompleks
dalam pernyataan-pernyataan anda. Jangan menggunakan bahasa
kualitatif jika anda dapat memungkinkan menghindarinya. Jangan
menulis, misalnya, logam-logam yang lebih baik menghantarkan
listrik lebih cepat. Susun pernyataan-pernyataan anda dalam 10
sampai dengan 20 pertanyaan. Prosedur ini menggantikan terlalu
banyak ketegangan untuk siswa. Ambil blok/tempat jawaban ada dalam
satu margin sehingga mereka dapat diperiksa dengan mudah dengan
menggunakan suatu kunci.
3.3.2 Konstruksi Tes Menjodohkan
Tipe soal menjodohkan ditulis dalam dua kolom. Kolom pertama
untuk pokok soal (stem) atau premis dan kolom kedua untuk kolom
jawaban. Tugas peserta tes adalah menjodohkan antara kolom pertama
dan kolom kedua.
Untuk menulis butir soal menjodohkan ada beberapa syarat, yaitu:
(1) pernyataan di bawah kolom pertama dan kolom kedua harus terdiri
atas kelompok yang homogen; dan (2) jumlah pernyataan di bawah
kolom kedua harus lebih banyak dari pernyataan di bawah kolom
petama. Tipe tes ini dapat dicontohkan sebagai berikut:
Petunjuk: Pasangkan pernyataan pada kolom pertama dengan pilihan
yang cocok pada kolom kedua dengan menulis huruf di muka nomor
pernyataan kolom pertama!
.
dst.
1. Besaran yang mempunyai besar dan arah
2. Dimensi percepatan adalah
3. Perbandingan antara gaya tarik atau gaya tekan dan
pemanjangan atau pemendekan pegas adalah konstan.
Dst.A. [LT-2]
B. Skalar
C. [LT2]
D. Vektor
E. Hukum II Newton
F. Hukum Hooke
Dst.
3.3.3 Konstruksi Tes Pilihan Ganda
Butir tes pilihan ganda (majemuk) adalah butir tes yang
alternatif jawabannya lebih dari dua, pada umumnya berkisar antara
4 (empat) atau 5 (lima). Alternatif pilihan ini tidak boleh terlalu
banyak, sebab selain menyulitkan peserta tes untuk menjawab juga
kesulitan dalam mengkonstruknya.
Trowbridge dan Bybee (1990) menyebutkan ada beberapa unsur yang
perlu diperhatikan dalam mengkonstruksi tes pilihan-ganda,
yaitu:
(1) Inti permasalahan harus ditempatkan pada pokok soal
(steam);
(2) Hindari pengulangan kata-kata yang sama dalam piliham;
(3) Hindari rumusan kata yang berlebihan;
(4) Jika pokok soal merupakan pernyataan yang belum lengkap,
maka kata atau kata-kata yang melengkapi harus diletakkan pada
ujung peryataan, bukan di tengah-tengah kalimat;
(5) Susunan alternatif jawaban dibuat teratur dan sederhana;
(6) Hindari penggunaan kata-kata teknis atau ilmiah atau yang
aneh atau mentereng;
(7) Semua pilihan jawaban harus homogen dan dimungkinkan sebagai
jawaban yang benar;
(8) Hindari keadaan dimana jawaban yang benar selalu ditulis
lebih panjang dari jawaban yang salah;
(9) Hindari adanya petunjuk/indikator pada jawaban yang
benar;
(10) Hindari menggunakan pilihan yang berbunyi semua yang di
atas benar atau tidak satupun yang di atas benar;
(11) Gunakan tiga atau lebih alternatif pilihan;
(12) Pokok soal diusahakan tidak menggunakan ungkapan atau
kata-kata yang bermakna tidak tentu, misalnya: kebanyakan,
seringkali, kadang-kadang, dan yang sejenis;
(13) Pokok soal sedikit mungkin dalam pernyataan atau pertanyaan
negatif. Jika terpaksa menggunakan pernyataan negatif maka kata
negatif tersebut digaris-bawahi atau ditulis miring atau tebal.
Tes pilihan ganda dapat berupa tes pilihan ganda biasa, analisis
hubungan antarhal, analisis kasus, kompleks, dengan menggunakan
diagram, grafik, atau tabel. Pilihan ganda biasa dicontohkan pada
contoh soal bagian B (lihat lampiran), yaitu tes pilihan ganda yang
setiap butir soal memuat pokok soal dan alternatif jawaban lebih
dari dua (3-5 pilihan). Untuk tes pilihan ganda yang lain diuraikan
berikut ini.
a. Tes Pilihan Ganda Analisis Hubungan Antarhal
Tes pilihan ganda analisis hubungan antarhal terdiri atas dua
pernyataan yang kedua nya dihubungkan dengan kata SEBAB. Jadi sifat
hubungannya bisa berupa sebab akibat atau tidak ada hubungan sebab
akibat. Agar kedua pernyataan termasuk pilihan ganda maka harus
dicari variabel lain yang dapat mengukur kemampuan siswa. Variabel
tersebut adalah kualitas pernyataan yaitu apakah pernyataan pertama
benar atau salah dan sebaliknya. Hubungan antar duapernyataan
tersebut dapat dikembangkan lagi seperti yang dicontohkan pada
contoh soal bagian C (lihat lampiran), yaitu: A jika penyataan
benar dan alasan benar, keduanya merupakan hubungan sebab akibat, B
jika pernyataan benar dan alasan benar, keduanya tidak ada hubungan
sebab akibat, dan seterusnya..
b. Tes Pilihan Ganda Analisis Kasus
Pada tes pilihan ganda analisis kasus, peserta tes disajikan
kasus dalam bentuk cerita, peristiwa, dan sejenisnya dan disertai
dengan beberapa pertanyaan. Setiap pertanyaan dibuat dalam bentuk
melengkapi pilihan. Kasus tersebut bisa diambil dari jurnal, surat
kabar, majalah, dan media yang lain.
c. Tes Pilihan Ganda Kompleks
Tes pilihan ganda kompleks biasa disebut Asosiasi pilihan ganda.
Struktur pertanyaan sama dengan pilihan ganda biasa, perbedaannya
adalah, kalau pada pilihan ganda biasa hanya ada satu jawaban yang
benar atau paling benar, sedangkan untuk pilihan ganda kompleks
jawabannya bisa lebih dari satu, mungkin bisa A jika 1 dan 2 benar
, B: 1 dan 3 benar, C: 2 dan 3 benar, atau D: jika semuanya
benar.
d. Tes Pilihan Ganda dengan Gambar, Diagram, Grafik, atau
Tabel
Tes pilihan ganda dengan diagram, gambar, grafik, atau tabel
mirip dengan analisis kasus baik struktur maupun pola
pertanyaannya. Perbedaannya pada tes ini tidak disajikan kasus
dalam bentuk ceritera atau peristiwa tetapi kasus tersebut berupa
diagram, gambar, tabel, atau grafik.
4. Mengadministrasi Tes
Kegiatan mengadministrasi tes meliputi penyusunan perangkat tes
dan pelaksanaan tes. Kedua kegiatan tersebut dapat kita lakukan
seperti berikut.
4.1 Penyusunan Tes
Ada dua hal yang perlu dipertimbangkan dalam menyusun tes, yaitu
proses penyuntingan naskah tes dan penggandaan tes. Ada beberapa
hal yang perlu dipertimbangkan dalam penyuntingan tes, yaitu:
a. Tes bentuk obyektif sebaiknya tidak dilaksanakan secara
lisan.
b. Butir tes disusun mulai dari pokok bahasan yag dibahas paling
awal ke yang dibahas paling akhir.
c. Butir soal disusun mulai dari yang termudah ke yang paling
sulit.
d. Butir tes yang setipe dijadikan dalam satu kelompok.
e. Petunjuk pengerjaan harus jelas, sehingga tidak memungkinkan
untuk dipertanyaan lagi cara pengerjaannya.
f. Setiap butir tes hendaknya disusun sedemikian rupa sehingga
memudahkan peserta tes untuk membacanya.
g. Stem dan options upayakan dalam satu halaman.
h. Letakkan wacana yang digunakan sebagai rujukan di atas butir
tes yang bersangkutan.
i. Hindari meletakkan kunci jawaban dalam suatu pola
tertentu.
Setelah naskah disunting, langkah selanjutnya adalah digandakan
(termasuk pengetikan). Prosedur penggandaan harus dapat menjamin
kerahasiaan naskah tes. Dalam penggandaan, sebaiknya lembaran tes
dan lembaran jawaban dipisah. Sehingga mudah menempatkan jawabannya
dan guru mudah dalam penskoran.
4.2 Pelaksanaan Tes
Dalam pengadministrasian tes juga harus mempertimbangkan
cara-cara pelaksanaannya. Cara pelaksanaan tersebut antara lain
meliputi:
a. tes catatan terbuka (open books) atau catatan tertutup (close
books,
b. tes diumumkan atau tes dirahasiakan (mendadak),
c. tes lisan atau tertulis, dan
d. tes tindakan (praktek)
Setiap pelaksanaan tes tersebut ada kelebihan dan kekurangannya.
Untuk itu kerjakan tugas 6 berikut ini.
5. Pengolahan dan Penilaian Hasil Tes
Setelah pelaksanaan tes kegitan berikutnya adalah mengolah hasil
tes tersebut dan melakukan penilaian.
5.1 Pengolahan Hasil Tes
Pengolahan hasil tes adalah kegiatan memeriksa hasil ujian dan
mencocokkan jawaban peserta tes dengan kunci jawaban. Mengolah tes
bentuk tes obyektif lebih mudah dan cepat dibandingkan dengan
bentuk tes esai. Setelah hasil tes diperiksa berikutnya adalah
memberikan skor.
Jika peserta tes tidak diperkenankan menerka jawaban, artinya
mereka yang menerka akan didenda, yaitu skor yang benar dikurangi
skor yang salah, maka pada petunjuk umum mengerjakan soal harus
mencantumkan: Pikirkan dengan baik-baik sebelum menjawab, karena
setiap jawaban yang salah akan mengurangi nilai anda. Pengurangan
nilai ini dihiting dengan rumus:
Skor = jumlah jawaban benar jumlah kawaban salah/(n-1)
(n adalah jumalternatif jawaban)
Pada contoh soal (dalam lampiran) terdapat 30 butir soal
obyektif, Badu menjawab benar 25 nomor dan salah 5 nomor, maka
dengan rumus tersebut
Skor Badu = 25 5/(5-1)
= 25 5/4 = 23,75
Jika tidak ada denda dalam menerka jawaban, maka skor Badu
adalah 25. Angka 5/4 atau 1,25 merupakan angka denda.
Untuk soal esai baik terbatas maupun bebas pemberian skor
didasarkan pada Pedoman Penskoran (Marking Scheme) yang telah
dirancang. Berdasarkan pedoman penskoran yang telah dirancang untuk
contoh soal pada lampiran, skor maksimum untuk tes esai adalah 15.
Jika pada tes esai skor Badu 10, maka
skor total Badu = 23,75 + 10 = 33,75 (jika ada denda)
skor total Badu = 25 + 10 = 35 (jika tidak ada denda)
Dari contoh di atas, periksalah semua jawaban (soal pada
lampiran) anda dan berikan skornya (anda bisa menggunakan aturan
yang menggunakan denda atau yang tanpa denda). Setelah itu kerjakan
tugas 7 berikut:
5.2 Pendekatan Penilaian
Ada dua pendekatan untuk melakukan penilaian hasil belajar
siswa, yaitu dengan menggunakan pendekatan Penilaian Acuan Norma
(PAN) dan Penilaian Acuan Patokan. Kedua pendekatan itu digunakan
sebagai acuan untuk memberikan nilai siswa. Di dalam proses
pendidikan biasanya setiap pendekatan itu tidak dapat dilaksanakan
secara murni, namun perlu diadakan penyesuaian yang kadang-kadang
merupakan kombinasi dari kedua pendekatan tersebut.
5.2.1 Pendekatan Penilaian Acuan Norma (PAN)
Yang dimaksud pendekatan PAN adalah pendekatan untuk memberikan
nilai didasarkan pada perolehan kelompoknya. Misalnya sekelompok
siswa ada 10 anak mendapat skor (nilai mentah): 70, 65, 60, 55, 40,
35, 35, 30, 30, dan 25. Jika jumlah kelompok tidak terlalu besar
(30 orang) atau lebih dari satu kelas, maka untuk memberi nilai
setiap anggota kelompok dapat digunakan statistik sederhana, yaitu
dengan menentukan skor rata-rata (X) dan simpangan baku (()
kelompok. Untuk anggota kelompok yang besar, distribusi kemampuan
anak dapat dimulai dari paling pandai, pandai, sedang, kurang, dan
sangat kurang. Distribusi (penyebaran) tersebut dapat digambarkan
dengan kurve normal.
Misalnya ada sekelompok siswa memiliki skor rata-rata X, maka
jumlah peserta antara:
X sampai dengan (X+1() adalah 34,13%
(X+1() sampai dengan (X+2() adalah 13,59%
(X+2() sampai dengan (X+3() adalah 2,14%
X sampai dengan (X-1() adalah 34,13%
(X+1() sampai dengan (X-2() adalah 13,59%
(X+2() sampai dengan (X-3() adalah 2,14%
Harga rata-rata skor dapat dihitung dengan rumus:
X = ( skor seluruh anggota kelompok/( seluruh anggota
kelompok
Dan
Simpangan Baku dirumuskan:
( skor 1/6 dari anggota kelompok tinggi - ( skor 1/6 dari
anggota kelompok rendah
( =
( seluruh anggota kelompok
Apabila terdapat data skor fisika siswa SMU dari 35 anak yang
telah diurutkan dari tertinggi sampai terrendah adalah sebagai
berikut:
60605555555050505050
45454540404040353535
35353030303025252525
2520201510
Dalam kurikulum 1975, penentuan nilai menggunakan konversi
seperti pada tabel 5-2 berikut:
Tabel 5-2: Konversi skor mentah ke dalam nilai 1-10
Skor MentahX-2 1/4(X-1 3/4(X-1
1/4(X-1/4(X+1/4(X+3/4(X+11/4(X+3/4(X+13/4(X+21/4(
Nilai
1-1012345678910
5.2.2 Pendekatan Penilaian Acuan Patokan (PAP)
Pendekatan PAP adalah suatu pendekatan yang digunakan untuk
menentukan keberhasilan atau kelulusan seseorang berdasarkan
patokan atau kriteria yang telah ditentukan. Dalam Proses
pembelajaran mengacu pada tujuan pembelajaran umum dan khusus.
Sehinga keberhasilan siswa dalam suatu mata pelajaran ditentukan
oleh kemampuan siswa dalam mencapai tujuan pembelajaran yang telah
dirumuskan. Inilah yang membedakan dengan pendekatan PAN, yaitu
kelulusan atau keberhasilan siswa ditentukan oleh kelompoknya. PAP
digunakan dalam sistem belajar tuntas. Misalnya dalam rumusan
tujuan pembelajaran khusus dirumuskan dengan Siswa kelas 1 SMU
dapat menulis dimensi besaran fisika. Untuk penguasaan yang tuntas,
kriteria yang dikembangkan antara lain siswa dapat: (1) menulis
dimensi besaran pokok dan (2) menulis dimensi beberapa dimensi
besaran turunan. Untuk mengetahui apakan kedua tujuan tersebut
telah dikuasai oleh siswa, maka untuk setiap tujuan harus ada butir
soalnya. Jika siswa dapat mengerjakan dengan benar butir-butir soal
tersebut maka dikatakan bahwa siswa telah menguasai tujuan tersebut
dengan tuntas. Jika belum dikuasai maka perlu ada pembelajaran
remedial (perbaikan).
Perencanaan dan konstruksi butir soal baik untuk PAN maupun PAP
kedua mempunyai kesamaan, yaitu keduanya menentukan lebih dahulu
tujuan (TPK) atau hasil apa yang akan diukur dan bagaimana cara
mengukurnya yang paling tepat. Perbedaannya, pada pengembangan
butir soal PAN, tingkat kesukaran soal harus diperhatikan, harus
mengombinasikan butir soal yang mudah, sedang, dan sukar, sehingga
tingkat keseluruhn butir soal adalah sekitar 50%. Pada pengembangan
butir soal PAP tingkat kesukaran dan daya beda tidak diperhatikan
karena maksud soal bukan untuk membedakan siswa yang pintar dari
siswa yang kurang pintar, tetapi melihat tingkat penguasaan
seseorang terhadap materi atau tujuan pembelajaran. Ynag
dipentingkan dalam PAP adalah daya serap siswa. Seharusnya sumua
tujuan pembelajaran dapat dikuasai siswa 100%. Penguasaan 100% ini
sulit dicapai, sehingga ada beberapa sekolah yang menetapkan
ketuntasan ini 80%.
Jika syarat ketuntasan adalah 80%, maka apakah semua siswa yang
mendapat skor 80% ke atas akan mendapat nilai yang sama? Jawabnya
tergantung pada sistem penilaian yang digunakan. Ada penilaian yang
menggunakan kriteria lulus dan tidak lulus, yaitu: anak yang lulus
adalah anak yang mempunyi skor ( 80% dan yang tidak lulus adalah
anak yang skornya 95% nilai A, (90,5-95)% nilai B, (85,5-90)% nilai
C, (80-85)% nilai D, dan < 80% nilai E (tidak lulus). Rentangan
skor untuk mendapat nilai A-E tidak baku seperti dicontohkan,
misalnya batas kelulusan bisa > 80% atau < 80%, dan nilai A
bisa ( 90%
6. Menganalisis Soal
Kegiatan menganalisis soal merupakan kegiatan untuk menentukan
mutu butir dan perangkat soal. Setiap guru harus memiliki kemampuan
untuk menentukan mutu butir soal dan perangkat soal agar mereka
dapat merancang soal yang baik. Penilaian mutu butir soal
ditentukan oleh karakter dari butir soal itu sendiri, yang meliputi
tingkat kesukaran, daya beda, dan berfungsi tidaknya pilihan untuk
tipe soal pilihan ganda. Penilaian mutu perangkat soal meliputi
validitas dan reliabilitasnya.
6.1 Karakteristik dan Spesifikasi Butir Soal
Yang dimaksud karakteristik butir soal adalah parameter
kuantitatif dari butir soal. Sebaliknya, parameter kualitatif butir
soal disebut dengan spesifikasi butir soal. Spesifikasi butir soal
ditentukan atas dasar penilaian ahli (expert judgment). Kedua hal
ini akan diuraikan seperti berikut.
6.1.1 Karakteristik Butir Soal
Karakteristik butir soal untuk tes hasil belajar dipertimbangkan
berdasarkan tingkat kesukaran (p), daya beda (D), dan berfungsi
atau tidaknya pilihan.
6.1.1.1 Tingkat Kesukaran
Tingkat kesukaran butir soal dimaknai sebagai proporsi peserta
tes menjawab benar terhadap butir soal tersebut, yang dirumuskan
dengan:
b = ( peserta yang menjawab benar/( peserta keseluruhan
Misalnya soal nomor 1, jumlah peserta tes yang menjawab benar 3
orang dan jumlah seluruh peserta tes 15 orang, maka tingkat
kesukaran butir soal nomor satu adalah 0,2. Butir soal ini
dikatakan sukar. Jika dalam suatu perangkat soal terdapat 10 butir
soal, dengan tingkat kesukaran setiap butirnya berturut-turut 0,2;
0,6; 0,4; 0,5; 0,7; 0,5; 0,35; 0,45, 0,8; dan 1,0, maka tingkat
kesukaran perangkat soal (p naskah ujian) tersebut adalah:
p naskah ujian = (0,2 + 0,6 + 0,4+ 0,5+ 0,7+ 0,5+ 0,35+ 0,45+
0,8 + 1,0)/10
= 5,5/10
= 0,55
atau p naskah ujian = (b/(butir soal
Tingkat kesukaran butir soal atau perangkat soal biasanya
dikategorikan mudah, sedang, dan sukar. Penentuan ketiga kategori
tersebut dapat menggunakan pedoman:
Tingkat kesukaranKategori
0,00 - 0,25Sukar
0,26 - 0,75Sedang
0,76 - 1,00Mudah
Contoh perangkat soal tersebut termasuk kategori sedang. Untuk
menyusun suatu naskah ujian atau tes hasil belajar sebaiknya
digunakan butir soal yang tingkat kesukarannya berimbang, yaitu:
sukar (25%), sedang (50%), dan mudah (25%). Komposisi ini dapat
diterapkan pada PAN dan PAP. Jika komposisi butir soal tidak
seimbang maka penggunaan PAN tidak tepat, sebab informasi kemampuan
yang dihasilkan tidak berdistribusi normal. Jadi ukuran butir soal
atau perangkat soal yang baik tidak ditentukan oleh tiinggi atau
rendahnya tingkat kesukaran tetapi pada komposisi tingkat
kesukarannya.
6.1.1.2 Daya Beda
Dalam suatu kelompok peserta tes, biasanya kita jumpai kelompok
yang berprestasi tinggi (kelompok atas) dan kelompok yang
berprestasi rendah (kelompok bawah). Indeks yang menunjukkan
tingkat kemampuan butir soal yang dapat membedakan kelompok atas
dan bawah disebut daya beda butir soal. Daya beda biasanya
disimbolkan dengan D dan dirumuskan:
D = (Ba Bb)/1/2T
Dimana D = daya beda
Ba = ( kelompok atas yang menjawab benar
Bb = ( kelompok bawah yang menjawab benar
T = ( peserta tes (jika jumlah ganjil = T-1)
Jika jumlah peserta banyak, maka kelompok atas dan bawah
masing-masing diambil 27%. Untuk memudahkan analisis, apabila
jumlah peserta besar maka kelompok dibuat menjadi tiga, yakni:
kelompok atas, tengah dan bawah.
Andaikan jumlah seluruh peserta tes 10 orang. Untuk soal nomor X
misalnya, kelompok atas yang menjawab benar adalah 4 orang dan
kelompok bawah yang menjawab benar hanya satu orang, maka proporsi
kelompok atas yang menjawab benar adalah 0,8 dan proporsi kelompok
bawah yang menjawab benar adalah 0,2. Jadi daya beda soal nomor X
adalah:
0,8 0,2 = 0,6 atau dapat dihitung dengan rumus:
D = (4 1)/5 = 0,6
Koefisien atau indeks daya beda berkisar antara 1 sampai dengan
+1. Daya beda berharga +1 berarti semua kelompok atas menjawab
benar dan semua kelompok bawah menjawab salah terhadap suatu butir
soal. Sebaliknya untuk daya beda yang berharga 1. Harga daya beda
yang dianggap masih memadai untuk sebutir soal adalah (0,25. Kurang
dari 0,25, butir soal dianggap kurang mampu membedakan peserta tes
yang siap menghadapi tes dari peserta yang tidak siap. Jika daya
beda negatif, maka butir soal tidak dapat digunakan untuk mengukur
hasil belajar siswa. Sehingga butir soal ini harus dibuang atau
tidak dihitung dalam penentuan skor mahasiswa. Jadi, makin tinggi
daya beda suatu butir soal, makin baik butir soal tersebut, dan
sebaliknya makin rendah daya beda makin tidak baik butir soal
tersebut.
6.1.1.3 Berlaku Tidaknya Pilihan
Dalam tipe soal obyektif, khususnya untuk soal pilihan ganda,
untuk menentukan berfungsi tidaknya pengecoh suatu butir soal, maka
butir soal tersebut perlu dianalisis. Untuk menganalisis setiap
butir soal tersebut, lembar jawaban peserta kelompok atas dan bawah
dijadikan sebagai sumber informasi. Distribusi dari jawaban kedua
kelompok ini untuk setiap butir soal dimasukkan dalam satu Tabel
6-1 berikut:
Andaikan butir soal nomor 12
Tabel 6-1 : Distribusi jawaban soal nomor 12
Pilihan
KelompokA*BCDE
Atas30100
Bawah11121
Jumlah41221
Jawaban yang benar adalah A (tanda *), jumlah peserta yang
memilih A adalah banyak, khususnya untuk kelompok atas. Pengecoh B,
C, D, dan E ada yang memilih terutama kelompok bawah. Jadi dapat
disimpulkan bahwa pengecoh berfungsi sebagai jawaban yang salah.
Sehingga semua pilihan pada soal nomor 12 sudah berfungsi.
Andaikan tabel di atas jumlah yang menjawab benar A lebih banyak
kelompok bawah, maka pilihan ini harus diperbaiki. Apabila pada
pengecoh ditemukan kelompok atas lebih banyak dibandingkan kelompok
bawah, pilihan ini juga kurang baik dan perlu diperbaiki. Selain
itu, bila pada pengecoh tidak ada satupun yang memilih, maka
pilihan ini harus diperbaiki pula.
Dari uraian di atas, cocokkan secara bersama jawaban THB tentang
besaran, satuan dan angka penting anda di kelas, kemudian kerjakan
bersama tugas 9 berikut di kelas.
6.1.2 Spesifikasi Butir Soal
Untuk menganalisis suatu butir soal ada dua spesifikasi yang
harus dipertimbangkan, yakni: validitas isi dan keakuratan
pengukuran tujuan yang ingin dicapai.
Validitas isi (konten) pelajaran sangat diperlukan untuk
menentukan apakah suatu butir soal merupakan alat ukur yang baik
untuk suatu hasil belajar tertentu. Analisis validitas isi ini
hanya bisa dilakukan oleh seorang yang menguasai bidang studi
tersebut dengan baik. Analisis dimulai dengan mengadakan kajian
terhadap kisi-kisi soal. Dalam kisi-kisi itu ditentukan bahwa butir
soal tertentu dimaksudkan untuk mengukur pokok bahasan atau sub
pokok bahasan tertentu. Jadi kisi-kisi soal digunakan sebagai tolok
ukur untuk memvalidasi butir soal.
Selain memvalidasi, aspek yang harus dianalisis secara
kualitatif oleh seorang ahli bidang studi adalah apakah butir soal
yang digunakan apakah mengukur tujuan pendidikan tertentu yang
ditetapkan dalam kisi-kisi. Untuk menganalisis ini perlu penguasaan
tentang tujuan pendidikan. Yang perlu diperhatikan bahwa butir soal
yang tidak secara akurat mengukur tujuan yang telah ditetapkan akan
merupakan butir soal yang sia-sia. Berbahayanya, bila butir soal
itu digunakan untuk menentukan keputusan bagi seseorang, hal ini
akan berakibat jauh bagi siswa di masa yang akan datang. Di
Indonesia, perumusan tujuan pendidikan masih cenderung mengacu pada
tujuan pendidikan menurut Bloom dan kawan-kawan.
6.2 Karakteristik Perangkat Tes
Meskipun suatu tes terdiri atas butir-butir soal yang baik,
belum tentu akan membuat perangkat tes (soal ujian) menjadi baik.
Selain penilaian terhadap setiap butir soal, ada dua hal yang harus
diperhatikan dalam menilai soal ujian, yakni: validitas dan
reliabilitasnya. Kedua hal ini dapat dijelaskan sebagai
berikut.
6.2.1 Reliabilitas Tes
Ketika kita mengamati skor hasil tes siswa, muncul pertanyaan
atau keraguan pada diri kita, yaitu apakah skor itu benar-benar
menggambarkan tingkat kemampuan siswa kita. Keraguan atau
pertanyaan ini sulit dijawab, karena dalam setiap tes selalu akan
terdapat unsur kekeliruan (error). Kekeliruan ini bisa bersumber
pada alat ukurnya atau mungkin faktor yang lain. Untuk melihat
apakah perangkat tes itu dapat dipercaya sebagai alat ukur yang
dapat menggambarkan kemampuan peserta tes, maka dapat dilihat dari
aspek reliabilitasnya. Secara umum, reliabilitas dimaknai sebagai
sejauh mana suatu alat ukur dapat diyakini memberikan informsi yang
konsisten (ajeg) dan tidak mendua tentang karakteristik peserta tes
yang diujikan.
Skor yang diperoleh peserta es pada dasarnya merupakan skor yang
secara langsung berhubungan dengan alat ukur dan kondisi eksternal
saat tes berlangsung. Kondisi eksternal tidak dapat didefinisikan
sepenuhnya, begitupula alat ukur yang digunakan tidak dapat
diketaui sepenuhnya kekuatan dan kelemahannya. Sehingga skor yang
diperoleh peserta tes adalah skor yang kemungkinan besar mengandung
kekeliruan yang tidak dapat diketahui. Andaikan skor peserta tes
itu tidak mengandung unsur kekeliruan, maka skor itu merupakan skor
yang sesungguhnya. Tetapi skor sesungguhnya itupun tidak kita
ketahui. Untuk itu kita kenal adanya tiga bentuk skor dalam setiap
hasil tes, yaitu: skor yang diperoleh (obtained score), skor
sesungguhnya (true score), dan kekeliruan skor (score error).
Hubungan ketiganya dinyatakan dengan:
Skor yang diperoleh = skor sesungguhnya kekeliruan
Secara operasional reliabilitas tes didefinisikan sebagai
koefisien korelasi antara dua perangkat skor yang dihasilkan oleh
perangkat tes yang sama atau paralel yang diadministrasikan kepada
sekelompok peserta tes yang sama. Karena reliabilitas merupakan
salah satu bentuk khusus korelasi yang menggambarkan keajegan alat
ukur (tes), maka ada beberapa prosedur untuk memperoleh koefisien
korelasi yang menggambarkan reliabilitasnya. Reliabilitas tes dapat
ditinjau dari unsur stabilitas, ekuivalensi dari dua tes yang
paralel, dan konsistensi atau homogenitas tes.
Reliabilitas ditinjau dari stabilitas dapat ditentukan dengan
mengkorelasikan anatardua skor dari satu tes yang diadministrasikan
dua kali kepada kelompok peserta tes yang sama. Selang waktu antara
dua pengadministrasian tes harus dekat, mengapa?
Reliabilitas dalam arti ekuivaensi dari dua tes yang paralel.
Dalam hal ini, kita harus mengkonstruk dua perangkat tes yang
paralel. Kedua perangkat tes diadministrasikan pada kelompok
peserta tes yang sama dalam waktu berurutan. Hasil tes dari dua
perangkat tes tersebut dikorelasikan.
Reliabilitas dalam arti konsistensi tes merupakan koefisien
korelasi yang menunjukkan seberapa jauh suatu perangkat tes
homogen, dalam arti mengukur mata pelajaran atau bidang studi yang
sama. Untuk menentukan koefisien korelasi ini dapat dilakukan
dengan dua cara, yaitu: teknik split-half dan teknik
Kuder-Richardson (KR). Teknik split-half dapat dilakukan dengan
mengkorelasikan skor setengah pertama dengan skor setengah kedua
dari suatu tes. Untuk memperoleh skor setengah pertama dan kedua
dapat dilakukan dengan mengkorelasikan skor pada nomor ganjil dan
nomor genap. Tenik Kuder-Richardson dikembangkangkan oleh Kuder dan
Richardson, dengan rumus ke-20nya (KR-20):
n SB2 - (pq
KR-20 = ( [ ((((( ]
n-1 SD2dimana n = ( butir soal
SB = simpangan baku skor-skor tes
p = tingkat kesukaran tes (perangkat tes)
q = 1 - p
Setelah Anda mempelajari reliabilitas tes di atas, diskusikan
dan kerjakan secara kelompok tugas 10 berikut ini.
6.2.2 Validitas Tes
Seperti halnya pada butir soal, perangkat tes yang baik juga
harus memenuhi kriteria valid (tepat). Validitas tes didefinisikan
sebagai seberapa jauh perangkat tes itu berguna dalam mengambil
keputusan yang relevan dengan tujuan yang telah ditentukan. Untuk
tes hasil belajar, aspek validitas yang paling penting adalah
validitas isi (content validity), yaitu: ukuran yang menunjukkan
sejauh mana skor dalam tes berasosiasi dengan penguasaan peserta
dalam bidang studi yang diuji melalui perangkat tes tersebut.
Validitas isi ini ditentukan oleh ahli yang menguasai bidang studi
tersebut. Jadi untuk validitas ini analisisnya lebih bersifat
kualitatif. Oleh karena itu, yang bisa menganalisis tes harus orang
mempunyai latar belakang bidang studi yang baik.
Selain validitas isi, juga kita kenal jenis validitas tes yang
lain, yaitu: validitas prediktif, validitas serempak, dan validitas
konstruk. Ketiga jenis validitas tersebut tidak dibahas di sini
karena ketekaitannya dengan keperluan terhadap penilaian perangkat
tes hasil belajar tidak terlalu kuat. Namun demikian, kemampuan dan
keterampilan Anda untuk mengukur validitas itu semua penting dan
diperlukan, sebab kelak ketika Anda menjadi guru tidak hanya
berfungsi sebagai pengajar (teacher), tetapi juga sebagai sebagai
peneliti, inovator, dan lain.
Setelah anda mempelajari validitas tes, diskusikan secara
kelompok tugas 11 berikut.
SUMBER
Bloom B. S., Madaus G. F., dan Hastings, Evaluation to Improve
Learning, McGraw-Hill Book Company, New York.
Depdikbud., 1995, Kurikulum Sekolah Menengah Umum: GBPP Mata
Pelajaran Fisika, Depdikbud., Jakarta.
Djamarah S. B. & Zain A., 1995, Strategi Belajar Mengajar,
Rineka Cipta, Jakarta.
Farmer W. A., Farrel M. A., (1980), Systematic Instruction in
Science for The Middle and High School Years, Addison-Wesley
Publishing Company, Inc., Sydney.
Giancoli D., 1995, Physics, Fourth edition, Prentice-Hall
International, Inc., Englewood Clifs, New Jersey.
Kertiasa N, 1993, Fisika 1 untuk Sekolah Menengah Umum Kelas 1,
Depdikbud., Jakarta.
Trowbridge L. W., Bybee R. W., 1990, Becoming a Secondary School
Science Teacher, Merrill Publishing Company, Columbus.
Zainul A., Nasoetion N., 1996, Program Pengembangan Keterampilan
Teknik Instruksional (Pekerti): Penilaian Hasil Belajar, Depdikbud,
Jakarta.
CATATAN: KERJAKAN TUGAS 1 S/D 11 DENGAN SUNGGUH-SUNGGUH DAN
KUMPULKAN PADA PERTEMUAN BERIKUTNYA!!!!Materi KuliahEVALUASI HASIL
BELAJAR: (Tes Hasil Belajar)Handout digunakan terbatas untuk:
Matakuliah Evaluasi Hasil belajar FisikaOleh:
Indrawati(Staf Pengajar Pendidikan Fisika FKIP Unej)
Jember, 2010
Instrumen B-4c
Tugas 1:
Dari definisi evaluasi, pengukuran, dan tes di atas jelaskan
hubungan antara ketiganya dan berikan contohnya dalam pembelajaran
fisika!
Tugas 2:
Buatlah kisi-kisi THB dalam bentuk obyektif dan esai suatu
Pokok/Sub Pokok Bahasan IPA/Fisika SLTP atau Fisika SMU untuk waktu
10-15 menit!
Tugas 3:
Berdasarkan 10 butir soal benar-salah pada contoh THB besaran,
satuan, dan angka penting, apakah semua soal telah memenuhi syarat
untuk tipe soal benar-salah yang baik? Berikan penjelasan!
Tugas 4:
Tulislah 5 butir soal tipe menjodohkan untuk suatu pokok bahasan
fisika SLTP atau SMU dan lengkapi pula dengan kunci jawabannya!
Tugas 5:
Tulislah masing-masing dua butir soal fisika SLTP atau SMU untuk
soal pilihan ganda analisis kasus dan pilihan ganda dengan
menggunakan gambar, tabel, atau grafik.
Tugas 6:
Jelaskan kelebihan dan kekurangan setiap pelaksanaan tes di
atas!
Tugas 7:
Kumpulkan semua skor teman-teman anda, kemudian buatlah tabel
yang memuat nomor, nama, dan skor mahasiswa (sebagai siswa),
urutkan skor dari skor tertinggi ke yang oaling rendah atau
sebaliknya.
Tugas 8:
Berdasarkan data skor fisika dari 35 siswa SMU di atas hitung(X
dan ( kemudian tentukan skor ke-35 siswa tersebut dengan nilai
1-10.
Tugas 9:
Tentukan tingkat kesukaran setiap butir soal!
Tentukan daya beda setiap butir soal dan tentukan pula
kelayakannya untuk digunakan sebagai THB!
Apakah pada butir-butir soal obyektif ada pilihan-pilihan yang
perlu diperbaiki? Sebutkan!
Tugas 10:
Apakah penskoran tes yang kurang obyektif berpengaruh terhadap
reliabilitas tes? Jelaskan.
Apakah peserta tes yang bervariasi berpengaruh terhadap
reliabilitas tes? Jelaskan.
Apakah jumlah butir soal dalam perangkat tes berpengaruh
terhadap reliabilitas tes? Jelaskan.
Tugas 11:
Apakah reliabilitas tes berpengaruh terhadap validitas tes?
Jelaskan.
1