Web viewBAB I. FUNGSI PENGUKURAN DAN PENILAIAN DALAM PENDIDIKAN. Pengertian Pengukuran dan Penilaian. Untuk mengetahui berhasil tidaknya tujuan dalam proses belajar mengajar
Post on 31-Jan-2018
235 Views
Preview:
Transcript
1
BAB I
FUNGSI PENGUKURAN DAN PENILAIAN DALAM PENDIDIKAN
1. Pengertian Pengukuran dan Penilaian
Untuk mengetahui berhasil tidaknya tujuan dalam proses belajar mengajar,
maka perlu adanya kegiatan evaluasi.
Sebab evaluasi merupakan suatu tindakan atau suatu proses untuk
menentukan nilai sesuatu dalam skup kependidikan atau segala sesuatu yang ada
hubungannya dengan masalah pendidikan.
Dalam kegiatan evaluasi ini ada dua kegiatan pokok yang tidak dapat
dipisahkan yaitu : kegiatan pengukuran dan kegiatan penilaian. Pengukuran
cenderung menunjukan luas atau kwantitas daripada sesuatu, sedangkan penilaian
cenderung menunjukkan kwalitas daripada sesuatu yang diukur. misalnya, jika
kita ingin mengetahui apakah daya serap siswa terhadap bidang studi tertentu baik
atau buruk, maka jelas harus diadakan pengukuran melalui tes. Dari hasil
pengukuran tersebutlah baru bisa diramalkan bahwa daya serap siswa terhadap
bidang studi tertentu baik atau buruk.
Dengan demikian proses pengukuran dan penilaian merupakan suatu
proses yang saling berkaitan dan tak dapat dipisahkan.
2. Latar Belakang Pengukuran dan Penilaian Individu
Bertitik tolak dari pengertian di atas bahwa evaluasi bermaksud untuk
mengetahui keberhasilan dari suatu kegiatan. Diketahui bahwa guru mempunyai
tugas sangat komplek dengan segala tuntutan yang harus dipertanggungjawabkan.
2
Salah satu tugas guru adalah melaksanakan / menciptakan kondisi belajar
yang paedagogis. Dalam kegitan tersebut sudah tentu dituntut adanya suatu
penilaian yang intensif dan obyektif.
Masalah pengukuran dan penilaian pendidikan merupakan masalah yang
selalu terkandung dalam pekerjaan pendidikan keguruan, karenanya sudah
seharusnyalah ia menjadi satu kesatuan yang penting dalam kelengkapan keahlian
seorang guru. Bahkan bukan hanya sekedar bagian pelengkap,melainkan
merupakan bagian yang integral, yang tak terpisahkan, dari proses belajar
mengajar. Kerap kali muncul anggapan-anggapan bahwa : 1) Untuk melaksanakan
pengukuran dan penilaian pendidikan tidak perlu adanya suatu persiapan, 2)
pelaksanaan pengukuran dan penilaian merupakan kegiatan yang terpisah dengan
proses belajar mengajar.
Dari masalah di atas nampak adanya kesenjangan-kesenjangan yang dapat
memberikan dampak negatif. Karena itu materi evaluasi (pengukuran dan
penilaian pendidikan) dipandang perlu untuk diterapkan, disebarluaskan kepada
setiap individu yang memerlukan.
Tidak dapat dipungkiri bahwa angka-angka sebagai hasil pengukuran dan
penilaian pendidikan mempunyai arti yang penting yaitu : ia berfungsi
memberikan kesaksian terhadap keberhasilan seseorang. Kesaksian mana banyak
diperlukan dalam berbagai peristiwa dalam kehidupan antara lain: kesaksian
dalam kenaikan kelas, melanjutkan sekolah, mencari pekerjaan dan sebagainya.
3
3. Tujuan Pengukuran dan Penilaian
Pengukuran dan penilaian dalam pendidikan dan pengajaran, mempunyai
beberapa tujuan antara lain :
a. Untuk mengetahui taraf kesiapan siswa dalam menempuh suatu
pendidikan dan pengajaran tertentu.
b. Untuk mengetahui seberapa jauh hasil yang diperoleh atau dicapai dalam
proses pendidikan dan pengajaran yang telah dilaksanakan.
c. Untuk mengetahui apakah mata pelajaran tertentu telah dapat dilanjutkan
ataukah masih perlu diulang.
d. Untuk mengetahui apakah metode pengajaran guru, dilaksanakan secara
efektif atau belum efektif.
e. Untuk memperoleh suatu informasi dalam memberikan atau pekerjaan
yang cocok bagi siswa.
f. Untuk memperoleh informasi tentang siswa apakah mereka dapat
dinaikkan atau tidak.
g. Untuk membandingkan apakah prestasi belajar siswa sesuai dengan
standar yang diharapkan.
h. Untuk menafsirkan apakah siswa telah siap untuk menghadapi pekerjaan
dalam masyarakat
i. Untuk mengadakan seleksi.
4
BAB II
MENYUSUN ITEM TES
1. Pengertian Tes
Tes adalah suatu cara untuk menadakan penilaian yang berbentuk suatu
tugas atau serangkaian tugas yang harus dikerjakan oleh anak atau kelompok,
sehingga menghasilkan suatu nilai tentang tingkah laku atau prestasi anak yang
dapat dibandingkan dengan nilai standar yang ditetapkan.
Dari pengertian di atas dapat disimpulkan bahwa :
a. Tes berbentuk suatu tugas yang terdiri dari pertanyaan-pertanyaan atau
perintah.
b. Tes diberikan kepada seseorang atau kelompok
c. Respon anak / kelompok dinilai.
2. Jenis Tes
Tes sebagai alat ukur mempunyai bentuk atau jenis yang berbeda-beda.
Perbedaan tersebut dapat dilihat dari :
a. Jumlah peserta atau pengikut tes
1. Tes individual, yaitu tes yang diberikan hanya pada seorang anak.
2. Tes kelompok, yaitu tes yang diberikan kepada sekelompok individu
dalam waktu bersamaan.
b. Dari segi penyusunan tes
1. Tes buatan guru, yaitu tes yang disusun sendiri oleh guru bidang studi
yang bersangkutan.
5
2. Tes buatan orang lain yang tidak distandarisasi.
3. Tes standar, atau baku.
c. Dari segi bentuk jawaban atau respon siswa
1. Tes tindakan, apabila jawaban anak berupa tingkah laku
2. Tes verbal, yaitu apabila jawaban atau respon yang diberikan oleh peserta
tes berbentuk bahasa, baik lisan maupun tulisan.
d. Dari segi bentuk pertanyaan tes
1. Tes obyektif
2. Tes essay
Dalam uraian berikut ini akan dibicarakan jenis tes diihat dari bentuk
pertanyaan yaitu ; tes obyektif dan tes essay.
Tes Obyektif
Jenis tes ini sering disebut tes jawaban pendek (short answer), karena tiap-
tiap persoalan hanya memerlukan jawaban pendek. Jawaban telah disediakan
berbentuk alternatif-alternatif.
Peserta tes hanya memiliki satu jawaban dari alternatif tersebut.
Tes obyektif hanya memiliki beberapa tipe yaitu :
1. True – false (benar – salah)
Tipe tes ini terdiri dari statement – statement, dimana sebagian dari
statement ada yang benar adapula yang tidak benar. Siswa disuruh memilih
mana statement yang benar dan tidak benar. Misalnya : Berilah tanda silang
(x) pada huruf (B) jika pertanyaan benar pada (S) jika pernyataan salah.
2. Multiple Choice (Pilihan Ganda)
6
Tipe tes ini terdiri dari statement yang belum lengkap (Stem). Untuk
melengkapinya disediakan beberapa alternatif (option). Option dapat diabgi
dua yaitu ; option kunci dan option pengecoh (distraktor). Tugas siswa adalah
memilih satu diantara option yang disediakan sebagai jawaban.
Misalnya : Pilihlah salah satu jawaban yang paling benar dari option yang
tersedia dengan memberi tanda silang (X) pada huruf a, b, c, … pada lembar
jawaban. Bentuk atau tipe tes pilihan ganda ini dapat dikembangkan dengan
berbagai variasi (variasi bentuk tes ini dibicarakan pada BAB berikutnya).
3. Matching (Menjodohkan)
Matching adalah tipe tes yang terdiri dari dua kolom yang paralel,
dimana masing-masing kolom berisi statemen. Kolom sebelah kiri berisi
statemen soal sedangkan kolom sebelah kanan berisi statemen jawaban. Tugas
siswa adalah menjodohkan statement soal dengan salah satu statement
disebelah kanan (jawaban). Misalnya: Jodohkan statement sebelah kiri dengan
salah satu statement yang paling benar yang terdapat disebelah kanan.
4. Completion (melengkapi)
Item tes ini terdiri dari statement atau pernyataan yang belum lenkgap
atau sempurna. Tugas siswa adalah melengkapi statement (kalimat) tersebut
supaya menjadi lengkap. Pernyataan atau soal dari tipe ini dapat berbentuk
pertanyaan langsung, atau mengunakan titik-titik.
Misalnya : Jawablah pertanyaan berikut ini dengan singkat dan tepat !
a. Tahun berapakah Indonesia merdeka?
b. Jika guru ingin menyampaikan informasi kepada sekelompok siswa,
metode yang tepat digunakan adalah……………………………………….
7
………………………………………………………………………………
Tes Essay
Berbeda dengan bentuk tes obyektif, dimana tes obyektif terdiri dari
beberapa tipe tes, sedangkan tes essay hanya satu bentuk. Tes essay adalah suatu
bentuk tes yang terdiri dari suatu pertanyaan atau suruhan yang memerlukan
jawaban panjang. Sehingga tes ini sering disebut (long answer) atau tes subyektif,
sebab analisa jawaban dipengaruhi oleh subyek yang menjawab.
Bentuk pertanayan dapat berupa :
Meminta penjelasan
Membandingkan suatu masalah dengan masalah lain
Mencari perbedaan
Mencari hubungan
Mengintepretasikan / menafsirkan
Menyimpulkan
Semua bentuk-bentuk pertanyaan di atas menuntut pemikiran pemahaman,
pengalaman terhadap suatu materi atau pelajaran.
3. Langkah-langkah Penyusunan Tes
Secara garis besarnya, bentuk ujian yang diberikan kepada siswa/
mahasiswa dapat dibedakan menjadi dua yaitu :
Ujian essay dan
Ujian bentuk objektif (objektif tes)
8
Dalam tulisan ini hanya akan disajikan langkah-langkah penyusunan tes objektif.
Kegiatan menyiapkan tes objektif secara garis besarnya dapat digambarkan dalam
langkah sebagai berikut;
Menyiapkan blue print
Menulis soal dan
Menguji kwalitas soal ujian.
a. Blue Print
Blue print juga disebut tabel spesifikasi atau tabel kisi-kisi. Blue print
berisi tentang informasi tentang tes yang akan ditulis. Misalnya menunjukkan
bagian mata pelajaran yang akan diukur, taraf kompetensi yang akan diukur,
banyaknya soal untuk masing-masing kompetensi dan untuk seluruh satu mata uji,
taraf kesukaran masing-masing mata soal dan jenis / bentuk tes yang akan
digunakan.
Mata pelajaran yang akan diukur diperinci ke dalam bentuk sautna-satuan
yang lebih kecil. Bisa juga diperinci melalui bab per bab sampai pada sub masing-
masing bab. Namun suatu hal yang tak boleh dilupakan bahwa arah materi yang
diukur jangan lepas dari kompetensi.
Kompetensi yang sering digunakan adalah yang dikembangkan oleh
Bloom yang terkenal dengan Taxonomy Bloomnya. Menurut Bloom, kompetensi
kognitif siswa / mahasiswa itu, yaitu sejauh mana siswa / mahasiswa menguasai
hal yang dipelajarinya, digambarkan dalam 6 taraf yang sifatnya berjenjang
(hierchical).
Taraf tersebut dari yang paling rendah sampai ke yang paling tinggi
adalah;
9
1. Pengetahuan
2. Pemahaman
3. Aplikasi atau penerapan
4. Analisis
5. Sintesis dan
6. Evaluasi
Semakin banyak kompetensi yang mampu diukur semakin baik. Namun
jangan lupa bahwa mengukur semua kompetensi di atas bukanlah mudah, kadang-
kadang tidak semua, kadang-kadang tidak semua pelajran dapat diukur dengan
semua cara itu.
Untuk itu hendaknya dipilih secara cermat dengan mempertimbangkan
kemampuan yang ada, fasilitas, waktu serta tujuan yang ingin dicapai.
Untuk jelasnya berikut ini diberikan tabel Blue-print atau tabel kisi-kisi.
Contoh : I
1. Mata kuliah yang diukur : Psikologi Pendidikan
2. Semester : IV/STKIP AH Singaraja
3. Jumlah materi yang diukur : 10 Bab (Bab I s/d X)
Jumlah item = 40.
4. Bobot/taraf kesukaran masing-masing
Bab : 10%
5. Jenis tes : (Hanya satu jenis yaitu pilihan
ganda)
6. Propisi masing-masing kompetensi : - pengetahuan = 30%
- Pemahaman = 25%
10
- Aplikasi = 25%
- Analisis = 1-%
- Sintesis = 5%
- Evaluasi = 5%
Total = 100%
Selanjutnya digambarkan sebagai berikut :
Tabel 01.TABEL KISI-KISI SOAL UJIAN AKHIR SEMESTER V
BIDANG STUDI PSIKOLOGI PENDIDIKAN
Materi yang
diukur
Taraf Komponen TotalPenge
- tahuan
Pema- haman
Apli-kasi
Ana- lisis
Sinte- sis
Eva- luasi f %
1 2 3 4 5 6 7 8 9I
II
III
IV
V
VI
VII
VIII
IX
X
1
1
1
1
1
1
2
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
-
-
1
1
-
1
1
-
-
-
-
-
-
-
1
-
-
1
-
-
-
-
1
-
-
1
-
-
-
-
3
3
5
4
4
5
5
4
3
4
10
10
10
10
10
10
10
10
10
10
Total:
f%
30 25 25 10 5 5 - 100
Total :
f komp
12 10 10 4 2 2 10 -
Contoh II
11
1. Mata kuliah yang diukur : Psikologi Pendidikan
2. Semester : V / STKIP AH Singaraja
3. Materi yang diukur : 4 Bab (Bab I s/d V)
4. Bobot / proporsi tiap bab : - Bab I = 14%
- Bab II = 32%
- Bab III = 33%
- Bab IV = 21%
Total = 100%
5. Kompetensi yang diukur : - Pengetahuan factual
- Pemahaman
- Aplikasi
6. Bentuk tes : - Benar salah (true false)
- Multiple choice
- Matching
7. Jumlah tes : 40 item
Tabel 02
TABEL KISI-KISI SOAL UJIAN SEMESTER VBIDANG STUDI PSIKOLOGI PENDIDIKAN
Materi yang
diukurProporsi Taraf kompetensi
Bentuk soal/Tes Jumlah ItemT-F M-C Matching
I 14% Pengetahuan factualPemahamanAplikasi
11-
11-
11-
33-
II 32% Pengetahuan factualPemahamanAplikasi
-21
221
221
463
III 33% Pengetahuan factualPemahaman
11
22
12
45
12
Aplikasi 1 1 2 4IV 21% Pengetahuan factual
PemahamanAplikasi
-11
111
12-
242
Total 100% - 10 15 15 40
Contoh III.TABEL KISI-KISI (BLUE PRINT)
Bidang Studi : IPAKelas : I Semester I SMAPerkiraan Waktu : 60 MenitKurikulum : SMA Th. 1975
Materi/Kompe- tensi Galaksi Tata
Surya
Peredaran Benda
langit
Tata Koor- dinat
Perpe- taan
Alat astrn + meteo
r
Flora &
FaunaEkologi Penduduk
+ sdm
Penel ruang angks
Total
Knowledge
(ingatan)1 1 1
2+
(1)1 1 1 1+(1) 1 1+(1) 11+(3)
Konprehentt
(pemahaman)2
1+
(1)3 4 2 2 1+ (1) - - - 15+(2)
Application
(penerapan)2 3 2
3 +
(1)1 2+ (1) 3+ (1) 1+(1) 2+(1) 1 20+(5)
Analysis
(analisis)-
1 +
(1)2 - - - 2 - 1+(1) - 6+(2)
Syntesis
(sistesi)- - 2
2 +
(1)- - - - 1+(1) - 5+(2)
Evaluation
(evaluasi)- 1 - - - - - 1+(1) - 1 3+(1)
Total5
7 +
(2)10
11 +
(3)4 5+ (1) 7+(2) 3+(3) 5+(3) 3+(1) 60+(15)
Catatan : (+ ) = cadangan
b) Menulis Soal ( T es Obyektif)
Soal ditulis berdasarkan blue print yang telah disusun. Jumlah soal
hendaknya selalu memperhatikan alokasi waktu yang tersedia dan tujuan evaluasi.
Soal hendaknya ditata sedemiian rupa agar dari segi strutkur dapat memberi kesan
13
psikologis yang menyenangkan bagi peserta tes. Struktur soal dapat diatur sebagai
berikut.
1. Pola pertama: soal disusun mulai dari yang paling sukar dan berakhir dari
yang paling mudah.
2. Pola kedua: soal disusun dari yang paling mudah dan berakhir dari yang
paling sukar.
3. Pola ketiga: mulai dari soal yang mudah, menuju soal yang lebih sukar sampai
yang paling sukar, kemudian secara teratur berakhir pada yang mudah lagi.
Hal lain yang sangat penting dalam penulisan soal adalah :
1) Penggunaan bahasa Indonesia yang tepat
2) Syarat-syarat merumuskan / menyusun item.
1. Penggunaan Bahasa Indonesia dalam penulisan soal.
Dalam uraian berikut ini penulis mencoba merumuskan penggunaan
bahasa Indonesia yang didasarkan atas Ejaan Bahasa Indonesia Yang
Disempurnakan (EYD), serta petunjuk dari Departemen Pendidikan dan
Kebudayaan, Direktorat Jenderal Pendidikan Dasar dan Menengah tahun 1984,
tentang Kaedah Bahasa Indonesia Dalam Penulisan Soal Tes Prestasi Belajar.
I. Penulisan Huruf
A. Huruf Besar
1. Huruf Besar selalu dipakai di awal stem
2. Huruf besar dipakai diawal option bila :
Stem diakhiri dengan tanda tanya (?) atau tanda seru (!)
14
Penulisan huruf besar yang lainnya dapat dilihat pada ejaan yang
disempurnakan.
B. Huruf Kecil
Huruf kecil selalu dipakai diawal option, kecuali pada ketentuan A diatas.
Contoh : Ahli psikiatri disebut,
a. Psikolog
b. Conselor
c. Psikiater
d. Evaluator
II. Tanda Baca :
A. Tanda Tanya (?)
1. Tanda tanya dipakai pada akhir stem atau option yang berbentuk
pertanyaan.
2. Setelah tanda tanya (?) atau tanda seru (!) diperkenankan memberi
tanda tiitk.
B. Tada Titik (.)
1. Jumlah titik pada akhir stem yang tidak diakhiri dengan tanda tanya
atau tanda seru adalah empat titik (tiga titik untuk elips dan satu titik
untuk mengakhiri kalimat)
Contoh: Dasar negara kita adalah…
a. Pancasila
b. UUD 1945
c. Burung Garuda
d. Bhinneka Tunggal Ika
15
2. Jumlah titik pada bagian kalimatyang dihilangkan sebanyak tiga titik
ditengah kalimat, dan empat titik di akhir kalimat
Contoh : tengah kalimat
Kegiatan…yang belum ditemukan dalam fase pendahuluan bimbingan
konseling.
a. membuat kontak yang baik dengan konseli
b. memberi keyakinan / kepercayaan kepada konseli
c. secara periodik dan teliti mengolah data
d. mengenal identitas konseli
3. Tanda titik dipakai pada akhir option bila:
a. Option berbentuk kalimat
b. Option berpribahasa
c. Stem diakhiri tanda tanya atau tanda seru
4. Tanda titik tidak dipakai pada akhir judul yang merupakan kepala
karangan atau kepala ilustrasi, tabel, dan sebagainya.
Contoh:
Bhagawad Gita
Kunjungan Mendikbud
C. Garis Bawah
1. Garis bawah dipaka untuk nama buku, majalah dan surat kabar yang
dikutip.
Contoh: majalah Horison
2. Garis bawah dipakai pada penekanan maksud soal
Contoh: skor tertinggi dalam norma relatif skala sebelas adalah…
16
a. 10 c. 11
b. 9 d. 12
3. Kata tidak atau bukan ditulis bergaris bawah pada pernyataan soal
berbentuk nefatif.
Contoh: Berikut ini yang bukan termasuk aspek psikologis:
a. kepribadian
b. sikap sosial
c. intelektual
d. lingkungan
4. Kata kecuali dalam stem ditulis dengan huruf kecil, dan bergaris
bawah.
Contoh: berikut ini adalah karya-karya Hamka, kecuali…
a. keadilan Ilahi
b. dibawah lindungan Ka’bah
c. menunggu beduk Berbunyi
d. dosa atas manusia
5. Kata sebab (dalam bentuk soal hubungan antar hal), ditulis dengan
huruf kecil dan bergaris bawah. Pada pernyataan kedua (setelah kata
sebab) dimulai dengan huruf kecil dan diakhiri dengan tanda titik pada
akhir kalimat.
D. Tanda Koma (,)
Tanda koma (,) dipakai sebelum kata :
1. Sebab (dalam bentuk hubungan antar hal)
2. Kecuali (dalam bentuk pilihan ganda)
17
E. Tanda Petik (“..”)
Tanda eitk dipakai untuk memperjelas maksud soal pada stem.
Contoh: Sinonim kata evaluasi yang tepat pada kalimat “Evaluasi Belajar
Tahap Akhir” ialah
a. penilaian
b. penapsiran
c. pengira-ngiraan
d. pendugaan
III. Penulisan Kata
a. Menghindarkan penggunaan kata tersebut pada soal / stem. Gunakan kata
diatas, dibawah, sebagai gantinya.
b. Menghindarkan perulangan kata / ungkapkan pada stem dan option yang
memberikan petunjuk ke arah jawaban yang benar.
c. Menghindari penggunaan kata / ungkapan yang bermakna luas / tidak
tentu pada stem. Seperti : kebanyakan pada umumnya, seringkali, kadang-
kadang dan sejenisnya.
d. Penggunaan nama orang, nama tempat harus yang sudah dikenal umum
atau telah diajarkan, ada pada diktat / buku bacaan.
e. Kata Depan dan Awalan
1. Kata depan di, ke, dari harus ditulis terpisah dari kata yang
mengikutinya, karena kata depan itu mempunyai kedudukan sebagai
kata dan fungsinya menyatakan tempat.
18
2. di, ke, dan dari selalu ditulis seringkali pada kata pendeta, daripada,
kemari.
2. Syarat-syarat Merumuskan / Menyusun Item.
Penyusunan item tes yang dibicarakan di bawah ini terbatas pada syarat
penyusunan item tes obyektif. Dalam menyusun item tes obyektif akan
dibicarakan : a) petunjuk secara umum dan b) petunjuk secara khusus.
a) Petunjuk Umum
Petunjuk umum merupakan pedoman yang berlaku secara umum untuk
semua tipe tes obyektif antara lain :
1. Janganlah menggunakan susunan kata / kalimat yang sukar, kecuali untuk
mengukur kemampuan bahasa.
2. Jangan menggunakan kalimat yang langsung diambil dari buku / teks book,
sebab dapat menibulkan verbalisme.
3. Apabila suatu item didasarkan atas suatu pendapat tertentu, harus disebutkan
dari siapa pendapat tersebut.
4. Item suatu tes hendaknya jangan memberikan petunjuk terhadap jawaban item
yang lain
5. Jawaban dari suatu item, janganlah merupakan kondisi dariapda item
berikutnya.
6. Susunan jawaban benar hendaknya disusun secara random.
Ada beberapa teknik random yang dapat digunakan yaitu : 1. Teknik
undian, 2. Teknik abjad, 3. Teknik bilangan random.
19
b) Petunjuk khusus
Petunjuk khsuus adalah suatu pedoman untuk menyusun item tes dalam
tipe tertentu tes obyektip.
1. Syarat / petunjuk item tes benar salah :
a. Item benar salah hendaknya ditulis secara jelas dan difinitif, sehingga tidak
meragukan.
b. Hindari penggunaan kata yang merupakan penentu – penentu khusus
seperti : selalu, semua, kadang-kadang tidak pernah kecuali bermaksud
untuk mengukur logika (teknik berpikir atau analisa pikiran).
c. Hindari penggunaan negatif rangkap
d. Jangan mempergunakan dua konsep atau masalah dalam satu item.
e. Hindari penentuan jawaban yang hanya tergantung kepada satu huruf saja,
kecuali digunakan untuk mengukur kemampuan ejaan.
2. Syarat item menjodohkan (matching)
a. Stem-stem merupakan satuan dalam pasangan hendaknya bersifat sejenis,
misalnya : nama orang, tanggal / tahun kejadian, tempat dan sebagainya.
b. Jumlah jawaban hendaknya lebih banyak daripada stem. Hal ini
bermaksud menghindari jebakan dari anak.
c. Option jawaban disusun secara random.
d. Stem ditulis disebelah kiri dengan nomor urut, dan option disebelah kanan
dengan huruf abjad.
e. Hindari penulisan yang bersambung kehalaman berikutnya.
3. Syarat item melengkapi (complition)
20
a. Hindari penggunaan statemen yang dapat menimbulkan lebih dari satu
jawaban.
b. Ruang yang dikosongkan hendaknya merupakan tempat untuk
memberikan jawaban dari suatu fakta.
c. Jangan terlalu banyak ruang isian dalam satu item.
d. Sedapat mungkin isian diletakkan bagian akhir statemen.
Catatan : semua jawaban dikerjakan pada lembar jawaban dengan bentuk
sebagai berikut :
1. ____________________________________
2. ____________________________________
3. ____________________________________
4. ____________________________________dst.
4. Syarat item tes pilihan ganda (multiple choice)
Dalam prakteknya, tipe tes pilihan ganda merupakan bentuk yang palig
banyak digunakan oleh seorang pendidik / guru. Sebab dengan variasi bentuk
tes ini, dapat melatih kemampuan kognitif dalam taraf tinggi seperti : aplikasi,
analisis, sintesis, dan sebagainya. Untuk jelasnya maka akan dijelaskan
tentang :
A) Variasi bentuk tes pilihan ganda (multiple choice)
B) Syarat item tes pilihan ganda (multiple choice)
A. Variasi Bentuk Tes Pilihan Ganda (Multiple Choice)
Variasi bentuk tes ini ada beberapa bentuk yaitu :
1. Melengkapi dengan beberapa pilihan
21
2. Analisa hubungan antar hal
3. Melengkapi berganda
4. Pemakaian diagram gambar dan grafik
5. Analisa khusus
Dibawah ini akan dijelaskan masing-masing variasi di atas
1. Melengkapi dengan beberapa pilihan
Bentuk ini tediri dari stem yang merupakan suatu pernyataan yang
belum lengkap, kemudian disediakan beberapa alternatif, atau
kemungkinan jawaban yang benar.
Dari kemungkinan jawaban tersebut hanya satu ada jawaban yang
benar/paling benar.
Contoh :
Petunjuk :untuk soal berikut (nomor…s/d…) pilihlah salah satu jawaban
yang paling tepat.
a. Variasi ke-1
Orang yang lebih mudah menangkap dan menyimpan kesan edngan
jalan melihat disebut mempunyai tipe…
a. motoris
b. visualis
c. ouditif
d. komplektif
b. Variasi ke-2
Termasuk kecakapan sebagai hasil belajar adalah sebagai berikut,
kecuali…
22
a. prestasi belajar
b. perubahan sikap dan tingkah laku
c. intelegensi (iq)
c. Variasi ke-3
Diantara hal-hal di bawah ini yang bukan merupakan tujuan
pembelajaran adalah yang berorientasi kepada…
a. materi pengajaran
b. tingkah laku siswa
c. kemampuan siswa
d. hasil belajar siswa
2. Analisa Hubungan Antar Hal (Relation Ship Analysis)
Jenis variasi bentuk ini sering disebut “Hubungan sebab akibat”.
Soal ini terdiri dari dua pernyataan. Dari kedua pernaytaan itu dapat
ditanyakan apakah keduanya benar atau tidak. Lebih lanjut dapat
dipikirkan apakah diantara pernyataan itu terjalin hubungan sebab akibat
atau tidak sama sekali.
Contoh :
Petunjuk : Untuk soal-soal berikut ini (nomor…s/d…) pilihlah :
A) Jika pernyataan betul, alasan beutl dan keduanya menunjukan
hubungan sebab-akibat.
B) Jika pernyataan betul, alasan betul tapi keduanya tidak menunjukkan
sebab-akiabt.
C) Jika pernaytaan betul alasan salah
D) Jika pernaytaan salah dan alasan betul
23
E) Jika pernyataan dan alasan salah.
Contoh soal :
Untuk menolong penderita muntah berak dapat digunakan garam diarhee,
Sebab
Diarhee dapat mengganggu keseimbangan elektrolit dalam tubuh (A)
3. Melengkapi Berganda (Multiple Complition)
Pada dasarnya bentuk ini sama dengan bentuk pertama, yaitu
melengkapi dengan beberapa pilihan. Bedanya adalah dalam bentuk
pertama hanya ada satu jawaban benar, tetapi dalam bentuk ini jawaban
benar bisa lebih dari satu.
Contoh :
Petunjuk : untuk soal-soal berikut ini (…s/d…) pilihlah :
A) Jika (1), (2), dan (3) betul
B) Jika (1), dan (3) betul
C) Jika (2), dan (4) betul
D) Jika (4) betul
E) Jika semuanya betul
Contoh soal :
Tujuan penggajaran berorientasi kepada…
1. tingkah laku siswa
2. kemampuan siswa (A)
3. hasil belajar siswa
4. kemampuan guru
24
4. Pemakaian Diagram Gambar dan Grafik
Bentuk soal yang dipakai disini adalah bentuk perama yang
melengkapi dengan beberapa pilihan, tetapi masalahnya diwujudkan dalam
bentuk gambar, diagram, atau grafik.
Contoh :
Petunjuk : Untuk soal-soal berikut (…s/d…) sesuaikanlah jawaban anda
dengan nomor yang ada pada masing-masing komponen pada gambar.
Gambar Sosiogram :
6
7
1
3
5
9
4
2
8
10 13
11 12
25
Soal :
Dalam gambar hubungan analisa sosial di atas, anak yang terisolir adalah:
a. 1 d. 4
b. 2 e. 7
c. 3
5. Analisa Kasus
Masalah yang diungkap dalam stem ini merupakan keadaan nyata,
sehingga peserta ujian seakan-akan berhadapan dengan keadaan
sebenarnya.
Contoh :
Petunjuk : Untuk soal nomor…s/d…disediakan suatu tes yang harus
dipahami secara cermat. Kemudian menyusul soal-soal yang
memasalahkan hal-hal yang berhubungan dengan isi tes. Pilihlah satu
jawaban yang tepat soal-soal yang mengiringi tes.
Soal :
Sebuah benda digantung dengan pegas, dengan H0 adalah tinggi benda dari
tanah. Bila sekarang benda ditarik sedikit ke bawah kemudian dilepaskan,
benda akan berayun naik turun secara harmonis dengan frekwensi ayunan
per detik.
Ayunan dari benda disebabkan oleh…
A) Tarikan searah dari gravitasi
B) Tarikan searah dari pegas
C) Interaksi antara pegas dan gaya gesekan udara
26
D) Interaksi antara gaya grafitasi dan gaya gesekan udara
E) Interaksi antara gaya pegas dan gravitasi (kuci E)
B. Syarat Item Tes Pilihan Ganda (Multiple Choice)
Sebelum dijelaskan beberapa syarat penulisan item tes ini, maka perlu
diperkenalkan bentuk soal sebagai berikut:
Pada soal terdapat dua komponen yaitu :
1. Stem, adalah suatu pernyataan uang mengungkap secara deskriptip tentang
permasalahan yang akan ditanyakan. Kalimat stem dapat berbentuk, kalimt
tanya, kalimat suruh, kalimat utuh (pernyataan) dan kalimat tidak utuh.
Contoh :
a. Siapakah nama Presiden Republik Indonesia yang pertama? (kalimat
tanya)
b. Tunjukkan alat peraga yang mudah ditangkap melalui indra
pendengaran ! (Kalimat suruh)
c. Hak setiap warga negara untuk memperoleh pendidikan dan
pengajaran dalam UUD 1945, (kalimat utuh)
d. Susunan UUD 1945 terdiri dari….bagian,(kalimat tak utuh) atau
Susunan UUD 1945 terdiri dari… (kalimat tidak utuh).
2. Option; ialah suatu kata atau kalimat yang merupakan kelengkapan dari
komponen Stem, yang berfungsi sebagai alternatif jawaban. Option dapat
dibedakan menjadi dua yaitu: option kunci dan option pengecoh
(dstractions).
27
Contohsoal :
Susunan UUD 1945 terdiri dari : --- STEM,
a. satu bagian
b. dua bagian ----- pengeceh Distractions
c. tiga bagian ----- Options
d. empat bagian ----- Option kunci
Setelah kita kenal bentuk tes seperti di atas, maka barulah kita
membicarakan syarat penyusun tes pilihan ganda yang berlaku untuk semua
variasinya.
Adapun syaratnya adalah :
1. Seluruh komposisi hendaknya betul-betul mengungkapkan permasalahan
yang layak dikemukakan sebagai suatu stem atau soal, bukan hanya
sekedar deretan kata atau kalimat yang tidak bernilai sebagai suatu soalan.
Hindari kalimat yang subyekti dan puitis.
2. Diskripsi masalah yang diungkap stem hendaknya jelas, terutama dalam
tata kalimat yang benar, dan tidak mengundang maksud untuk menjebak
peserta tes (yang diuji).
3. Gunakan sedapat mungkin bentuk kalimat positif. Apabila digunakan
bentuk ingkar atau menyangkal, tulislah dengan garis bawah seperti :
(tidak, bukan, kecuali).
4. Dalam mengungkap permasalahan hendaknya dihindari penggunaan
ungkapan yang bersifat indenfinite seperti : kebanyakan, sering kali,
kadang-kadang, paling dan sejenisnya sehingga menimbulkan tafsiran
yang subyektif bagi peserta ujian.
28
5. Dalam menyusun soal hendaknya dapat diusahakan agar tidak terdapat
suatu ungkapan atau susunan kalimat yang memberikan petunjuk kepada
peserta ujian tentang kuncinya.
6. Kata-kata atau ungkapan yang digunakan sebagai pilihan jawaban
hendaknya seimbang baik kandungan makna maupun susunan kata-
katanya.
7. Untuk setiap soal hanya terdapat satu jawaban benar atau hanya satu
nomor benar dari nomor-nomor option yang disediakan.
8. Usahakan agar umpan (distractor) mirip betul dengan kunci (key) sehingga
derajat derajat kesukaran soal dapat mencerminkan kemampuan peserta
ujian.
9. Kunci jawaban di buat secara randomisasi, baik jumlahnya, maupun
tempat atau letaknya dalam lembar jawaban.
10. Hal-hal yang berhubungan dengan permaslaahan dan dapat menunjukkan
arah jawaban, hendaknya jangan dipergunakan.
11. Hindarkan interpendency antar soal satu dengan yang lainnya.
12. Cegah kesalahan dalam penggunaan kata-akta / kalimat (gunakan bahasa
sesuai dengan EYD)
13. Perhatikan taraf isi soal, hendaknya cocok seperti tabel kisi-kisi yang
memuat beberapa kompetensi.
14. Option hendaknya diusahakan mungkin benar (plaussible). Makin
homogin optionnya semakin tinggi taraf knowledge yang diukur.
15. Sedapat mungkin hindari penggunaan “semua di atas benar” atau “semua
di atas salah” pada option.
29
16. Jumlah option masing-masing soal dari satu ungkapan soal hendaknya
sama.
17. Hindari penulisan soal yang terpisah atau terpotong kehalaman berikutnya.
18. Option hendaknya disusun secara jelas dan secara vertikal.
(Suprapto, tahun 1982, hal 14).
30
BAB III
MEMBERI SKOR (SCORING)
1. Tes Essay
Pemberian skor tes essay dapat ditempuh dua cara yaitu : a) dengan
menggunakan metode analisa (analitycal method), b) metode sortir (sorting
method).
a) Metode Analisa (Analytical Method)
Ialah suatu cara menilai dengan menyiapkan sebuah acuan atau model
tertentu dari tiap-tiap nomor soal atau jawaban. Tiap-tiap jawaban dianalisa
menjadi beberapa elemen, kemudian masing-masing elemen disiapkan skor sesuai
dengn skala tau norma yang digunakan. Kemudian jawaban anak dicocokkan
dengan acuan tersebut tadi.
Misalnya :
Sebuah tes essay, dengan bobot lima (5) artinya jika tes tersebut dijawab
benar anak dapat skor = 5 (lima). Jawaban tes tersebut dianalisa menjadi lime
elemen yaitu I, II, III, IV, dan V. Kemudian jawaban anak dibandingkan dengan
elemen yang telah disiapkan. Jika jawaban anak hanya memuat 4 (empat) elemen
dan benar maka anak memperoleh skor untuk nomor tersebut 4 (empat). Demikian
seterusnya untuk semua soal.
b) Metode Sortir (Soting Method)
31
Cara ini tidak diabgi menjadi beberapa elemen tetapi pemeriksa harus
memabca seluurh jawaban masing anak, setelah itu baru diletakkan pada masing-
masing klasifikasi,misal : sangat baik, baik, sedang, kurang, sangat kurang. Cara
seperti ini dikerjakan terus menerus sampai pada semua jawaban anak. Metode ini
akan lebih baik jika pemeriksa dapat mengulang atau mengecek kembali apakah
klasifikasi di atas tadi sudah tepat atau belum. Setelah itu barulah diberi skor
sesuai dengan klasifikasinya.
Skor yang diperoleh anak atas klasifikasi ini adalah skor dari seluruh tes.
Bilamana acuan norma yang digunakan adalah penilaian Acuan Patokan dengan
skala 5 (lima) maka dapat dijabarkan sebagai berikut ;
Sangat baik, diberi skor = 4 atau A
Baik, diberi skor = 3 atau B
Sedang, diberi skor = 2 atau C
Kurang, diberi skor = 1 atau D
Jika kita ingin menggunakan penilaian acuan patokan dengan skor tertinggi adalah
10 (sepuluh), maka masing-masing klasifikasi di atas tadi dibagi dua lagi yaitu:
a = 10SB
b = 9c = 8
Bd = 7e = 6
SDf = 5---------5,5g = 4
KRh = 3i = 2
SKj = 1
32
2. Tes Obyektif
Setelah jawaban anak diperiksa dengan menggunakan sistim kunci maka
skor yang diperoleh dianalisa dengan mengguankan rumus sebagai berikut:
a. Rumus untuk tipe Tes Benar – Salah (B – S)
SK = (B – S) x Bt
Keterangan :
= Jumlah
Sk = Skor
B = Benar
S = Salah
Bt = Bobot
b. Rumus untuk tipe Tes Menjodohkan (Matching Tyepe)
Sk = B x Bt
Keterangan :
Sk = Skor
B = Jumlah benar
Bt = Bobot
c. Rumus untuk tipe Tes Melengkapi (Complition)
Sk = B x Bt
Sk = Skor
B = Jumlah benar
33
Bt = Bobot
d. Rumus untuk tipe Tes Pilihan Ganda (Multiple Choice)
Sk = (B−S)
n−1x bt
Keterangan :
Sk = skor
B = jumlah jawaban benar
S = jumlah jawaban salah
n = jumlah option
1 = Bil. Tetap
Bt = Bobot
Rumus ini dapat digunakan untuk semua variasi tipe pilihan ganda.
34
BAB IV
MENGUBAH SKO MENTAH MENJADI SKOR STANDAR
Mengubah skor mentah menjadi skor standar yang dibicarakan berikut ini
terbatas untuk tipe tes obyektif. Sebab tes essay sesuai dengan fungsinya maka
akan lebih tepat diukur dengan menggunakan PAP, seperti telah diuraikan
didepan dengan variasi yang tidak terlalu banyak. Sedangkan dalam tipe tes
obyektif memiliki variasi skor yang sangat heterogen sebab masing-masing tipe
memiliki rumus skoring tersendiri, kadang-kadang satu rangkaian soal memuat
berbagai variasi tes obyektif serta jumlah soal yang relatif banyak. Dengan
kemungkinan itu sudah tentu diperoleh siswa. Dengan kata lain skor mentah perlu
dianalisa, sebab skor tersebut tidak akn berarti apa-apa sebelum diolah.
Misalnya : Erma memperoleh skor psikologi = 47. Apakah artinya?
Sudah tentu akan tidak terjawab, jika tidak diolah/dirubah.
Untuk mengubah skor mentah menjadi skor standar ada dua pendekatan
yaitu : 1) Pendekatan Acuan Patokan (PAP) dan 2) Pendekatan Acuan Norma
(PAN).
1. Penilaian Acuan Patokan
Penilaian acuan patokan adalah suatu cara penilaian dengan jalan
membandingkan skor yang dicapai anak atau siswa dengan nilai yang telah
35
ditetapkan. Skor patokan ini didasarkan atas tingkat penguasaan kompetensi
bidang studi yang didapat dilihat dari :
a. Prosentase tingkat penguasaan materi
b. Patokan yang disusun berdasarkan Mean ideal (Mi), dan Standar Deviasi ideal
(Sdi)
a. PAP dilihat dari prosentase tingkat penguasaan materi. Cara ini menggunakan
rentangan prosentase dari 0% - 100%, yang diklasifikasikan menadi beberapa
kelompok.
Dalam cotoh dibawah ini diuraikan PAP skala lima sebagai berikut:
Tingkat penguasaan materi NilaiAngka Huruf
90 % - 100 %
80 % - 89 %
65 % - 79 %
55 % - 64 %
0 % - 54 %
4
3
2
1
0
A
B
C
D
E
Contoh penggunaannya :
Tes evaluasi pendidikan terdiri dari ; 85 item, dengan demikian maka skor
maksimal ideal adalah 85 (bobot soal adalah 1). Erma mampu mengerjakan
betul dengan skor 55.
Berapakah skor standarnya ?
Jawab :
Pedoman konversi dapt dibuat sebagai berikut :
Penguasaan 90 % = 90
100 x 85 = 76,50 (71)
36
Penguasaan 80 % = 80
100 x 85 = 68,00
Penguasaan 65 % = 65
100 x 85 = 55,25 (55)
Penguasaan 55 % = 55
100 x 85 = 46,75 (47)
Selanjutnya disusun bentuk konversi sebagai berikut:
Tingkat penguasaan materi NilaiAngka Huruf
71 - 85
68 - 70
55 - 67
47 - 54
0 - 46
4
3
2
1
0
A
B
C
D
E
Cara menyusun; baris disebelah kiri didapat dari perhitungan prosentase, yang
disebelah kanan dicari dengan cara: tuliskan skor maksimal idial paling atas
(85) selanjutnya mengurangi 1 angka disebelah kiri yang berada di atas kelas
intervalnya ( lihat tanda panah). Berdasarkan tabel konversi di atas maka Erma
memperoleh skor mentah 55 standarnya adalah (2) C.
Standar PAP dapat dirubah sesuai dengan tujuan evaluasi, materi yang diukur dan
pertimbangan lain yang berorientasi pada mutu atau kebermanfaatan untuk peserta
didik.
Contoh standar yang bisa digunakan:
Tingkat penguasaan materi NilaiAngka Huruf
85 % - 100 %
75 % - 84 %
4
3
A
B
37
65 % - 74 %
55 % - 64 %
0 % - 54 %
2
1
0
C
D
E
Mengingat bahwa penilaian pendidikan pada tingkat SMA ke bawah
sangat jarang menggunakan penilaian skala lima, melainkan yang digunakan
adalah skala sebelas artinya skor tertinggi adalah 10 dan terendah adalah 0.
Sehubungan dengan hal itu, penulis mencoba memberikan acuan patokan yang
tingkat penguasaan materinya dapat diequvalensikan dengan PAP.
ST = X
∑ SMI x 100 (untuk nilai puluhan)
ST = X
∑ SMI x 10 (untuk nilai satuan)
Keterangan :
ST = Skor standar
X = Skor mentah (skor yang diperoleh siswa)
SMI = Skor maksimal ideal
= Sigma / jumlah
Rumus di atas dapat diguankan untuk bobot soal yang berbeda-beda.
Setelah dianalisa dengan rumus di atas skor yang diperoleh diequivalensikan
dengan batas kelulusan pada PAP yaitu 65%. Semua siswa memperoleh skor (ST)
65% ke atas, lulus sedangkan dibawah itu tidak lulus.
Contoh penggunannya :
38
Bidang studi yang dievaluasi adalah : PMP. Jumlah soal / item adalah 90.
Bobot soal adalah 1 untuk tiap-tiap item.
Peserta testing adalah : Erma, Era, Eka, Edi, dan Eva. Setelah diperiksa ternyata
masing-amsing peserta tes memperoleh skor sebagai berikut :
Erma = 70 Eka = 50
Era = 65 Edi = 85
Eva = 80
Berapakah skor standarnya?
Jawab :
Jumlah item = 90
Bobot soal = 1
SMI = 90 x 1
= 90
Skor standar Erma = 7090 x 100 = 77,8 (78)
Skor standar Era = 6590 x 100 = 72,2 (72)
Skor standar Eka = 5090 x 100 = 55,5 (56)
Skor standar Edi = 8590 x 100 = 94,4 (94)
Skor standar Eva = 8090 x 100 = 88,8 (89)
Melihat dari skor standar di atas, maka Eka tidak lulus karena ST-nya masih di
bawah standar kelulusan 65%.
39
b. Nilai Patokan Yang Disusun Berdasarkan Mean Ideal (Mi) dan Standar
Deviasi (SDi)
Norma ini juga didasarkan atas penguasaan kompetensi yang diajarkan. Norma
yang disusun sangat erat hubungannya dengan jumlah item dan bobot untuk tiap-
tiap item. Berdasarkan atas jumlah item dan bobot itu akan diperoleh skor yang
diperoleh siswa, kemudian dapat dicari berturut-turut : Skor Maksimal Ideal
(SMI), mean ideal (MI) dan Standar Deviasi Ideal (SDI).
Adapun langkah-langkah yang ditempuh dalam menyusun nilai patokan
ini adalah sebagai berikut :
1. Menentukan Skor Maksimal Ideal (SMI), adalah suatu skor yang diperoleh
oleh siswa jika semua soal dijawab dengan betul.
Dengan kata lain dapat dikatakan bahwa SMI adalah penjumlahan hasil kali
masing-masing item dengan bobotnya.
2. Menentukan angka rata-rata ideal (Mi), dengan menggunakan rumus sebagai
berikut :
Mi = ½ x SMI
3. Menentukan standar deviasi ideal (SDi), dengan rumus sebagai berikut :
SDi = 13 x Mi
4. Menyusun pedoman konversi / patokan sebagai berikut :
------ 10M + 2,25 SD
------ 9M + 1,75 SD
------ 8M + 1,25 SD
------ 7M + 0,75 SD
------ 6
40
M + 0,25 SD------ 5
M - 0,25 SD------ 4
M - 0,75 SD------ 3
M - 1,25 SD------ 2
M - 1,75 SD------ 1
M - 2,25 SD------ 0
Contoh penggunaannya :
Suatu tes hasil belajar bidang studi yang terdiri dari :
15 item benar – salah dengan bobot 2
15 item pilihan ganda dengan bobot 1
30 soal item menjodohkan (matching) dengan bobot 1
2 item tes essay masing-masing dengan bobot 5
Jika salah seorang peserta tes memperoleh skor 85, berapakah skor
sntadarnya?
Jawab :
a. Skor maksimal ideal dicari dengan berikut :
Skor untuk benar – salah = 15 x 2 = 30
Skor untuk piilhan ganda = 15 x 2 = 30
Skor untuk menjodohkan = 30 x 1 = 30
Skor untuk tes essay = 2 x 5 = 10
Jumlah (SMI) = 100
41
b. Menentukan Mi = ½ x SMI
Mi = ½ x 100
= 50
c. Menentukan SDi = 13 x Mi
= 13 x 50
= 16,67
d. Membuat tabel konversi
Mi = 50, SDi = 16,67
-----10
M + 2,25 SD = 50 + (2,25 x 16,67) = 50 + 37,51 = 87,51 (88)
-----9
M + 1,75 SD = 50 + (1,75 x 16,67) = 50 + 29,17 = 79,17 (79)
-----8
M + 1,25 SD = 50 + (1,25 x 16,67) = 50 + 20,84 = 70,84 (71)
-----7
M + 0,75 SD = 50 + (0,75 x 16,67) = 50 + 12,50 = 62,50 (63)
-----6
M + 0,25 SD = 50 + (0,25 x 16,67) = 50 + 4,17 = 54,17 (54)
-----5
M – 0,25 SD = 50 – (0,25 x 16,67) = 50 – 4,17 = 45,83 (46)
-----4
M – 0,75 SD = 50 – (0,75 x 16,67) = 50 – 12,50 = 37,50 (38)
-----3
M – 1,25 SD = 50 – (1,25 x 16,67) = 50 – 20,84 = 29,16 (29)
-----2
M – 1,75 SD = 50 – (1,75 x 16,67) = 50 – 29,17 = 20,83 (21)
-----1
M – 2,25 SD = 50 – (2,25 x 16,67) = 50 – 37,51 = 12,49 (12)
------0
42
88-… = 10
79-87 = 9
71-78 = 8
63-70 = 7
54-62 = 6
46-53 = 5
38-45 = 4
29-37 = 3
21-28 = 2
12-20 = 1
0-11 = 0
Jadi siswa yang mendapat skor 85, memperoleh skor standar = 9.
2. Penilaian Acuan Norma
Panilaian acuan norma adalah suatu cara penilaian dengan cara
membandingkan skor yang diperoleh siswa dengan skor rata-rata yang dicapai
oleh kelompoknya.
Adapun langkah-langkah yang ditempuh adalah :
a. Menyusun tabel data
b. Menyusun tabel kerja untuk mencari Mean (M) dan Standar Deviasi
(SD)
c. Menyusun tabel konversi.
Contoh penggunaannya :
Hasil EBTA dari suatu SMA adalah sebagai berikut :
a. Tabel tentang hasil EBTA SMA…
No Nama Skor No Nama Skor
1 Asih 45 17 Surya 58
43
2345678910111213141516
ArianiGarianiBudarsaArtaDewiDamaYusufJoniKusumaMelyawatiLelyMastriSariatiPuspaSutarmi
375142343924493014323840352831
181920212223242526272829303132
SetiaSudiTiniJayaSuriSundariUmbaraTrsinaAstiniWidiaWinaYuniToniErdaErma
453627431741353332482520534438
b. Menyusun tabel kerja untuk mencari M dan SD
Diketahui skor tertinggi = 58, skor terendah = 14 maka :
R = 58,5 – 3,5
= 45
i maksimum = R7
= 457
= 6,43
i minimum = R15
= 4515
= 3,0
Jadi interval yang dipakai adalah 3.
Tabel kerja untuk mencari M dan SD
Kls Interval X f fX X1 fX1,2
57 – 59 58 1 58 21,66 469,16
44
54 – 56
51 – 53
48 – 50
45 – 47
42 – 44
39 – 41
36 – 38
33 – 35
30 – 32
27 – 29
24 – 26
21 – 23
18 – 20
15 – 17
12 – 14
55
52
49
46
43
40
37
34
31
28
25
22
19
16
13
0
2
2
2
3
3
4
4
4
2
2
0
1
1
1
0
104
98
92
129
120
148
136
124
56
50
0
19
16
13
18,66
15,66
12,66
9,66
6,66
3,66
0,66
-2,34
-5,34
-8,34
-11,34
-14,34
-17,34
-20,34
-23,34
0
490,47
320,50
186,63
133,07
40,19
1,74
21,90
144,06
139,11
257,19
0
100,68
413,72
544,76
- - N = 32 1163 - 3464,23
fX fX1,2
M = ∑ fXN
= 116332
= 36,34
SD = √∑ fX 1.2
N
= √ 3464,23N 32
= √108,25718
= 10,40
45
c. Menyusun pedoman konversi
-----10
M + 2,25 SD = 36,34 + (2,25 x 10,40) = 36,34 + 23,40 = 59,74
-----9
M + 1,75 SD = 36,34 + (1,75 x 10,40) = 36,34 + 18,20 = 54,54
-----8
M + 1,25 SD = 36,34 + (1,25 x 10,40) = 36,34 + 13,00 = 49,34
-----7
M + 0,75 SD = 36,34 + (0,75 x 10,40) = 36,34 + 7,80 = 44,14
-----6
M + 0,25 SD = 36,34 + (0,25 x 10,40) = 36,34 + 2,60 = 38,94
-----5
M - 0,25 SD = 36,34 - (0,25 x 10,40) = 36,34 – 2,60 = 33,74
-----4
M - 0,75 SD = 36,34 - (0,75 x 10,40) = 36,34 – 7,80 = 28,54
-----3
M - 1,25 SD = 36,34 - (1,25 x 10,40) = 36,34 – 13,00 = 23,24
-----2
M - 1,75 SD = 36,34 - (1,75 x 10,40) = 36,34 – 18,20 = 18,14
-----1
M - 2,25 SD = 36,34 - (2,25 x 10,40) = 36,34 – 23,40 = 12,94
-----0
Berdasarkan tabel konversi di atas dapat dibandingkan skor yang
diperoleh siswa dengan skor standar norma. Siswa yang dinyatakan lulus adalah
skor 44,14 dibulatkan = 44 ke atas.
Secara umum pelaksanaan penilaian dalam proses belajar sering berakhir
setelah diperoleh skor standar dari masing-masing siswa. Sebenarnya penilaian
tidaklah berhenti sampai disana. Skor yang diperoleh dalam bentuk angka atau
46
kwanitas itu perlu diinterpretasikan dalam penilaian yang berifat kwalitas. Sebab
bagaimanapun seorang guru dituntut untuk dapat memberikan berbagai
interpretasi terhadap keberhasilan siswa.
Misalnya seorang siswa memperoleh skor 50. Apakah artinya?. Sudah
tentu akan menuntut berbagai jawaban antara lain : siswa itu pintar, siswa itu
berhasil sangat baik, cukup, kurang dan sebagainya.
Agar estimasi yang diberikan guru tidak terlalu subyektif, maka
diperlukan adanya suatu cara untuk mengkonversikan skor kwantitas.
Salah satu cara yang dapat ditempuh dalam sistem perpencaran skor
menurut area kurva normal.
Pencaran Skor Standar Dalam Kurva Normal
Percent of cases underportions of the normalcurve
standard deviationcommulative 0,13% 2,14% 13,59% 34,13% 34,13% 13,59% 2,14% 0,13%percentagesrounded -4σ -3σ -2σ -1σ σ +1σ +2σ +3σ
0,1% 2,3% 15,0% 50,0% 84,1% 97,7% 99,9%2% 16% 50% 84% 98%
Percentileequivalents
1 5 10 203040 50 60 70 80 90 95 99
typical standardscoresz – scores -40 -30 -20 -10 0 +10 +20 +30
T – scores 20 30 40 50 60 70 80
Ceed scores 200 300 400 500 600 700 800
47
ACT scores 40 60 80 100 120 140 160
Stanine 1 2 3 4 5 6 7 8 9
Percent in stanine 4% 7% 12% 17% 20% 17% 12% 7% 4%
Deviation IQ’s 55 70 5 100 115 130 145
Stanley, Tahun 1964, hal 74
Keterangan0 = titik tengah (Mean) daerah kurva normalσ = standard deviasi (SD)+ = daerah positif kurva normal (0 s/d + 40)- = daerah negatif kurva normal (0 s/d -40)
Dari kurva normal diatas kita bisa menyusun pedoman konversi dari skor
kwantitas kepada skor kwalitas kepada skor kwalitas diketaui -40 dan + 40
merupakan daerah kurva yang terlalu jauh dari kenormalan. Karena itu dalam
konversi berikut ini angka tersebut di atas tidak disertakan.
Beberapa model konversi yang dapat disusun adalah sebagai berikut:
1. Konversi Berjenjang (Klasifikasi) Lima
M + 2 SD ≤ N M + 3 SD = sangat baik
M + 1 SD ≤ N < M + 2 SD = baik
M – 1 SD ≤ N < M + 1 SD = sedang
M – 2 SD ≤ N < M – 1 SD = kurang
M – 3 SD N < M – 2 SD = sangat kurang
Contoh penggunaannya :
Perhatikan data tentang hasil EBTA di depan
Diketahui : M = 36,34
48
SD = 10,40
Setelah dicari M dan SD barulah dimasukan ke dalam konversi sebagai
berikut:
M + 2 SD ≤ N M + 3 SD
M + 1 SD ≤ N < M + 2 SD
M – 1 SD ≤ N < M + 1 SD
M – 2 SD ≤ N < M – 1 SD
M – 3 SD N < M – 2 SD
36,34 + (2 x 10,40) ≤ N 36,34 + (3 x 10,40)
36,34 + (1 x 10,40) ≤ N < 36,34 + (2 x 10,40)
36,34 - (1 x 10,40) ≤ N < 36,34 + (1 x 10,40)
36,34 - (3 x 10,40) ≤ N < 36,34 - (2 x 10,40)
57,14 ≤ N 67,54 = sangat baik
46,74 ≤ N < 57,14 = baik
25,94 ≤ N < 46,74 = sedang
15,54 ≤ N < 25,94 = kurang
5,14 N < 15,54 = sangat kurang
Jadi siswa yang memperoleh skor 50 tergolong baik
2. Konversi Berjenjang (Klasifikasi) Tiga
M + 1 SD ≤ N M + 3 SD = baik
M – 1 SD ≤ N < M + 1 SD = sedang
M – 3 SD N < M – 1 SD = kurang
49
3. Konversi Berjenjang Dua
M ≤ N M + 3 SD = baik
M – 3 SD N < M = kurang
Contoh penggunaan nomor 2 dan 3 sama dengan nomor 1 di atas
Keterangan : X (M) = angka rata-rata
σ (SD) = standar deviasi
Acuan Norma Persentil
Penilaian dengan menggunakan norma persentil PAN dirasakan lebih
banyak manfaatnya, sebab nilai tersebut dapat diequvalensikan dengan skor
standar lainnya seperti Z-skor, T-skor, berdasarkan pencaran skor – skor standar
normal.
Adapun rumus untuk Persentil sebagai berikut :
P = cfb+1/2 fp
Nx100
Keterangan :
P = Persentil
Cfb = Cumulatif frekwensi below, yaitu jumlah frekwensi yang mendapat skor
di bawah skor yang akan dicari persentilnya.
Fp = frekwensi daerah persentil, yaitu jumlah frekwensi yang mendapat skor
sama dengan skor yang akandicari persentilnya.
N = Jumlah subyek
Contoh :
50
Diketahui nilai raport anak-anak kelas 1 SMA sebagai berikut :
10 1 6 6 10
9 9 9 9 7
8 8 8 8 7
7 7 7 7 7
6 6 6 6 6
5 5 5 5 5
4 4 4 4 4
4 4 4 4 2
3 3 3 3 2
5 5 5 5 5
Berapakah persentil skor 8?
Jawab : Tabel kerja untuk mencari f dan cf
X C Cf
10
9
8
7
6
5
4
3
2
1
2
4
4
7
7
10
9
4
2
1
50
48
44
40
33
26
16
7
3
1
Total 50 -
Memasukkan data ke dalam rumus :
P = cfb+1/2 fp
Nx100
51
P =40+ 1
2(4)
50 Nx 100
P = 40+2
50x 100
P = 4250
x 100
P = 84
Jadi persentil skor 8 adalah 84. P = 84, maka Z-skornya kurang lebih =
+1,0 sedangkan T-skornya kurang lebh = 60. (Perhatikan pencaran skor standar
dalam kurva normal).
ANALISIS DESKRIPTIF DENGAN SPSS
BAB V
PEMBAKUAN ALAT UKUR
(Tes Prestasi Belajar)
Diketahui bahwa skor yang diperoleh siswa dari hasil pengukuran,
mempunyai makna yang sangat penting baik dari segiguru yang mengajar, anak
atau siswa yang bersangkutan serta lembaga pengelola pendidikan. Agar skor
yang diperoleh siswa itu bermakna secara tepat, maka salah satu faktor yang perlu
diperhaitkan adalah faktor alat ukur (tes yang digunakan).
Tes yang tersusun hendaknya baku, agar dapat berfungsi yaitu
membedakan antara anak yang pandai dengan anak yang tidak pandai, anak yang
52
siap dalam pelajaran tertentu dengan anak yang tidak siap. Mengingat bahwa
pelaksanaan pembakuan tes adalah suatu pekerjaan yang tidak mudah, sehingga
tidak semua guru dapat melaksanakan pembakuan ini.
Sehubungan dengan hal itu, penulis mencoba menganjurkan hal-hal
sebagai berikut :
1. Tes yang tersusun hendaknya sesuai dengan tujuan pengajaran
2. Tes evaluasi belajar disusun berdasarkan tabel kisi-kisi, sebab melalui
tabel tersebut telah tersusun rencana atau materi yang akan diukur.
3. Teknik pembakuan tes dapat dipilih satu dari yang dianjurkan, serta dipilih
berdasarkan atas tujuan pengajaran, kemampuan, biaya dan waktu.
Ada beberapa cara yang dapat ditempuh dalam pembakuan tes ini adalah :
1. Mencari Derajat Kesukaran suatu tes (DK)
2. Mencari Daya Beda suatu tes (DB)
3. Mencari Efektifitas Option
4. Mencari Reliabiiltas Tes
5. Validitas tes
1. Mencari Derajat Kesukaran Suatu Tes (DK)
Item tes tidak boleh terlalu sukar dan tidak boleh terlalu mudah. Sebuah
item yang terlalu mudah memungkinkan semua anak dapat menjawab dengan
benar. Item seperti itu bukanlah suatu item yang baik. Jadi item yang baik adalah
item yang mempunyai derajat kesukaran tertentu, dan biasanya ditentukan
berdasarkan prosentase. Derajat kesukaran yang baik adalah derajat kesukaran
yang bergerak antara :
53
Item yang memperoleh DK 75% adalah item yang terlalu sukar
Item yang memperoleh DK 25% adalah item yang terlalu mudah
Angka tersebut diatas dapat dicari dengan menggunakan rumus sebagai berikut:
DK = ∑ (W L+W H )N
x 100%
Keterangan :
DK = Derajat kesukaran
WL = Jumlah kelompok bawah yang menjawab salah
WH = Jumlah kelompok atas yang menjawab salah
N = Jumlah kelompok atas dan kelompok bawah (N = nh + n1)
Dengan demikian dapat disimpulkan bahwa derajat kesukaran berarti :
sejauhmana suatu tes mengukur kemampuan anak yang masih dirasakan
manfaatnya dalam bidang pendidikan.
Langkah-langkah Mencari DK
1. Buatlah tabel data, yang memuat semua skor dari hasil testing dan disusun
berurutan dari skor tertinggi sampai skor terendah. Tabel dapat memuat
kolom: No urut, nama siswa/testee, nomor pokok dan kolom keterangan.
2. Menentukan kelompok atas dan kelompok bawah, dengan jalan menghitung
27% dari jumlah peserta tes atau 27% dari N. Sedangkan yang 46% ditengah-
tengah dibuang, dalam arti tidak dipersoalkan dalam analisis karena tidak
pintar dan tidak bodoh.
25% sampai dengan 75%
54
3. Memasukkan data kedalam tabel kerja. Tabel kerja memuat kolom :
No Item, WL, WH, WL + WH dan WL - WH
Contoh tabel kerja :
No item WL WH WL + WH WL + WH
1
2
3
4
5
Dst
4. Memasukkan data kedalam rumus
5. Menarik kesimpulan (kesimpulan analisis). Kesimpulan Analisis diperoleh
dengan angka batas derajat kesukaran item yang tidak ditentukan.
Dari hasil membandingkan akan diperoleh sebagai berikut :
a. 25% ≤ N ≤ 75% = item baik
b. N < 25% = item ditolak (mudah)
c. N > 75% = item ditolak (sukar)
Contoh penggunaannya :
Suatu tes hasil belajar terdiri dari 15 item dalam bentuk tes obyektif masing-
masing berbobot 1, diberikan kepada 21 orang siswa SPG negeri di Singaraja.
55
Hasilnya ditabulasikan dalam tabel 01. Carilah derajat kesukaran (DK) masing-
masing itemnya!
Jawab
Tabel : 01. Tabel Data Hasil Testing
No Nama NRPItem Tes
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Skor1 Agung 215 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 142 Mahmud 221 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 133 Bakri 230 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 134 Rusmini 225 1 1 1 1 1 0 1 1 1 1 1 1 0 0 0 115 Yusuf 212 1 1 1 1 1 0 1 1 1 1 1 0 0 0 0 106 Idrus 218 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 107 Bagus Mas 227 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 98 Indrawati 219 0 1 0 0 0 1 0 0 1 1 0 1 1 1 1 89 Aminah 223 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 8
10 Amir 213 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 711 Anwar 214 0 0 1 1 1 0 0 1 0 0 0 0 1 1 1 712 Sunadi 231 1 0 0 0 1 1 0 0 1 0 0 1 0 1 1 713 Abdulah 211 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 614 Gandri 216 1 0 0 0 0 1 1 0 0 0 1 1 0 0 1 615 Suryadi 224 1 1 0 0 0 1 0 0 0 1 0 0 1 1 0 616 Yasa Wibawa 228 1 1 1 1 1 0 0 0 0 0 0 0 0 1 0 617 Jayarsa 220 1 1 1 1 0 0 0 0 0 0 0 0 0 1 0 518 Saminah 226 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 419 Niraini 229 0 0 1 1 0 0 0 1 0 0 0 0 1 0 0 420 Hermin 217 1 1 0 0 0 1 0 0 0 0 0 0 0 0 0 321 Ahmad 222 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 2 N W WH 0 0 0 0 0 2 0 0 0 0 1 2 3 6 5
WL 1 2 2 3 5 4 6 5 6 6 6 6 5 3 6
2. Mencari Kelompok Atas dan Kelompok Bawah
Kelompok Atas dan Kelompok Bawah dapat dicari dengan rumus :
27
100 x 1N
N = 21, maka : 27
100 x 21 = 617100 x 6,17 = 6
Jadi : a. Jumlah kelompok atas = 6 orang
56
b. Jumlah kelompok bawah = 6 orang sesuai dengan hasil skor yang
diurut mulai dari yang tertinggi sampai terendah.
A. Nama-nama yang tergolong kelompok atas adalah :
1. Agung Nrp : 215
2. Mahmud Nrp : 221
3. Bakir Nrp : 230
4. Rusmini Nrp : 225
5. Yusuf Nrp : 212
6. Idrus Nrp : 218
B. Nama-nama yang tergolong kelompok bawah adalah :
1. Yasa Wibawa Nrp : 228
2. Jayarsa Nrp : 220
3. Saminah Nrp : 226
4. Niraini Nrp : 229
5. Hermin Nrp : 217
6. Ahmad Nrp : 222
3. Membuat Tabel Kerja
Tabel kerja ini memuat hal-hal sebagai berikut :
- Kolom nomor item
- WL = jumlah kelompok bawah
- WH = jumlah kelompok atas, dst
Tabel : 02. Tabel Kerja
No Item WL WH WL + WH WL - WH
1 1 0 1 1
57
23456789101112131415
22354656666536
00002000012365
223566566788911
22352656654231
- - - - -
4. Memasukkan Data ke Dalam Rumus
DK = ∑ W L+W H
N x 100%
Keterangan :
N = Jumlah kelompok atas dan kelompok bawah (N = n1 + nh)
Item nomor 1 : Dk = 1/12 x 100 = 8,33%
Item nomor 2 : Dk = 2/12 x 100 = 16,67%
Item nomor 3 : Dk = 2/12 x 100 = 16,67%
Item nomor 4 : Dk = 3/12 x 100 = 25,00%
Item nomor 5 : Dk = 5/12 x 100 = 41,67%
Item nomor 6 : Dk = 6/12 x 100 = 50,00%
Item nomor 7 : Dk = 6/12 x 100 = 50,00%
Item nomor 8 : Dk = 5/12 x 100 = 41,67%
Item nomor 9 : Dk = 6/12 x 100 = 50,00%
58
Item nomor 10 : Dk = 6/12 x 100 = 50,00%
Item nomor 11 : Dk = 7/12 x 100 = 58,33%
Item nomor 12 : Dk = 8/12 x 100 = 66,67%
Item nomor 13 : Dk = 8/12 x 100 = 66,67%
Item nomor 14 : Dk = 9/12 x 100 = 75,00%
Item nomor 15 : Dk = 11/12 x 100 = 91,67%
5. Menarik Kesimpulan Analisis
Bandingkan nilai (N) yang diperoleh dengan nilai penolakan item.
Kemudian tunjukanlah item-item mana yang diterima dan yang ditolak.
2. Mencari Daya Beda Suatu Tes (DB)
Suatu tes hendaknya mampu membedakan anak yang satu dengan yang
lainnya. Jika tidak, maka tes itu bukanlah tes yang baik. Misalnya dari 21 orang
peserta tes semuanya memperoleh skor 10 atau semuanya memperoleh skor 0.
Untuk mengatasi hal seperti itu perlu diketahui daya beda suatu tes, artinya
sejauhmana suatu tes mampu membedakan kemampuan anak / individu yang
masih dirasakan manfaatnya dalam bidang pendidikan. Ada beberapa sumber
menyebutkan bahwa daya beda (DB) yang baik adalah 0,40 ke atas dan 0,20 ke
atas. Dalam tulisan ini penulis cenderung menggunakan kedua-duanya, dengan
catatan bahwa penggunannya hendaknya memperhitungkan :
59
1. Tujuan pengajaran atau tujuan penggunaan tes, apakah untuk seleksi
siswa teladan, penerima beasiswa, untuk mengukur kemampuan
belajar akhir semester, ulangan harian atau hanya sekedar motivasi
belajar.
2. Bobot mata kuliah / bidang studi yang ditentukan oleh besarnya angka
kredit.
Berdasarkan pertimbangan di atas kita dapat memilih salah satu
diantaranya, misalnya tujuan pengukuran adalah memperoleh nilai raport akhir
semester (ulangan umum) untuk bidang studi mayor dengan kredit 4 maka daya
beda tes yang dipilih adalah 0,40 ke atas.
Langkah-langkah yang ditempuh mencari DB :
Adapun langkah-langkah yang ditempuh pada dasarnya sama, hanya
berbeda dalam rumus yang digunakan yaitu :
DB = ∑ (W L−W H )N
DB = Daya Beda
WL = Jumlah kelompok bawah yang menjawab salah
WH = Jumlah kelompok atas yang menjawab salah
N = Jumlah individu kelompok bawah dan atas (N = n1 + nh)
Skor yang diperoleh berdasarkan rumus di atas dibandingkan dengan skor
penolakan yang ditentukan tadi yaitu :
a. N ≥ 0,40 = baik (diterima)
N < 0,40 = kurang (ditolak)
b. N ≥ 0,40 = kurang (ditolak)
60
N < 0,20 = kurang (ditolak)
Contoh penggunaanya : (perhatikan tabel 01 dan tabel 02)
Daya beda (DB) dari masing-masing item dapat dicari dengan rumus
sebagai berikut :
DB = W L−W H
N
Item nomor 1 : DB = 1/12 = 0,08
Item nomor 2 : DB = 2/12 = 0,17
Item nomor 3 : DB = 2/12 = 0,17
Item nomor 4 : DB = 3/12 = 0,25
Item nomor 5 : DB = 5/12 = 0,42
Item nomor 6 : DB = 2/12 = 0,17
Item nomor 7 : DB = 6/12 = 0,50
Item nomor 8 : DB = 5/12 = 0,42
Item nomor 9 : DB = 6/12 = 0,50
Item nomor 10 : DB = 6/12 = 0,50
Item nomor 11 : DB = 5/12 = 0,42
Item nomor 12 : DB = 4/12 = 0,33
Item nomor 13 : DB = 2/12 = 0,17
Item nomor 14 : DB = 3/12 = 0,25
Item nomor 15 : DB = 1/12 = 0,08
Jika penolakan DB : 0,20, berapa item yang diterima? Sedangkan angka
penolakan DB : 0,40, Berapa item yang diterima?
61
3. Mencari Efektivitas Option
Berdasarkan analisa di atas, maka dapat diketahui item-item mana yang
memenuhi syarat dan item mana yang tidak memenuhi syarat. Item yang tidak
memenuhi syarat berarti perlu diadakan perbaikan atau revisi. Salah satu hal yang
perlu diketahui dalam mengadakan suatu revisi adalah efektivitas daripada
masing-masing option.
Langkah-langkah yang ditempuh menguji efektivitas option :
1. Menyusun tabel data
2. Menentukan kelompok atas dan bawah
3. Memasukkan data ke dalam tabel kerja
Tabel kerja dibuat sejumlah item yang akan diuji efektivitasnya.
KelompokOption
A B C D E
Atas
Bawah
4. Menarik kesimpulan (kesimpulan analisis)
Kesimpulan analisis didasarkan perbandingan data yang diperoleh dalam
penelitian dengan kreteria sebagai berikut;
a. Option Kunci
62
1. Jumlah pemilih kelompok atas dan bawah tidak kurang dari 25% tetapi
tidak lebih dari 75% atau
25% ≤ P ≤ 75% = efektif
P < 25% = tidak efektif
P > 75% = tidak efektif
2. Frekwensi pilihan-pilihan kelompok atas harus lebih banyak dari
kelompok bawah atau PKA > PKB
b. Option pengecoh (Distractor)
Jumlah pemilih kelompok atas dan bawah minimal 25% kali satu
perdua kali jumlah option pengecoh, kali jumlah kelompok atas ditambah
kelompok bawah.
PKA + PKB ≥ { 0,25 x 1
2 x x (n1 + n2) }
Keterangan :
0,25 = 255
x = jumlah option pengecoh
n1 = jumlah individu kelompok atas
n2 = jumlah individu kelompok bawah
PKA = jumlah pilihan kelompok atas
PKB = jumlah pilihan kelompok bawah
Contoh soal :
63
Misalnya murid yang dites sebanyak 50 orang, dengan bentuk tes piilhan
ganda 5 option. Untuk item nomor 1, option kuncinya adalah b, sedangkan
pengecohnya adalah a, c, d, dan e.
Setelah ditabulasi ke dalam tabel data, kemudian ditentukan 27% (0,27) kelompok
atas dan bawah yaitu masing-masing sebanyak 14 orang (dibulatkan) maka
diperoleh data sebagai berikut :
Penyebaran pilihan kelompok atas
Option a = 3 orang
Option b = 8 orang
Option c = 3 orang
Option d = 0 orang
Option e = 0 orang
Penyebaran pilihan kelompok bawah
Option a = 5 orang
Option b = 3 orang
Option c = 4 orang
Option d = 2 orang
Option e = 0 orang
Kemudian data dimasukkan ke dalam tabel kerja sebagai berikut :
KelompokOption
A B C D E
Atas 3 8 3 0 0
Bawah 5 3 4 2 0
Berdasarkan tabel di atas dapat diuji efektivitasnya sebagai berikut :
64
a. Option kunci (b)
Prosentase pilihan =8+3
n1+n2 x 100 %
=1128 x 100 %
= 39%
Kemudian diuji dalam rentangan : 25% ≤ P ≤ 75%
25% < 39% < 75%
39% < 25% atau
39% < 75%
Jadi option kunci efektif
Disamping itu jumlah pilihan kelompok atas lebih besar dari kelompok bawah
(PKA > PKB atau 8 > 3).
b. Option Pengecoh
1. Option a
PKA + PKB ≥ {0,25 x 1
2 X x (n1 + n2)}
3 + 5 ≥ {0,25 x 1
2 X 4 x (14 + 14)}
8 ≥ {0,25 x 18 x 28}
8 > 0,875
Jadi option a efektif
2. Option c
Berdasarkan rumus di atas maka diperoleh ;
7 > 0,85
65
Jadi option c efektif
3. Option d
Data yang diperoleh adalah 2 > 0,875 sehingga option d adalah efektif.
4. Option e
Dimana diketahui bahwa 0 < 0,875 sehingga option e tidak efektif.
4. Validitas Tes
Suatu tes dapat dikatakan valid jika tes tersebut betul-betul mengukur apa
yang hendak diukur. Apabila tes tersebut tidak mengukur apa yang hendak diukur
maka tes tersebut tidak dapat dipercaya. Menurut Sambas dkk.,(2007:30)
menyatakan bahwa suatu instrument pengukuran dikatakan valod jika instrument
dapat mengukur sesuatu dengan tepat apa yang hendak diukur. Ada dua jenis
validitas yaitu validitas logis (logical validity) dan validitas emperik (empirical
validity). Arikunto (1993:219) menjelaskan bahwa, validitas logis adalah validitas
yang dinyatakan berdasarkan hasil penalaran. Instrument dinyatakan valid apabila
telah dirancang dengan baik dengan mengikuti teori dan ketentuan lain seperti
model atau pola tertentu yang diikutinya.
Validitas emperik (empirical validity) adalah validitas yang didasarkan
atas hasil uji-coba (try out) terhadap responden. Jumlah responden yang
digunakan dalam uji-coba instrument minimal 30 orang, semakin besar jumlah
responden untuk uji-coba instrument semakin memberi peluang item-item tersebut
untuk valid. Sugiyono, 2006 (dalam Paramartha 2010:146) menyatakan bahwa
bila dalam penelitian akan melakukan analisis multivariat, maka jumlah anggota
sampel minimal 10 kali dari jumlah variabel yang diteliti. Sedangkan Nunnally
66
(dalam Fernandes,1984:14) dijelaskan, the sample of 300 to 400 students should
be drawn a broad range of schools as is possible. There should be at least five
times as many persons as items otherwise the results will be misleading. Jumlah
sampel yang besar antara 300 sampai 400 orang atau sedikitnya lima kali jumlah
butir dari suatu alat ukur akan memberi peluang yang lebih besar item atau butir
tersebut valid dan reliabel, dan sebaliknya sampel yang kecil kemungkinan
peluang untuk valid dan reliabel lebih kecil.
Validitas tes dapat ditinjau dari beberapa segi yaitu :
a. Content Validity (validitas isi)
Suatu tes dikatakan memiliki validitas isi apabila isi tes (soalan)
mencakup seluruh isi mata pelajaran yang akan diujikan. Salah satu cara yang
dapat ditempuh dengan cara ini adalah menyusun tabel kisi-kisi soal
(Perhatikan tabel kisi-kisi soal di depan).
b. Creterion – related validity
Creterion – related validity suatu validitas ditinjau dari segi hubungan
dengan alat pengukur lain yang dipandang sebagai kreteria atau pedoman
untuk menentukan validitas suatu tes.
Dilihat dari kreteria yang diguankan maka creterion related ini dapat
dibedakan menjadi dua yaitu :
1. Concurent validity (validitas bandingan)
Yaitu suatu validitas yang dapat dilihat dari hasil korelasi antara
dua buah tes yaitu tes yang dicari validitasnya dengan tes yang telah
dimiliki kriteria validitas yang diberikan kepada testee dalam waktu yang
bersaman (perbedaan waktu pelaksanaan tes tidak boleh terlalu jauh atau
67
lama) misalnya : tes yang dibuat oleh guru kelas, sedangkan kreteria
pembandingnya adalah tes PMP yang telah diakui memiliki validitas.
Kemudian kedua tes tersebut dalam waktu bersamaan atau berselang satu
hari diberikan kepada sekelompok individu, kemudian hasilnya
dikorelasikan. Koefisien korelasi menunjukkan valid tidaknya tes.
2. Predictive Validity (validitas ramalan)
Suatu tes dapat dikatakan memiliki validitas ramalan apabila
prestasi yang dicapai oleh tes tersebut dapat meramalkan keberhasilan
untuk yang akan datang, misalnya alat ukurnya adalah tes seleksi masuk
SMA, sebagai tes yang dicari validitasnya, dikorelasikan dengan indeks
prestasi belajarnya di SMA sebagai kriterianya. Koefisien korelasinya,
menunjukkan sejauhmana tes tersebut memiliki validitas ramalan.
Jenis korelasi seperti (c.1 dan c.2) didasarkan atas perhitungan-
perhitungan yang bersifat empiris, sehingga sering disebut validitas
empiris.
Skema Validitas
a. content validity
Valdity b. contruct validity 1. Concurrent validity
c. cretarion validity 2. Predictive validity
Menghitung validitas Instrumen Tes dengan Menggunakan Excel
68
1. Menyebarkan tes kepada responden, tentukan jumlah responden minimal
30 orang (semakin banyak semakin baik). Pada saat penyebaran tes
diusahakan responden tidak bekerjasama dengan lainnya agar hasil yang
diperoleh menggambarkan kemampuan peserta didik (objektif).
2. Memeriksa hasil tes.
3. Memasukkan data ke dalam table kerja (lihat table terlampir).
Tabel Kerja Untuk Analisis Validitas Butir
RpdnNomor Butir
Jumlah1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 1 1 1 1 1 0 92 1 1 1 1 1 1 0 1 1 1 93 1 1 1 1 1 1 0 1 1 1 94 1 1 1 1 1 1 1 1 1 0 95 1 1 1 1 0 1 1 1 1 0 86 1 1 0 1 0 1 1 1 1 0 77 1 1 1 0 1 0 1 1 0 1 78 1 1 1 0 0 1 1 1 0 0 69 1 1 1 1 1 0 1 1 1 0 8
10 0 1 1 0 1 1 0 0 1 1 611 1 1 1 1 1 1 1 0 1 1 912 1 1 0 1 0 1 1 1 0 0 613 1 0 0 1 1 1 0 1 0 0 514 1 1 1 0 0 0 1 0 0 0 415 0 0 0 1 0 0 1 1 0 0 316 0 0 1 0 0 1 0 1 1 1 517 0 0 0 1 1 1 1 1 1 0 618 1 1 0 0 1 0 0 1 1 0 519 1 0 0 1 1 0 1 0 1 0 520 0 0 0 1 0 1 1 1 0 0 4
pi 0.7500.70
0 0.6000.70
0 0.6000.70
0 0.700 0.8000.65
0 0.300
qi 0.2500.30
0 0.4000.30
0 0.4000.30
0 0.300 0.2000.35
0 0.700
Mi 7.0677.28
6 7.4176.92
9 7.2507.00
0 6.500 6.6257.30
8 7.500
Mt 6.5006.50
0 6.5006.50
0 6.5006.50
0 6.500 6.5006.50
0 6.500
SD 1.9331.93
3 1.9331.93
3 1.9331.93
3 1.933 1.9331.93
3 1.933
69
r-pbi 0.5080.62
1 0.5810.33
9 0.4750.39
5 0.000 0.1290.56
9 0.339
r-t 0.4440.44
4 0.4440.44
4 0.4440.44
4 0.444 0.4440.44
4 0.444St btr Valid Valid Valid drop Valid drop drop drop Valid drop
Langkah-langkah analisis butir menggunakan fasilitas excel, ada 9 (sembilan)
langkah yang harus diikuti yaitu:
1. Mencari jumlah skor masing-masing responden:
tempatkan kursor pada cel terakhir (L3) kemudian ketik =SUM(B3:K3)
tekan enter
tekan ctrl kemudian drag kursor dari responden ke 1 sampai terakhir
kemudian lepas secara bersamaan.
2. Mencari proporsi butir ke-i (pi) yaitu butir yang dijawab benar:
tempatkan kursor pada cel B23 kemudian ketik =SUM(B3:B22)/20
tekan enter
Blok cel B23 sampai K23, kemudian tekan
Ctrl-R. Catatan angka 20 adalah jumlah responden (N)
3. Mencari proporsi qi yaitu butir yang dijawab salah:
Tempatkan kursor pada cel B24 kemudian ketik =1-B23
Tekan enter
Blok cel B24 sampai cel K24
Tekan Ctrl-R
4. Mencari rerata butir ke-i (Mi)
Tempatkan kursor pada cel B25 kemudian ketik
=SUMIF(B3:B22,">0",$L$3:$L$22)/SUMIF(B3:B22,">0")
Tekan enter
70
Blok cel B25 sampai K25
Tekan Ctrl-R
5. Mencari rerata total (Mt)
Tempatkan kursor pada cel B26 kemudian ketik
=AVERAGE($L$3:$L$22)
Tekan enter
Blok cel B26 sampai K26
Tekan Ctrl-R
6. Mencari Standar Deviasi (SD)
Tempatkan kursor pada cel B27 kemudian ketik
=STDEV($L$3:$L$22)
Tekan enter
Blok cel B27 sampai K27
Tekan Ctrl-R
7. Menghitung koefisien korelasi point biserial (r-pbi)
Tempatkan kursor pada cel B28 kemudian ketik
=((B25-B26)/B27)*(SQRT(B23/B24))
Tekan enter
Blok cel B28 sampai K28
Tekan Ctrl-R
8. Menentukan koefisien r-kritis
Cari r-kritis pada table r-product moment dengan N = 20. Ada dua
jenis nilai t-tabel yaitu untuk signifikansi 5% (0,05) dan 1% (0,01).
71
Pilih salah satu, yang 5% lebih rendah dari 1%. Berikut dipilih 5%
maka diperoleh r-t sebesar 0,444 kemudian ketik pada cel B29
Blok cel B29 sampai K29
Tekan Ctrl-R
9. Menentuka status butir
Tempatkan kursor pada cel B30 kemudian ketik
=IF(B28>B29,"Valid","drop")
Lalu tekan enter
Blok cel B30 sampai K30
Terakhir tekan Ctrl-R
Pertanyaan:1. Sebutkan butir/item tes yang valid dan drop!2. Mengapa item/butir tes tersebut valid atau drop?3. Apa tindakan kita terhadap butir/item yang drop?
Tugas 1. Buatlah 25 tes prestasi belajar objektif dengan 5 option dan bobot
masing-masing 1 (satu).2. Analisislah validitas item-itemnya!
4. Reliabilitas Tes
Reliabilitas suatu tes adalah keajegan atau konsistensi dari instrument,
artinya jika instrument/tes tersebut diteskan terhadap suatu objek yang sama pada
waktu yang berbeda maka hasilnya akan tetap sama (ini disebut konsiten).
Sambas, dkk (2007:37) menjelaskan bahwa, uji reliabilitas instrument dilakukan
72
dengan tujuan untuk mengetahui konsistensi dari instrument sebagai alau ukur,
sehingga hasil suatu pengukuran dapat dipercaya. Dwi Endra Suanthara (2009:60)
menyatakan bahwa, suatu tes dikatakan reliabel apabila mantap, kemantapan
mana dapat diihat dari beberapa segi yaitu:
1. Sebagai kemantapan hasil mengukur ulangan dengan tes yang sama, yang
menghasilkan indeks stabilitas.
2. Sebagai kemantapan hasil mengukur dengan dua tes yang paralel, yang
dianggap sama yang menghasilkan indeks ekuialensi atau kesamaan.
3. Kemantapan hasil mengukur dari amsing-masing soal dihubungkan
dengan kemantapan tes secara keseluruhan yang menghasilkan indeks
konsistensi internal.
Reliabel sering disebut “dapat dipercaya” atau ajeg atau sama dengan
konsistensi (consitency). Cara yang digunakan untuk menyelidiki reliabilitas suatu
teks adalah sama yang digunakan dalam waktu yang berbeda, atau antara alat
pengukur yang setara, atau antar bagian-bagian alat ukur yang sama yang
digunaakn dalam waktu yang sama.
Pada umumnya cara-cara penyelidikan reliabilitas itu dapat dibedakan
menjadi tiga macam yaitu : 1) metode tes ulang, 2) metode bentuk sejajar, 3)
metode belah dua.
1. Metode Tes Ulang (Test resest method)
Dalam metode ini tes yang sama diberikan kepada suatu kelompok yang
sama dalam dua kesempatan yang berlainan. Misalnya : minggu pertama tes
diberikan kepada kelompok / kelas A, kemudian beberapa minggu berikutnya
diberikan tes pertama dikorelasikan dengan hasil tes kedua. Koefisien korelasi
73
antara skor-skor tersebut diuji dengan nilai-nilai r-standar. Kemungkinan hasil
pengujian adalah sebagai berikut :
rh ≥ r1 (ts = 0,01) → sangat reliabel
rh ≥ rt (ts = 0,05) → reliabel
rh < rt (ts = 0,05) → tidak reliabel
2. Metode Bentuk Sejajar (pararel–form method, equivalent method)
Dalam metode ini digunakan dua tes yang sejenis atau equivalen, baik dari
segi isi, bentuk (form) maupun aspek-aspek lainnya. Kedua tes ini diberikan
kepada kelompok subyek tanpa adanya tenggang waktu (waktu bersamaan). Skor
yang diperoleh dari kedua tes tersebut dikorelasikan.
3. Metode Belah Dua (Split – half)
Metode ini sebenarnya metode satu kali tes. Sebab metode belah dua berasal
dari satu tes yang dibelah dua. Sehingga tes yang diteliti reliabilitasnya dianggap
dua tes.
Cara yang digunakan dalam membelah dua adalah:
a. Cara nomor ganjil dan genap, artinya item yang bernomor ganjil
dikelompokkan menjadi satu bagian dan yang bernomor genap
dikelompokkan menjadi bagian kedua.
b. Cara randomisasi, artinya dapat menggunakan cara-cara random seperti : lotre
atau undian bilangan random.
Setelah tes terbelah dua dengan menggunakan salah satu cara di atas
kemudian dikorelasikan. Koefisien korelasinya akan menunjukkan reliabilitas
setengah tes. Untuk mencari reliabilitas seluruh tes dapat digunakan rumus
Spearman Brown sebagai berikut :
74
rn N . r1.2
1+(N−1)r1.2
Keterangan :
rn = koefisien korelasi seluruh tes
N = perbandingan antara panjang tes seluruhnya dengan panjang tes yang
dikorelasikan.
R1.2 = koefisien korelasi antara sebagian tes dengan bagian tes lainnya.
Contoh :
Suatu tes terdiri 60 item. Secara random diambil 30 item sebagai
kelompok atau belahan pertama dan 30 item berikutnya sebagai belahan kedua.
Skor-skor yang diperoleh antara kedua tes tersebut adalah 0,996.
Berapakah koefisien korelasi seluruh tes?
Adalah sebagai berikut :
Rn = N .r1.2
1+(N−1)r1.2
=
6030 x0,996
1+( 6030
−1)x 0,996
= 1,9921,996
= 0,998
Nilai rn = 0,998 kita uji, sedangkan N yang diperhitungkan adalah N dari masing-
masing belahan yaitu 30
rh ≥ rt (ts =0,01) → sangat reliabel
75
0,998 > 0,463 (ts = 0,01) → sangat reliabel
Metode belah dua ini mempunyai kelemahan-kelemahan karena mungkin
faktor penyebabnya adalah :
1. Derajat kesuakran (DK) dari masing-masing item tidak seimbang
2. Isi soal mungkin tidak seimbang antara belahan pertama dengan belahan
kedua
3. Kemungkinan item-item yang belekangan tidak dikerjakan dengan waktu yang
sama seperti item-item pada awal tes.
Untuk mengatasi kekurangan tersebut penulis cenderung menggunakan
metode analisis dengan teknik korelasi Kuder-Richardson 20 (KR-20). Sebab KR
– 20 pada pokoknya menunjukkan homoginitas soal-soal yang terdapat dalam tes
yang bersangkutan.
Adapun rumus KR – 20 adalah :
r – KR – 20 = nn−1
xSD1
2−∑ p . qSD1
2
Keterangan :
n = banyaknya item dalam tes
SDt = standar deviasi skor keseluruhan dari peserta tes
p = propoinsi individu peserta tes yang menjawab benar atau untuk setiap
soal, dicari dengan jumlah penjawab benar dibagi jumlah peserta tes atau
p =jumlah penjawab benarjumlah peserta tes(N)
76
q = propinsi penjawab tidak benar atau bisa diperoleh dengan jalan : q = (1 –
p)
Misalkan suatu evaluasi belajar yang terdiri dari 60 soal, diberikan kepada
siswa SPG Negeri Singaraja kelas III sebanyak 85 orang, setelah diperiksa dengan
teliti, kemudian dicari pq dan SDt diperoleh :
Pq = 12,34
SDt = 8,50
Maka koefisien korelasi r – KR – 20 dapat dicari :
R – KR – 20 = n
n−1x
SD12−∑ p . q
SD12
= 6060−1
x (8,50)2−12,34(8,50)2
= 6059
x 72,25−12,3472,25
= 6059
x 59,9172,25
= 1,017 x 0,829
= 0,843
Kesulitan yang nampak dalam menggunakan rumus di atas aalah dalam
pq, sebab setiapitem kita harus mencari p dan q. terlebih-lebih bila item tes dan
peserta tes terlalu banyak. Sehubungan denan hal itu digunakan rumus lain yang
merupakan taksiran terhadap rumus KR – 20 :
r. est . KR – 20 = n . SDt
2−X t (n−X t )SDt
2(n−1)
77
Keterangan :
r . est. KR – 20 = estimasi terhadap r . KR – 20
n = banyaknya item dalam tes
Xt = angka rata-rata skor keseluruhan tes
(Baca pengukuran dan penilaian pendidikan oleh T. Raka Joni, hal 95, th. 1977)
Misalkan soal dalam contoh di atas tadi, setelah dicari SDt dan Xt diperoleh data
sebagai berikut : Xt = 26,70
SDt = 8,50
Dengan menggunakan rumus di atas dapat dianalisa :
r. est . KR – 20 = n . SDt
2−X t (n−X t )SDt
2(n−1)
= 60.(8,50)2−26,70(60−60,70)
(8,50)2(60−1)
= 60 (72,25 )−26,70(33,33)
(72,25 )(59)
= 4335−889,11
4262,75
= 0,808 (diuji dengan nilai r – tabel)
Menghitung Reliabilitas Menggunakan Excel
Dalam analisis reliabilitas menggunakan excel kita harus menyiapkan data yang
diperoleh dari hasil uji coba tes (sama dengan uji validitas di atas). Perhatikan
table kerja berikut:
78
Resp Nomor Butir Jumlah1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 1 1 1 1 1 1 10
2 1 1 1 1 1 1 1 1 1 1 10
3 1 1 1 1 1 1 1 1 1 1 10
4 1 0 1 1 1 1 1 1 1 0 8
5 1 1 1 0 1 1 1 1 1 0 8
6 1 1 0 1 1 1 1 1 1 0 8
7 1 0 0 0 1 1 1 1 1 1 7
8 1 1 1 0 1 1 1 1 1 0 8
9 1 1 1 0 1 1 1 1 1 0 8
10 1 1 1 0 1 1 1 1 1 0 8
11 1 0 0 0 1 1 1 1 1 1 7
12 1 0 0 0 1 1 1 1 1 0 6
13 1 1 1 0 1 1 1 1 1 0 8
14 1 1 1 0 1 1 1 1 0 0 7
15 0 0 1 1 1 0 1 1 1 0 6
16 1 1 1 1 1 1 1 1 1 0 9
17 1 1 1 0 1 1 1 1 1 0 8
18 1 0 0 0 1 1 1 1 0 1 6
19 1 1 1 0 1 1 1 1 0 0 7
20 1 1 0 0 1 1 1 1 1 0 7
21 0 1 1 0 0 0 0 0 1 0 3
22 1 1 0 1 0 1 0 0 1 0 5
k 10
vartot
2.7359
3
p
0.9090
90.72727
0.6818
2
0.36364
0.9091
0.9090
90.9091
0.90909
0.86364
0.27273
q
0.0909
10.27273
0.3181
8
0.63636
0.0909
0.0909
10.0909
0.09091
0.13636
0.72727
pq
0.0826
40.19835
0.2169
40.2314
0.0826
0.0826
40.0826
0.08264
0.11777
0.19835
∑ p*q
1.3760
31.29339
1.0950
40.8781
0.6467
0.5640
50.4814
0.39876
0.31612
0.19835
79
KR-20
0.5522
8
Langkah-langkah menghitung reliabilitas perangkat tes:
1. Mencari jumlah skor masing-masing responden:
Tempatkan kursor pada cel terakhir (L3) kemudian ketik =SUM(B3:K3)
Tekan enter
Tekan ctrl kemudian drag kursor dari responden ke 1 sampai terakhir
kemudian lepas secara bersamaan.
2. Tuliskan k pada cel A25 kemudian ketik jumlah item/butir pada cel B25
3. Menghitung varian total
Pada cel B26 ketik =VAR(L3:L24)
Tekan enter
4. Menghitung p dengan cara:
Pada cel B27 tulis =SUM(B3:B24)/22. Angka 22 adalah jumlah
sampel/responden.
Blok cel B27 sampai K27
Tekan Ctrl-R
5. Menghitung q:
Pada cel B28 tuliskan = 1-B27
Tekan enter
Blok cel B28 sampai K28
Tekan Ctrl-R
6. Menghitung pq dengan cara:
Pada cel B29 tuliskan =B27*B28
80
Tekan enter
Blok B29 sampai K29
Tekan Ctrl-R
7. Menghitung sigma pq
Pada cel B30 tuliskan =SUM(B29:K29)
Tekan enter
Blok cel B30 sampai K 30
Tekan Ctrl-R
8. Menghitung koefisien KR-20:
Tuliskan pada cel B31 =(B25/(B25-1))*((B26-B30)/(B26))
Tekan enter
Koefisien KR-20 menunjukkan reliabitas perangkat tes yaitu 0.55228. untuk
menentukan derajat reliabilitas digunakan kriteria sebagai berikut.
Koefisien Reliabilitas Klasifikasi
0,80 ≥ 1,00 Sangat Tinggi
0,60 ≥ 0,80 Tinggi
0,40 ≥ 0,60 Sedang
0,20 ≥ 0,40 Rendah
0 ≥ 0,20 Sangat rendah
Dimodifikasi dari (Koyan, 2011:136)
Jadi reliabilitas perangkat tes di atas tergolong sedang (0,55).
Tugas
81
Buat perangkat tes prestasi belajar dengan jenis tes objektif sebanyak 25 item dengan option adalah 5 (a,b,c,d,e) dan bobot masing-masing item adalah 1.
ANALISIS VALIDITAS DAN RELIABILITAS TES MENGGUNAKAN
SPSS
Disamping menggunakan program excel dapat juga digunakan bantuan program
Statistical Product and Service Solution (SPSS). Program ini terus mengalami
perubahan nama seperti SPSS for Windows 10.0, berubah menjadi SPSS for
Windows 11,0, SPSS for Windows 12,0 dan setrusnya sekarang sudah SPSS for
Windows 17,0. Perubahan nama tersebut tidak mempengaruhi tatacara
pengoprasiannya.
Langkah-langkah kerja sbb:
1. Siapkan program SPSS pada layar computer anda dengan tampilan sbb.
82
2. Kelik variable view kemudian tuliskan nama butir atau item semua
tes/instrument, kemudian lanjutkan kelik menu data variable. Pada data
variable isikan data yang diambil dari table kerja validitas atau reliabilitas
instrument. Maka akan tampak tampilan sbb.
3. Klik menu Analyze, Scale, Reliability Analysis, maka tampak seperti
tampilan berikut.
Masukkan semua item yang ada pada kotak sebelah kiri ke dalam kotak
yang ada disebelah kana,
83
4. Pilih Alpha pada kotak bagian bawah
5. Pilih menu statistic, beri tanda chek (√) pada kotak dialog: Item, Scale,
Scale if item deleted, kemudian Continue, lalu OK. Kemudian muncul
Output:
Output SPSS
6. Uji Validitas
84
Untuk menafsirkan hasil uji validitas, kriteria yang digunakan adalah:
a. Jika koefisien r-hitung (rh) > dari nilai r-tabel (rt) maka item tersebut
dinyatakan valid.
b. Jika koefisien r-hitung (rh) < dari nilai r-tabel (rt) maka item tersebut
dinyatakan drop (tidak valid), item seperti ini tidak dapat digunakan
atau harus diganti. Dalam pengujian dapat digunakan taraf signifikansi
1% (0,01) atau 5% (0,05). Koefisien r-tabel dapat dilihat pada table
tentang Nilai-nilai r Product Moment, dengan N adalah 20.
7. Menafsikan hasil analisis SPSS
a. Validitas
Rekap hasil analisis validitas dengan bantuan program SPSS dapat ditulis
pada table di bawah ini.
Tabel Rekap Hasil Analisis Validitas Tes Prestasi Belajar
No. Item r-hitung (rh)
r-tabel (rt)(1%)
r-tabel (rt)(5%)
Keterangan
1 0,955**) 0,651 0,444 Valid2 0.948**) 0,651 0,444 Valid3 0,942**) 0,651 0,444 Valid4 0,938**) 0,651 0,444 Valid5 0,934**) 0,651 0,444 Valid6 0,931**) 0,651 0,444 Valid7 0,931**) 0,651 0,444 Valid8 0,929**) 0,651 0,444 Valid9 0,929**) 0,651 0,444 Valid10 0,934**) 0,651 0,444 Valid
Catatan: **) Valid untuk 1% dan 5%.
b. Reliabilitas
Menafsikan reliabilitas hasil analisis SPSS, kriteria yang digunakan
adlah:
85
a) Jika koefisien Alpha > dari koefisien r-tabel maka tes/instrument
tersebut dinyatakan reliable.
b) Jika koefisien Alpha < dari koefisien r-tabel maka tes/instrument
tersebut dinyatakan tidak reliable.
Semakin tinggi koefisien reliabilitas semakin baik tes/instrument tersebut.
Berdasarkan analisis di atas dengan taraf signifikansi 5% diketahui r-alpha
sebesar 0,944 > 0,444 (rt) maka tes/instrument tersebut reliable.
86
BEBERAPA ISTILAH PENTING DALAM PENGUKURAN DAN
PENILAIAN PENDIDIKAN
1. Ability : kemampuan mengerjakan sesuatu dengan stimulasi yang diberikan,
kemampuan ini bisa bersifat potensial atau aktual, bersifat keturunan maupun
diperoleh karena sesuatu proses belajar, yang penting kemampuan tersebut
telah ada pada saat pengukuran dilaksanakan.
2. Achievment Test : tes yang mengukur prestasi seseorang dalam sesuatu
bidang sebagai hasil proses belajar yang spesifik yang disengaja, biasanya
dalam bentuk pengetahuan dan atau keterampilan.
3. Arithmetic Mean : rata-rata hitung, yaitu rata-rata yang diperoleh dengan
menjumlahkan semua scores dalam sesuatu kelompok dan kemudian membagi
jumlah tersebut dengan banyaknya scores dalam kelompok itu.
4. Battery : sejumlah tes yang disatukan dan distandardisir kepada sesuatu
kelompok, kadang-kadang juga dipergunakan untuk menunjuk kepada
sejumlah tes yang diberikan bersama-sama meskipun tes-tes tersebut
distandardisir pada kelompok yang berlain-lainan.
5. Ceiling : Batas ata (plafond) daripada kemampuan yang terukur oleh sesuatu
tes.
6. Coefficient of Correlation : ukuran atau indeks yang menunjukan seberapa
jauh dua variabel atau lebih berubah, baik searah maupun berlawanan,
bersama-sama, perubahan pada variabel yang satu disertai oleh perubahan
pada variabel yang lain.
87
7. Correction for guessing : pengukuran score (nilai hukuman) untuk setiap
kesalahan yang diperbuat testee, yang dihukum sebenarnya bukan penerkaan
akan tetapi jawaban yang salah, terlepas daripada sebab-sebab mengapa
kesalahan tersebut diperbuat.
8. Creterion : suatu standar, ukuran, patokan atau pertimbangan yang
dipergunakan sebagai pembanding, baik secara kwantitatif maupun kwalitatif,
scores, hasil rating dan sebagainya yang diramalkan dalam penyelidikan
tentang tes.
9. Difficulty level : Tingkatan kesukaran sesuatu soal atau item, umumnya
dinyatakan dalam % - tase testee yang menjawab item tersebut dengan benar
bisa disimpulkan P, bisa juga dinyatkan dalam bentuk terstandardisir berupa
delta ( )
10. Discrimination power : kemampuan sesuatu item membedakan testee yang
berprestasi tinggi dari yang berprestasi rendah, biasa dinyatakan dalam bentuk
%-tase perbedaan jumlah anggota kelompok atas dengan anggota kelompok
bawah yang benar menjawab item tersebut, biasa disimpulkan D. Cara linnya
adalah dalam bentuk r-biserial yang menunjukkan kecenderungan testee yang
mempunyai prestasi tinggi menjawab sesuatu item tertentu dengan benar.
11. Distribution (frequency distribution ) : Tabulasi pencaran score dari yang
tinggi sampai dengan yang rendah atau sebaliknya darimana bisa dilihat
jumlah testee yang mencapai masing-masing score.
12. Equivalent form : bentuk yang ekuivalent yaitu keparalelan dua atau lebih tes
dengan isi serta tingkatan kesukaran sama sehingga kalau diberikan kepada
satu kelompok, maka akan menghasilkan pencaran scores yang serupa.
88
13. Halo effect : pemihakan (bias) dalam penilaian yang disebabkan oleh karena
ikut dieprtimbangkan hal-hal lain yang tidak termasuk dalam acara penilaian
yang sebenarnya.
14. Item Analysis : proses penilaian soal-soal (items) secara individual atau satu
persatu, yaitu dalam arti menemukan bagaiamna sesuatu soal berfungsi ketika
dicobakan pada kelompok testee. Proses ini biasanya menghasilkan indeks
tentang tingkatan kesukaran serta kemampuan diskriminasi masing-masing
soal tersebut. Kriteria untuk menentukan keberhasilan atau ketidakberhasilan
testee umumnya diambil berdasarkan total scores masing-masing testee.
15. Kuder-Richarson Formula (s) : Rumus untuk menghitung reliabilitas suatu tes
berdasarkan informasi tentang masing-masing item mean SD dan banyaknya
item dalam suatu soal, tidak cocok untuk tes yang “speeded”
16. Multiple-choice item : sekumpulan jenis-jenis soal dimana testee harus
memilih satu atau lebih dai kesemua alternatif jawaban yang disediakan untuk
masing-masing soal.
17. Normal distribution : suatu distribusi teoritis yang didasarkan kepada teori
“kebetulan”, dinamakan juga kurva normal yang apabila dilukiskan, mean,
median serta modenya berhimpit. Banyak pecahan sifat-sifat biologis
(misalnya tinggi badan) dan psikologis (misalnya intelligensi) yang
mempunyai sifat-sifat seperti pencaran yang dilukiskan oleh kurva ini.
18. Power Test : suatu tes untuk mengukur tingkatan kemampuan, bukan
kecepatan me-respons, oleh karena itu batas waktunya longgar sekali.
89
19. Random sample : pengambilan sampel dimana masing-masing anggota sampel
memperoleh kesempatan yang sama besar dan tetap untuk terpilih sebagai
anggota sample tersebut.
20. Range : Perbedaan antara score yang tertinggi dengan yang terendah dalam
suatu kelompok.
21. Reliability : kemantapan hasil mengukur suatu tes, besar kecilnya kesalhaan
mengukur dinyatakan dengan koefisien korelasi.
22. Representative sample : sampel yang menyerupai populasi dalam ciri-ciri
yang akan diselidiki.
23. Practice effect : pengaruh pengalaman dengan suatu tes yang bersifat
menguntungkan testee dalam mengerjakan tes itu untuk kedua kalinya 9atau
tes lain yang bersamaan dengan tes yang pertama.
24. Sampel : sejumlah kecil individu-individu yang diambil dari keseluruhan
individu serupa yang ada dan mungkin serta pernah ada, dalam penyelidikan
sampel untuk mewakili kelompok yang lebih besar yang dinamakan populasi.
25. Spearman – Brown formula : Rumus yang menyatakan hubungan antara
reliability sesuatu tes dengan banyaknya item dalam tes tersebut, biasanya
dipergunakan untuk menaksir reliability yang diperoleh dengan teknik
splithalf.
26. Speed test : suatu tes dimana yang dipentingkan adalah kecepatan bekerja
biasanya diukur dalam bentuk banyaknya satuan tugas yang biasa diselesaikan
dalam suatu satuan waktu tertentu.
27. Split-half coeficient : koefisien reliabilitas yang diperoleh dengan membagi
tes menjadi dua sub tes yang diperkirakan pararel atau equivalent, biasanya
90
dengan mengumpulkan soal-soal bernomor genap disatu pihak dan soal-soal
bernomor ganjil di pihak lain.
28. Standard deviation (SD) : Indeks yang menyatakan banyak sedikitnya score
menyimpang dari mean, semakin score cenderung berdekatan dengan mean,
semakin kecil pula SD.
29. Validity : ukuran sejauh mana suatu tes mengukur apa yang hendak diukur
30. Variability : kecenderungan scores untuk menyimpang dari mean, biasa
dinyatkan dalam standar deviation, range, atau quartile deviation.
31. Variable : sesuatu yang berubah, yaitu barang, faktor atau dimensi yang
diukur.
91
SOAL-SOAL
I. Kerjakan dengan teliti dan Benar!
1. Sekelompok siswa SMA diberikan tes subyektif, masing-masing : benar –
salah 25 dengan bobot 1, pilihan ganda 40 dengan bobot 1, menjodohkan 15
dengan bobot 1 dan melengkapi dengan bobot 2. Tes tersebut dikerjakan
dengan baik, setelah diperiksa salah seorang siswa yaitu Arma memperoleh
hasil sebagai berikut : benar-salah dikerjakan dengan betul sebanyak 20 yang
lainnya tidak dikerjakan, pilihan ganda salah 2, menjodohkan betul 10 dan
melengkapi salah pada nomor-nomor ganjil.
Hitunglah : skor standar yang diperoleh Arma, jika digunakan PAP skala 11
dan 5
2. Diketahui data sebagai berikut :
a. Hasil seleksi masuk STKIP AH Singaraja
12
21
18
17
24
14
19
14
17
28
20
18
36
23
17
21
30
31
14
16
32
26
23
22
34
25
17
20
18
20
92
b. Nilai akademik semester genap siswa STKIP AH Singaraja
25
24
32
26
19
18
23
20
20
17
18
27
26
16
18
22
23
30
31
32
36
38
21
19
13
19
27
19
23
14
c. Skor mentah midel tes Pendidikan Agama Hindu
46
37
50
42
34
44
39
24
49
30
11
38
32
40
35
28
31
38
58
45
36
20
21
27
43
17
15
41
35
24
3. Hitunglah skor standar dengan PAN skala 11 dan 5, dan 2.a, kemudian
tentukan berapa orang yang lulus
4. Hitunglah persentil masing-masing skor (data 2.b)
5. Rubahlah data kwantitas (2.c) ke dalam data kwalitas berjenjang, klasifikasi :
tiga dan lima
6. Ujilah validitas tes yang digunakan untuk mengumpulkan data (2.a dengan
2.b). Golongkan jenis mana validitasnya.
93
DAFTAR PUSTAKA
Arikunto,. 1993. Dasar-dasar Evaluasi Pendidikan. Yogyakarta: Bumi Aksara. Jakarta.
Buning, James L, 1977. Compulational Hand Book of Statistics. Second Edition. Ohio University: United States of America.
Departemen Pendidikan dan Kebudayaan Direktorat Jenderal Pendidikan Dasar dan Menengah. 1984. Kaedah Bahasa Indoneia Dalam Penulisan Soal Tes Prestasi Belajar.
Dantes, I Nyoman. 1981. Beberapa Contoh Tentang Pembuktian Normalitas Data. Singaraja : FIP UNUD.
Fernandes, H.J.X. 1984. Testing and Measurement. Jakarta : National Education Planning Evaluation and Curriculum Develepoment.
Guilford, J.P. 1973. Fundamental Statistics in Psychology and Education. Sydney: McGraw-Hill, LTD.
Nana Sudjana, 2001. Penilaian Hasil Belajar Mengajar. Bandung: PT. Remaja Rosdakarya.
Nurkancana, Wayan, PPN Sunartana. 2000. Evaluasi Pendidikan. Surabaya: Usaha Nasional.
Nurkancana, Wayan. 1983. Penyusunan dan Analisis Tes. Makalah Disampaikan dalam Penetepan Dosen Kopertis Wilayan VIII Denpasar.
Netra, Ida Bagus. 1979. Statistik Inferensial. Singaraja: Biro Penerbitan FIP UNUD.
Purwanto Ngalim. 1985. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung: Remaja Karya CV.
Puskom IKIPN Singaraja, 2005. Pedoman Praktikum Aplikasi Komputer, Kalibrasi Instrumen, Pengolahan Data.
Raka Joni T. 1979. Pengukuran dan Penilaian Pendidikan. Malang: Bank Evaluasi IKIP Malang.
Stenly IC. 1964. Measurement in Today’s School. Englewood Cliffs Inc.
Sumady Suryabrata. 1984. Pengukuran dan Evaluasi Pendidikan. Yogyakarta: UGM.
94
Suprapto. 1982. Pedoman Penyusunan Tes Prestasi Belajar. Jakarta: P2LPTK-PS. I.
Siahaan, dkk. 1992. Taksonomi Tujuan Pendidikan Aspek Kognitif. Jakarta: P2LPTK-PS.I.
Suanthara, DE.NGH. 1988. Teori Pengukuran dan Penilaian Pendidikan. Diktat. Singaraja: STKIP AH.
95
KATA PENGANTAR
Berkat rahmat Tuhan Yang Maha Esa, Ida Sang Hyang Widhi Wasa yang
dilimpahkanNya kepada kami sehingga kami dapat menyusun materi pengajaran
perkuliahan ini dalam waktu yang relatif singkat.
Ada beberapa hal yang mendasar yang dapat mendorong kami untuk
mencoba menyusun materi perkuliahan ini antara lain :
1. Perguruan Tinggi Swasta (STKIP AH) Singaraja, sangat miskin akan
bahan bacaan yang dapat menunjang kesuksesan studi mahasiswa.
2. Terbatasnya literatur yang dapat digunakan atau dibaca oleh mahasiswa,
khususnya dalam mata kuliah Teori Pengukuran dan Penilaian Pendidikan.
Sampai saat ini literatur yang dapat dijadikan pedoman oleh mahasiswa
pada perpustakaan STKIP AH Singaraja hanya “Evaluasi Ilmu
Pendidikan” oleh Drs. Wayan Nurkancana dan Drs. PPN Sunarthana
dalam jumlah yang sangat sedikit.
3. Sebagai konsekwensi di atas maka mau tidak mau mahasiswa banyak
belajar dari catatan hasil kuliah. Sudah dapat dibayangkan jika catatan
kuliah mereka tidak teratur atau semrawut, maka mereka akan mengalami
kesulitan.
Bertitik tolak dari ketiga hal diatas kami membukukan materi perkuliahan
ini agar dapat dijadikan pedoman untuk mencapai tujuan minimal dalam
perkuliahan ini.
96
Kami menyadai bahwa keterbatasan selalu ada pada diri kami, sehingga
segala kritik yang membangun sangat kami hargai.
Terimakasih
Penyusun
97
DAFTAR ISI
Halaman
KATA PENGANTAR......................................................................................
DAFTAR ISI.....................................................................................................
BAB I. FUNGSI PERGURUAN DAN PENILAIAN DALAM
PENDIDIKAN
1. Pengertian Pengukuran dan Penilaian........................................
2. Latar Belakang Pengukuran dan Penilaian dalam Pendidikan...
3. Tujuan Pengukuran dan Penilaian Pendidikan...........................
BAB II BEBERAPA HAL YANG PERLU DIPERHATIAKN DALAM
MENYUSUN ITEM TES
1. Pengertian Tes............................................................................
2. Jenis Tes.....................................................................................
3. Langkah-langkah Penyusunan Tes.............................................
a. Blue-Print / Tabel Kisi-kisi..................................................
b. Menulis Soal (Tes Obyektif)................................................
1. Penggunaan Bahasa Indonesia yang Tepat....................
2. Syarat-syarat Menyusun Item Tes..................................
BAB III MEMBUAT SKOR (SCORING)
1. Tes Essay....................................................................................
2. Tes Obyektif...............................................................................
BAB IV MENGUBAH SKOR MENTAH MENJADI SKOR STANDAR
1. Penilaian Acuan Patokan (PAP).................................................
2. Penilaian Acuan Norma (PAN)..................................................
98
BAB V PEMBAKUAN ALAT UKUR
1. Mencari Derajat Kesukaran (DK)..............................................
2. Mencari Daya Beda Suatu Tes (DB)..........................................
3. Mencari Efektivitas Option........................................................
4. Mencari Reliabilitas Tes.............................................................
5. Validitas Tes...............................................................................
BEBERAPA ISTILAH PENTING...................................................................
SOAL-SOAL....................................................................................................
top related