Tes, Pengukuran, Asesmen, dan Evaluasi merupakan istilah yang berbeda namun saling berhubungan. Banyak orang tidak mengetahui secara jelas perbedaan di antara istilah-istilah tersebut, sehingga penggunaannya sering dipertukarkan secara tidak tepat. Agar jelas berikut ini akan diuraikan perbedaan antara Tes, Pengukuran, Asesmen, dan Evaluasi 1.Instrumen/Tes Instrumen adalah alat yang digunakan untuk memperoleh informasi tentang individu atau objek. Terdapat berragam instrumen sesuai dengan jenis informasi yang ingin dikumpulkan, dapat berupa tes maupun non-tes. Instrumen yang baik harus memenuhi syarat kesahihan, kehandalan, kekhususan. Sebagai alat pengumpul informasi atau data, tes harus dirancang secara khusus. Kekhususan tes terlihat dari bentuk soal tes yang digunakan, jenis pertanyaan, rumusan pertanyaan yang diberikan, dan pola jawabannya harus dirancang menurut kriteria yang telah ditetapkan. Demikian juga waktu yang disediakan untuk menjawab pertanyaan serta Ismaryati 0818341963 [email protected]1
132
Embed
Tugas_MK_B_Is.doc - ppkhb - Pengakuan … · Web viewsiswa mengembangkan minatnya dalam suatu cabang olahraga Ranah psikomotor banyak berhubungan dengan pencapaian kemampuan yang
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Tes, Pengukuran, Asesmen, dan Evaluasi merupakan istilah yang berbeda
namun saling berhubungan. Banyak orang tidak mengetahui secara jelas
perbedaan di antara istilah-istilah tersebut, sehingga penggunaannya sering
dipertukarkan secara tidak tepat. Agar jelas berikut ini akan diuraikan
perbedaan antara Tes, Pengukuran, Asesmen, dan Evaluasi
1. Instrumen/Tes
Instrumen adalah alat yang digunakan untuk memperoleh informasi
tentang individu atau objek. Terdapat berragam instrumen sesuai dengan
jenis informasi yang ingin dikumpulkan, dapat berupa tes maupun non-tes.
Instrumen yang baik harus memenuhi syarat kesahihan, kehandalan,
kekhususan.
Sebagai alat pengumpul informasi atau data, tes harus dirancang
secara khusus. Kekhususan tes terlihat dari bentuk soal tes yang digunakan,
jenis pertanyaan, rumusan pertanyaan yang diberikan, dan pola jawabannya
harus dirancang menurut kriteria yang telah ditetapkan. Demikian juga
waktu yang disediakan untuk menjawab pertanyaan serta pengadministrasian
tes juga dirancang secara khusus. Selain itu, aspek yang diteskan pun
terbatas. Biasanya meliputi ranah kognitif, afektif, dan psikomotor.
Kekhususan-kekhususan tersebut berbeda antara satu tes yang satu dan tes
yang lain.
2. Pengukuran
Pengukuran adalah proses pengumpulan data atau informasi yang
dilakukan secara objektif. Melalui kegiatan pengukuran segala program yang
menyangkut perkembangan dalam banyak bidang dapat dikontrol dan
dievaluasi. Hasil pengukuran berupa kuantifikasi dari jarak, waktu, jumlah,
Gambar 1.3: Kedudukan Evaluasi dalam Perencanaan Program
Siswa
Administrasi Tes
Program Penjas
Pengetesan berkala
Hasil Dianalisis oleh
Guru
PenentuanHasil Umpan Balik
Penyesuaian Program
B. Tujuan Pengukuran dan Evaluasi
Pengukuran dan evaluasi dalam bidang pendidikan pada umumnya dan
keolahragaan khususnya mempunyai peranan yang sangat penting. Pengukuran
dan evaluasi bertujuan untuk: (1) pengelompokkan, (2) penilaian (3) motivasi,
dan (4) penelitian. Penentuan ini dapat digunakan untuk menentukan tingkat,
membebaskan peserta dari suatu kesatuan pelajaran, menaikkan peserta dari
suatu tingkat ke tingkat yang lebih tinggi, memberikan umpan balik untuk
memperbaiki unjuk kerja, menempatkan individu-individu ke dalam kelompok-
kelompok tertentu atau menentukan suatu bentuk latihan yang khusus. Pada
pokoknya, penentuan status mencakup semua tujuan-tujuan lain pada
pengukuran dan evaluasi. Berikut ini diuraikan tujuan tujuan pengukuran dan
evaluasi sebagaimana tersebut di atas:
1. Pengelompokkan.Salah satu tujuan pengukuran dan evaluasi adalah untuk pengelompokan.
Pengelompokkan ini berdasarkan tingkat keterampilan, umur, jenis kelamin, kondisi kesehatan, minat. Sebagai upaya memperbaiki proses pembelajaran, guru dapat menempatkan siswanya ke dalam kelompok-kelompok tertentu, sesuai dengan tingkat kemampuannya. Siswa dengan kemampuan yang tinggi tidak harus dipaksa bertahan dengan teman sekelompoknya yang berkemampuan kurang. Demikian juga sebaliknya. Dengan dilakukannya pengukuran dan evaluasi, siswa dapat dikelompokkan pada kelompok yang tepat.
Jika siswa ditempatkan pada kelompok yang setara tingkat keterampilannya, guru dapat menyusun program pelajaran secara individual. Keuntungan lain yang diperoleh dari pengelompokkan ini adalah siswa dapat
berani, lebih lancar, lebih aktif ketika berlatih, karena mereka bersaing dengan siswa lain yang berkemampuan setara. Dengan kata lain, tujuan penempatan siswa ke dalam kelompok yang setara adalah untuk memperbaiki proses pembelajaran.
2. PenilaianTujuan utama penilaian adalah memberi informasi tentang kemajuan
yang dicapai dalam proses pembelajaran yang dikerjakan dan posisi siswa di dalam kelompoknya. Dengan mempertimbangkan seluruh faktor, penilaian harus dilakukan secara objektif sehingga dapat mencerminkan kemajuan yang diperoleh, dan perbaikan-perbaikan yang diperlukan.
3. MotivasiMotivasi merupakan kekuatan yang memandu seseorang untuk mencapai
hasil yang tertinggi. Apabila dilaksanakan secara tepat, evaluasi dapat merupakan proses memotivasi yang positif. Demikian pula sebaliknya, bila dilakukan secara sembarangan evaluasi dapat mengurangi motivasi.
Motivasi yang terbesar adalah keberhasilan. Agar siswa tetap memiliki motivasi, mereka harus mengetahui bahwa dirinya berkembang kemampuannya. Tes-tes keterampilan olahraga memungkinkan siswa untuk berkompetisi dengan dirinya sendiri sebagai cara untuk mengukur kemajuannya.
4. Penelitian.Penelitian adalah penyelidikan yang dilakukan secara sistematis untuk
meningkatkan ilmu pengetahuan. Mutu data yang dikumpulkan bergantung pada ketelitian dan ketepatan alat ukur, teknik pengukuran, dan kelayakan tes.
Dengan menggunakan tes yang mengukur unjuk kerja fisik dalam
penelitian, diharapkan dapat membantu guru/pelatih dalam menyusun
program pelatihan yang tepat, membantu memecahkan masalah-masalah
dalam proses pembelajaran, dan memperbaiki program latihan yang telah
dijalankan. Dengan demikian,, penelitian dapat dianggap sebagai sarana.
Informasi data yang dikumpulkan untuk tujuan-tujuan penelitian harus
dievaluasi keberartiannya. Jadi, tujuan penting pengukuran dan evaluasi
a. Bagi siswaDengan diadakan evaluasi, maka siswa dapat mengatahui tingkat keberhasilannya setelah menerima pengalaman belajar dari guru. Hasil yang diperoleh melalui evaluasi dapat memuaskan atau tidak memuaskan.
Apabila hasilnya memuaskan, maka siswa akan berusaha untuk memperolehnya pada kesempatan yang berikut, dengan demikian siswa akan termotivasi untuk belajar lebih giat. Sedangkan apabila hasilnya tidak memuaskan, siswa akan berusaha agar tidak terulang pada kesempatan yang berikut, sehingga ia akan berusaha memperbaikinya.
b. Bagi guruDengan mengadakan evaluasi, guru dapat mempeoleh manfaat yang
berupa:
Guru dapat mengetahui siswa yang sudah berhak melanjutkan pelajarannya dan yang belum menguasai materi pelajaran. Dengan petunjuk ini guru dapat lebih memusatkan perhatiannya kepada siswa yang belum berhasil. Apalagi jika guru mengetahui penyebabnya, maka bimbingan atau perlakuan yang lebih teliti dapat diberikan sehingga keberhasilan belajar yang selanjutnya dapat diharapkan.
Guru akan mengetahui apakah materi pelajaran yang diberikan kepada siswa sudah tepat atau belum, sehingga untuk yang selanjutnya guru akan menggunakan materi yang sudah tepat dan bagi materi yang belum tepat dapat dilakukan perbaikan seperlunya.
Guru akan mengetahui apakah metode dan alat evaluasi yang digunakan sudah tepat. Apabila banyak siswa yang mendapatkan nilai yang jelek, hal ini mungkin disebabkan karena metode atau alat evaluasi yang digunakan kurang tepat.
c. Bagi sekolah
Apabila guru-guru mengadakan evaluasi dan kemudian diketahui deskripsi
tentang hasil belajar para siswanya, maka dapat diketahui apakah kondisi
belajar yang diciptakan sudah sesuai dengan harapan atau belum. Hasil
belajar merupakan cerminan kualitas suatu sekolah.
Informasi dari guru tentang tepat tidaknya kurikulum untuk sekolah dapat merupakan bahan pertimbangan bagi perencanaan selanjutnya.
Informasi yang diperoleh dari tahun ke tahun dapat dijadikan pedoman bagi pengambilan kebijakan selanjutnya.
6. Prinsip-prinsip Evaluasi
Betapapun sempurnanya suatu alat evaluasi, namun apabila tidak
memperhatikan prinsip-prinsip evaluasi, maka hasil yang diperoleh tidak akan
seperti yang diharapkan. Prinsip-prinsip tersebut adalah:
a. Sesuai dengan norma masyarakat atau filosofi hidup
Prinsip ini berkaitan erat dengan filsafat dan tata nilai (norma) hidup yang
berlaku di masyarakat. Artinya setiap tahapan evaluasi yang dilakukan
jangan sampai bertentangan dengan filsafat hidup dan tata nilai yang
Pada kegiatan pengetesan, peneliti atau guru sering dihadapkan kepada persoalan untuk memilih salah satu dari dua atau lebih tes yang sejenis. Oleh karena itu, peneliti atau guru harus mengetahui kriteria atau persyaratan yang dapat dijadikan sebagai bahan pegangan dalam menentukan tes yang akan digunakan. Kriteria ini akan memberikan petunjuk pemilihan tes karena para ahli tes dan pengukuran telah mempunyai kesepakatan pendapat tentang kriteria tersebut.
Kriteria untuk memilih tes memberikan arah terhadap pemilihan tes yang akan digunakan untuk mengukur objek. Pada pemilihan tersebut pengetes harus mempertimbangkan secara seksama apakah tes yang akan digunakan memenuhi kriteria sebagai suatau alat ukur yang baik atau tidak. Dengan demikian, bahan pertimbangan yang dapat diajukan acuan dalam memilih tes harus diketahui dan dipahami secara jelas, agar tidak menimbulkan kekeliruan dalam menentukan alat ukur yang akan digunakan. Misalnya tes yang tidak memenuhi kriteria validitas akan memberikan hasil pengukuran yang tidak menggambarkan keadaan yang sesungguhnya dari objek yang diukur.
Supaya hasil pengetesan menggambarkan keadaan yang sesungguhnya dari objek yang diukur, maka tes yang digunakan haruslah tes yang baik. Tes dikatakan baik apabila dapat memberikan data yang sehubungan dengan tepat.
Disamping itu juga harus memenuhi persyaratan dalam teori tes dan pengukuran, yaitu: validitas, reliabilitas, objektivitas, diskriminitas, praktibilitas.
1. Validitas
Ada dua pertanyaan paling utama yang harus diajukan terhadap alat ukur
(dalam hal ini tes), bagaimanakah validitas dan objektivitasnya. Kedua
pertanyaan ini untuk memastikan bahwa alat ukur yang digunakan betul-
betul mengukur semua gatra (unsur) yang harus diukur.
Secara sederhana, validitas adalah ukuran yang menyatakan ketepatan
tujuan tes (alat ukur) dan memenuhi persyaratan pembuatan tes. Validitas
tes menunjukkan derajat kesesuaian tes dengan atribut yang ingin diukur.
Validitas menggambarkan kemampuan tes untuk mengukur apa yang ingin
diukur (Kirkendall, 1987). Alat ukur dapat dikatakan valid apabila alat ukur
tersebut mengukur objek dengan tepat dan sesuai dengan gejala yang
diukurnya. Contohnya,
Meteran tepat untuk mengukur panjang benda, tetapi tidak tepat untuk
mengukur berat dan isi benda.
Literan tepat untuk mengukur isi benda, tetapi tidak tepat untuk
mengukur berat dan panjang benda.
Kilogram tepat untuk mengukur berat benda, tetapi tidak tidak tepat
untuk mengukur panjang dan isi benda.
Perlu diingat bahwa pengertian valid mencakup ketepatan dan ketelitian.
Misalnya, timbangan dacin tepat untuk mengukur berat beras dalam karung,
tetapi tidak teliti untuk mengukur berat cincin emas yang hanya beberapa
gram saja. Oleh karena, itu agar hasil pengukuran tepat dan teliti, cincin emas
harus ditimbang dengan penimbang emas yang berskala milligram. Jadi
penimbang emas valid untuk mengukur berat cincin, sebab kecuali hasilnya
lebih tepat juga teliti. Demikian juga halnya dengan gelas atau pipa ukuran
yang berskala cc, sahih (valid) untuk mengukur bibit minyak wangi yang isinya
hanya beberapa cc.
Dari uraian dan contoh di atas dapat disimpulkan bahwa tes yang sahih (valid) adalah tes yang dapat mengukur dengan tepat dan teliti gejala yang hendak diukurnya. Dalam pengertian yang lebih luas, validitas tes adalah kebenaran dari penafsiran tes.
Jenis-jenis validitas
Kebenaran validitas sangat bergantung pada dasar pemikiran yang dipertimbangkan atau ditentukan. Dasar pemikiran konsep validitas menjadi rumit karena ada berbagai macam definisi dan penamaan yang digunakan untuk memerinci berbagai unsur validitas tes. Agar lebih jelas berikut ini akan diuraikan jenis-jenis validitas.
Validitas dibedakan menjadi dua, yaitu validitas langsung (validitas logis) dan validitas derivatif (validitas empiris) (Nasir, 1985). Validitas langsung atau logis didasarkan atas pengertian seberapa jauh tes dapat dikatakan sesuai dengan putusan profesi dan proses analisis logis yang dituntut oleh suatu tes. Validitas logis dibedakan menjadi dua macam, yaitu validitas isi (content validity) dan validitas konstruk (costruct validity).
Validitas derivatif atau validitas empiris didasarkan atas bukti empiris dan statistik yang berhubungan dengan kriteria tes. Validitas empiris ini juga dibedakan menjadi dua macam, yaitu validitas konkuren (concurrent validity) dan validitas prediktif (predictif validity).
Validitas konstruk adalah abstraksi untuk memberlakukan suatu konsep yang direka secara khusus bagi kebutuhan penelitian atau pengetesan. Berkenaan dengan contoh tentang soal ujian kecerdasan di atas, untuk mengetahui validitas konstruknya ada tiga pertanyaan yang perlu dijawab: (1) apakah landasan teori yang digunakan telah merangkum ranah (domain) tentang kecerdasan? (2) ranah apa sajakah yang membentuk konsep kecerdasan yang hendak diukur? (3) bukti nyata apakah yang memperlihatkan ada tidaknya keterkaitan antara ranah-ranah di atas?. Tiga pertanyaan tersebut merupakan pertanyaan pokok yang mendasari analisis validitas konstruk. Dalam hal ini usaha ditujukan untuk mengetahui apakah hal-hal yang termasuk di dalam konsep yang ditanyakan itu merupakan bagian soal ujian yang disusun. Dalam validitas konstruk, validasi tidak hanya dilakukan terhadap teori yang mendasari alat ukur, tetapi juga terhadap bukti empiris.
Langkah pertama yang harus dilakukan untuk menilai validitas konstruk adalah menentukan ranah yang akan diukur dari kecerdasan, apakah kemampuan menghafal, menganalisis, mengevaluasi, mensintesis atau kemampuan menerapkan sesuatu. Langkah ke dua adalah menentukan kriteria yang secara umum dapat digunakan untuk membedakan antara orang yang mempunyai kecerdasan tinggi dan rendah. Misalnya, kriteria yang dipilih adalah “kemampuan menyelesaikan soal matematika dengan cepat dan tepat”, kemudian kepada subjek diberikan tes kecerdasan dan soal metematika. Subjek yang memperoleh niali tinggi dalam tes kecerdasan juga mampu menyelesaikan ujian matematika secara cepat dan tepat. Namun sebaliknya, subjek yang memperoleh nilai rendah dalam tes kecerdasan juga kurang mampu dalam menyelesaikan soal-soal matematika. Maka dapat disimpulkan bahwa konstruk kecerdasan dengan 5 ranah di atas mempunyai validitas konstruk yang tinggi. Pada kenyatannya, penelaahan terhadap validitas konstruk seringkali bersangkut-paut dengan validitas isi.
c. Validitas Konkuren (concurrent validity)
Validitas konkuren adalah validitas yang ditinjau dari segi hubungan antara
alat ukur dengan suatu kriteria. Kriteria yang dimaksud dalam validitas
konkuren adalah kriteria yang telah diketahui atau yang dapat dipercaya
untuk mengukur atribut tertentu. Contoh kriteria konkuren adalah tes
kecerdasan yang sudah dibakukan. Hasil korelasi tes kecerdasan yang baru
dengan keriteria tes kecerdasan yang sudah dibakukan merupakan validitas
konkuren. Dengan demikian, validitas konkuren diperoleh dari jawaban
pertanyaan “Seberapa jauh suatu alat ukur berkorelasi positif dengan tes
sejenis yang telah dinyatakan validitas dan objektivitas”. Konkuren di sini
diartikan sebagai derajat yang mempunyai nilai dan bobot yang sama dalam
hal isi maupun prakiraannya.
d. Validitas Prediktif (predictive validity)
Validitas prediktif atau validitas ramalan adalah validitas yang berkenaan dengan hubungan antara nilai kriteria umum yang akan ada di masa yang akan datang. Misalnya, seorang siswa yang ingin masuk ke perguruan tinggi harus terlebih dahulu mengikuti ujian masuk universitas. Soal ujian masuk atau alat ukur telah dibuat sedemikian rupa sehingga diperkirakan siswa yang nilainya baik dalam ujian masuk akan menjadi mahasiswa yang nilainya baik dalam setiap ujian. Untuk mengetahui derajat validitas prediktif suatu tes diperlukan penghitungan dengan rumus korelasi, yang hasilnya merupakan koefisien korelasi.
Koefisien korelasi merupakan suatu angka perkiraan terhadap faktor Y (peubah bergantung) berdasarkan informasi dari faktor X (peubah bebas). Misalnya, dari hasil pengukuran power tungkai dalam latihan pliometrik, diperoleh hasil rerata X (latihan pliometrik) sebesar 26 dengan simpangan baku 8 dan rerata Y (power tungkai) sebesar 34 dengan simpangan baku 5. Hasil penghitungannya adalah X berkorelasi positif dengan Y; dengan besaran r = 0.757. Karena keduanya berkorelasi positif, maka jika nilai X naik, nilai Y pun naik. Jika digunakan data baru, rumusnya menjadi: bila simpangan baku X naik 1, maka Y akan naik sebesar 75,7% x 5 = 3,785. Bila dengan berbagai usaha, nilai rerata yang semula 26 naik menjadi 34 (26 + 8), maka rerata Y naik menjadi 37,785 (34 + 3.785).
Reliabilitas menyangkut ketepatan hasil pengukuran. Pengertian reliabilitas akan lebih mudah dipahami dengan menjawab pertanyaan berikut: (1) jika objek yang sama diukur berkali-kali dengan alat ukur yang sama, apakah akan diperoleh hasil yang sama?, (2) apakah ukuran yang diperoleh dengan menggunakan alat ukur tertentu merupakan ukuran yang sebenarnya dari objek tersebut?, (3) berapa besar kesalahan yang diperoleh dengan menggunakan ukuran tersebut terhadap objek?. Jawaban dari ketiga pertanyaan tersebut merupakan tiga unsur pengertian reliabilitas.
Suatu alat ukur mempunyai kehandalan yang tinggi atau dapat dipercaya jika alat ukur itu mantap; Artinya, alat ukur itu stabil, dapat diandalkan, dan dapat diramalkan. Alat ukur dikatakan mantap apabila alat ukur tersebut dalam pengukuran yang berulangkali pada objek yang sama menghasilkan ukuran yang sama. Misalnya, benda yang beratnya 40 kg, bila ditimbang berulangkali dengan penimbang yang sama dan dalam waktu yang berlainan akan memberikan hasil yang sama, yaitu 40 kg. Dengan demikian dapat dikatakan bahwa penimbang berat tersebut mantap. Jawaban pertanyaan ke dua menunjukkan aspek ketepatan. Ukuran yang tepat adalah ukuran yang cocok dengan unsur yang ingin diukur. Jika aspek kemantapan dan ketepatan digabungkan, maka dapat disimpulkan bahwa alat ukur yang digunakan mantap, dapat mengukur secara ajeg dan tepat. Selanjutnya, jawaban pertanyaan ke tiga menyiratkan bahwa alat ukur yang digunakan harus sedemikian rupa sifatnya sehingga kesalahan yang terjadi dalam pengukuran dapat ditolelir.
Dari uraian di atas dapat disimpulkan bahwa tes yang reliabel adalah tes yang
dapat menghasilkan ukuran secara ajeg dan tepat sesuai dengan gejala yang
hendak diukur. Reliabilitas suatu tes menunjukkan derajat keajegan hasil yang
diperoleh dari beberapa kali pengetesan terhadap subjek yang sama, alat ukur
yang sama, dan prosedur yang sama.
Jenis-jenis reliabilitas
Pada bagian terdahulu, dijelaskan bahwa reliabilitas berkaitan dengan ketepatan tes sebagai alat ukur. Selanjutnya, pada bagian ini akan diuraikan tentang
reliabilitas yang berkaitan dengan ketepatan ukuran suatu tes. Secara nyata, reliabilitas selalu mensyaratkan proses pengetesan yang berulang.
Berdasarkan cara memperolehnya, koefisien reliabilitas dapat dibedakan menjadi: koefisien kemantapan (koefisien stabilitas), koefisien taksiran (koefisien estimasi), koefisien kesetaraan (koefisien ekuivalensi) dan koefisien ketaatasasan (koefisien konsistensi). Penamaan keempat istilah tersebut mencerminkan cara atau metode yang digunakan untuk memperoleh koefisien reliabilitasnya yaitu: metode tes ulang (test-retest method), metode belah dua (split half method), metode tes paralel (equivalent method), metode konsistensi internal (internal consistency method).
Koefisien reliabilitas diperoleh dengan cara yang sama dengan proses mencari validitas empiris yaitu dengan menghitung koefisien korelasi. Namun demikian proses pemerolehan koefisien reliabilitas tidak dapat digunakan untuk keperluanb validasi; karena apa yang reliabel belum tentu valid, tetapi apa yang valid akan selalu reliabel.
a. Koefisien stabilitas
Koefisien stabilitas diperoleh dengan cara tes ulang, yaitu suatu tes diberikan dua kali kepada kelompok yang sama, dengan alat ukur yang sama, dengan jeda waktu yang tidak lama. Kemudian, hasil pengukuran tersebut dihitung koefisien korelasinya dengan menggunakan rumus angka kasar. Hasil penghitungan ini disebut koefisien stabilitas. Cara menghitung koefisien stabilitas tersebut adalah sebagai berikut:
1) Buatlah tabel frekuensi yang berisi nomer, testi, hasil tes pertama (X),
hasil tes ke dua (Y), kuadrat hasil tes pertama (X2), kuadrat hasil tes ke
dua (Y2), perkalian antara hasil tes pertana dan ke dua (XY).
2) Jumlahkan X, Y, X2, Y2, XY.
3) Masukkan angka-angka yang diperoleh ke dalam rumus berikut:
{(20 x 2752,7411) – (74895,2689)} {(20 x 3794,2277) – (75751,5529)}
= 0.8287436465 = 0.83 (dibulatkan)
Koefisien reliabilitasnya = 0.83 adalah sangat tinggi, dengan demikian dapat disimpulkan bahwa tes lari 100 meter terhadap 20 siswa tersebut adalah reliabel.
b. Koefisien estimasi
Koefisien taksiran diperoleh dengan metode belah dua. Di dalam metode belah dua, suatu tes diberikan satu kali kepada suatu kelompok, kemudian pemberian nilai dilakukan dengan cara membelah hasil tes tersebut menjadi dua, yaitu paruhan atas dan bawah atau paruhan gasal dan genap.
Pada cara yang pertama, seluruh hasil tes dibelah menjadi dua sama besar, paruh atas dan paruh bawah. Contohnya suatu tes berjumlah 10 butir. Jawaban dari kesepuluh butir soal tersebut diberi nilai, nilai jawaban soal ke 1 - 5 (paruh atas) dijumlahkan terpisah dengan nilai jawaban soal ke 6 - 10 (paruh bawah). Nilai dari paruhan atas dikorelasikan dengan nilai paruhan bawah.
Cara yang ke dua adalah dengan membelah hasil tes menjadi paruhan gasal dan genap. Nilai jawaban soal bernomer gasal dijumlahkan terpisah dengan jumlah nilai jawaban soal bernomer genap. Kemudian jumlah nilai kedua
paruhan tersebut dikorelasikan. Setelah diperoleh angka hasil penghitungannya, dikoreksi dengan rumus Spearman Brown. Angka hasil penghitungan setelah dikoreksi dengan rumus Spearman Brown inilah yang disebut koefisien taksiran. Berikut ini disajikan contoh cara menghitung koefisien estimasi dengan cara paruhan gasal-genap.
Hasil jawaban dari 20 siswa yang mengerjakan 10 butir soal sebagai berikut: (1
= adalah jawaban yang betul, 0 = adalah jawaban yang salah)
N0 Siswa Nilai Terhadap Butir Tes Jumlah Nilai1 2 3 4 5 6 7 8 9 10 Gasal Genap
Untuk mencari reliabilitas pertama-tama dicari korelasi antara kedua hasil pengukuran tersebut dengan menghitung koefisien korelasi Spearman. Dari angka hasil penghitungannya dicari koefisien reliabilitasnya dengan rumus:
r 1 1 =2
1 +
Perlu diketahui bahwa: Koefisien korelasi Spearman dan r = koefisien reliabilitas.
Dengan menggunakan data di atas dicari terlebih dahulu koefisien korelasi Spearman.
Hasilnya adalah sebagai berikut:
No Responden Urutan I Urutan I D D2
1 A 1 1 0 02 B 2 2 0 03 C 3 5 -2 44 D 4 3 1 15 E 5 7 -2 46 F 6 6 0 07 G 7 4 3 98 H 8 10 -2 49 I 9 8 1 110 J 10 9 1 1
k = Jumlah butir soal p = rerata dari jumlah proporsi jawaban benar q = rerata dari jumlah proporsi jawaban salah s2 = varians, X X N = Jumlah peserta tes
Berdasarkan rumus di atas dapat dihitung bahwa:
k = 10
p = 6 : 10 = 0,6
q = 4 : 10 = 0,4
s2 = 382 – (602 : 10) = 382 – 360 = 22N = 10
r = 10 x (1 – 10 x 0,6 x 0,4 ) =
0,98989 22
Dari hasil penghitungan di atas diperoleh angka koefisien kehandalannya = 0,9898 (sangat tinggi), dengan demikian dapat disimpulkan bahwa tes tersebut adalah handal. Dan jika dihitung dengan KR-20, maka koefisien korelasinya adalah sebagai berikut:
r = k x {1 p.q } k – 1 s2
= 10 X (1 2,24 )9 22
= 10 X (1 0,1018181818 )9
= 0,9979
Dari hasil perhitungan dengan KR-20 ternyata tes ini adalah handal, dan angka hasil penghitungannya lebih tinggi daripada jika dihitung dengan KR-21.
Masalah-masalah khusus yang berkenaan dengan penentuan reliabilita tes kinerja motorik tidak terjadi di dalam tes tertulis, misalnya tes yang harus dilakukan berulang-ulang dan biasanya dilaksanakan pada hari yang berlainan. Salah satu contoh nyata yang biasa terjadi dalam tes kinerja motorik adalah: 5 orang siswa yang masing-masing melakukan 4 kali loncatan pada tes Vertical Jump. Setiap siswa mempunyai nilai yang berbeda pada setiap loncataannya. Pertanyaan yang harus dijawab adalah bagaimana menentukan koefisien reliabilitasnya? , sedangkan teknik penghitungan reliabilitas yang telah dijelaskan terdahulu tidak dapat digunakan untuk menentukan reliabilitas hasil tes pada tes yang dilakukan berulangkali.Sebuah alternatif untuk menentukan reliabilitas data hasil tes kinerja motorik adalah dengan teknik “koefisien korelasi interklas”. Koefisien ini mengukur keajegan (konsistensi) nilai pada trial yang dilakukan secara berulang-ulang. Berikut disajikan satu contoh untuk menghitung reliabilitas dengan menggunakan teknik korelasi interklas. 5 orang siswa yang melakukan tes Vertical Power Jump, masing-masing melakukan 4 kali trial, hasilnya adalah sebagai berikut:
Subyek Trial 1 Trial 2 Trial 3 Trial 4 Row (Row)2
(X1) (X2) (X3) (X4)
A 278 279 281 280 1118 1249924
B 298 297 296 275 1186 1406596
C 282 285 287 289 1143 1306449
D 269 273 272 275 1089 1185921
E 272 270 270 268 1080 1166400
X = 1399 1404 1406 1407 Grand X = 5616 6315290
X2 = ( 2782 +298 2 + 2822 + … + 2682 ) = 1578886
Urutan langkah yang harus dilakukan untuk menghitung koefisien korelasi interklas adalah:Langkah 1: menghitung jumlah kuadrat total (SST)
Gambar 2.1: Hubungan dan pengaruh antara obyektivitas, reliabilitas, dan validitas
Hal-hal yang perlu diperhatikan sehubungan dengan reliabilitas dan validitas tes
Biasanya angka koefisien reliabilitas lebih besar daripada angka koefisien validitas pada tes yang sama.
Tes dalam pendidikan jasmani yang diberikan kepada anak putri biasanya menghasilkan koefisien validitas yang sangat rendah daripada bila tes itu diberikan kepada anak putra.
Hasil prestasi keterampilan pemain yang kurang berpengalaman biasanya kurang reliabel jika dibandingkan dengan hasil pemain-pemain yang berprestasi tinggi.
Bila suatu tes dilaporkan mempunyai koefisien reliabilitas sebesar 0,85 misalnya, ini tidak berarti bahwa kelompok lain yang menggunakan tes itu akan menghasilkan koefisien reliabilitas yang sama; bila dihitung dari data kelompok itu sendiri. Reliabilitas suatu tes adalah khusus bagi kelompok yang dites dalam pembuatan tes itu. Koefisien reliabilitas yang sama dapat diharapkan akan diperoleh asalkan tes tersebut digunakan untuk kelompok yang serupa dan dalam kondisi yang serupa pula.
Jumlah subjek dapat mempengaruhi reliabilitas, oleh karena itu kepercayaan akan lebih diberikan kepada koefisien reliabilitas suatu tes yang dihitung dari jumlah subjek yang besar.
Untuk membuat penafsiran kualitatif dari angka-angka korelasi, keterangan ini dapat dijadikan untuk pedoman.1) koefisien validitas di atas 0,85 dianggap sangat baik.2) Koefisien validitas jarang sekali lebih dari 0,85.
3) Koefisien reliabilitas bahkan seringkali lebih dari 0,85.4) Koefisien reliabilitas dari 0,75 sampai 0,85 berarti bahwa tes itu sudah
dapat dianggap baik untuk berbagai tujuan.5) Bila koefisien reliabilitasnya lebih kecil dari 0,70 menunjukkan
ketidakajegan alat ukur itu. Koefisien validitas yang rendah menunjukkan adanya unsur ketidakajegan
dalam pengukuran itu. Untuk memperbaiki, disarankan supaya menyempurnakan petunjuk pelaksanaan tes agar situasi dalam pelaksanaannya menjadi lebih baik. Jalan lain yang dapat ditempuh ialah dengan menambah jumlah trial atau percobaannya, atau jika dalam tes tulis dengan menambah jumlah butir soalnya.
Koefisien validitas yang rendah menandakan bahwa tes itu tidak cukup bernilai bila digunakan untuk meramalkan kemampuan yang seharusnya diukur. Meskipun begitu, kalau secara subjektif tes tersebut masih dianggap berharga dan betul-betul handal, maka tes tersebut masih dapat dipakai sebagai alat latihan yang baik.
4. Diskriminitas (daya pembeda)
Soal di dalam ujian atau tes diberikan kepada siswa dengan tujuan terutama untuk membedakan antara mereka yang betul-betul berlatih dengan mereka yang memang tidak berlatih, antara mereka yang betul-betul belajar dengan mereka yang tidak belajar atau lebih tepat untuk membedakan mereka yang betul-betul menguasai bahan pelajaran dengan mereka yang memang tidak menguasai bahan pelajaran.Tes yang baik, harus dapat membedakan kemampuan siswa sesuai dengan tingkat keterampilan dan kepandaian mereka. Tes yang terlalu sukar, sehingga semua siswa tidak yang dapat mengerjakannya bukanlah tes yang baik, sebaliknya tes yang sangat mudah sehingga semua siswa dapat mengerjakan dengan benar juga bukan tes yang baik karena tes-tes yang demikian itu tidak memiliki kemampuan untuk membedakan antara mereka yang berkemampuan jelek, cukup, baik dan baik sekali.
5. Praktibilitas (kemudahan)
Meskipun kriteria validitas dan reliabilitas tes merupakan hal yang terpenting dari kriteria lainnya, namun sejumlah pertimbangan yang bersifat praktis dan
dapat mempengaruhi tes perlu dipertimbangkan pula. Pertimbangan-pertimbangan tersebut meliputi; waktu dan biaya, kemudahan pengadministrasian dan kemudahan dalam penafsiran pengukuran
a. Kemudahan Waktu dan biaya
Jumlah waktu yang diperlukan erat hubungannya dengan biaya yang dikeluarkan. Demikian pula alat-alat yang dipakai dan pelaksana yang terlibat di dalam pelaksanaan tes akan memberikan ketelitian hasil tes sehingga mempengaruhi pula derajat kehandalannya. Makin sedikit personal dan alat-alat yang digunakan di dalam tes tersebut, makin sedikit biaya yang dikeluarkan.
Setiap pemakaian alat pengukur selalu membutuhkan tuntunan cara penggunaannya. Adanya tuntunan pelaksanaan suatu tes akan memberikan kejelasan dan keseragaman dalam pelaksanaan suatu tes. Tuntunan pelaksanaan ini merupakan suatu hal yang sangat penting, karena tanpa petunjuk pelaksanaan akan menimbulkan perbedaan penafsiran di dalam melaksanakan pengukuran. Contohnya: untuk pelaksanaan tes passing selama 30 detik dalam permainan basket, tanpa petunjuk pelaksanaan maka terjadi berbagai cara penafsiran dalam pelaksanaan tes tersebut. Mungkin pengetes X menafsirkan dalam pelaksanaan tes passing dengan satu tangan dan pengetes Y menafsirkan tes tersebut dalam pelaksanannya dengan dua tangan. Dalam hal ini terjadi penafsiran yang berbeda dalam pelaksanannya. Perbedaan penafsiran untuk melaksanakan tes ini terjadi oleh karena tidak ada tuntunan petunjuk pelaksanaan tes yang jelas. Tetapi bila ada petunjuk pelaksanaan yang jelas, tidak akan terjadi penafsiran pelaksanaan yang berbeda.
Perbedaan pelaksanaan tes ini mempunyai pengaruh yang besar terhadap reliabilitas tes. Demikian pula semakin banyak alat yang digunakan, maka kemungkinan salah lebih besar sehingga akan berakibat semakin kurangnya reliabilitas tes itu.
Sebuah tes dikatakan memiliki kemudahan administrasi bila:a. Mudah dilaksanakan.
Suatu tes yang dilengkapi dengan tuntunan atau petunjuk yang lengkap akan memberikan kejelasan bagi pengetes maupun testinya. Suatu tes yang mudah dalam pelaksanannya akan memberikan ketelitian hasil tes, sehingga derajat validitas tes lebih mungkin untuk dicapai.
b. Mudah pemeriksaannya
Suatu tes yang dilengkapi dengan kunci jawaban maupun pedoman penilaiannya akan memberikan kemudahan dalam pemeriksaannya, sehingga penghematan tenaga, kemudahan dan kemungkinan kesalahan dapat diperkecil.
c. Kemudahan dalam penafsiranTes yang dilengkapi dengan norma adalah lebih berguna daripada yang tidak ada normanya. Dengan adanya norma yang baku akan mempermudah untuk membandingkan nilai yang dicapai subjek dalam suatu tes. Norma yang jelas dan mudah dimengerti akan memberikan motivasi kepada siswa yang mengikuti tes, karena secara langsung siswa dapat mengetahui kedudukan hasil tes yang ia peroleh. Disamping itu dapat membandingkannya dengan teman lain dalam kelompoknya, dalam keadaan ukuran-ukuran yang sebanding. Jika terpaksa normanya belum ada, diharapkan para guru atau pengetes mampu mengerjakan perhitungan-perhitungan statistik yang diperlukan untuk mengolah nilai hasil tes menjadi norma yang baku. Kemudian hasil pengolahan ini selanjutnya diterapkan untuk penafsiran nilai ke dalam pendekatan nilai PAP (Penilaian Acuan Patokan). Untuk tes baku, biasanya si penyusun tes telah menyediakan berbagai keterangan dan bahan-bahan yang dipergunakan untuk menafsirkan hasil tes tersebut.
Dari uraian-uraian di atas dapat dikatakan bahwa tes yang baik akan
mencakup kriteria yang ada, yaitu valid, reliabel, objektif, diskriminitas,
dan praktibilitas. Akan tetapi dalam prakteknya sangat sulit untuk dicapai,
sehingga sangat jarang tes yang dapat memenuhi persyaratan tersebut
secara keseluruhan. Kiranya cukup memadai jika sebuat tes telah
memenuhi tiga buah syarat yang telah ditentukan yaitu: valid, reliabel, dan
objektif.
TugasKerjakan tugas berikut ini secara individu1. Bila saudara dihadapkan pada situasi untuk memilih satu alat ukur dari
banyak pilhan yang tersedia, pertimbangan apa yang saudara gunakan untuk memilihnya. Jelaskan alasannya
2. Jelaskan apa yang dimaksud dengan validitas, reliabilitas, dan objektivitas3. Jelaskan perbedaan validitas isi, validitas konstruk, validitas konkuren, dan
validitas empiris4. Metode apa yang digunakan untuk memperoleh koefisien stabilitas, koefisien
estimasi, koefisien ekuivalensi, koefisien konsistensi?5. Berikut ini adalah hasil pengukuran lompat jauh tanpa awalan pasa 10 0rang
siswa kelas IV SD. Hitunglah koefisien konsistensinya
Setiap suatu kegiatan berlangsung, akhirnya selalu ingin diketahui hasilnya. Demikian pula jika suatu program pendidikan berakhir juga ingin diketahui seberapa jauh tujuan pendidikan yang telah ditetapkan dapat tercapai.
Untuk mengetahui hasil suatu kegiatan harus dilakukan pengukuran. Dalam kegiatan belajar mengajar, pengukuran hasil belajar bertujuan untuk mengetahui seberapa jauh perubahan tingkah laku siswa setelah mengikuti suatu program.
Pada umumnya pengukuran yang dilakukan oleh guru menggunakan tes sebagai alat ukurnya. Hasil pengukuran berwujud angka atau pernyataan yang mencerminkan tingkat penguasaan materi.
Kegiatan pengukuran dan evaluasi harus terprogram. Hal ini berarti kegiatan pengukuran dan evaluasi harus dilakukan dengan teratur, terrencana, dan menggunakan sistem tertentu.
1. Langkah-langkah pengukuran.Secara umum kegiatan pengukuran terdiri atas delapan langkah, yaitu:
Penentuan tujuan program Pemilihan tes atau alat ukur yang sesuai Pelaksanaan tes (testing) Penetapan skor Analisis dan penafsiran skor Penerapan hasil Pelaksanaan tes kembali untuk menentukan keberhasilan program Pembuatan catatan dan laporan
Ada tiga ciri utama program dalam pendidikan jasmani atau pembinaan olahraga, yaitu: dilaksanakan secara integratif dengan tujuan yang jelas dan dapat dipahami oleh semua orang yang terlibat di dalamnya. Program testing, sebagai kegiatan yang yang berkaitan erat dengan kegiatan lain di sekolah harus dirasakan oleh semua pihak, dalam hal ini siswa, guru, dan tenaga administratif.
Tujuan utama program testing adalah untuk memecahkan masalah-masalah praktis dalam pendidikan. Pengumpulan data atau informasi yang banyak tentunya akan sia-sia apabila tidak dimanfaatkan. Data atau informasi yang terkumpul dalam program testing dapat dimanfaatkan untuk pengelompokkan, pemilihan tim, pemberian bimbingan, penelitian, dan sebagainya.
Setelah menetapkan tujuan program testing, langkah berikutnya adalah memilih tes yang sesuai dengan tujuan. Ada tiga hal yang perlu dipertimbangkan dalam langkah ini. Pertama, siapakah yang berhak memilih tes. Ke dua, macam tes apakah yang akan digunakan, dan yang ke tiga prosedur yang manakah yang akan digunakan untuk memilih tes.
Tes hendaknya dipilih oleh orang yang berkompeten di bidangnya. Misalnya dalam memilih tes untuk mengukur tingkat kecerdasan, para psikologlah yang berhak menentukan tes yang akan digunakan. Hal ini sangat penting karena akan menentukan validitas isi suatu tes. Selanjutnya macam tes yang digunakan berkaitan erat dengan aspek yang ingin diukur, misalnya bentuk tes yang mengukur intelegensi umum, aspek bakat khusus, aspek kepribadian, dan lain-lain. Dengan memperhatikan tujuan testing, siapa yang memilih tes, penting juga diperhatikan prosedur yang sistematik dalam memilih tes. Untuk memutuskan berapa kali testing akan dilaksanakan bergantung pada tujuan tes diberikan. Sehubungan dengan pengetesan, pelaksana tes harus memiliki syarat tertentu sesuai dengan bidangnya.
Setelah tes dilaksanakan, langkah yang berikutnya adalah pemberian biji (scoring). Skoring harus dilaksanakan dengan cepat dan teliti. Sistem yang terbaik adalah yang hemat tenaga, waktu dan biaya. Setelah skoring, data yang diperoleh perlu diolah dan dianalisis. Analisis data mencakup pengolahan secara statistika dan pengungkapan secara visual (misalnya dengan grafik).
Hasil dari pengolahan data yang telah dilakukan kemudian ditafsirkan berdasarkan norma kelompok (PAN) atau norma yang sudah baku (PAP).
Penerapan hasil tes merupakan tahap yang paling kritis dalam program testing. Hal ini berkaitan dengan implikasi hasil tes. Penggunaan hasil tes juga bergantung pada tujuan program testing. Tujuan program testing juga berkaitan dengan tujuan intruksional dan tujuan kurikuler. Pengetesan pada tahap berikutnya harus dilakukan untuk mengecek apakah ada perbaikan yang perlu dilakukan.
Langkah terakhir adalah membuat catatan atau pelaporan. Hal ini penting dilakukan, karena menyangkut kepentingan banyak pihak: siswa, guru, tenaga administrasi, orang tua, dan masyarakat umum. Bentuk laporan disusun sesuai dengan kepentingan pihak yang akan menerima laporan.
2. Perumusan Tujuan Pengajaran
Evaluasi selalu bertolak dari perumusan tujuan, oleh karenanya perubahan perilaku yang diharapkan juga harus tercakup di dalam tujuan. Karena tujuan merupakan pegangan dalam melaksanakan pengukuran, maka antara tujuan dan evaluasi harus berkaitan. Kemampuan merumuskan tujuan secara jelas merupakan kompetensi utama dari seorang guru, juga guru pendidikan jasmani.
Tujuan pengajaran dibedakan menjadi dua, yakni tujuan jangka panjang (aim) dan tujuan jangka pendek (objective). Aim merupakan istilah yang menunjukkan tujuan pendidikan jangka panjang yang akan dicapai setelah ditempuh proses dan jangka waktu yang cukup lama (misalnya 15 – 20 tahun). Objective, merupakan istilah yang menunjukkan perumusan tujuan pendidikan yang lebih spesifik, operasional, dan tercapai dalam jangka waktu yang lebih pendek. Yang paling mungkin dicapai oleh guru bidang studi, misalkan pendidikan jasmani ialah tujuan jangka pendek. Contoh berikut akan memberikan gambaran yang lebih jelas tentang kedua tujuan tersebut. Aim: Untuk menciptakan warga negara yang bertanggung jawab, untuk memberantas buta huruf. Objective: Untuk meningkatkan kesegaran jasmani, untuk meningkatkan konsumsi oksigen maksimal.
Tujuan jangka panjang merupakan tujuan akhir atau arah dari program pendidikan. Kemajuan pendidikan jasmani hanya akan dapat dicapai hanya jika ada arah yang menentu. Tujuan jangka pendek menunjukkan tujuan yang lebih khusus. Karena itu, tujuan jangka pendek merupakan tujuan penentu yang lebih khas.
Selain sebagai pengarah kegiatan pendidikan, tujuan jangka panjang secara langsung mengandung nilai praktis, yaitu menentukan isi pengalaman belajar yang akan disampaikan atau disediakan kepada siswa. Berkaitan dengan hal ini, tugas guru adalah melakukan analisis isi mata pelajaran yang dibinanya. Hal ini dapat diperbarui atau direvisi pada setiap semester atau setiap tahun sesuai dengan perkembangan atau kebutuhan.
Tujuan, pengalaman belajar, metode, dan evaluasi mempunyai kaitan yang
sangat erat. Seorang guru harus menetapkan tujuan tentatif sebelum
menetapkan strategi pendidikan untuk mencapai tujuan itu (menetapkan
pengalaman belajar yang sesuai) dan kemudian mengukur pencapaian tujuan.
Dengan demikian perlu diketahui tingkat kemampuan sebelum dan sesudah
program berlangsung. Gambar 3.1 menunjukkan siklus tujuan dan evaluasi.
Karena tujuan merupakan penentu arah bagi program pendidikan, bahkan
merupakan landasan bagi pembuatan keputusan, maka tujuan harus
dirumuskan secara baik.
Ciri ciri rumusan tujuan yang baik
Jelas, tidak mempunyai pengertian ganda Menunjukkan aspek perilaku yang dapat diamati dan
diukur Memberikan arah yang jelas dan dapat dicapai
Berikut ini merupakan contoh perumusan tujuan.
Contoh
1:
Setelah selesai mempelajari materi ini, mahasiswa diharapkan mengerti apa yang dimaksud dengan kapasitas erobik maksimal.
Rumusan tujuan seperti contoh 1 adalah kurang jelas. Kata-kata seperti mengerti, memahami, mengapresiasi merupakan kata-kata yang sulit untuk dijabarkan menjadi tujuan yang operasional, bagaimana kita mengamatinya?
Kemampuan menerima komunikasi secara tepat, menempatkan hasil komunikasi dalam bentuk penyajian yang berbeda, me-reorganisasikannya secara singkat tanpa merubah pengertian
Menerjemahkan, menyatakan kembali, mendiskusikan, menggambarkan, menjelaskan, mengidentifikasi, menempatkan, menceritakan, memaparkan
Aplikasi Kemampuan menerapkan prinsip atau metode pada situasi yang baru
Interpretasikan, terapkan, gunakan, praktikkan.
Analisa Kemampuan memisah-misahkan meteri menjadi bagian-bagian yang membentuknya, mendeteksi hubungan di antara bagian-bagian tersebut dan cara materi itu diorganisir
Evaluasi Kemampuan mengambil keputusan,memberi pertimbangan, menyatakan pendapat tentang sesuatu tujuan, pekerjaan, metoda, materi dll. Dalam mengambil keputusan atau menyatakan pendapat, termasuk juga kriteria yang digunakan
Menerima Kemampuan menerima dan rangsang yang terjadi di sekitarnya. Yang termasuk di dalamnya adalah kesadaran, kesediaan untuk menerima dan mengontrol atau memilih sikap tertentu
Perilaku siswa pada tataran ini adalah konsisten dan stabil, tidak hanya persetujuan terhadap nilai tetapi juga pemilihan terhadapnya dan keterikatannya pada suatu pandangan atau ide tertentu.
Pada tataran ini sudah terjadi internalisasi, nilai-nilai yang dipelajari telah mendapat tempat pada diri individu, diorganisir ke dalam suatu sistem yang internal, memiliki kontrol perilaku.
Bersifat objektif, bijaksana, adil, teguh dalam pendirian, percaya diri, berkepribadian
Berikut ini merupakan contoh perntanyaan yang dapat diajukan jika guru ingin menilai pencapaian ranah afektif.
- Apakah siswa aktif dalam mengikuti pelajaran pendidikan jasmani?- Apakah siswa menaati peraturan yang telah ditetapkan?
- Apakah siswa selalu dapat menjaga kebugarannya? Ranah Psikomotor
Ranah psikomoror mencakup tujuan yang berkenaan dengan keterampilan motorik. Dave, mengembangkan ranah psikomotor ini ke dalam jenjang peniruan, manipulasi, kecermatan, artikulasi, naturalisasi.
Naturalisasi
Artikulasi
Kecermatan
Manipulasi
Peniruan
Gambar 3.4: Jenjang Ranah Psikomotor
Agar lebih mudah dipelajari jenjang-jenjang ranah psikomotor disajikan dalam tabel 3.3
Tabel 3.3: Kemampuan yang Dimiliki dalam Ranah Psikomotor
Jenjang Kemampuan yang dimiliki Kata-kata yg digunakan
Peniruan Merirukan gerakan yang diperagakan oleh guru
Menirukan pengulangan, coba lakukan, dll
Manipulasi Pada tataran ini siswa dapat menampilkan suatu gerakan yang diajarkan, dan tidak hanya seperti yang diamati. Siswa mulai dapat membedakan antara satu gerakan dengan gerakan yang lain,
Artikulasi Siswa telah dapat mengkoordinasikan serentetan gerakan dengan menetapkan urutan secara tepat di antara bagian-bagian gerakan-gerakan yang berbeda
Lakukan secara harmonis, lakukan secara urut
Naturalisasi
Siswa dapat melakukan suatu gerakan utuh secara alami tanpa memikirkannya lebih dahulu
Kegunaan Taksonomi dalam Evaluasi
Membantu kita dalam menganalisis dan mengklasifikasikan tujuan Memberikan ide tentang pencapaian manusia seutuhnya Membantu dalam membandingkan yang cermat tentang silabi atau
kurikulum Dengan topik yang sama kita dapat mengajar menggunakan
pendekatan yang berbeda Membantu dalam prosedur evaluasi Ranah afektif membantu kita dalam mendidik siswa agar memiliki
sifat-sifat yang dapat diterima oleh norma, nilai dan bahkan falsafah hidup bangsa
Proses belajar mengajar dapat mencakup ketiga ranah, sehingga pengalaman belajar menjadi seimbang dalam rangka mencapai keseimbangan jiwa dan raga
Membantu dalam meningkatkan validitas dan reliabilitas pengetesan
4. Pendekatan dalam Perumusan Tujuan
Berdasarkan landasannya prinsip penyusunan tujuan pendidikan dapat diklasifikasikan menjadi 4 (empat), yaitu: (a) kemampuan, (b) lamanya waktu, (c) prestasi dalam kelas, (d) perilaku yang teramati dan terukur.
a. Tujuan berdasar kemampuanPendekatan ini menekankan kemampuan tertentu pada setiap ranah. Misalnya pada ranah kognitif, perumusan tujuan dapat disusun sebagai berikut:
(1) siswa memiliki pengetahuan tentang konsumsi oksigen maksimal(2) siswa dapat menyebutkan pengertian tentang faktor-faktor yang
mempengaruhi konsumsi oksigen maksimal.Pada ranah afektif, tujuan yang dimaksud berkenaan dengan sikap, minat, nilai, dan perkembangan apresiasi dan penyesiauan diri. Misalnya:
(1) siswa memiliki sikap yang positif terhadap kesegaran jasmani(2) siswa mengembangkan minatnya dalam suatu cabang olahraga
Ranah psikomotor banyak berhubungan dengan pencapaian kemampuan yang membutuhkan pemahaman dan keterampilan. Misalnya:
(1) siswa mengembangkan keterampilan dasar bola voli(2) siswa mampu mengutarakan pendapatnya dengan tata bahasa yang benar
b. Klasifikasi berdasar waktuPencapaian tujuan memerlukan periode waktu tertentu. Setiap tujuan memerlukan waktu yang berbeda untuk mencapainya. Karena itu, perumusan tujuan dapat juga dilakukan berdasar jangka waktu pencapaiannya, ada tujuan jangka pendek dan jangka panjang atau tujuan antara dan akhir.
Pencapaian tujuan pada ranah kognitif dan psikomotor relatif membutuhkan waktu yang lebih singkat jika dibandingkan dengan pencapaian tujuan pada rasnah afektif. Peningkatan prestasi balajar atau atau keterampilan tertentu dapat dicapai dalam waktu yang relatif lebih singkat daripada proses perubahan sikap, minat, dan apresiasi dalam suatu bidang. Oleh karena itu tujuan dalam ranah kognitif dan psikomotor tergolong tujuan anjgka pendek. Contoh rumusannya adalah:
(1) Siswa memperoleh pengetahuan tentang …………….(2) Siswa dapat mengembangkan pengertian tentang …………….(3) Siswa dapat menerapkan prinsip-prinsip tentang ………………
Selanjutnya tujuan dalam lingkup ranah afektif tergolomg dalam tujuan jangka panjang. Contoh rumusan tujuannya adalah:
(1) Siswa mengembangkan sikap terhadap kegiatan olahraga(2) Siswa mengembangkan minat dalam kegiatan di alam terbuka.
c. Tujuan berdasar prestasi yang dicapaiTujuan pendidikan dapat dicapai melalui metode tertentu dan pendekatan yang diterapkan dalam situasi belajar baik di kelas maupun di luar kelas. Tujuan yang dirumuskan berdasarkan prestasi yang dicapai disebut sebagai tujuan instruksional. Tujuan dalam lingkup ranah kognitif dan psikomotor termasuk di dalamnya.
Tujuan yang bermanfaat untuk mencapai sasaran akhir dari pendidikan, yakni pengembangan kepribadian dinamakan tujuan kepribadian. Tujuan dalam lingkup ranah afektif termasuk di dalam tujuan kepribadian.
d. Tujuan berdasar perilakuPerumusan tujuan berdasar perilaku dikelompokkan menjadi dua macam, yakni tujuan umum atau non-behavioral dan tujuan khusus atau behavioral.
Pada tujuan umum, rumusan yang digunakan masih agak umum, sehingga masih agak kabur. Misalnya: (1) siswa dapat menyebutkan sedikitnya 2 syarat sebagai pelatih yang bermutu, (2) siswa dapat menunjukkan 3 macam kelemahan tes objektif.
Seharusnya tujuan pendidkan harus mencakup tiga ranah yaitu kognitif, afektif,
dan psikomotor. Ketiga ranah tersebut harus merupakan satu keseluruhan yang
tidak terpisahkan dalam rangka pencapaian kualitas manusia seutuhnya. Namun
pada kenyatannya kegiatan evaluasi saat ini banyak ditujukan hanya pada
perkembangan ranah kognitif dan psikomotor daripada afektif. Nampaknya hal
ini berkaitan dengan keterampilan guru dalam hal mengevaluasi ranah afektif,
karena penilaian ranah ini sukar untuk dilakukan. Beberapa kemungkinan yang
menyebabkan sukarnya pengukuran ranah afektif di antaranya adalah:
- Guru kurang memperhatikan perumusan tujuan dalam lingkup ranah afektif, perumusannya kurang operasional.
- Guru kurang berusaha untuk menilai apakah tujuan dalam ranah afektif tercapai atau tidak.
Ukuran keberhasilan di sekolah pada umumnya adalah kemampuan pada ranah kognitif dan psikomotor. Oleh karenanya berbagai bentuk tes yang dipakai misalnya untuk mempromosikan siswa ke tingkat kelas yang lebih tinggi selalu digunakan tes kognitif. Buku laporan (rapor) selalu dipenuhi dengan data kemampuan kognitif dan pada setiap akhir semester atau tahun kenaikan kelas siswa yang memperoleh penghargaan adalah siswa yang berprestasi dalam kemampuan intelektual. Hal ini dapat dilihat dari kebiasaab guru menyusun peringkat siswanya. Dengan demikian tidak mengherankan kalau laporan tentang kemajuan dalam ranah afektif jarang dibuat. Padahal, ranah afektif sangat penting dalam kehidupan bermasyarakat. Contohnya, guru tidak merangsang siswanya untuk menampilkan performa dalam berbagai aspek. Siswa yang tak pernah membolos atau yang berperangai baik seharusnya dapat memperoleh penghargaan. Demikian juga siswa yang sangat aktif dalam kegiatan ekstrakurikuler.
Untuk menyempurnakan penilaian ranah afektif, kepada guru-guru disarankan agar:
Menyempurnakan tujuan ranah afektif, karena akan terkait secara langsung dengan kejelasan aspek perilaku yang akan dievaluasi.
Pendekatan yang dapat diterapkan adalah seperti apa yang dianjurkan oleh Mager (1968) yaitu gejala “respon menjauhi” atau “mendekati” hal-hal yang seharusnya, misalnya sikap positif terhadap lingkungan bersih atau sikap negatif terhadap merokok. Selanjutnya berdasarkan perilaku yang nampak guru yang bersangkutan dapat menafsirkan sikap para siswanya.
Perlu disempurnakan teknik pencatatan data, seperti observasi, sosiogram dan inventori yang dilakukan. Hal ini sangat membantu dalam pengukuran ranah afektif yang objektif.
Agar terampil dalam menulis tujuan pendidikan, perlu diperhatikan beberapa syarat sebagai berikut:(a) Perumusannya mengungkapkan tujuan yang layak, rasional, atau bahkan
Siswa mampu menguasai semua keterampilan dasar bola voli dengan koordinasi gerak yang baik.
Jika tujuan ini ditetapkan, misalnya untuk siswa SLTP, rumusan tujuan tersebut tidak realistik karena melebihi kemampuan siswa. Faktor kesiapan fisik dan psikis kurang mendukung. Tujuan di atas lebih tepat untuk mahasiswa jurusan olahraga.
(b) Perumusan tujuan harus berkaitan dengan kemampuan siswa yang dapat dicapai melalui proses belajar. Contohnya: Siswa dapat mengembangkan kemampuan mengutarakan pendapat secara lisan.
(c) Perumusan tujuan harus secara nyata mengungkapkan penguasan suatu bidang studi atau materi dari pengalaman yang akan disediakan. Contohnya:
Siswa dapat menyebutkan macam-macam vitamin yang larut di dalam lemak.
Siswa dapat menyatakan pendapatnya dengan menggunakan bahasa yang benar.
(d) Perumusan tujuan harus ditinjau dari sisi perubahan perilaku siswa. Contohnya:
Siswa mengembangkan sikap ilmiah dalam bidang olahraga
(e) Perumusan tujuan hanya mengutarakan satu kemampuan yang akan dicapai. Contoh salah:
Siswa dapat mengembangkan sikap, dan pengetahuan ilmiah serta dapat menerapkan prinsip-prinsip mekanika olahraga.
Contoh benar:
Siswa dapat menjelaskan proses perubahan karbohidrat menjadi glukosa
Siswa dapat memilih tes yang tepat untuk mengukur power siklik otot-otot tungkai
Membuang kata-kata yang khas yang sifatnya menentukan, misalnya semua, selalu, tidak pernah, tidak ada. Contoh: orang yang memiliki ukuran potongan melintang otot yang luas pasti memiliki kekuatan yang besar.
Menghindari pertanyaan yang meragukan Menghindari kata-kata yang eksak, termasuk pernyataan yang sifatnya jebakan. Menghindari pernyataan negatif ganda. Misalnya: kelentukan tidak bertambah baik jika suhu
udara meningkat. Akan lebih baik jika dirumuskan demikian: kelentukan tidak bertambah baik walaupun suhu udara meningkat.
Menghindari pernyataan yang kabur, terlampau panjang, dan penggunaan bahasa kuantitatif seperti “banyak”, “sedikit”, “tua”, “muda”.
Jika pernyataan bermaksud untuk menguji alasan tentang kebenaran atau kesalahan sesuatu, maka bagian kalimat yang pertama harus menunjukkan segi benarnya dan bagian ke dua menunjukkan alasan benar atau salahnya. Contoh: Hemoglobin merupakan unsur yang
Soal bentuk pilihan ganda
Soal bentuk pilihan ganda terdiri atas sebuat permasalahan dan sejumlah pilihan
jawaban untuk dipilih. Permasalahan biasanya dinyatakan dalam bentuk kalimat tanya
atau pernyataan yang kurang sempurna, dan disebut batang tubuh soal. Pilihan jawaban
dapat berupa kata, bilangan, simbol, atau anak kalimat. Peserta tes diharuskan
membaca batang tubuh soal dan memilih satu pilihan jawaban yang benar atau paling
benar. Jawaban yang benar atau paling benar disebut sebagai jawaban, sedangkan yang
lainnya adalah distraktor atau pengecoh.
Kebaikan soal pilihan ganda ini adalah:
dapat digunakan untuk mengukur hasil belajar dalam bidang pengetahuan, seperti
pengetahuan tentang terminologi, tentang fakta-fakta tertentu, tentang prinsip-
prinsip, tentang metode dan prosedur
dapat digunakan untuk mengukur hasil belajar dalam bidang pemahanan dan
aplikasi, seperti kemampuan dalam mengaplikasikan fakta dan prinsip, kemampuan
sukar di dalam penyusunannya dan memerlukan banyak waktu.
Agar butir soal pilihan ganda yang kita susun mempunyai mutu yang baik, di dalam
penyusunannya perlu memperhatikan rambu-rambu berikut:
RAMBU-RAMBU untuk MENYUSUN SOAL PILIHAN GANDA
Kalimat pengarah atau stem harus mengandung inti masalah Jangan menggunakan pilihan jawaban “bukan salah satu di antara yang di atas” Soal dibuat sesingkat-singkatnya Hindarkan memakai sistem negatif Arahkan peserta tes untuk mengemukakan jawaban yang paling tepat Gunakan bahasa yang mudah dipahami Penghilangan bagian pernyataan jangan pada bagian awal Gunakan urutan logis atau tata waktu, jika ada Pakailah pengecoh yang benar-benar menarik untuk mengetes penguasaan materi yang
sebenarnya Susunlah semua alternatif jawaban dengan bahasa yang ajeg, panjang, dan variasi yang tepat Alternatif jawaban sebaiknya seragam dalam hal bentuk dan struktur bahasa Alternatif jawaban antara 4 – 5 Jangan menggunakan kalimat puitis, mengulang alternatif jawaban butir lain, atau kata-kata yang
khas yang menentukan, misalnya “selalu”, “tidak pernah” Butir soal jangan disusun seperti tata urutan dalam buku sumber Jangan memasukkan sebanyak mungkin soal Butir soal diberi nomor dengan angka dan alternatif jawaban dengan huruf
Soal tipe menjodohkan
Pada umumnya soal bentuk menjodohkan terdiri atas dua kolom. Kolom yang pertama
berisi kata, bilangan, atau simbol. Kolom yang ke dua terdapat kata, kalimat, atau anak
kalimat. Butir-butir dalam kolom yang akan dicarikan pasangannya disebut premis, dan
butir-butir dalam kolom tempat mencari pasangan disebut respon. Peserta tes
diharuskan mencari pasangan pasangan yang sesuai antara butir-butir dalam premis
dengan butir-butir dalam respon.
Yang paling mudah mudah dalam menyusun adalah bila jumlah respon sama dengan
jumlah premis. Penyediaan jumlah respon yang lebih banyak daripada premis berguna
3) Item no. 3 P = 0.24) Item no. 4 P = 0.55) Item no. 5 P = 0.86) Item no. 6 P = 0.37) Item no. 7 P = 0.78) Item no. 8 P = 1.09) Item no. 9 P = 0.010) Item no. 10 P = 0.5
Langkah 3:
Menyimpulkan hasil penghitungan indeks kesukaran setiap item. Konsultasikan hasil penghitungan indeks kesukaran item dengan tabel klasifikasi indeks kesukaran. (tabel: 4.3)
median digolongkan sebagai kelompok atas dan yang di bawah median digolongkan sebagai
kelompok bawah.
Untuk sampel besar (lebih dari 100 orang)
Untuk menetapkan kelompok atas dan bawah pada sampel besar biasanya hanya
diambil 27% dari skor teratas untuk kelompok atas dan 27% skor terrendah untuk
kelompok bawah. Ambillah 27% dari skor tertinggi ke bawah untuk kelompok atas dan
27% skor terrendah ke atas untuk kelompok bawah. Cara ini dapat dilakukan bila peserta
tes tidak terlalu banyak. Namun bila peserta tes sangat banyak gunakanlah presentil
(pelajari kembali rumus presentil pada matakuliah statistik). Untuk menentukan
kelompok atas ambillah presentil ke 74 – 100 dan ke 1 – 27 untuk kelompok bawah.
Langkah untuk menghitung indeks daya beda
Sebagai contoh untuk menghitung indeks daya beda, gunakan data pada tabel 4.2.
Langkah 1:
menentukan kelompok atas dan bawah. Untuk keperluan ini lihatlah data pada tabel 1, halaman. Karena jumlah peserta hanya 10 orang, maka untuk menentukan kelompok atas dan bawah kita gunakan cara yang pertama. Urutkan dari siswa yang mendapat skor tertinggi ke terrendah. Hasilnya adalah sebagai berikut:
membuat tabel persiapan analisis indeks daya beda. Caranya sama dengan membuat tabel persiapan analisis indeks kesukaran, namun urutan nomer peserta berdasarkan urutan skor tertinggi ke terrendah.
Menghitung keberfungsian alternatif jawaban dengan cara menjumlahkan pemilih kelompok atas dan bawah, kemudian dibagi dengan jumlah kelompok atas dan bawah, hasilnya kalikan dengan 100% untuk setiap alternatif jawaban.
Kesimpulannya:
Jika hasilnya di atas 5%, maka alternatif jawaban tersebut berfungsi sebagai pengecoh yang baik, tetapi jika kurang dari 5% maka alternatif jawaban tersebut sebagai pengecoh yang jelek.
Jika pemilih kelompok atas lebih sedikit dari kelompok bawah, maka maka alternatif jawaban tersebut berfungsi sebagai pengecoh yang baik, sebaliknya jika pemilih kelompok atas lebih banyak daripada kelompok bawah, maka pengecoh tersebut jelek.
Kesimpulan: Semua alternatif jawaban untuk item ini berfungsi sebagai pengecoh yang baik karena dipilih lebih dari 5% dan pemilih dari kelompok atas lebih sedikit dari kelompok bawah
Tidak lebih dari 5% dari peserta tes yang blangko, pemilih dari kelompok atas lebih sedikit dari kelompok bawah.
2) Untuk item soal no. 2
Alternatif b
: 1 + 0 x 100% = 10%
5 + 5
Alternatif c
: 0 + 2 x 100% = 20 %
5 + 5
Alternatif d : 0 + 1 x 100
%= 10%
5 + 5
Omiet : 0 + 0 x 100
%= 0%
5 + 5
Kesimpulan: Alternatif jawaban b masih jelek, karena walaupun dilipih lebih dari 5% dari peserta tes namun pemilih kelompok atas lebih banyak dari kelompok bawah.
Alternatif jawaban c dan d sudah baik Tidak lebih dari 5% dari peserta tes yang blangko, pemilih dari kelompok
Kesimpulan: Semua alternatif jawaban untuk item ini sudah berfungsi baik karena dipilih lebih dari 5% dan pemilih dari kelompok atas lebih sedikit dari kelompok bawah
Tidak lebih dari 5% dari peserta tes yang blangko, pemilih dari kelompok atas lebih sedikit dari kelompok bawah.
Dari ketiga item yang telah dianalisis, indeks kesukaran item, indeks daya beda, dan keberfungsian
alternatif jawabannya dapat dilihat pada tabel 4.8 berikut:
Tabel 4.8: Rangkuman Hasil Penghitungan tentang Indeks Kesukaran Item, Indeks Daya Beda, dan Keberfungsian Alternatif Jawaban