-
2014 Dr. Ferlis bin Bullare @ Bahari
PENGUKURAN, KESAHAN (VALIDITY)
DAN KEBOLEHPERCAYAAN (RELIABILITY) INSTRUMEN
Dr. Ferlis Bin Bullare @ Hj. Bahari
Pensyarah Kanan/Ketua
Unit Penyelidikan Psikologi & Kesihatan Sosial
Universiti Malaysia Sabah
Tel (O) : 088 320 000 (8979)
H/P : 016 520 2070
e-mel : [email protected]; [email protected]
A. PENGUKURAN
1. Edward L. Thorndike, seorang ahli psikologi, berkata bahawa:
... jika sesuatu itu wujud, maka ia wujud dalam sesuatu amaun. Jika
ia
wujud dalam suatu amaun, maka ia boleh diukur. Demikianlah
data atau khususnya pembolehubah.
2. Kerlinger (1973) mentakrifkan pembolehubah sebagai satu
simbol yang diberikan perangkaan atau nilai.
3. Pembolehubah yang dikumpul boleh dikod dan kemudiannya
dikomputerkan.
4. Kerlinger (1973) membahagikan pemboleh ubah kepada dua
jenis:
(i) Pemboleh ubah bebas dan terikat (ii) Pemboleh ubah
berterusan dan kategorikal
mailto:[email protected]:[email protected]
-
2014 Dr. Ferlis bin Bullare @ Bahari
5. Pemboleh ubah bebas dinyatakan sebagai pemboleh ubah yang
menyebabkan berlakunya pemboleh ubah terikat; ia juga
melibatkan
kesan atau pengaruhnya ke atas pemboleh ubah terikat.
6. Pemboleh ubah berterusan mengambil nilai perangkaan berjulat.
Misalnya umur memperlihatkan perbezaan seorang bayi berumur
dua bulan dengan seorang tua berumur 70 tahun.
7. Pemboleh ubah kategorikal mempunyai ukuran berbentuk nominal,
iaitu objek dimasukkan ke dalam satu kategori yang ditentukan.
Misalnya jantina (lelaki dikodkan dengan nombor 1 dan
perempuan
dikodkan dengan nombor 2). Komputer tidak membezakan antara
peringkat-peringkat ukuran yang berlainan seperti contoh umur
dan
jantina di atas. Komputer akan memproses sebarang jenis
angka
yang diberikan kepadanya tanpa membezakan sama ada sesuatu
ukuran itu bersifat mutlak (umur) atau bersifat sembarangan
(jantina).
8. Mengukur pemboleh ubah bererti memberi angka kepada objek,
kejadian atau manusia mengikut aturan tertentu (Stevens, 1951).
Cohen & Nagel (1934) mendefinisikan ukuran sebagai
mengkorelasi
entiti yang bukan angka dengan angka.
-
2014 Dr. Ferlis bin Bullare @ Bahari
9. Lazimnya terdapat EMPAT (4) peringkat pengukuran/ skala
pengukuran:
(i) Nominal atau kategori (Nominal)
Setiap nilai yang diberikan sebagai kategori tersendiri (label
dan tanda semata-mata).
Tidak boleh melakukan operasi aritmetik (menjumlah, menolak,
mendarab dan membahagi) terhadap data angka
tersebut kerana hasilnya tidak memberi apa-apa makna.
Contohnya jantina (1 = lelaki; 2 = perempuan);
Contohnya Etnik (1 = Melayu; 2 = Kadazan; 3 = Bajau; 4 = Murut;
5 = Bisaya; 6 = Iban; 7 = Lain-lain)
Statistik perihalan (mod dan frekuensi) boleh digunakan untuk
memerihalkan pembolehubah yang diukur. Statistik
tak berparameter (ujian khi kuasa dua dan ujian binomial)
sesuai digunakan menganalisis data yang melibatkan skala
nominal.
(ii) Ordinal atau darjah (Ordinal)
Untuk pembolehubah yang boleh diatur atau disusun mengikut
pangkat atau darjah.
Jarak antara dua paras ukuran masih belum diketahui. Kita tidak
ketahui berapa tingginya SES kelas atasan daripada SES kelas
menengah atas atau antara kelas menengah atas dengan
menengah
bawah. Kita Cuma tahu SES kelas atasan lebih tinggi daripada
kelas
-
2014 Dr. Ferlis bin Bullare @ Bahari
menengah atas, yang lebih tinggi pula daripada kelas
bawahan.
Tidak lebih daripada itu.
Dengan kata lain, susunan pangkat yang dibuat hanya memberikan
kategori manakah yang tinggi atau rendah dan BUKAN berapa
banyakkah ia lebih besar, lebih baik atau lebih tinggi
dipilih
berbanding kategori lain.
Kita tidak boleh melakukan apa-apa operasi aritmetik.
Namun, statistik yang sesuai untuk menghuraikan kecenderungan
memusat untuk kategori-kategori dalam skala ordinal ialah
penengah dan mod.
Bagi menentukan perbezaan antara kategori-kategori dalam skala
ordinal, ujian-ujian statistik tak parametrik yang sesuai
digunakan
seperti Ujian Kolmogorov-Smirnov, Ujian Larian Satu Sampel,
Ujian Tanda, Ujian Wilcoxon, Ujian Median, Ujian
Mann-Whitney,
Ujian Wald-Wolfowitz, Ujian Friedman dan Ujian
Kruskal-Wallis.
Untuk menentukan perkaitan antara pembolehubah, pekali korelasi
pangkat Spearman dan pekali korelasi pangkat Kendall sesuai
digunakan.
Contohnya, jawapan berbentuk skala Likert iaitu, 1 = sangat
tidak setuju;
2 = tidak setuju; 3 = tidak pasti; 4 = setuju; 5 = sangat
setuju
Contoh lain ialah status ekonomi social (SES) seseorang iaitu, 1
= kelas
atasan; 2 = kelas menengah atas; 3 = kelas menengah bawah; 4
= kelas bawahan
-
2014 Dr. Ferlis bin Bullare @ Bahari
(iii) Sela atau selang (Interval)
Pengukuran yang menggunakan skel sela tidak mempunyai titik
sifar yang mutlak (nilai sifar sebenar), misalnya sukatan suhu
Celsius dan
Fahrenheit.
Operasi aritmatik (campur dan tolak) boleh dilakukan ke atas
cerapan skala sela. Skala sela adalah skala pertama yang
bersifat
kuantitatif.
Semua statistik parametrik umum (min, sisihan piawai dan pekali
korelasi Pearson) boleh digunakan.
Angka sela boleh dijumlah dan ditolak antara satu sama lain,
misalnya kita boleh mencampurkan suhu beberapa tempat di
Malaysia pada hari tertentu dan mengira puratanya. Namun
kita
tidak boleh mengira nisbah dua suhu kerana kita tidak boleh
membahagi angkubah yang bersifat sela. Dengan kata lain,
operasi
bahagi dan darab tidak boleh dilakukan bagi data sela
(interval).
Contohnya 32F31F=1F. Jarak 1 darjah ini sama dengan 1 darjah
bagi perbezaan 85F84F atau 78F77F. Tapi salah sama sekali jika
kita mengatakan bahawa haba 100F bernilai dua kali ganda
haba
yang ada pada 50F.
-
2014 Dr. Ferlis bin Bullare @ Bahari
(iv) Nisbah (Ratio)
Pengukuran secara nisbah mempunyai sifat pengukuran sela, dengan
ditambah satu sifat lagi, iaitu titik sifar mutlak sudah dapat
ditakrifkan baginya (ataupun mempunyai nilai sifar sebenar).
Contohnya, markah pelajar bagi subjek Matematik dalam
peperiksaan antara 0 hingga 100. Angka 0 merupakan sifar
yang
sebenar kerana pelajar yang mendapat markah 0 menunjukkan
mereka menjawab salah dalam semua soalan.
Apabila ada titik sifar yang mutlak, semua operasi aritmetik
dapat dilakukan. Misalnya timbangan berat, jarak jauh, umur,
keluasan
tanah, jumlah pendapatan (RM).
Misalnya berat badan seorang kanak-kanak 30kg semestinya
melebihi berat badan seorang yang berat badan 15kg sebanyak dua
kali ganda (30/15=2).
Contoh lain ialah pendapatan sebanyak RM 4,000 sebulan adalah
RM1,000 lebih tinggi daripada pendapatan RM3,000 sebulan.
Pendapatan RM 5,000 sebulan ini adalah dua kali lebih tinggi
daripada RM2,000. Oleh yang demikian, semua operasi
aritmetik
(campur, tolak, darab dan bahagi) boleh digunakan bagi data
nisbah
(ratio).
-
2014 Dr. Ferlis bin Bullare @ Bahari
B. KESAHAN (VALIDITY)
B1 Pendahuluan
1. Kesahan sesuatu alat pengukuran merujuk kepada sejauh mana
alat itu mengukur data yang sepatutnya ia dikehendaki mengukur.
2. Anastasi (1967) mendefinisikan kesahan sebagai satu ujian
yang menekankan tentang apa yang hendak diukur dan sejauhmana
ia
boleh berbuat demikian.
3. Kerlinger (1973) menyatakan bahawa kesahan alat ujian
mempunyai ciri-ciri kestabilan (stabiliti), konsistensi, keramalan
dan ketepatan.
4. Sekiranya data yang dikehendaki ialah ketinggian pelajar,
alat ukur yang digunakan mestilah dapat mengukur ketinggian pelajar
dengan
tepat. Misalnya, timbang adalah alat sah mengukur berat dan
tidak
sah digunakan untuk mengukur ketinggian. Ketinggian pelajar
sah
diukur menggunakan pembaris.
5. Persoalan utama yang perlu diambilkira tentang pengukur yang
digunakan dalam sesuatu kajian ialah:
Apakah yang alat itu telah ukur?
Adakah alat itu benar-benar mengukur apa yang kita ingin
ukur?
Adakah dengan menggunakannya, alat itu membenarkan pengutipan
data yang relevan dengan apa yang menjadi
tumpuan kajian?
6. Kesahan sesuatu alat kajian dipengaruhi oleh jenis pemboleh
ubah iaitu pemboleh ubah fizikal atau kuantitatif (ketinggian
pembaris;
berat timbang) dan kualitatif/gagasan/konsep (pencapaian,
stres,
kecerdasan, sikap, motivasi).
-
2014 Dr. Ferlis bin Bullare @ Bahari
7. Satu konsep yang digunakan dalam kajian sains sosial ialah
satu yang abstrak seperti kecerdasan. Ujian diberikan untuk melihat
tahap
kecerdasan. Adakah ujian kecerdasan ini menguji kecerdasan
seseorang? Oleh itu pengukuran bagi sesuatu yang abstrak
biasanya
menimbulkan keraguan.
8. Seperkara lagi iaitu tentang penerimaan satu ujian sebagai
sah atau tidak. Kesahan ujian bagi satu kumpulan di sesuatu tempat
tidak
semestinya sah bagi ujian lain di tempat berasingan. Misalnya
ujian
kecerdasan atau kesulitan ekonomi di Afrika tidak tentu sama
keberkesanan kesahannya di negara Malaysia kerana
masing-masing
mempunyai kebudayaan dan gaya hidup yang berlainan.
9. Gronlund (1985) menyatakan bahawa perkara yang perlu diingat
semasa menggunakan kesahan ialah:
9.1 Kesahan berhubung rapat dengan keputusan ujian dan
hubungannya terhadap alat ukuran itu sendiri.
9.2 Kesahan sepatutnya tidak dilihat dari segi sah atau tidak
sah tetapi
dari segi darjah kesahannya sama ada tinggi, sederhana atau
rendah.
9.3 Kesahan perlu dirujuk kepada satu kegunaan yang khusus dan
ujian
tidak akan menunjukkan kesahan untuk semua tujuan.
-
2014 Dr. Ferlis bin Bullare @ Bahari
B2 Jenis Kesahan
B2.1 Kesahan Muka (Face Validity)
1. Bailey (1984) menyatakan bagi mengetahui sama ada instrumen
atau soal selidik mempunyai kesahan, penyelidik perlu tahu
bagaimana
konsep hendak diukur itu didefinisikan dan sama ada maklumat
yang dikumpulkan itu berkaitan dengan konsep itu. Kesahan
muka
adalah perkara yang perlu dipertimbangkan oleh pengkaji
sendiri,
kumpulan penyelidik ataupun pakar.
2. Kesahan muka juga dapat dinilai berdasarkan penyelidikan
pengkaji tentang konsep yang hendak diukur dan pertimbangan
berdasarkan
sama ada alat itu berjaya mendekati satu konsep itu dengan
sepenuhnya atau tidak. Jika ukuran itu mengukur satu konsep
pada
keseluruhannya, maka pengkaji berjaya dengan mengemukakan
kesahan muka.
3. Misalnya seorang penyelidik ingin membentuk instrumen kajian.
Penyelidik itu akan memberikan instrumen kepada pakar dalam
bidang yang hendak dikaji bagi dinilai sekali imbas.
Pengesahan
awal soal selidik itu memperlihatkan ciri-ciri pengukuran
yang
hendak diukur adalah merupakan kesahan muka bagi instrumen
tersebut. Dengan kata lain, apabila dilihat kali pertama,
instrumen
ini mengukur apa yang hendak diukur dan nampak sesuai.
4. Bagi mengetahui suatu alat pengukur itu mempunyai kesahan
muka atau tidak; definisi konsep yang hendak dikur serta maklumat
yang
dikumpulkan itu bersesuaian ataupun tidak dengan konsep
tersebut
perlu diketahui.
5. Contohnya, seorang pelajar ingin menjalankan kajian tentang
penyusuan susu ibu tetapi item-item atau soalan-soalan dalam
soal
selidik yang digunakan berkaitan dengan stres, maka dapat
dikatakan item-item tersebut tidak mempunyai kesahan muka.
-
2014 Dr. Ferlis bin Bullare @ Bahari
6. Namun, masalah yang wujud apabila tidak wujudnya kata sepakat
tentang sesuatu konsep. Misalnya percanggahan tentang sesuatu
ujian / soalan peperiksaan antara pensyarah dengan pelajar.
Pensyarah yakin bahawa ujian yang dijalankan mempunyai
kesahan
muka yang tinggi, namun para pelajar mungkin ada pendapat
tersendiri.
7. Satu isu lagi yang wujud iaitu dimensi atau gagasan sesuatu
konsep itu berubah dari semasa ke semasa.
8. LATIHAN 1: Tentukan dan kenal pasti kesahan muka bagi
IKSOKU-F.
B2.2 Kesahan Kandungan (Content Validity)
1. Ia adalah kesahan kedua selepas kesahan muka. Ia lebih
mendalam di mana soal selidik akan dipastikan memang mengukur
konsep-
konsep yang hendak diukur. Contohnya pengukuran kepuasan
kerja meliputi pelbagai komponen seperti gaji, rakan
sekerja,
pangkat, penghargaan, pengiktirafan dan sebagainya. Oleh
itu,
semua komponen ini perlu diambilkira sewaktu memilih item.
2. Item-item ini akan diperiksa dari segi perkataan, ayat, dan
istilah yang digunakan.
3. Kesahan kandungan dapat dilakukan dengan menggunakan khidmat
panel / pakar bagi menimbangkan sejauhmana instrumen itu
memenuhi piawaian. Cadangan pakar dalam bidang yang diukur
perlu bagi tujuan pembaikan, pembetulan, penambahan ataupun
pengurangan ke atas skala dan item dalam soal selidik yang
digunakan.
-
2014 Dr. Ferlis bin Bullare @ Bahari
4. Guion (dlm. Brown, 1983) mencadangkan lima syarat yang perlu
dipenuhi sebelum sesuatu ujian itu dikatakan mempunyai kesahan
kandungan:
Bidang kandungan mestilah dinyatakan dalam bentuk tingkah laku
secara umum diterima maknanya
Bidang mestilah dihuraikan dengan jelas
Bidang mestilah relevan dengan tujuan penggunaan ujian
Hakim-hakim/ panel/ pakar yang berkelayakan mestilah bersetuju
bahawa bidang telah disampel secara mencukupi
Gerak balas mestilah diperhati dan dinilai secara tekal
5. Latihan: Tentukan dan kenal pasti kesahan kandungan
(content
validity) bagi IKSOKU-F.
B2.3 Kesahan Kriteria (Kesahan Serentak & Kesahan
Peramal)
1. Kesahan ini diperolehi apabila sesuatu ujian yang dijalankan
membezakan ukuran melalui sesuatu kriteria yang ingin dilihat
dalam sesuatu soal selidik.
2. Tujuan kesahan kriteria ialah untuk menggunakan ujian sebagai
pentaksir terhadap satu tingkah laku atau sikap. Misalnya,
apabila
seseorang itu telah melalui ujian memandu dan disahkan lulus,
kita
akan mentaksirkan bahawa dia akan dapat memandu dengan baik
dan cermat.
3. Kesahan Serentak/ Selari (Concurrent Validity) : Ialah
kriteria yang ditunjukkan pada masa yang sama atau hampir sama
dengan
pengukuran yang dikenakan ke atas kriteria tersebut. Ia
digunakan
untuk mengukur sesuatu fenomena pada masa kini.
-
2014 Dr. Ferlis bin Bullare @ Bahari
Contoh 1 : Alat kajian bagi mengukur kebolehan bermain muzik
dikatakan mempunyai kesahan kriteria serentak yang tinggi jika
seseorang pelajar yang mencapai kebolehan yang cemerlang
dalam ujian tersebut juga pada masa itu boleh menunjukkan
kebolehannya bermain muzik dengan baik.
Contoh 2 : Di dalam satu kilang, seorang pengkaji telah
mendapatkan ukuran bahawa mereka yang mengikuti latihan
jasmani pada tiap-tiap pagi adalah mereka yang menunjukkan
prestasi dan dapat mengeluarkan produktiviti yang lebih
tinggi
berbanding pekerja lain. Masa yang sama, penyelia diminta
memberikan laporan samada benar bahawa pekerja yang
mengikuti latihan jasmani tersebut mencatat daya pengeluaran
yang tinggi. Jika ini betul, maka pihak kilang akan
melakukan
ujian jasmani tersebut kerana ia ada kaitan dengan daya
pengeluaran pekerja.
4. Kesahan Peramal (Predictive Validity) : Merujuk kepada
keupayaan ukuran itu meramalkan peristiwa masa akan datang atau
sejauhmanakah sesuatu /soal selidik ujian (peramal) itu
dapat
meramalkan sesuatu yang sebenar (kriteria). Bagi menentukan
kesahan ramalan, korelasi antara ujian ramalan dengan
kejadian
sebenar akan dibuat. Jika korelasi yang diperoleh tinggi,
ini
bermakna ujian itu mempunyai kesahan ramalan yang tinggi.
Contoh 1: Sejauhmana ujian percubaan SPM dapat meramal kejayaan
akademik seterusnya iaitu peperiksaan SPM sebenar.
Ujian SPM sebenar akan dibandingkan dengan ujian
percubaan SPM; yang mana penyelidik merasa yakin dapat
mengukur konstruk ini iaitu prestasi akademik di sekolah
menengah. Indeks statistik bagi kesahan ramalan ini ialah
ukuran korelasi di antara peramal (agregat dalam ujian
percubaan SPM) dengan kriteria (agregat dalam ujian SPM
sebenar).
-
2014 Dr. Ferlis bin Bullare @ Bahari
Contoh 2: Kesahan STPM sebagai pengukur kejayaan seseorang itu
dalam universiti kelak.
Contoh 3 : Apabila seseorang itu lulus dan dapat sijil memandu,
dia akan dapat memandu kenderaan dengan baik.
Namun, keadaan ini tidak selalu benar.
Contoh 4 : Majikan mengadakan ujian seperti temuduga, ujian
bertulis dan lisan bagi calon-calon yang akan diterima bekerja
di dalam syarikat/organisasi.
LATIHAN 3: Tentukan dan kenal pasti kesahan peramal
IKSOKU-F.
B2.4 Kesahan Konstruk/ Gagasan, Kesahan
Konvergens dan Kesahan Discriminant
Pengenalan
1. Gagasan (construct) merujuk kepada sekumpulan pemikiran yang
ada dalam fikiran tetapi tidak dapat dilihat objek tersebut
secara
langsung / dengan mata kasar.
2. Kesahan gagasan melibatkan hubungan di antara satu kerangka
teori yang menyeluruh supaya dapat menentukan sama ada alat
ukuran
yang digunakan mempunyai hubungan dengan konsep dan andaian
yang digunakan.
3. Kesahan gagasan digunakan bagi mengukur sifat-sifat yang
tidak dapat diukur oleh kriteria luaran, misalnya kepuasan.
Kelebihan
menggunakan kesahan gagasan ialah ia mengukur kesahan sifat
yang
tersembunyi bagi satu-satu ukuran. Ia membolehkan pengkaji
menentukan komponen satu-satu sifat yang ditunjukkan oleh
sesuatu
alat (Siti Saleha Samsuddin, 2002).
-
2014 Dr. Ferlis bin Bullare @ Bahari
4. LATIHAN 4: Uji kesahan konstruk bagi SDKSOKU-F dan SSKSOKU-F
menggunakan analisis faktor.
Kesahan Convergens
1. Cara mendapatkan kesahan ini ialah dengan mendapatkan
keputusan korelasi di antara soal selidik yang baru dibentuk
dengan
soal selidik yang lain yang telah ada yang mengukur konsep
yang
sama. Sekiranya keputusan menunjukkan hasil korelasi yang
tinggi,
maka kesahan konvergen dikatakan telah diperolehi. Ini
adalah
kerana kedua-dua soal selidik tadi mengukur konsep yang
sama.
2. Sebaliknya sekiranya keputusan korelasi rendah atau tidak
signifikan, ini bermakna soal selidik yang baru dibentuk itu
mungkin tidak sesuai dengan teori kerana tidak mempunyai
hubungan dengan konsep yang sama dalam soal selidik yang
telah
ada (piawai).
3. LATIHAN 5: Uji kesahan konvergen kedua-dua skala dengan PWB
dan SWLS dengan menggunakan korelasi Pearson.
-
2014 Dr. Ferlis bin Bullare @ Bahari
Kesahan Discriminant
1. Cara memperolehi kesahan ini ialah dengan mendapatkan
keputusan korelasi di antara soal selidik yang baru dibentuk
itu
dengan soal selidik yang lain yang telah ada yang tidak
mengukur
konsep yang sama. Sekiranya tidak ada korelasi yang signifikan
yang
dicatatkan, ini bermakna berdasarkan teori konsep dalam soal
selidik baru mempunyai kesahan diskriminan.
2. Sekiranya ada korelasi yang signifikan, ini bermakna konsep
dalam soal selidik yang baru tadi tidak mengukur apa yang hendak
diukur
kerana ia berkorelasi dengan konsep yang tidak sepatutnya
dalam
soal selidik yang ada.
3. LATIHAN 6: Uji kesahan diskriminan kedua-dua instrumen dengan
skala tertentu dengan menggunakan korelasi Pearson.
Jadual 1: Perbezaan antara Kesahan Konvergen dan Kesahan
Diskriminan
Kesahan Konvergen (KK) Kesahan Diskriminan/Divergent
(KD)
1. A construct-validated
instrument should have high
correlations with other measures
or methods of measuring the
same construct samb
1. samb but low correlations
with measure of different
constructs
2. KK baik apabila nilai korelasi
tinggi
2. KD baik apabila nilai korelasi
rendah
-
2014 Dr. Ferlis bin Bullare @ Bahari
C. KEBOLEHPERCAYAAN (RELIABILITY)
C1 Pengenalan
1. Kebolehpercayaan ialah suatu konsep yang ditujukan kepada
pengukuran atau instrumen yang digunakan oleh pengkaji terhadap
sesuatu konstruk teorinya.
2. Menurut Carmines dan Zeller (1979), kebolehpercayaan ialah
sejauhmana satu uji kaji, ujian atau prosedur kajian apabila
diulangkan akan memberikan keputusan yang sama.
3. Ia juga merujuk kepada ketekalan dalam pengukuran berkenaan
sesuatu set data yang diperoleh.
4. Kerlinger (1973) menyatakan bahawa ujian yang amat tinggi
kebolehpercayaannya mempunyai ciri-ciri stabiliti, konsistensi,
keramalan dan ketepatan.
Contoh 1 : Apabila rakan rapat anda mempunyai sikap dan tabii
yang konsisten, tepat dan dapat diramalkan, anda akan
menganggap rakan anda itu boleh dipercayai.
Contoh 2 : Jam sebagai ukuran masa. Jika sebuah jam itu sentiasa
memberikan waktu yang tepat, tekal dan stabil, kita yakin
akan tahap kebolehpercayaan jam tersebut sebagai pengukur
masa.
5. Satu pengukur yang mempunyai tahap kebolehpercayaan yang
tinggi akan mempunyai ralat yang kecil (tiada langsung). Lebih
kecil ralat,
maka lebih tinggi tahap kebolehpercayaan sesuatu pengukur
atau
alat ujian/kajian.
Misalnya dalam ujian A (jam tangan A), kita akan dapati bahawa
ralatnya ialah 10% sahaja, sementara dalam ujian B (jam tangan
-
2014 Dr. Ferlis bin Bullare @ Bahari
B), kita akan dapati ralatnya ialah 40%. Ini bermakna bahawa
sekali dalam 10 kali, jam tangan A tidak akan menunjukkan
waktu yang tepat, manakala bagi jam tangan B, 4 kali dalam
10
kali jam tangan itu akan memberikan waktu yang salah. Kita
akan lebih mengharapkan jam A daripada jam tangan B.
6. Mohd Majid Konting (1990) menyatakan bahawa kebolehpercayaan
sesuatu alat ujian boleh dipertingkat dengan beberapa cara
iaitu:
Pernyataan item yang tepat dan jelas
Item-item yang digunakan hendaklah homogenous
Arahan-arahan ujian mestilah jelas, ringkas dan padat
Mengelakkan gangguan semasa subjek menjawab ujian
Pengumpulan data dilakukan dalam keadaan yang piawai, serupa dan
terkawal.
7. Misalnya dalam sesuatu kajian, pengkaji membentuk empat item
bagi mengukur kepuasan perkahwinan di kalangan responden ibu
etnik Rungus, Sabah. Item-item tersebut dibahagikan kepada
dua
item positif dan dua item negatif seperti berikut:
V1 Saya berpuas hati dengan perkahwinan saya (+)
V2 Saya tidak berpuas hati dengan suami saya (-)
V3 Saya berpuas hati dgn kasih sayang yang suami saya berikan
(+)
V4 Saya tidak berpuas hati dgn layanan yang suami saya berikan
(-)
-
2014 Dr. Ferlis bin Bullare @ Bahari
8. Jawapan bagi item positif dan negatif yang boleh dipilih oleh
responden berdasarkan Jadual 9.1 berikut:
Jadual 9.1 Skor Bagi Item Positif dan Negatif
Item Positif (+) Item Negatif (-)
5 = Sangat Setuju 5 = Sangat Tidak Setuju
4 = Setuju 4 = Tidak Setuju
3 = Tidak Pasti 3 = Tidak Pasti
2 = Tidak Setuju 2 = Setuju
1 = Sangat Tidak Setuju 1 = Sangat Setuju
Nota: Recode boleh dibuat pada program SPSS
9. Kebolehpercayaan sesuatu alat ujian boleh diukur melalui tiga
cara iaitu:
C2 Jenis Kebolehpercayaan
C2.1 Ketekalan/Kebolehpercayaan Luaran
1. Kaedah Uji-Uji Kembali (Test-Retest)
Sesuatu ujian/soal selidik diberikan kepada responden yang sama
pada dua masa berlainan. Contohnya, ujian/soal selidik
diberikan pada hari ini, dan kemudian ujian/soal selidik
yang
sama diberikan semula seminggu kemudian kepada
responden yang sama. Ujian korelasi dilakukan dan semakin
tinggi korelasi antara dua ujian/soal selidik ini, maka
semakin
boleh dipercayai ujian/soal selidik tersebut.
Dalam kebolehpercayaan Uji-Uji Kembali, ujian yang sama
diberikan semula kepada subjek yang sama selepas satu
jangkamasa tertentu. Jangkamasa yang diberikan boleh jadi
-
2014 Dr. Ferlis bin Bullare @ Bahari
daripada beberapa minit kepada beberapa tahun (Brown,
1976).
Bila reliabiliti ujian semula ini dilaporkan di dalam test
manual, jarak masa yang digunakan mestilah dinyatakan.
Korelasi ujian kembali akan menjadi rendah jika jarak masa
terlalu lama. Perkara ini terjadi disebabkan oleh beberapa
angkubah lain seperti umur, kematangan dan pembelajaran
yang mungking mempengaruhi subjek (Anastasi, 1968).
Di samping itu pekali kebolehpercayaan juga akan menjadi tinggi
jika jangka masa yang digunakan terlalu singkat kerana
individu itu masih dapat mengingati kembali jawapan pada
item-item yang tertentu (Mehrens & Lehmann, 1978).
Namun begitu, kelesuan dan jemu pada satu ujian itu juga mungkin
mempengaruhi prestasi subjek untuk menjawab ujian
yang diberikan dan akibatnya reliabiliti akan menjadi
rendah.
Mohd Majid Konting (1990) menyatakan kaedah test-retest
merupakan kaedah bagi mendapatkan dua set markat dengan
mentadbir alat ukur yang sama ke atas subjek yang sama
sebanyak dua kali. Skor-skor yang diperoleh pada
pengukuran pertama dan pengukuran kedua dikorelasikan.
Pengkaji mengandaikan responden dapat mencapai keputusan yang
sama dalam ujian pertama dan kedua. Sekiranya kedua-
dua skor dalam ujian pertama dan kedua itu mempunyai
korelasi yang tinggi, menunjukkan alat pengukuran (alat
ujian/soal selidik) itu mempunyai kebolehpercayaan yang
tinggi.
Contoh 1 : Mesin pemberat untuk mengukur berat badan A. Dua hari
kemudian kita ukur semula berat A. Kita berharap
mendapatkan ukuran yang sama jika pengukur (mesin
pemberat) adalah dalam keadaan yang sama. Masalah yang
timbul ialah jika kita ulangi pengukuran ini 4 bulan
kemudian,
mungkin A telah mengurangkan berat badannya dengan
-
2014 Dr. Ferlis bin Bullare @ Bahari
berdiet, maka berat badannya akan lebih ringan berbanding
permulaannya. Ini tidak bermakna mesin mengukur berat
badan yang salah, tetapi yang telah berubah ialah berat
badan
A.
Contoh 2 : Soalan bertanyakan tarikh lahir responden B dan
jawapannya ialah 30 November 1947, maka pada ujian yang
kedua kita menanyakan soalan sama, sudah tentu kita akan
mendapat jawapan yang sama. Masalahnya ialah, jika
ditanya pada waktu lain, responden lupa bila tarikh
lahirnya,
maka soalan yang kita reka sebagai pengukur bukanlah salah.
Yang silap ialah jawapan responden.
TUGASAN 7: Uji kebolehpercayaan uji-uji kembali
IKSOKU-F dengan menggunakan korelasi Pearson.
2. Ujian Bentuk Selari/Setara (Parallel-Forms Coefficient)
Dalam ujian ini, pengkaji mempunyai dua ujian (2 bahagian soal
selidik), tetapi kedua-duanya mengukur perkara yang
sama. Ia ditadbir ke atas kumpulan orang/ responden yang
sama bagi mendapat hubung kait antara dua ujian.
Mohd Majid Konting (1990) menyatakan bahawa kaedah ini
menggunakan satu alat ukur yang dibina dan satu alat ukur
yang piawai. Kedua-dua alat ukur tersebut adalah setara dari
segi kandungannya tetapi mungkin berbeza dari segi
penyampaian. Kedua-dua alat ukur ditadbir pada subjek yang
sama dan skor yang diperoleh daripada kedua-dua alat ukuran
itu dikorelasikan.
-
2014 Dr. Ferlis bin Bullare @ Bahari
Perkara yang sama seperti dilakukan dalam prosedur test-retest.
Cuma perkataan dan susunan item dalam alat
ujian/soal selidik ditukar supaya nampak berbeza namun
isinya tetap sama.
Sekiranya korelasi yang dicatat tinggi, maka alat ujian/soal
selidik itu boleh dipercayai.
Masalah yang dihadapi ialah untuk menentukan supaya kedua-dua
ujian tersebut mengukur fenomena yang sama.
C2.2 Ketekalan Dalaman (Internal Consistency)
1. Menurut Brown (1984), analisis kebolehpercayaan
ketekalan dalaman merujuk kepada sejauh mana item-
item dalam sesuatu ujian saling berhubung kait. Ini
bermakna semakin tinggi korelasi antara item, semakin
tinggi kebolehpercayaan item itu.
2. Ketekalan dalaman berhubung kait dengan korelasi
purata antara item. Sesuatu ujian dikatakan seragam
sekiranya skor bagi keseluruhan item dalam ujian
tesebut adalah berkorelasi positif.
3. Bagi memaksimumkan korelasi antara item ini,
kepayahan item sepatutnya adalah sama. Jika dua item
mengukur tingkah laku yang sama tetapi berbeza dalam
kepayahan masing-masing, kedua-dua item ini
-
2014 Dr. Ferlis bin Bullare @ Bahari
dikatakan mempunyai korelasi antara item yang sangat
rendah.
4. Secara umumnya, boleh dikatakan bahawa
kebolehpercayaan sesuatu ujian itu sangat berhubung
kait dengan darjah kepayahan iaitu pelbagai item dalam
sesuatu ujian adalah berkorelasi di antara satu sama
lain.
5. Kebolehpercayaan sesuatu ujian dijelaskan sebagai satu
nombor perpuluhan positif yang melingkungi sifar
(0.00) hingga satu (1.00). Nilai 1.00 menunjukkan
kebolehpercayaan yang sempurna. Manakla 0.00
menunjukkan ketiadaan nilai kebolehpercayaan
(Aiken, 1988).
6. Anastasi (1982) menyatakan bahawa pekali
kebolehpercayaan yang memuaskan dan tinggi adalah
di antara 0.70 dan 0.90. Kaplan dan Succuzoo (2001)
pula mencadangkan nilai kebolehpercayaan dalam
lingkungan 0.70 hingga 0.80 adalah cukup baik untuk
kebanyakan penyelidikan.
7. Kerlingger (1973) berpendapat nilai kebolehpercayaan
yang tinggi ialah 0.80.
8. Terdapat pelbagai kaedah yang boleh digunakan untuk
mengukur ketekalan dalaman seperti kaedah pekali alfa
-
2014 Dr. Ferlis bin Bullare @ Bahari
Cronbach, Split Half, dan analisis varians ukuran
berulang Hoyt.
1. Alfa Cronbach
1. Pekali Alfa Cronbach (Cronbach, 1951) merupakan salah
satu
teknik yang digunakan untuk menganggarkan kebolehpercayaan
ketekalan dalaman.
2. Ianya digunakan dalam situasi di mana format jawapan adalah
lebih
daripada alternatif misalnya pilihan jawapan betul atau
salah.
3. Alfa yang disarankan oleh Cronbach dan rakan-rakan (1955)
boleh
digunakan untuk melihat kebolehpercayaan ketekalan dalaman
dan
keseragaman item bagi sesuatu ujian.
4. Anastasi (1982) menyatakan bahawa pekali Cronbach
merupakan
satu kaedah kebohpercayaan ketekalan dalaman sesuatu alat
ukuran
yang menggunakan jawapan tidak dikotomi. Kaedah ini sesuai
digunakan bagi alat ukuran yang mempunyai skala jawapan
lebih
daripada dua seperti skala likert. Formula pekali alfa
Cronbach
adalah seperti berikut:
1
N Sa SiCr
N Sa
Di mana,
Cr = pekali alfa
N = jumlah item dalam ujian
-
2014 Dr. Ferlis bin Bullare @ Bahari
Sa = varians alat ukuran
Si = varians item
TUGASAN 8: Uji kebolehpercayaan ketekalan dalaman Cronbach
alfa IKSOKU-F.
2. Berbahagi-Dua (Split-Half)
1. Menurut Anastasi (1982) kaedah split-half merupakan kaedah
yang
digunakan untuk melihat kebolehpercayaan dengan membahagikan
item-item kepada dua bahagian dan mengkorelasikan item-item
di
antara kedua-dua bahagian masing-masing dengan menggunakan
kaedah indeks ketekalan dalaman.
2. Kaedah bahagi dua dilakukan dengan menggunakan statistik
pekali
korelasi Pearson dan diperbaiki dengan menggunakan formula
Spearman Brown (Anastasi, 1982).
3. Pembahagian juga boleh dibahagikan dengan dua cara.
Pertama
ialah apabila ujian adalah panjang maka ujian tersebut
dibahagikan
kepada dua bahagian. Cara pertama ini mungkin akan
menimbulkan masalah akibat kesukaran membezakan item antara
dua bahagian.
4. Bagi mengatasi masalah ini, cara kedua perlu diaplikasikan
iaitu
dengan membahagikan ujian kepada dua berdasarkan nombor
ganjil
dan nombor genap soal selidik (Kaplan & Saccuzzo, 1993;
Murphy
& Davidshofer, 1991). Formula split half adalah sperti
berikut:
-
2014 Dr. Ferlis bin Bullare @ Bahari
2
1
RR
r
Di mana,
R = kebolehpercayaan keseluruhan item dalam ujian
r = korelasi antara item bernombor ganjil dan genap
5. Jika diteliti split half ini hanya merupakan sebahagian
daripada
keseluruhan ujian. Jadi, keseluruhan kebolehpercayaan sesuatu
alat
ujian itu perlu diubahsuai dengan formula Spearman-Brown
(1910)
seperti di bawah:
'
'1 1
llll
ll
nrr
n r
Di mana,
rII = estimate coefficient
nrII = korelasi yang telah diperolehi daripada dua
split-half
n = berapa kali item-item itu telah dibahagikan daripada jumlah
item-item
secara keseluruhannya.
6. Korelasi antara dua bahagian itu dinamakan correlation
between forms.
Pekali yang dinamakan equal length Spearman-Brown memberi
anggaran kebolehpercayaan skel lapan item
seandainya skel tersebut terbina daripada dua bahagian sama
panjang.
Satu cara lagi untuk mengukur kebolehpercayaan ialah dengan
mengira pekali Guttman split-half yang kebetulannya boleh
dilakukan serentak dalam satu prosedur.
-
2014 Dr. Ferlis bin Bullare @ Bahari
7. TUGASAN 9: Uji kebolehpercayaan ketekalan dalaman Split-
Half IKSOKU-F.
Kuder-Richardson (KR)
1. Kaedah ini berasaskan sisihan piawai alat ukur dan sisihan
piawai item-item yang berlainan.
2. Pekali kebolehpercayaan melalui kaedah ini juga dikenali
sebagai alfa Cronbach.
3. Menurut Sidek Mohd Noah (1990) dan Tuckman (1978), apabila
item-item ujian yang dibina mempunyai skor sama ada A atau B,
Salah atau Betul, Ya atau Tidak pada suatu ujian, kaedah ini
sesuai
digunakan.
Menggunakan kaedah ini, skor yang diperolehi dari setiap item
akan dikorelasikan dengan skor keseluruhan item.
C2.3 Kebolehpercayaan interrater/interscorer
1. Sesuatu kajian kadangkala perlukan rater atau pakar bagi
membuat penilaian ke atas sesuatu fenomena. Oleh kerana data
yang
diperoleh mungkin melibatkan pemerhatian, pengkategorian
ataupun temubual, maka pengkaji perlu memastikan sejauh mana
tekalnya jawapan atau maklum balas yang mereka berikan.
2. Sebagai contoh, adakah ketekalan dalam ujian memastikan sama
ada 10 jenis air yang diminum itu panas, suam ataupun biasa.
Mungkin 5 orang akan diminta menilai. Sejauhmana tekal dan
sama jawpan yang diberikan merupakan kebolehpercayaan
interrater.
-
2014 Dr. Ferlis bin Bullare @ Bahari
D. ANALISIS ITEM
D1. Pengenalan
1. Analisis item ialah satu kaedah yang digunakan bagi menilai
kualiti
item-item alat ujian dengan menggunakan beberapa cara
berdasarkan sifat yang ingin dikaji.
2. Analisis item bertujuan untuk memperbaiki sesuatu ujian
dengan
menyemak dan menggugurkan item-item yang tidak berkenaan
(Aiken 1988).
3. Alat pengukuran yang baik adalah alat pengukuran berkualiti
yang
didakwa sesuai bagi mengukur perkara yang ingin diuji. Bagi
menghasilkan item yang baik dalam alat ujian, ahli
psikometrik
biasanya akan menjalankan proses pemilihan item bagi
memastikan
item-item yang berjaya menjadi ujian yang terakhir adalah
item-item
yang dianggap berkualiti untuk mengukur sesuatu trait yang
hendak
diukur.
4. Menurut Aiken (1988), analisis item yang baik dapat
memberi
maklumat mengapa sesuatu alat ukuran itu tidak boleh
dipercayai
atau gagal menunjukkan tahap kesahan yang dijangkakan.
5. Analisis item juga dapat menunjukkan mengapa ukuran itu
boleh
dipercayai dan dapat digunakan sebagai peramal kepada
sesuatu
kriteria tetapi tidak kepada kriteria pengukuran (Murphy
&
Davidshofer, 1988).
-
2014 Dr. Ferlis bin Bullare @ Bahari
6. Hasil dari analisis item dapat memberi satu petunjuk apakah
ukuran
itu dapat difahami oleh sampel kajian (Iran Herman, 1988).
7. Murphy dan Davidshofer (1988) menyatakan bahawa sesuatu
kriteria dapat diramal dan dijangka oleh analisis item
tetapi
sesetengah pula tidak dapat diramal.
8. Allen dan Yen (1982) menyatakan bahawa sesuatu alat yang
baik
dan sesuai harus mengalami satu proses analisis item bagi
memastikan hanya item-item yang baik sahaja yang dapat
dijadikan
edisi ujian. Ini adalah penting untuk membuat kesimpulan
keputusan dalam menentukan sama ada ukuran itu sah atau
tidak
sah.
9. Anastasi (1982) menyatakan bahawa analisis item dapat
memendekkan ujian dan pada masa yang sama meningkatkan
kebolehpercayaan dan kesahan alat ujian tersebut.
10. Wolman (1973) berpendapat bahawa analisis item adalah
sesuatu penentu kepayahan, kemampuan mendiskriminasi,
ketekalan dalaman dan kebolehpercayaan item-item di dalam
ujian.
Ia juga merupakan penentu kesahan item.
-
2014 Dr. Ferlis bin Bullare @ Bahari
D2. Indeks Kepayahan Item
1. Kepayahan item didefinisikan sebagai kebolehan individu
menjawab
betul sesuatu item (Anastasi, 1982). Sesuatu item yang senang
akan
menghasilkan peratus jawapan yang tinggi. Item yang terlalu
susah
pula akan menunjukkan nilai peratus jawapan betul yang
rendah.
2. Kedua-dua keadaan tersebut sama ada item yang terlalu senang
dan
terlalu susah adalah bentuk item yang kurang baik untuk
dijadikan
ujian terhadap sesuatu tret.
3. Sesuatu item ujian yang baik dan ideal diperolehi sekiranya
jawapan
dapat menunjukkan 50% jawapan betul dan 50% jawapan salah.
D3. Indeks Kebolehpercayaan Item
1. Indeks Kebolehpercayaan item melihat fungsi keperbezaan
dan
serakan markat item dan juga korelasi di antara markat item
dengan
keseluruhan ujian. Secara formula indeks ini ialah hasil darab
di
antara item dengan markat keseluruhan. Jumlah keseluruhan
markat dianggap sebagai kriteria dalam sesuatu item.
Formulanya
adalah berikut:
kl i itI SP r
-
2014 Dr. Ferlis bin Bullare @ Bahari
Di mana,
Iki = indeks kebolehpercayaan item
spi = sisihan piawai item.
rit = korelasi item dengan keseluruhan item.
D4. Indeks Kesahan Item
1. Indeks kesahan item diperolehi dengan mengkorelasikan
markat
item dengan markat pembolehubah kriterium (ric). Indeks
kesahan
item adalah hasil darab sisihan piawai item sebagai petunjuk
keperbezaan dan serakan dengan korelasi item dengan
kriterium.
Formulanya adalah seperti berikut:
icISi SP r
Di mana
Isi = Indeks Kesahan item
Spi = Sisihan piawai item
ric = Korelasi item dengan kriterium.