Mohd. Majid (1990) pula mentafsirkan bahawa kesahan sesuatu alat pengukur merujuk kepada sejauh mana alat itu mengukur data yang sepatutnya ia dikehendaki mengukur. Ini bermakna sesuatu alat yang berupaya mengukur dengan tepat sesuatu pembolehubah yang ditetapkan adalah dianggap sah sebagai alat pengukur bagi pembolehubah tersebut.
Mohd. Majid (1990) seterusnya menyatakan bahawa kesahan sesuatu alat ukuran adalah dipengaruhi oleh jenis pembolehubah. Sekiranya sesuatu pembolehubah itu berbentuk fizikal atau kuantitatif, seseorang individu boleh menentukan kesahan alat ukuran bagai pembolehubah tersebut dengan mudah. Namun begitu, sekiranya pembolehubah yang hendak diukur adalah berbentuk konsep atau gagasan iaitu berbentuk kualitatif, seseorang individu akan mengalami kesukaran untuk menentukan kesahan alat ukuran untuk mengukur pembolehubah tersebut.
Pengukuran ke atas konsep atau gagasan sebenarnya tidak dapat dilakukan secara langsung kerana konsep atau gagasan itu hanya terbentuk di dalam fikiran dan bukan merupakan sesuatu objek yang nyata. Walaupun kewujudannya tidak jelas, tetapi ia tetap wujud dan sesuatu objek atau konsep yang wujud tentulah boleh diukur.
Kesahan sesuatu alat ukuran boleh dilihat daripada tiga aspek iaitu kesahan kandungan, kesahan kriteria dan kesahan gagasan. Apabila menilai kesahan kandungan dalam alat ukuran, persoalan yang asas ialah: adakah item2 kesahan yang terkandung si dalam alat ukuran tersebut mewakili bidang yang hendak diukur? Seperti yang tercatat di dalam Standards (1974:28) yang menyatakan:
“to demonstrate the content validity of a set of test scores, one must show that the behaviors demonstrate in testing constitute a representative sample of behaviors to be exhibited in a desired performance domain.”
Ini bermakna kesahan kandungan sesuatu alat ukuran seperti juga namanya, memberi fokus kepada kandungan item2 dalam ujian. Dengan kata lain sejauh mana alat ukuran tersebut berupaya mengumpul data yang merangkumi isi kandungan sesuatu bidang yang hendak diukur. Menurut Mohd. Majid (1990) sesuatu alat ukuran dikatakan mempunyai kesahan kandungan yang tinggi sekiranya alat tersebut dapat mengukur semua isi serta kandungan bidang yang dikaji dengan berkesan.
Kesahan kandungan sesuatu alat ukuran adalah bergantung kepada skop dan objektif bidang yang dikaji. Kesahan kandungan sesuatu alat ukuran dikatakan sesuai sekiranya data atau maklumat yang dikumpulkan menunjukkan liputan menyeluruh sesuatu pencapaian terhadap sesuatu bidang.
Tujuan utama kesahan kandungan adalah untuk memastikan item-item yang terkandung dalam sesuatu alat ukuran benar2 mewakili bidang yang sepatutnya ia ukur. Guion (dalam brown 1983:136) mencadangkan lima syarat yang perlu dipenuhi sebelum ujian itu dikatakan mempunyai kesahan kandungan:
- Bidang kandungan mestilah dinyatakan dalam bentuk tingkah laku yang secara umum diterima maknanya.
- Bidang mestilah dihuraikan dengan jelas.
- Bidang mestilah relevan dengan tujuan penggunaan ujian.
- Hakim2 yang berkelayakan mestilah bersetuju bahawa bidang telah di sampel secara mencukupi.
- Gerak balas mestilah di perhati dan dinilai secara tekal.
Kesahan kriteria sesuatu alat ukuran merujuk kepada pertalian antara item2 dalam alat ukuran dengan kriteria luaran yang berkecuali. Kesahan kriteria selalunya mempersoalkan sejauh mana sesuatu alat ukuran sah mengukur kriteria yang hendak diukur? Menurut Mohd. Majid (1990) kriteria yang hendak diukur adalah kriteria yang tekal sebagaimana ditunjukkan oleh subjek di luar pengukuran. Menurut beliau lagi, kriteria yang dipilih mestilah kriteria yang benar2 mewakili dengan tepat domain atau bidang yang hendak diukur. Kesahan kriteria menekankan kepada perbandingan sesuatu skala markah atau skor dengan pembolehubah luaran atau kriteria yang diketahui atau dipercayai mengukur sifat yang hendak dikaji. Oleh itu, kriteria luaran mestilah dikenal pasti dan ditentukan bagi mengukur sesuatu gagasan yang hendak diukur.
Kriteria yang digunakan bagi menentukan kesahan kriteria terbahagi kepada dua iaitu kriteria jangkaan dan kriteria serentak. Kriteria jangkaan adalah yang ditunjukkan pada selang masa yang berbeza selepas pengukuran dilakukan ke atas kriteria tersebut. Sementara itu kriteria serentak adalah kriteria yang ditunjukkan pada masa yang sama atau hampir sama dengan pengukuran yang dikenakan ke atas kriteria tersebut. Kesahan jangkaan menurut sidek (1990) ialah kesahan yang didapati dengan mengaitkan sesuatu ujian dengan tingkah laku sebenar untuk tujuan jangkaan atau ramalan. Kesahan serentak pula adalah kesahan yang didapati dengan mengaitkan prestasi sesuatu ujian dengan prestasi ujian lain yang piawai.
Kesahan gagasan pula adalah kesahan yang didapati dengan mengaitkan andaian ukuran sesuatu gagasan atau kuantiti hipotetikal dengan sesuatu tingkah laku atau manifestasi yang dijangkakan akan berlaku (Tuckman, 1978). Menurut Mohd. Majid (1990) kesahan gagasan sesuatu alat ukuran merujuk kepada sejauh mana alat itu menghasilkan gerak balas yang mewakili gagasan yang diukur. Sesuatu alat ukuran yang mempunyai kesahan gagasan yang tinggi akan menunjukkan wujudnya kekuatan sesuatu konsep dalam gagasan yang diukur.
Untuk menentukan kesahan gagasan sesuatu ujian atau alat ukuran, penyelidik perlu mendefinisikan makna sesuatu gagasan atau kontrak yang dikaji terlebih dahulu. Gagasan adalah sekumpulan konsep yang ada difikirkan yang tidak wujud di alam nyata, yang mana tiap2 gagasan mengandungi konsep2 yang kompleks yang terdiri dari berbagai2 faktor yang berinteraksi sesama sendiri. Oleh kerana gagasan adalah sesuatu yang tidak dapat dilihat, maka pengukuran ke atasnya juga tidak dapat dilakukan secara langsung. Selepas sesuatu gagasan didefinisikan, penyelidik perlu mengenal pasti sama ada alat ukuran yang dibentuk bagi mengukur sesuatu gagasan memperlihatkan wujudnya hubungan antara gagasan dengan hasil jangkaan. Analisis faktor adalah satu kaedah berstatistik yang boleh digunakan untuk membentuk sesuatu gagasan boleh ditentukan dan dikenal pasti.
Kesahan gagasan merupakan suatu aspek terpenting kesahan alat ukuran terutamanya yang berkaitan dengan penyelidikan sains sosial dan pendidikan. Ini adalah kerana kebanyakan pembolahubah yang terlibat di dalam penyelidikan sains sosial dan pendidikan adalah dalam bentuk gagasan.
Permasalahan yang biasanya timbul ialah apakah aras yang boleh diterima? Dalam hal ini, brown (1983:128) menyatakan; oleh kerana keadaan semula jadi kesahan yang mengkhusus daripada segi situasi, pekali kesahan yang berbagai2, dan terlalu banyak faktor yang mempengaruhi pekali kesahan, adalah tidak mungkin seseorang itu untuk memberikan jawapan yang tepat. Dalam hal ini beliau seterusnya menyatakan; seseorang itu hanya boleh menentukan beberapa keperluan minimum, antaranya ialah:
- Hubungan antara kesahan silang dengan peramal dan kriteria mestilah signifikan secara statistik, iaitu lebih daripada hubungan yang disebabkan oleh peluang atau nasib.
- Penggunaan ujian mestilah menghasilkan keputusan yang lebih tepat.
- Ujian mestilah mempunyai beberapa kegunaan iaitu ia mesti memberikan faedah kepada pengguna.
- Keberkesanan dalam memberi keputusan dengan menggunakan ujian mestilah lebih baik berbanding dengan penggunaan lain-lain alat yang ada; iaitu ujian mestilah memberikan beberapa maklumat yang unik.