gözat - Karabük Üniversitesi

5. HAFTA PFS 107 EĞİTİMDE ÖLÇME VE DEĞERLENDİRME Yrd. Doç Dr. Fatma Betül Kurnaz
[email protected] KBUZEM Karabük Üniversitesi Uzaktan Eğitim Uygulama ve Araştırma Merkezi PFS 107
ÖLÇME VE DEĞERLENDİRME
İçindekiler Standart Hata ........................................................... Hata! Yer işareti tanımlanmamış. Ölçme Aracında Bulunması İstenilen Özellikler .......................................................... 3 Güvenirlik .......................................................................................................................... 3 Güvenirlik Kestirme Yöntemleri ..................................................................................... 4 Kaynakça ............................................................................................................................ 8 KBUZEM Karabük Üniversitesi Uzaktan Eğitim Uygulama ve Araştırma Merkezi 2 PFS 107
ÖLÇME VE DEĞERLENDİRME
STANDART HATA
Standart hata (Se) ölçme işlemine karışan tesadüfi hatanın miktarını gösterir.
Ölçülen özelliğin bireyde ya da nesnede var olan gerçek değeriyle, ölçme sonucunda
elde edilen gözlenen değeri arasındaki farkı ifade eder. Standart hata bireyler
hakkında geleceğe dönük önemli kararlar alınırken kullanılır. Aşağıdaki formülle
hesaplanır.
Se: Standart hata
Sx: Standart sapma
Rx: Güvenirlik katsayısı
ÖLÇME ARAÇLARINDA BULUNMASI İSTENEN ÖZELLİKLER
Ölçme aracında bulunması istenen üç özellik vardır. Bunlar güvenirlik, geçrlik
ve kullanışlılıktır. Bu bölümde güvenirliğin anlamlarına ve güvenrilik kestirme
yöntemlerine yer verilecektir.
GÜVENİRLİK
Güvenrilik, tesadüfi hatalardan aranıklıktır. Güvenirliğin pratikteki anlamı ise
birbiri ardına yapılan denemelerden aynı sonucun elde edilmesidir. Bireyin sahip
olduğu gerçek puan değerine ulaşabilmek, Se değerinin düşük olmasıdır.
Güvenirlik araştırılırken elde edilen korelasyon katsayısı 0 ile 1 arasında
bulunur. Güvenirlik 0 ya da 1 olmaz, yani tam çıkmaz. Güvenirliğin yüksek olduğu
yorumu yapabilmek için elde edilen korelasyon katsayısının en az 0,70 ve daha
büyük olması gerekir.
Güvenirliğin anlamı olan bazı önemli kavramlar bulunmaktadır. Bunlar
duyarlık, kararlılık, iç tutarlılık ve objektifliktir. Aşağıda bu kavramlara ilişkin bilgi yer
almaktadır.
KBUZEM Karabük Üniversitesi Uzaktan Eğitim Uygulama ve Araştırma Merkezi 3 PFS 107
ÖLÇME VE DEĞERLENDİRME
Güvenirlikle İlgili Temel Kavramlar
Duyarlık
Kararlılık
Ölçme aracının
birim aralıklarının
küçük olması, bir
başka deyişle birim
sayısının fazla
olmasıdır.
Ölçme aracının
aynı gruba birden
fazla uygulanması
sonucunda elde
edilen ölçülerin
benzer olmasıdır.
Objektiflik
İçtutarlılık
Bireylere ait bir
performansın, aynı
ya da farklı
puanlayıcılar
tarafından benzer
sonuçlar
vermesidir.
Bir testi oluşturan
maddelerin
birbirleriyle uyumlu
sonuçlar
vermesidir.
GÜVENİRLIK KESTİRME YÖNTEMLERİ
Test-Tekrar Test
Aynı öğrenci grubuna, aynı testin belli aralıklarla iki kez uygulanmasını gerektirir.
Ölçülen özelliğin kararlılığı araştırıldığında ya da ölçülen özellikteki değişmenin az
olduğu düşünülen durumlarda kullanılması uygundur. Test-tekrar test güvenirliğinde
ölçülen özelliğin zamana karşı kararlılığı ve iki uygulamada elde edilen yanıtların
tutarlılığı araştırılır.
Test-tekrar test yöntemi kullanılırken; iki uygulama arasında geçen zaman
öğrencilerin soruları ve yanıtları hatırlayamayacakları kadar uzun, ölçülen özelliğin
değişmeyeceği kadar kısa olmalıdır.
Bu yöntemde güvenirliği düşüren sebepler ölçülen özelliğin zaman içinde
değişmesi, testte yer alan soruların her okumada farklı anlaşılması, uygulama
koşullarının
değişmesi,
iki
uygulama
arasında
geçen
zamanın
uygun
belirlenememesi ya da tesadüfi hatalar olabilir.
Paralel (Eşdeğer) Formlar
Aynı öğrenci grubuna; soru sayıları, soru türleri, güçlükleri, kapsamları, ölçülen
özellik, vb. her bakımdan paralel iki testin aynı gün ya da bir kaç hafta arayla
uygulanmasını gerektirir. İki formdan elde edilen ölçüler arasındaki eşdeğerlik
katsayısı araştırıldığında kullanılabilir. Ayrıca, ölçme sonuçlarının zaman içindeki
kararlığı ve yanıtların tutarlılığını da verir.
KBUZEM Karabük Üniversitesi Uzaktan Eğitim Uygulama ve Araştırma Merkezi 4 PFS 107
ÖLÇME VE DEĞERLENDİRME
Bu yöntemde güvenirliği düşüren sebepler iki uygulama arasında geçen
sürenin çok kısa tutulması ya da formların arka arkaya uygulanması, iki formun
birbirine eşdeğer olmaması, formların arka arkaya uygulanması sonucunda birinci
uygulamanın ikinci uygulamayı etkilemesi oabilir.
Bilişsel alan sınıflamasında daha alt boyutlarda (bilgi, kavrama gibi) paralel
sorular yazmak daha kolayken, üst düzey becerileri yoklayan paralel soru hazırlamak
daha güçtür.
Paralel formlar güvenirliğinde ise, iki formdan elde edilen yanıtların tutarlılığı,
iki formun eş değerliliği ve ölçülen özelliğin zamana karşı kararlılığı araştırılır.6
Testi Yarılama
Bir test tek oturumda bir grup bireye uygulanır. Test eşit iki parçaya bölünür.
Bireylerin birinci yarı ile ikinci yarıdan aldıkları puanların ilişkisi araştırılır. İki yarıya
bölünen testin her iki yarısının birbirine paralel olduğu ve ortalamaları ile
varyanslarının eşit olduğu varsayılır. Bireylerin testin iki yarısından elde ettikleri
puanların korelasyonu eşdeğerlik katsayısı olarak adlandırılır. Testin iç tutarlık
katsayısının bir ölçüsüdür.
Bu
yöntemde
testin
iki
yarısının
kapsam
bakımından
eşitliğinin
sağlanamaması, iki yarının güçlüklerinin eşit olmaması, yanıtlayıcının yorgunluğu,
sınav ortamı gibi tesadüfi değişkenlerin test boyunca aynı kalmaması güvenirliği
düşürebilir.
Eşdeğer yarılar güvenirliği kapsam tutarlılığına ilişkin bilgi sağlar. Testteki
maddeleri iki yarıya bölerken; eğer bu başarı testi gibi kapsam bakımından farklı
maddelerden oluşmuş bir testse tek numaralı maddeler bir yarı, çift numaralı
maddeler diğer yarı alacak biçimde ayrılabilir. Test kapsam bakımından farklı
maddelerden oluşmuyorsa maddeler tesadüfi çekilerek yarılar oluşturalabilir.
Test eşdeğer iki yarıya bölündükten sonra, yarılardan elde edilen puanlar arasındaki
korelasyon hesaplanır. Elde edilen bu katsayı yarıların güvenirliğini verir. Testin
tümüne ilişkin güvenirlik katsayısı ise 2r /(1+r) formülü ile belirlenir.
KBUZEM Karabük Üniversitesi Uzaktan Eğitim Uygulama ve Araştırma Merkezi 5 PFS 107
ÖLÇME VE DEĞERLENDİRME
KR 20 ve KR 21
Doğru yanıta “1”, yanlış yanıta “0” puan verilen yani kategorik puanlanan
testlerin iç tutarlılığını kestirmede kullanılır. KR 20 ve KR 21 güvenirliği testin içtutarlık
katsayısının bir ölçüsüdür.
KR 20 iç tutarlılık katsayısı, testte yer alan her bir maddenin madde güçlük
indekslerinin bilinmesi ya da hesaplanabilmesi durumunda kullanılır. Madde güçlük
indekslerinin bilinmediği ya da hesaplanamadığı durumlarda KR 21 iç tutarlılık
katsayısı kullanılır.
Bu yöntemde testi yanıtlayan bireylerin %90-95’inin tüm soruları yanıtlaması
istenir.
KR 21, madde güçlüklerinin eşit olduğu varsayımına dayandığı için, testi
oluşturan madde güçlükleri arasındaki farklılıklara duyarlı değildir. Bu nedenle KR 21,
KR 20’den düşük çıkma eğilimindedir.
KR 20 ve KR 21 güvenirliğinin yüksek çıkması durumunda, testi yanıtlayan
grup heterojendir, testi oluşturan maddeler homojendir, madde örnekleminden
kaynaklı hata azdır, test tek boyutludur yorumları yapılabilir.
Cronbach Alfa
Test, ağırlıklı ya da çok kategorili puanlanan maddelere sahipse kullanılır.
Likert tipi tutum ölçeklerinin, dereceleme ölçeklerinin ya da ağırlıklı puanlama
gerektiren yazılı yoklamaların içtutarlığını hesaplamada kullanılabilir.
Cronbach α güvenirliği yüksekse, iç tutarlılık yüksektir. Testi yanıtlayan grup
heterojendir, testi oluşturan maddeler homojendir, madde örnekleminden kaynaklı
hata azdır, test tek boyutludur.
Güvenirliği Etkileyen Faktörler

Açık ve anlaşılır bir dil kullanılması güvenirliği artırır.

Yazım ve imla kurallarına uygunluk güvenirliği artırır.

Soruların öğrenci düzeyine uygunluğu güvenirliği artırır.

Orta güçlükte ve ayırıcı olan sorular güvenirliği artırır.
KBUZEM Karabük Üniversitesi Uzaktan Eğitim Uygulama ve Araştırma Merkezi 6 PFS 107
ÖLÇME VE DEĞERLENDİRME

Teste ölçülen özellikle ilgili yeni sorular eklemek belli bir noktaya kadar
güvenirliği artırırken; belli bir noktadan sonra yorgunluk, motivasyon kaybı gibi
tesadüfi nedenlerle güvenirliği düşürür.

Kişi sayısı arttıkça, grup heterojen olacağından dağılım normalleşir. Ranj,
standart sapma, varyans büyür. Ayırıcılık artar. Güvenirlik artar.

Standart hata arttıkça güvenirlik düşer.

Tahminle doğru cevabı bulma olasılığı (şans başarısı) arttıkça güvenirlik
düşer.

Kağıdın düzeni, puntosunun büyüklüğü gibi etkenler dikkati etkilerse güvenirlik
düşer.

Sınav süresi, soru sayısına ve soruların güçlük düzeylerine uygun olmalıdır.

Sınav ortamı ısı, ışık, ses gibi etkenler bakımından uygun düzenlenmelidir.

Cevaplayıcıların birbirlerinden kopya çekmeleri engellenmelidir.

Sorular kolaydan zora bir sıra izlemelidir.

Puanlayıcıdan kaynaklı dikkatsizlik gibi hatalar önlenmelidir.
KBUZEM Karabük Üniversitesi Uzaktan Eğitim Uygulama ve Araştırma Merkezi 7 PFS 107
ÖLÇME VE DEĞERLENDİRME
Kaynakça Baykul, Y. (2000). Eğitimde ve Psikolojide Ölçme Klasik Test Teorisi ve Uygulaması.
Ankara: ÖSYM Yayınları.
Crocker, L ve Algina, J. (1986). Introduction to Classical and Modern Test Theory.
Florida: Harcourt Brace Jovanovich College Publishers.
Ertürk, S. (1972). Eğitimde Program Geliştirme. Ankara: Yelkentepe Yayınları.
Özçelik, D.A. (1998). Ölçme ve Değerlendirme. Ankara: ÖSYM Yayınları.
Turgut, F. (1987). Eğitimde Ölçme ve Değerlendirme Metotları. Beşinci Baskı,
Ankara: Saydam Matbaacılık.
KBUZEM Karabük Üniversitesi Uzaktan Eğitim Uygulama ve Araştırma Merkezi 8

Download Report