Ölçme ve Değerlendirme 2 Kapsadığı Konular 1

ÖLÇME ve DEĞERLENDĠRME ( 1 )
Bilimsel AraĢtırma Yöntemleri
Ölçme ve Değerlendirmenin Temel Kavramları
Ölçme Araçlarında Bulunması Gereken Özellikler
ÇalıĢma ve Yapılandırma soruları
ÖLÇME ve DEĞERLENDĠRME ( 1)
1.
2.
3.
4.
Alpay KÖSE
Ölçme ve Değerlendirme 2 Kapsadığı Konular
BĠLĠMSEL ARAġTIRMA YÖNTEMLERĠ
Bu dergide geçen konuları birçok yayında GeliĢim Psikolojisi baĢlığında iĢlendiği dikkatinizi çekmiĢtir. Ben bu
konuyu Ölçme ve Değerlendirme kapsamında ele alacağım. Ancak bahsettiğimiz Ģeylerin psikolojide kullanılan araĢtırma
yöntemleri olduğunu unutmayın. Neden burada anlatıyoruz; burada bahsettiklerimizle ölçmede bahsedeceklerimiz sıkı iliĢkili.

Ayrıca burada bahsedeceklerimiz her alanda karşınıza çıkabilir ( Rehberlik – öğretim – gelişim vs) Önemli bir konudur.
Hakim olmanızda fayda var.
Önceleri daha çok yüksek lisans öğrencilerine verilen bilimsel araĢtırma yöntemleri dersi artık birçok üniversitede lisans
düzeyinde de verilmektedir. Bu yüzden ÖSYM konu ile ilgili soru sormaya baĢlamıĢtır. Konu olduça önemlidir. Birkaç kısmı
dıĢında oldukça da kolaydır.
EĞĠTĠM PSĠKOLOJĠSĠNDE KULLANILAN ARAġTIRMA YÖNTEMLERĠ
Betimsel YaklaĢımlar
Deneysel Yöntemler
Betimsel araĢtırma, belli durumlara
iliĢkin
ayrıntılı
bilgi
toplayan
çalıĢmalardır ve sıklıkla tarama,
görüĢme, kayıt tutma, gözlem, testler,
anket, örnek olay, vaka incelemesi, ya
da bunların birleĢimi kullanılır.
Bağımlı değiĢken
Bağımsız değiĢken
Ara değiĢken
Deney grubu
Kontrol grubu

Plasebo DeğiĢkeni ve Placebo Grupları
Deneysel
ya
da
ilişkisel
( korelasyon) çalışmaları kadar
bilimsel bir nesnelliğe sahip olmasa
da bu zayıflığını, zengin ayrıntı ve
yorumla kapatır. Yani Betimsel
yaklaşımlar bize ayrıntılı bilgiler
sunarken çok bilimsel yöntemler
değildir.
ĠliĢkisel Yöntem ( Korelasyon)
Yüksek korelasyon
DüĢük korelasyon
ĠliĢkisizlik ( Nötr)
Bilimsel Yöntemin AĢamaları
1.
2.
3.
4.
Çözülecek problemleri ya da araĢtırmada yanıtlanacak soruları belirleme
Sınanacak önermeler Ģeklinde denence ( hipotez) geliĢtirme
Önermelerin doğrulunu ya da yanlıĢlığını belirlemek için araĢtırma yaparak denenceleri test etme
AraĢtırmada elde edilen sonuçları bir kuram Ģekilde ifade etme
A. BETİMSEL YÖNTEMLER
Gözlem: Bireyin kiĢi, eĢya ve olaylar hakkındaki
gözlemlerini
sayısal olarak belirlemeye çalıĢan
yöntemlerdir.

Gözlem kendi içinde kendiliğinden oluĢan ( doğal) ya
da bilinçli olarak hazırlanan ( Sistematik) olayları
belirlenen sırada, sistematik ve amaçlı bir Ģekilde
incelemektir.
Bilimsel gözlem sistemli ve amaçlı yapılır. Yani
ister doğal gözlem ister sistematik gözlem olsun tüm
gözlemler sistemli ve amaçlıdır. ġayet gözlenecek olayı
gözlemci tasarlamıĢsa ( deney – laboratuvar ortamında
olduğu gibi ) bu sistematik gözlemdir. Ancak doğadaki
kuĢların yuva yapma davranıĢlarını gözleyen bir
gözlemci de bu gözlemlerini sitemli Ģekilde kaydeder ve
bir amaçla bu gözlemi yapar.Ancak bu sefer ortama
müdahale etmez buna da doğal gözlem denir.
Doğal Gözlem: Çoğu geliĢimcinin tercih ettiği yöntem doğal
gözlemdir. Doğal gözlem insanları kendi doğal ortamlarında (
örneğin evde, okulda ya da oyun alanında) günlük etkinliklerini
yaparken gözlemlemek ve hipotezleri test etmektir. Gözlemci
kendi duyu organları ile bunu yapabileceği gibi teknolojik kayıt
cihazları ( kamera vs) kullanabilir.

Gözlemlerde her davranıĢ kayda alınmaz; önemli
davranıĢlara dikkat edilir. Örneğin “Çocuklarda
saldırganlık davranıĢlarını inceliyorsak bu tip ya da
saldırganlıkla ilgili davranıĢları kayda alınırken, önemsiz
Ģeyler kayıt altına alınmaz”
Bu yöntemin iki önemli faydası vardır; birincisi sözel
beceriler gerektiren yöntemlerle incelenemeyen bebeklere
kolayca uygulanması ve insanların ( gözlendiklerinden
haberdar olmadıkları için) günlük yaĢamlarında gerçekten
nasıl davrandıklarını ortaya koyabilmesidir.
Etnografya: AraĢtırmacının bir kültür ya da alt kültürün
kendine özgü değerlerini, gelenek ve sosyal süreçlerini anlamak
için o kültürün üyeleriyle yaĢayarak ve yoğun gözlemler
yaparak ve notlar tutarak yaptığı araĢtırma yöntemidir.


Aylar hatta yıllar boyu sürebilir. Örneğin Afrika‟da bir
kabilenin dilini araĢtıran bir araĢtırmacı orada 4 yıl kalmıĢ
ve o kabile üyeleri ile yaĢamıĢtır. Bu yönüyle baktığımızda
gerçekleĢen durum doğal bir gözlemdir.
Sınırlı yanları ise araĢtırmacının o kütlüde dönük
önyargılarının araĢtırmanın nesnelliğini zedelemesi ve elde
edilen bulgular sadece o kültüre özgü olması diğer
kültürlere genellenememesi.
Sistematik Gözlem ( YapılandırılmıĢ Gözlem) :
AraĢtırmacının deneğin tepkilerini bir laboratuvar ortamında
gözlemlediği ve ilgilenilen davranıĢın ipuçlarını topladığı bir
gözlem türüdür.
Örneklemdeki her katılımcı, aynı uyarıcıya
maruz kalır ve böylece hedef davranıĢı
göstermede eĢit fırsatlara sahip olurlar.
KoĢullar herkes için aynıdır.


YapılandırılmıĢ gözlemde her katılımcı, araĢtırılacak
davranıĢa ipucu olabilecek bir ortama
( gözlemci
tarafından düzenlenmiĢ bir ortama – laboratuvar – özel
düzenlenmiĢ bir ortam) konur. Sonra gizli bir kamera ya da
tek yönlü bir ayna (Ġçerden bakındığında dıĢarının
görülmediği - ayna sanıldığı ; filmlerde polislerin durduğu
ve içerdeki zanlıyı gözlemledikleri aynalı camlar) ile
gizlice gözlenir. Yani gözlenen gözlendiğinin farkına
varmaz.
Doğal ortamda sıkça gösterilmeyen davranıĢların
araĢtırılmasında kullanılır.
Sistematik gözlemler doğal gözleme göre daha
ekonomiktir. Yine sistematik gözlemlerde sonuca daha
çabul eriĢilir.
Testler: Psikologlar bireylerin zeka, baĢarı, mesleki ilgi, yetenek ve kiĢilik gibi belirli özelliklerini ölçmek için çok çeĢitli
testler geliĢtirmiĢlerdir. Bilimsel araĢtırma yapılırken testler kullanılır.

Testlerin geçerli ve güvenilir olması Ģarttır. Örneğin bir zeka testinden beklediğimiz matematik bilgisini ölçmesi değil
zekayı ölçmesidir. Ve bu ölçümleri yaparken , tutarlı ve kararlı olması gerekir. ( Ġlerde geçerlik ve güvenirlik konusunda
ayrıntılı iĢleriz. )
Anket ( Survey): Anketler, yaĢça büyük çocuklar ve ergenlerden bilgi toplamak üzere kullanılır ( GeliĢim psikolojisi için )
AraĢtırmaya katılanlardan daha önceden hazırlanmıĢ sorulara yanıt vermeleri beklenir.
Anketler bilimsel araĢtırma amaçlı herkese uygulanır. Ancak program geliĢtirme dersinde göreceğimiz anketler
Programın Ġhtiyaçlarını saptama amaçlı kullanılır. Bu yüzden program geliĢtirme çalıĢmalarında anketler sadece
uzmanlara uygulanır. Ġki durumu karıĢtırmayalım !!!

Anketler, çok sayıda kiĢinin oldukça kolay bir Ģekilde posta yoluyla ya da en az düzeyde maliyetle incelenmesi
taranması) olumlu bir yönüdür.
(
Anketlerde çok sayıda soru bulunur. Soru listeleri ise; verilerin hızlıca ve kolayca elde edildiği anketin kısaltılmıĢ
formlarıdır.
Vaka ( Olay ) Ġncelemesi: Bir kiĢinin özel olarak ve çok detaylı davranıĢ boyutlarında incelenmesidir. Yani kapsam çok
geniĢ değildir; bir durum üzerinde derinliğine inceleme söz konusudur.




Bireyin yaĢamındaki önemli olaylar derinliğine incelenir. ( Örneğin bireyin çocukluk döneminde duygusal geliĢimine
yönelik bazı olaylar çok derin bir Ģekilde incelenir – analiz edilir.)
Bilirsiniz ki psikologlar sizin çocukluğunuza bir inelim derler ve çocukluk döneminizi derinliğine incelerler iĢte o esnada
yaptıkları vaka incelemesidir. Sizin çocukluğunuzdaki önemli olayları derinliğine inceliyorlardır. Bu durum bir sınırlılığı
ortaya koyuyor. Vaka incelemelerinde elde edilen sonuçlar diğer bireylere genellenemez. Çünkü ele alınan olaylar o
kiĢiyi ilgilendirmektedir.
Freud ve Darwin çalıĢmalarında bu yöntemi kullanmıĢlardır:
Vaka çalıĢmaları TEK BĠR KĠġĠ üzerine de yapılabilir.
Örneğin: Freud’un yaklaĢımına getirilen eleĢtirilerden biri, duygusal yönden rahatsızlığı olan hastaların
yaĢamlarından verilerin elde edilmesi ve bu verilerin genel evreni yansıtmamasıdır. Bu nedenle olay incelemelerinden
çıkarılan sonuçlar diğer araĢtırma teknikleri kullanılarak desteklendiğinde geçerli kabul edilmelidir
.
Vaka incelemesi yapmadan önce kiĢinin kimlik bilgilerinden aile bilgisine, yeteneklerine, ilgilerine, arkadaĢ çevresine,
geçirdiği hastalıklara kadar birçok konuda kiĢi hakkında bilgi toplanır. Bu toplanan bilgilerin hepsine VAKA TARĠHÇESĠ
denir.
Psikofizyolojik Yöntemler: Çocuğun algısal, biliĢsel ve duyuĢsal tepkileri altındaki biyolojik durumları anlatmak için,
fizyolojik tepkiler ile davranıĢları arasındaki iliĢkiyi araĢtırır.


Buna en güzel örnek olarak yalan makineleri verilebilir. KiĢinin söyledikleri ile fizyolojik tepkileri ( kalp atıĢı ) arasındaki
bağ belirlenir. Örneğin bir banka soyguncusuna önce konu dıĢı sorular sorulur ( Anne adı, baba adı, kardeĢ sayısı, tuttuğu
takım vs vs sonra bankayı çağrıĢtıracak bir soru sorulur ne kadar para kazanıyorsun Ģayet kiĢi bu soruyu yanıtlarken kalp
atıĢında önceki sorulardan farklı bir hızlanma olursa yalan söylediğine dair bir ipucu kabul edilir)
Son zamanlarda beyin dalgaları ile yapılan ölçümler de geliĢtirilmiĢtir. DavranıĢlarımızla beyin dalgalarımız arasındaki
iliĢki ortaya konur. ( Bir nevi düĢünce okuma ; ama bugünkü teknoloji ile kesin bilgiler elde edildiği iddia edilmez)
GörüĢme: GörüĢme yüz yüze yapıldığından tepkileri netleĢtirmek için açımlayıcı sorular sorularak ayrıntılı ve kiĢisel bilgiler
elde edilebilmektedir.


GörüĢmede olaylardan çok bireylerin olaylara iliĢkin duyguları, düĢünceleri ve tutumları ele alınmaktadır. GörüĢmenin
bir diğer üstünlüğü ise, görüĢmecinin ihtiyacına bağlı olarak, çok çeĢitli konuların incelenmesine fırsat veren esnek bir
yöntemdir.
Çocukla görüĢme ( biraz zaman alıcı olabilir) , aile ile görüĢme , yaĢıt ve öğretmenle görüĢme gibi türleri vardır.
Klinik Yöntem: Bir katılımcının her aĢamalı soruya verdiği cevaba göre, araĢtırmacının bir sonrasında ne soracağını
belirlediği bir görüĢme türüdür.


Bu yöntemle tek bir insanın o andaki davranıĢı gözlenir ve anlamaya çalıĢılır. Katılımcının cevabından sonra araĢtırmacı
katılımcıya tipik olan ikinci bir soru sorar ya da katılımcının ilk cevabını belirgin hale getirmek için ona yeni bir görev
( iĢ ) verir.
Piaget tarafından sıklıkla kullanılan bu yöntem, uygulayıcının öznel yorumlarına – bilgi birikimine bağlı olduğu için diğer
araĢtırma tekniklerinden elde edilen verileri de kullanarak desteklemek her zaman arzu edilir.
Piaget’nin en çok eleĢtirilen yanlarından biri de Klinik Yönteme çok güvenmesi ve bu yöntemi çok sık
kullanmasıdır.
Örnek:
- Piaget: Yalanın ne olduğunu biliyor musun?
-
Çocuk: O, doğru olmayan Ģeyi söylediğinde olur.
-
P: 2+2=5 bir yalan mı?
-
Ç: Evet bu bir yalan
-
P: Niçin?
-
Ç: Çünkü bu doğru değil.
-
P: 2+2=5 diyen bir çocuk bunun doğru olmadığını mı söyledi yoksa bir yanlıĢ mı yaptı?
-
Ç: O yanlıĢ yaptı
-
P: Eğer o bir yanlıĢ yaptıysa, bir yalan mı söyledi ya da söylemedi mi?
-
Ç: Evet, o bir yalan söyledi.
B. ĠLĠġKĠSEL ( KORELASYON) YÖNTEM
KORELASYON
Pozitif Korelasyon :
 DeğiĢkenlerin birlikte azalıp birlikte
çoğaldığı bağıntıdır. Doğru Orantı
 Katsayı iĢareti + yöndedir.
 +1 e yaklaĢtıkça güçlenen pozitif
korelasyon vardır.
Yemek yeme – Kilo
Sigara içme – Kanser riski
Para – Refah
Eğitim düzeyi – ĠĢ olanakları

Negatif Korelasyon:
 DeğiĢkenlerden biri artarken diğeri azalır.
Ters Orantı
 Katsayı iĢareti – yöndedir.
 -1 e yaklaĢtıkça güçlenen negatif
korelasyon vardır.
Ders çalıĢmaya istek – zayıf not
Spor yapma – kilo alma
Eğitim düzeyi – kavgacı yapı
Ekonomik refah – terör
Korelasyon deneysel çalıĢmaya konu olabilecek iki değiĢkenin birbiri ile ilgileĢimidir. Korelasyon katsayısı 0’a
yaklaĢtıkça korelasyonun gücü azalmaktadır.
-0,99 - 0,54
- 0,089
Büyükten küçüğe doğru sıralama ( Sayıların Mutlak Değeri Önemlidir)
+0,99 + 0,54
+ 0,099 Büyükten küçüğe doğru sıralama ( Sayıların Mutlak Değeri Önemlidir)
ĠliĢkisizlik ( Korelasyon Katsayısının 0 Olması ) :
 Ġki değiĢken arasında herhangi bir ilgileĢim yoktur.
 Katsayı 0‟dır
Sağlıklı beslenme – okunan kitap sayısı
Boy uzunluğu – zekâ
A
B
C
D
E
A
0,45
0, 30 0,20
-0,40
B
0,45
-0,90
0,85
-0,50
C
0,30
-0,90
0,25
-0,70
D
0,20
0,85
0,25
-0,43
E
-0,40
-0,50
-0,70
-0,43
Yukarıda beĢ harfle ifade edilmiĢ değiĢkenlerin birbirleriyle olan korelasyon (ilgileĢim) katsayıları verilmiĢtir.
Buna göre tablodan aĢağıdakilerden hangisi çıkarılamaz?
A) En güçlü korelasyon B ile C arasındadır. ( Doğru = -0,90 ile en güçlü iliĢki ( Mutlak değer)
B) E‟nin en güçlü korelasyonu A iledir. ( YanlıĢ = E’nin en güçlü iliĢkisi C iledir ; - 0,70 ( Mutlak değer)
C) B ile D arasında güçlü + korelasyon vardır. ( Doğru= B ile D arasında + yönde korelasyon vardır)
D) En zayıf korelasyon A ile D arasındadır. ( Doğru = A ile D arasındaki korelasyon katsayısı 0,20 )
E) E değiĢkeni artarken C değiĢkeni azalmaktadır. ( Doğru= E ile C arasında – iliĢki var o halde test orantı olur ve biri
artarken diğeri azalır )
Bir araĢtırmada A ve B değiĢkenleri arasındaki korelasyon
değeri sıfıra ( 0 ) yakın bulunmuĢtur.
Bu değiĢkenler aĢağıdakilerin hangisinde verilenler
olabilir?
A) Boy - Ağırlık
B) Dengeli beslenme – sağlık
C) Sigara içme – sağlık
D) Yüzük takma – deri hastalıkları
E) Kalkınmışlık – Eğitim düzeyi
Korelasyon 0’a yakın çıkmıĢsa, A ile B arasında bir iliĢki
yok ya da çok düĢük bir iliĢki vardır. ġimdi 1000 kiĢi
üzerinde bir araĢtırma yapsak ( Deri hastalığı olan)
kaçının deri hastalığının sebebi yüzük takması olur? Tabi
ki ya hiçbirinin ya da birkaçının bu da yüzük takma ile
deri hastalıkları arasında düĢük bir korelasyon çıkmasına
neden olur. Korelasyon 0’a yakın çıkar. ( Yanıt D)
AĢağıda verilen korelasyon katsayılarından hangisi kilolu
olma ile resim yeteneği arasındaki ilgileĢimi verebilir?
A) 0,90
B) -0,89
C) 0,30
D) 0,04
E) 0,70
Kilolu olma ile resim yeteneği arasında çok bir iliĢki
yoktur. Bu yüzden 0’a yakın bir değer çıkmalı 0’a en
yakın değer de 0,04’tür. ( Matematiği iyi olmayan
arkadaĢlar için uyarı 0,3 ; 0,04‟ten büyüktür. Pratik olarak
nasıl ayırırız. Ġkisinin de virgülden sonraki ilk rakamına
bakın 0,04 – 0,3 birinin 0 diğerinin 3 bu durumda 0,04‟ün
virgülden sonraki ilk rakamı 0 olduğu için o daha küçüktür. ;
baĢka bir örnek 0,19 mu büyük 0,2 mi? Tabii ki 0,2 daha
büyük çünkü virgülden sonraki ilk rakamı 2 diğerinin ise 1)
C. DENEYSEL YÖNTEMLER
Neden sonuç iliĢkilerini test etmek için pek çok araĢtırmacının baĢvurduğu bir araĢtırma desenidir. Katılımcılar iki
gruba ayrılır ( Deney ve Kontrol ) ve deney grubundaki deneklere müdahalede edilir ( maniple edilir) Bu müdahalenin
etkisi araĢtırılır.
Bir örnekle ele alalım: “Okullarda sınıf içi mesleki rehberlik etkinliklerinin öğrencilerin mesleki olgunluklarına etkisini
araĢtıran bir deneysel çalıĢmada” Öncelikle Ģunu belirtelim ki deneysel çalıĢmalar bir neden sonuç iliĢkisi kurmaya
yarar. Ve deneysel çalıĢmalara konu olacak cümleler bir neden sonuç cümlesi niteliğinde olmalıdır. Bu örnekte de bir
neden sonuç iliĢkisi vardır. “Mesleki rehberlik uygulamalarının” “Mesleki olgunluğa” etkisi araĢtırılmaktadır.
Bağımsız DeğiĢken: Etkisi olan, faktör vs. Sebep – sonuç iliĢkisindeki sebep ifadesidir.
Bağımlı DeğiĢken : Etkilenen, Sebep – sonuç iliĢkisindeki sonuç ifadesidir.
Ara DeğiĢken ( Konrol DeğiĢkenler) : Bağımlı değiĢkeni aynen bağımsız değiĢken gibi etkileyen ancak araĢtırmada ele
alınmadığı için kontrol altında tutulması gereken değiĢkendir.
ġimdi yukarıdaki örneğimize geri dönelim. AraĢtırmada mesleki rehberlik uygulamalarının , mesleki olgunluk üzerindeki
etkisi araĢtırılıyordu. Bu durumda mesleki olgunluğu etkileyen faktör “mesleki rehberlik uygulamalarıdır” Bu durumda,
mesleki rehberlik uygulamaları sebep olduğu için bağımsız değiĢken, mesleki olgunluk da bu değiĢkene bağlı olarak
değiĢeceğinden “mesleki olgunluk” bağımlı değiĢkendir. ġimdi çok dikkatli okuyun. Bir insanın “mesleki olgunluğunu”
sadece “ mesleki rehberlik hizmetleri” mi belirler. Tabii ki hayır. Bir kiĢinin “mesleki olgunluğunu” etkileyen birçok faktör
vardır. Ancak araĢtırmamızın bağımsız değiĢkeni bir tanedir. Bu durumda araĢtırmacıya düĢen görev “deneysel kontrol”
sağlaması ve “ara değiĢkenleri” kontrol etmesidir.. Yani mesleki olgunluğu etkileyen diğer tüm faktörleri kontrol etmeli ve
araĢtırma sonuçlarını etkilemesinin önüne geçmelidir. ( Yani diyelim ki çocuklar üzerinde 3 aylık süren bir çalıĢma olsun. Bu
3 ayda çocuklarda meydana gelen değiĢikliğin “verdiğimiz mesleki rehberlik hizmetlerinden” olduğundan emin olmamız
gerekir. ġayet çocuklardaki değiĢme araĢtırma konumuzun dıĢındaki bir değiĢkenden kaynaklandı ise DENEYSEL
KONTROL sağlanmamıĢ demektir.
Deney Grubu : AraĢtırmada kullanılan bağımsız değiĢken ile müdahale edilen gruptur. Yani deney grubu araĢtırmacı
tarafından belirlenen bir etkinliğe katılan gruptur.
Kontrol Grubu: AraĢtırmada kullanılan bağımsız değiĢken ile müdahale edilmez. Sadece kontrol amaçlı olan gruptur.
Yukarıda verdiğimiz örneğe geri dönersek: bir grup öğrenciye eğitsel rehberlik etkinlikleri verilirse bu grup ( Deney grubu)
diğer grup öğrenciye ise eğitsel rehberlik etkinlikleri verilmeyip baĢka Ģeyler yaptırılırsa ( Kontrol Grubu)
ÇOK ÖNEMLĠ UYARI: Yaptığınız çalıĢma sonunda deney grubu öğrencileri ile kontrol grubu öğrencileri arasında
anlamlı bir fark oluĢmuyorsa ya kurduğunuz neden sonuç iliĢkisi anlamsızdır ya da deneysel çalıĢmanıza kontrol
edemediğiniz değiĢkenler karıĢmıĢtır ( Ara değiĢkenler)
Placebo Kontrol Grubu nedir? Tıp dünyasında kullanılan bir terim olan placebo etkisini önce kısaca anlatayım.
Placebo etkisi, herhangi bir biyolojik etkisi olmayan bir Ģekerin vb. hastaya ağrı kesici olarak verilmesi ve hastanın bu hapı ağrı
kesici sanarak içtiği için psikolojik olarak rahatlamasıdır. Farklı örnekler de verilebilir en yalın söylemi ile budur. Placebo
Grubu ise bilimsel araĢtırmaların deneysel çalıĢmalarında yer alan bir tür kontrol grubudur. Hatta bilimsel çalıĢmalarda
Placebo Kontrol Grubu (PKG)olarak da geçer.
Bir örnekle ele alalım: “BiliĢsel davranıĢçı yaklaĢımla bütünleĢtirilen hobi-terapi uygulamalarının örgüt depresyonuna etkisi”
konulu bir deneysel çalıĢmanın
Bağımsız DeğiĢkeni: BiliĢsel davranıĢçı yaklaĢımla bütünleĢtirilen hobi-terapi uygulamaları
Bağımlı DeğiĢkeni: Örgütsel depresyon
Ġki okuldan seçilen öğretmenler random yoluyla ( Rastgele) deney ve kontrol grubu olarak oluĢturulur. Deney grubu
öğretmenlerine 6 hafta boyunca “ BiliĢsel DavranıĢçı YaklaĢımla BütünleĢtirilen Hobiterapi Uygulaması” yapılırken kontrol
grubu öğretmenlerine oturumluk “Sınıf Yönetimi” eğitimi verilir. ĠĢte burda deney grubuna verilen ve aslında örgüt depresyonu
üzerinde etkisi pek olmayan ( ?!) “Sınıf Yönetim” eğitimi placebo niteliğindedir. Bu noktada kontrol grubumuz aynı zamanda
placebo grubu ya da placebo kontrol grubudur.
Örnek Durum ( Analiz ÇalıĢması Yapacağız Dikkatli Olun)
Deney Konusu: “Tam öğrenme uygulamalarının öğrencilerin Türkçe dersi baĢarı testlerine etkisi”
Hipotez: “Tam öğrenme uygulaması yaptığımız öğrencilerden oluĢan deney grubu öğrencilerinin Türkçe dersi baĢarı testlerinden
elde ettikleri puanlar, tam öğrenme uygulaması vermediğimiz öğrencilerden oluĢan kontrol grubu öğrencilerinin Türkçe dersi
baĢarı testlerinden elde ettikleri puanlardan fazla olacaktır.”
Analiz: Deneyin bağımsız değiĢkeni “ tam öğrenme uygulamaları” bağımlı değiĢkeni “Türkçe dersi baĢarı puanı”dır.
I.
AĢama : Deney ve kontrol gruplarına deney öncesinde bir ön test uygulanır. Ve sonuçlarına bakılır.
Grup
D Grubu
K Grubu
Türkçe
Dersi
Öntest A.O
Türkçe
Öntest
(Standart
Sapma)
56
55
12
11,5
Testi
S.S
NOT: Dikkat ettiyseniz deneyin baĢında uygulanan öntestte kontrol ve deney grubu öğrencilerinin baĢarı puanları ve standart sapmaları
birbirine yakın. Zaten olması gereken de budur. ġayet birbirinden farklı çıksaydı grupların yeniden oluĢturulması gerekirdi. Çünkü deneysel
çalıĢmalarda deneyin baĢlangıcında DENEY GRUBU ve KONTROL GRUBU öğrencileri her açıdan EġĠTLENMELĠDĠR. ( HOMOJEN
OLMALILAR)
II.
AĢama : Deney grubu öğrencilerine tam öğrenme uygulamaları ile ders anlatılır ( 2 ay boyunca) Kontrol grubu öğrencilerine ise tam
öğrenme uygulamaları yaptırılmaz.
III.
AĢama: 2 ay sonra deney grubu ve kontrol grubu öğrencilerine son test uygulanır.
Türkçe Dersi Öntest A.O
Türkçe Testi Öntest S.S
Grup
(Standart Sapma)
D Grubu
K Grubu
81
57
19
12.1
NOT: ġayet deneysel çalıĢmamızın sonucunda böyle bir tablo oluĢursa hipotezimiz doğrulanır. Dikkat ettiyseniz kontrol grubunda kayda değer
bir değiĢme olmadığı halde deney grubunun Türkçe dersi baĢarı testi puan ortalamasında artıĢ olmuĢtur. Demek ki “tam öğrenme uygulamaları”
( Bağımsız değiĢken) “Türkçe dersi baĢarı puanlarını” ( Bağımlı değiĢken) etkilemektedir.
SORU: Diyelim ki Kontrol grubunun puanları da artmıĢ olsaydı yani son testte kontrol grubu öğrencileri de 80 puan alsaydı, bu durumda
deneysel çalıĢmamıza kontrol edilemeyen bazı değiĢkenlerin karıĢtığını söyleyebiliriz. ( Kontrol değiĢkenleri) O zaman deneysel çalıĢmanın
geçerliği düĢer. Deneyci deneysel kontrolü sağlayamamıĢ olmalıdır. Ayrıca Deney grubu öğrencilerindeki bu puan artıĢının “Tam öğrenme
uygulamalarından” kaynaklı olduğundan da emin olmalıyız. 2 ay içersinde özel ders aldıkları için puanları artmıĢsa deneysel çalıĢmamız yine
geçerli değil; çünkü yine deneysel kontrol sağlanamamıĢ olurdu. O HALDE DENEY YAPARKEN BAĞIMSIZ DEĞĠġKEN DIġINDA
TÜM FAKTÖRLERĠ KONTROL ALTINDA TUTMAMIZ GEREKĠYOR… !
Problem çözme yöntemlerinin öğretilmesi, zekâ testinden alınan puanı artırır. hipotezini yoklamak (test etmek) isteyen
bir araĢtırmacı sırasıyla aĢağıdaki iĢlemleri yapmıĢtır.
I.
II.
III.
IV.
V.
VI.
Öğretim yılı başında öğrencileri kura ile ( random) olarak eşit büyüklükte iki gruba ayırmıştır.
Gruplardan kura ile ( random olarak ) belirlediği öğrencileri deney grubu ( D) , Kontrol Grubu ( K) yapmıştır.
D ve K gruplarındaki öğrencilere bir zeka testi uygulamıştır. (Öntest)
D grubundaki öğrencilere öğretim yılı boyunca belli aralıklarla problem çözme yöntemlerini öğretmiş ve bu
süreç içinde K grubundaki öğrencilere ilgi duydukları başka bir çalışma yaptırmıştır.
Öğretim yılı sonunda, D ve K gruplarındaki öğrencilere bir problem çözme testi uygulamıştır.
Öğretim yılı sonunda ( problem çözme testini yaptıktan sonra) D ve K grubu öğrencilerine önceki zeka testinin
değişik bir formunu ( paralelini) uygulamıştır. ( Son test)
Semboller ve açıklamaları:
XD : Deneysel iĢlem grubu öntest ortalaması
XK : Kontrol grubu öntest ortalaması
sD : Deneysel iĢlem grubu öntest standart sapması
sK : Kontrol grubu öntest standart sapması
nD : Deneysel iĢlem grubundaki öğrenci sayısı
nK : Kontrol grubundaki öğrenci sayısı
SORULAR
1.
2.
3.
4.
5.
Yukarıdaki çalıĢmada bağımlı ve bağımsız değiĢkenler nelerdir? Yanıt: Sadece deney grubu öğrencilerine uygulanan “
Problem çözme yöntemleri” bağımsız değiĢkendir. Ön test ve son test olarak uygulanan “ zeka testi” puanı ise bağımlı
değiĢkendir. AraĢtırmacı Problem çözme yöntemlerinin zeka testi puanları üzerindeki etkisini araĢtırmaktadır.
AraĢtırmacının ilk iki aĢamada yaptığı uygulamaların amacı nedir? Yanıt: AraĢtırmacı grupları seçerken random ( kura )
yöntemini belirmiĢ. Bu Ģekilde deney ve kontrol gruplarını oluĢtururken bir grubun diğerinden üstün ya da farklı olmasının
önüne geçmeye çalıĢmıĢ. Amacı XD = XK ve sD = sK eĢitliğini sağlamaktır. Bildiğiniz gibi öntestlerde aritmetik
ortalama ve standart sapmaların yakın ya da eĢit çıkması beklenir.
AraĢtırmacının 5. aĢamada “Problem çözme testi uygulamasının amacı nedir? Yanıt: Söylediğimiz gibi deneyin bağımsız
değiĢkeni “Problem çözme” becerisiydi. Ve araĢtırmacı Deney grubu öğrencilerine problem çözme becerisine dönük
etkinlikler yapmıĢtı. Bu etkinliklerin iĢe yarayıp yaramadığını belirlemek istiyor. ġayet iĢe yaramamıĢsa zeka üzerindeki
etkisini de araĢtıramazdık.
Deneyin sonunda uygulanan sontest sonuçlarının nasıl çıkması gerekir? Yanıt: Deney grubu öğrencilerinin ilk ve son testleri
arasında pozitif yönde anlamlı bir artıĢ olmalı. Çünkü hipotezimize göre “Problem çözme yöntemleri” “Zeka testi”
sonuçlarını etkiler. Bu durumda problem çözme yöntemlerimizi anlattığımız deney grubunun puanlarında artıĢ beklenir. Buna
karĢılık Kontrol grubunun ön test ve son test sonuçları arasında çok bir fark olmamalıdır.
Deneysel araĢtırmanın gereklerinin gerçekleĢip gerçekleĢmedi hangi basamaklarda kontrol edilmiĢtir? Yanıt: Deneysel bir
araĢtırmanın birincil gereği deney ve kontrol gruplarının eĢitlenmesidir ( homojen – aynı ) AraĢtırmacı III. basamakta yaptığı
zeka testi ile ( öntest) oluĢturduğu grupların benzer – eĢit olup olmadığını kontrol etmiĢtir. Deneysel bir araĢtırmanın ikinci
gereği ise deney grubunun bağımsız değiĢkendeki beceriyi kazanıp kazanmadığının belirlenmesidir. Bildiğiniz gibi bağımsız
değiĢkenimiz “Problem çözme yöntemleri” idi. Bu becerinin kazanılıp kazanılmadığı da 5. aĢamada uygulanan “Problem
çözme” testi ile ölçülmüĢtür.
D. GELİŞİMSEL YAKLAŞIMLAR
Kesitsel Yöntem ( Kesitsel Desen) : GeliĢim psikolojisinde
en çok kullanılan araĢtırma desenidir. Kesitsel desende
araĢtırmacılar farklı yaĢ gruplarındaki insanları aynı anda
seçip aynı zaman diliminde inceler.
PÜF NOKTASI: Farklı yaĢ gruplarına 1 kere inceleme
yapılır 2. bir inceleme yapılmaz.
Boylamsal Yöntem ( Boylamsal Desen) : Aynı yaĢ grubunda
olan bir grup deneğin, aylar ya da yıllar boyunca değiĢik
yaĢlarda aralıklı olarak incelendiği bir araĢtırma desenidir. Bu
süre 6 ay 1 yıl olabileceği gibi ömür boyu da olabilir.
Örneğin ; çevre ve saldırganlık davranıĢlarının sıklığının
yaĢla farklılık gösterip göstermediği farklı yaĢlardaki ( 5, 7,
9 ve 11) çocuklarının saldırganlık davranıĢları ölçülerek
incelenir. Eğer 5 ve 7 yaĢ çocuklarındaki saldırganlık 9 ve
11 yaĢlarındaki çocuklardan daha yüksek çıkarsa
saldırganlığın yaĢa bağlı olarak azaldığı söylenebilir.
Örneğin çocukların biliĢsel geliĢimlerini incelemek isteyen bir
araĢtırmacı, bir grup çocuğu doğumdan itibaren 15 yıl süreyle
bu amaç kapsamında gözlediği takdirde (diyelim ki 15 yıl
boyunca 10 kere gözlesin) boylamsal bir araĢtırma yapmıĢ
olur.
Kesitsel yöntem sadece yaĢa bağlı değiĢmeleri
incelemek için uygundur. DeğiĢim tarihsel zaman
etkisinden kaynaklanıyorsa Kesitsel Yöntem etkisiz
kalır. ( Birazdan açıklayacağım)
Bölük: Aynı zaman aralığında doğan, aynı tarihsel ve
toplumsal koĢulları yaĢayan, aynı yaĢtaki insanların
oluĢturduğu grup ya da özel bir yaĢ grubunun üyeleri.
Bölük Etkisi: Tarihsel zaman etkisi de denebilir. Bölükler
arasındaki farklılıklar sadece geliĢimin yol açtığı
farklılıklar üzerinde odaklaĢmak isteyen araĢtırmaları zor
duruma sokabilmektedir. Bu karıĢıklığa bölük etkisi denir.
Örneğin 35 ve 65 yaĢlarındaki insanların iĢ ve finansal
güvence konusundaki tutumları araĢtırıldığını düĢünün. 65
yaĢındaki insanların (bölük) geçmiĢte ağır bir ülkesel
ekonomik kriz ya da savaĢ yaĢadıklarını düĢünün, 35
yaĢındakilerin ise böyle olaylar yaĢamadıklarını düĢünün.
ġimdi bu iki grubun finansal güvence üzerindeki
görüĢlerinin farklı olmasını sadece yaĢ ile açıklayamayız.
Bu duruma BÖLÜK ETKĠSĠ DENĠR. BaĢka bir örnek
verelim 10 ve 15 yaĢlarındaki çocuklar üzerinde yapılan
kesitsel bir araĢtırmada 15 yaĢındaki çocukların Ģiddete
dönük tutumlarının daha yüksek çıktığını düĢünelim. Ancak
araĢtırdığımızda 15 yaĢındaki çocukların geçmiĢte
televizyonda oynayan ancak birkaç yıl sonra yayından
kaldırılan bir tv programını izlediklerini düĢünelim. Bu
durumda saldırgan eğilimlerinin sebebi yaĢ değil geçmiĢte
izledikleri tv programıdır. Bu durum da BÖLÜK ETKĠSĠNE
örnektir.
PÜF NOKTASI: Aynı gruba birden fazla inceleme yapılır

Çocukların geliĢimi hakkında pek çok bilgi verse de
bir kiĢi ya da grubun uzun sürelerce gözlenmesi
maliyetlidir.
Sıralamalı ( Sırasal) Yöntem: Kesitsel ve boylamsal
yöntemlerin iyi yanlarının bir sentezidir denebilir. Yani farklı
yaĢ gruplarındaki deneklerin, seçilerek (Kesitsel) aylar ya da
yıllar boyunca tekrar tekrar incelenmesi ( Boylamsal) ile
yapılan araĢtırma yöntemidir.
PÜF NOKTASI: Farklı yaĢ grubundaki bireylere birden
fazla inceleme yapılır.
GeliĢimsel yaklaĢımlar anlatılırken genelde
uzun yıllar sürüyorsa boylamsal, kısa sürüyorsa kesitsel gibi sığ
ve yetersiz açıklamalar yapılıyor. Pratikte test sorularını
çözerken tabii ki iĢinize yarar. Yukarıda da belirttiğim gibi 6 ay
hatta 1 ay süren boylamsal çalıĢmalar vardır. O halde dikkat
edeceğimiz Ģey ne kadar sürdüğü değil deneklerin kaç kere
gözlendiğidir. Eğer denekler farklı yaĢ grubunda iseler ve
sadece bir kere inceleniyorlarsa kesitsel; hem farklı yaĢ
gruplarında iseler hem de birden fazla inceleniyorlarsa
sıralamalı ( sırasal) aynı yaĢ grubu birden fazla inceleniyorsa
boylamsaldır.
YaĢları 10 – 15 ve 20 olan 30‟ar kiĢilik üç denek grubuna bir
anket yapılır ve incelenir. Bu örnekte dikkat edeceğiniz kaç
grup var 3 kaç kere incelenmiĢler ( Sadece 1 kere anket
yapılmıĢ) o halde kesitsel
YaĢları 10 – 15 ve 20 olan 30‟ar kiĢilik üç denek grubuna altı
ay ara ile 4 kere ilgi envanteri uygulanır. Bu örnekte dikkat
edeceğiniz kaç grup var 3 kaç kere incelenmiĢler altı ay ara ile 4
kere hem birden fazla yaĢ grubu hem de birden fazla inceleme
o halde sıralamalı
1980 yılında doğmuĢ bir gruba 10 yaĢından beri 2‟Ģer yıl ara ile
yetenek testleri uygulanmıĢtır. Bu örnekte dikkat edeceğiniz
nokta kaç grup var 1980 doğumlulardan oluĢan 1 grup, kaç kere
incelenmiĢler 2‟Ģer yıl ara ile birden fazla yetenek testi
uygulanmıĢ o halde 1 grup birden fazla gözlem boylamsal.
Desen
Kesitsel
ĠĢlem
Farklı yaĢlardaki insanları zamanın bir
anında gözleme. Farklı yaĢ gruplarını bir
kere gözleme
Boylamsal
Bir bölükteki insanları bir zaman
boyunca tekrar tekrar gözlemleme. Bir
yaĢ grubunu birden fazla gözleme
Sıralamalı
Farklı bölükleri, zaman boyunca
tekrarlayarak
gözlemesi
nedeniyle
kesitsel ve boylamsal ( uzunlamalı)
desenlerin birleĢtirmesi . Birden fazla
yaĢ grubunun birden fazla gözlenmesi
Güçlü Yanı
YaĢ
farklılıklarını,
geliĢimsel
eğilimlerdeki
belirtileri
gösterir.
Nispeten
masrafsızdır,
uygulaması
kolaydır.
Bireylerin geliĢimi konusunda veri
sağlar. Ġlk yaĢantılarla sonraki yaĢantılar
arasında bağlantıları ortaya çıkarır.
Bireylerin zaman boyunca olan değiĢim
sekilerli yönünden ne kadar benzer ya da
farklı olduklarını gösterir.
YaĢın, büyüklüğün ve toplumsal
değiĢmelerin etkilerini ortaya çıkarır.
Boylamsal yaklaĢıma göre az zaman
alıcı ve az masraflıdır.
Zayıf Yanı
Farklılıklar geliĢimsel değiĢmelerden çok,
bölükler arasındaki değiĢmeleri ( bölük
etkisi) yansıtabilir.
Farklılıklar
toplumdaki
değiĢimleri
yansıtabilir. Temsil özelliği olmayan
örneklem ortaya çıkabilir. Bu da sonuçların
genellenebilirliğini sınırlayabilir.
Kesitsel denese göre daha masraflı ve zaman
alıcıdır. En güçlü desen olmasına rağmen,
bir
geliĢimsel
değiĢimin
araĢtırılan
bölüklerin dıĢına genellemesinin yapılıp
yapılmayacağı ile ilgili problemleri vardır.
Meta – Analiz: Meta-analizi, belirli bir konuda yapılmıĢ, birbirinden bağımsız, birden çok çalıĢmanın sonuçlarını birleĢtirme
ve elde edilen araĢtırma bulgularının istatistiksel analizini yapma yöntemidir. Meta-analizi, klinikçilere ve tıbbi
araĢtırmacılara çeĢitli çalıĢmaların sonuçlarını özetleyen nicel yöntemler sunar ve sonuçların birleĢtirilmesi ile ortak yargıya
ulaĢmalarını sağlar


Meta-analizi, ayrı çalışmaların bulgularının birleştirilmesi ve eleştirilerin yeniden gözden geçirilmesi yöntemidir
Belirli bir konuda yapılmış, birbirinden bağımsız birden çok çalışmanın sonuçları birbirine uygun düşmediği zaman
belirsizlik hakkında karar vermek amacıyla meta – analiz yapılabilir.
Bilimsel AraĢtırmalarda Örneklem ve Evren
Evren: Bilimsel araĢtırmaya konu olan bireylerin tamamı. Diyelim ki Türkiye‟deki orta yaĢ düzeyindeki kadınlar üzerinde
bir araĢtırma yapılacaksa Türkiye‟de bulunan orta yaĢtaki tüm kadınlar evreni oluĢturur. Ya da öğrenciler üzerinde bir
araĢtırma yapılacaksa tüm öğrenciler evreni oluĢturur.
Örneklem: Tabii ki tüm evrenle araĢtırma yapmak masraflı hatta imkansızdır. O halde evreni temsil eden örnek bir grup
seçilir. ( Kapsam geçerliği olmalı yani örnek seçtiklerimiz evrenin küçük bir maketi – modeli – temsili olmalı ) Ve seçilen bu
grup üzerinde bilimsel araĢtırma yapılır. Ancak örneklem belirleme iĢi uzmanlık gerektirir.
Seçim anketi yapan bir firma tabii ki Türkiye‟deki tüm seçmenlere ( EVREN) ulaĢamaz. Bu durumda 5000 kiĢilik bir
örneklem belirler. Ve bu 5000 kiĢinin eğitim düzeyi, cinsiyeti, yaĢadığı Ģehir, iĢ vs açıdan Türkiye‟deki tüm seçmenlerin mini
bir maketi olması gerekir. Aksi olursa ne olur:
Örneklem ağırlılık olarak Konya’dan seçilirse AK Parti birinci parti çıkar
Örneklem ağırlıklı olarak Ġzmir’den seçilirse CHP birinci parti çıkar
Örneklem ağırlıklı olarak Osmaniye’den seçilirse MHP birinci parti çıkar. O halde tüm iller ve her düzeyde insan
dikkate alınarak örneklem oluĢturulmalıdır. Bu duruma Örneklemin Kapsam Geçerliği ya da Örneklemin Evreni temsil
edebilmesi denir.
TEMEL KAVRAMLAR
ÖLÇMENĠN TEMEL KAVRAMLARI
 Ölçme
 Ölçüm (Ölçme Sonucu )
 Ölçme Kuralı
 Birim
 Ölçek
 Ölçme Hatası
- Sabit
- Sistematik
- Seçkisiz ( Random – Tesadüfi)
 Ölçmede Sıfır
 Ölçme Türleri
- Doğrudan Ölçme
- Dolaylı Ölçme
- TüretilmiĢ Ölçme
 Ölçmede Ġzomorfluk ve Homomorfluk
DEĞERLENDĠRMENĠN TEMEL KAVRAMLARI
 Ölçüt
 Değerlendirme Türleri
- Mutlak Değerlendirme
- Bağıl Değerlendirme
 Değerlendirme Türleri
- Diagnostik
- Formatif
- Sümmatif
ÖLÇME : Geçerli görgül yollarla test edilebilecek kurallar çerçevesinde nesnelere belli özelliklere sahip oluĢ derecelerine göre
sayı veya semboller vermektir.
 Ölçme bir betimleme iĢlemidir. GeniĢ anlamda ölçme belli bir nesnenin ya da nesnelerin belli bir özelliğe sahip
olup olmadığının sahipse sahip oluĢ derecesinin gözlenip gözlem sonuçlarının sembol ya da sayı ifade
edilmesidir
Ölçme farktan doğmuĢ bir durumdur. Ölçülecek nesneler arasında bir fark yok ise ölçmeye de gerek kalmazdı. Ölçme aynı
zamanda bir betimleme , adlandırma, sınıflama, sıralama durumudur.
Ölçme kavramını sadece eğitim uygulamaları noktasında düĢünmek çok dar olacaktır. Ölçme, bir insanın boy
uzunluğundan cinsiyetine, bir yerdeki sıcaklık değerinden o yerin yükseltisine, bir ortamdaki nesne sayısından bir insanın
üzerindeki kıyafetin rengine kadar birçok noktada sayı ya da sembol atama olarak düĢünülmelidir.

Ölçme bir niteliğin gözlenip gözlem sonucunun sayılarla ya da baĢka sembollerle gösterilmesidir.
Yapılandırma Kutusu: Ölçme iĢleminin aĢamalarını anlatarak ölçme kavramını yapılandıralım...
1.
2.
3.
AĢama : Ölçülecek özelliğin tanımlanması: Ölçmeci kiĢi hangi nesnenin hangi özelliğini ölçecek buna karar
vermelidir. Örneğin: Bir öğrencinin Türkçe baĢarısı, bir masanın uzunluğu, bir kazağın rengi, bir insanın
cinsiyeti, bir arabanın fiyatı, bir okuldaki sınıf sayısı vb.
AĢama: Ölçme aracı belirleyip ölçme aracı ile gözlemin yapılması: Ölçmeci bu aĢamada aracı ile gözlem yapar.
Örneğin: Türkçe baĢarı testi hazırlayıp uygulamak, cetvel ile masanın uzunluğunu gözlemek, bir kazağa
bakarak rengini anlamak, bir insana bakarak cinsiyetini anlamak, arabanın fiyatını sormak, okuldaki sınıfları
saymak
AĢama: Sonucun sayı ya da sembolle ifade edilmesi: Ölçmeci yaptığı gözlem sonucu çıkan değere sayı ya da
sembol atar. Örneğin: Türkçe sınavından 70 aldı, masa 3 metre, kazak yeĢil, Ali erkektir, Araba 70.000Tl,
okulda 35 sınıf var.
PRATĠK BĠR ÇALIġMA ĠLE ÖLÇME ĠFADE EDEN CÜMLELER
Ölçülecek Nitelik
Bir öğrencinin yaĢı
Bir öğrencinin tarih bilgisi
Öğrencilerin okul numarası
Öğrencilerin boyu
Bir kiĢinin sınıfı
Bir kredi
numarası
kartının
kart
Durum Ġfade Eden Ölçme Cümleleri
Bir öğrencinin yaĢının saptanması/belirlenmesi
Bir öğrencinin tarih sınavından aldığı puanın sayı
ile ifade edilmesi
Okuldaki tüm öğrencilere numara verilmesi
Sınıftaki öğrencileri boylarına göre sıralamak
ĠĢyerindeki insanları sigara içenler ve içmeyenler
diye sınıflamak
Bir kiĢinin kredi kartı numarasını belirlemek
Ölçüm (Sayı - Sembol) Ġfade Eden Ölçme Cümleleri
Alpay‟ın yaĢı 19‟dur.
Ahmet, tarihten 92 aldı.
AyĢe‟nin okul numarası 535‟tir.
Metin sınıfta boy bakımından üçüncüdür.
Alpay sigara içenler sınıfındadır.
Alpay‟ın kredi kartı numarası 42xxxxxxxxxxxx46‟dır.
Yukarıdaki örneklerde olduğu gibi ÖSYM ölçme testlerinde ölçme ifade eden cümle sorularında bazen durumu
anlatan bazen de ölçümü ifade eden cümleler istemektedir. Son bir örnekle açıklayalım “Bir insanın boy uzunluğunun
belirlenmesi” cümlesi ile “Ali’nin boy uzunluğu 198 santimdir” cümlelerinin ikisi de ölçme cümlesidir. Çünkü bir insanın boy
uzunluğunun belirlenmesi yine o kiĢinin boy uzunluğunun yazılması ile aynıdır. Yani teknik olarak iki cümle de ölçme cümlesidir.
ÖLÇMEDE DEĞĠġKENLER
Nicel DeğiĢken: Bir değiĢken sayı ile ifade ediliyorsa niceldir.
Nitel DeğiĢken: Bir değiĢken matematiksel sayı değil de
sembolle ifade ediliyorsa niteldir.
O halde, ölçmedeki semboller nitel değiĢken; sayılar
ise nicel değiĢkendir.
Ahmet‟in boyu 186 cm‟dir, Arabanın fiyatı 23.000 Türk
lirasıdır gibi örneklerdeki değiĢkenler niceldir.
Ali Ġngilizceden pek iyi aldı, iyi not aldı, AyĢe‟nin üstündeki
gömlek siyah renklidir gibi örneklerdeki değiĢkenler niteldir.
ÇOK ÖNEMLĠ: Ahmet‟in okul numarası 234‟tür
örneğindeki 234 bir sayı değil semboldür yani nitel değiĢkendir.
Çünkü buradaki matematiksel bir sayı değil öğrenciye verilmiĢ
bir isimdir ( Ġsimlendirme yapılırken sayılar seçilmiĢ
memurların sicil numaraları, askeriyede kullanılan silahların
seri numaraları da buna örnektir yani sadece sayılarla isim
vermedir; bu yüzden bir matematiksel sayı olarak değil isim
olarak kabul edilir ) ya da Ahmet 1. ( birinci) oldu tarzı sıra
sayıları bir matematiksel sayı değil semboldür. BUNLARI
UNUTMAYIN.
Sürekli (Kesiksiz) DeğiĢken: Bir değiĢkenin alabileceği iki
değer arasında baĢka değerler de (Sonsuz sayıda) alabilmesi
onu sürekli yapar. BaĢka bir tanımla kullandığımız birim
ondalıklı
ifadeleri
kullanmamıza
olanak
sağlıyorsa
değiĢkenimiz süreklidir.
Örneğin: Ağırlık, uzunluk, zeka düzeyi , yaĢ ifadeleri
istenirse daha duyarlı hale getirilebilir ve ondalıklı ifade
edilebilir. Ya da iki değer arasında sonsuz sayıda değer
verilebilir.
Süreksiz ( Kesikli) DeğiĢken: Bir değiĢkenin alabileceği iki
değer arasında baĢka değerler alamıyorsa ( ya da çok az değer
alabiliyorsa) bu değiĢken süreksizdir. Kullandığımız birim
ondalıklı ifadeleri – sonsuz sayıda – kullanmamıza olanak
sağlamıyorsa değiĢkenimiz süreksizdir.
Örneğin: Cinsiyet , bazı nesne – canlı sayıları , renk
Ahmet‟in boy uzunluğu 167 cm‟dir. Bu örneği ele aldığımızda
167 ile 168 arasında ( 167,1 – 167,2 – 167,3 .. gibi) birçok
ondalıklı değer olabilir bu durumda bu değiĢken süreklidir.
Ahmet‟in 2 tane bilgisayarı var. Bu örneği ele aldığınızda ise
kullandığımız birim olan bilgisayar ondalıklı ifade
kullanmamızı engelliyor ( 2,13 tane bilgisayarım var
diyemeyiz) bu durumda bu değiĢken süreksizdir.
Yapılandırma Kutusu: DeğiĢkenler kavramını yapılandıralım.
Masada 7 tane kalem var. Bu örnekte ölçümü yapılan kalem sayısının alabileceği değerler tam sayı olmak zorundadır. Yani
masada 7 ya da 8 ya da 9 kalem olabilir. 7,3 gibi bir kalem sayısı olamaz. Bu yüzden iki değer arasında sonsuz sayıda değer
alamamakta. DeğiĢkenimiz süreksizdir.
Öğrencinin yaĢı 18’dir. Bu örnekte ölçümü yapılan, bir insanın yaĢıdır. YaĢ yıl birimi ile ifade edilmiĢ ancak yıl gün ay hatta
saat olarak daha küçük birimlerle ifade edildiğinde rahatlıkla 18,5 gibi ya da 18,6 gibi ondalıklı değerlerle ifade edilebilir. Bu
yüzden değiĢkenimiz süreklidir.
ÖLÇMEDE BĠRĠM: Ölçmede birim ölçme aracının en küçük bölümü için kullanılır. Ölçülecek özelliğin standartlarıdır.
Birimler ÖLÇMEDE STANDARTI SAĞLAR
Ölçmede birim özellikle de doğal birim kavramı biraz zor anlaĢılmaktadır. Bir örnek durum ile birim kavramını
açıklamaya çalıĢacağız. Ġki kent arası uzaklığı ölçmek istiyorsunuz. Hangi birimi kullanırsınız. Bir kere kullanacağınız birim bir
uzunluk birimi olmalıdır. Peki iki kent arası uzaklık santimetre ya da metre ile ölçülebilir mi? Ġstenirse ölçülebilir ama bu kadar
küçük bir bölme ( birim) seçmek hiç kullanıĢlı olmayacaktır. Bu durumda sizin seçebileceğiniz en küçük bölme kilometre
olmalıdır. Örnekten de anlaĢıldığı gibi hangi özelliği ölçeceksek birimimizi ( ek küçük bölmemizi) ona göre seçiyoruz. Ġki kent
arası değil de bir masanın uzunluğunu ölçecek olsaydık metre ya da santimetreyi birim ( en küçük bölme) olarak seçerdik. BaĢka
bir örnek verelim, bir iĢyerinde çalıĢan insanların sayısını ölçeceksiniz. Bu durumda en küçük bölmenin ( birim) insan olmalıdır.
Yani iĢ yerindeki insanları sayarsanız ölçme iĢleminizi gerçekleĢtirebilirsiniz. Yok ben iĢ yerindeki insanları ölçerken daha küçük
bir bölme kullanacağım diyorsanız bir düĢünün bakalım oluyor mu? Bir arkadaĢım ordan Ģöyle diyebilir iĢ yerindeki kolları
sayarım toplam 100 kol varsa 50 insan vardır. Tabii ki bu örnekte olduğu gibi kol da bir birim olabilir ama insan sayısı
ölçeceksek hiç de kullanıĢlı bir birim olmuyor.
A) Doğal Birim: Ölçülecek değiĢkenlerin bazılarının doğal birimleri vardır. Ayrı olarak birim oluĢturmaya gerek yoktur.
Genellikle kesikli ( Süreksiz) değiĢkenlerin birimleri doğaldır. Birer ardıĢık olarak saydığımız ölçmelerde doğal birim
kullanırız. Örneğin “Bu sınıfta üç masa var” derken kullandığımız masa doğal bir birimdir. Ya da “Bu kitaptaki bölüm
sayısı 3‟tür derken kullandığımız bölüm doğal bir birimdir” Bu birimler uzmanlar tarafından belirlenmiĢ
birimlerden değildir.
Uzunluk, zaman, öğrenci baĢarısı gibi değiĢkenlerin ölçümünde doğal birim kullanılmaz. AnlaĢma sağlanması
adına belirlenmiĢ birimler kullanılır. Bunlara YAPAY BĠRĠM adı verilir.
B) Yapay Birim: Örneğin ne kadar uzunluğa 1 metre, kilometre, mil, fersah deneceği, ne kadar ağırlığa 1 kilo, gram
deneceği , kaç paralık birime 1 lira ya da kuruĢ deneceği, ne kadar süreye 1 saat, dakika vs deneceği keyfi olarak
belirlenmiĢtir.
Bazen doğal birim kullanabileceğimiz değiĢkenlerde bir yapay birimi tercih ederiz. Yani bazı durumlarda yapay
birim daha kullanıĢlı olabilir. Örneğin: Manava gittiniz ve elma alacaksınız. Ġsterseniz 3 tane elma diyip doğal birim
kullanarak alabilirsiniz ancak 1 kilo elma diyip yapay birim kullanmak bazen alıĢveriĢ adına daha kullanıĢlı olabilir.
BĠRĠMLERĠN TAġIMASI GEREKEN ÖZELLĠKLER:
a) EĢitlik: Ölçme aracının tüm bölümleri aynı büyüklükte olmalıdır. Örneğin, zaman ölçümlerinde birim olarak yapay bir birim
olan saat kullanılmaktadır. Saat birimi her yerde ve durumda eĢittir. 5 saat dediğimizde 5 tane 60 dakika düĢünülür. BaĢka
bir örnek olarak metre ya da ºC verilebilir.
-
KarıĢ, kulaç, adım da birer birimdir ancak eĢitlik ilkesine uygun olmayan birimlerdir
EĢitlik ilkesi genelde yapay birimlerdedir. Doğal birimlerde eĢitliği yakalamak zordur.
b) Genellik: Ölçme iĢleminde kullandığımız birimlerin herkesçe kabul gören, ulusal ya da uluslararası standartlarda
karĢılığının olmasıdır. Örneğin uzunluk için metre – kilometre gibi birimler ulusal ya da uluslararası arenada yaygın
kullanılmaktadır.
Bir uzunluk birimi olarak kullanılan mil tüm dünyada kullanılmasa da kullanıldıkları ülkeler için genellik özelliği taĢırlar.
Genellik ilkesine uymayan birimler genelde dar gruplar için geçerlidir.
c)
KullanıĢlık: Birimin ölçülecek niteliğe uygun olmasıdır. Birimin ölçülecek değiĢkenin büyüklüğüne göre duyarlığının
değiĢmesidir. BaĢka bir ifade ile bir objeyi ölçerken kullandığımız ölçü aracının en küçük bölmesinin bu ölçme iĢlemini
yapmak konusunda iĢimizi kolaylaĢtırmasıdır.
Ġki kent arası uzaklığı santimetre ya da milimetre ile ölçmek belki mümkün olabilir ancak böyle bir ölçme iĢlemi
oldukça maliyetli olur; ancak ölçme aracımızın en küçük bölmesini ( yani birimini ) kilometre olarak seçmemiz bu ölçme iĢlemini
kolaylaĢtıracaktır. Ya da bir kuyumcunun altınlarını kilogram birimi ile ölçü yapan bir tartı ile tartması yerine gram hatta
miligram birimlerinde ölçü yapan bir tartı ile tartması daha kullanıĢlı ve uygun olacaktır.
ÖLÇME ĠġLEMĠNDE SIFIR
BAġLANGIÇ NOKTASI
MUTLAK ( Doğal – Gerçek) SIFIR: Ölçmeye bu Ģekilde
formal anlamda yaklaĢtığımızda, ampirik anlamda sıfır, söz
konusu niceliğin hiç bulunmaması halidir. Ampirik kümede
ölçme konusu niceliğe hiç sahip olmayan bir eleman sıfır
değerli elemandır. Bu değere doğal sıfır denir. Aynı anlamda
mutlak sıfır yada gerçek sıfır terimleri de kullanılır.

Ölçme iĢleminde ölçümün sıfır çıkması gözlenen
özelliğin yokluğunu ifade ediyorsa sıfır, mutlaktır.
Benim cebimde 15 tl var” ölçme ifade eden cümle
irdelendiğinde bu ölçmede 0 bir yokluğu ifade etmektedir.
Kitap 350 sayfa , 4 kazağım var , boyumun uzunluğu 186cm,
bu maçta 6 gol oldu, bilgisayarın 55 tuĢu vardı, giydiği montta
24 cep var, bizim eve 3 km var gibi.
Benim cebimde 0 lira var  Para yok
Bu kitapta 0 sayfa var  Sayfa yok
Maçta 0 gol var  Gol yok
Benim boyum 0 cm Boy yok
Bilgisayarın 0 tuĢu var  TuĢ yok
KARġILAġTIRALIM
ġu an saat 13.00‟dır.  Saat 00.00 olması hiçliği mi ifade
ediyor ; hayır. O halde bağıl sıfır kullanılmıĢ.
Ali 8 saat ders çalıĢtı.  Ali 0 saat ders çalıĢtı hiçliği mi
ifade ediyor; evet hiç çalıĢmamıĢ. Gerçek sıfır
Aradan 30 yıl geçti.  Aradan 0 yıl geçti yani hiç ayrılık
olmadı gerçek sıfır.
ġu an 2012 yılındayız.  Diyelim ki Ģu an 0 yılında olalım.
Buradaki 0 hiçliği mi ifade eder. Hayır 0 tanımlanmıĢtır ve
Ġsa’nın doğumu kabul edilir. Ayrıca takvim – (eksi) değer
de alır ( M.Ö 3000 gibi ) O halde sıfırı gerçek sıfır değil.
Bağıl sıfır.
TANIMLANMIġ ( Bağıl – Ġtibari – Keyfi) SIFIR : Bazen
ampirik kümede gerçek sıfır bilindiği halde, ölçümleri ifade
etmede kolaylık sağladığı için gerçek değerde olmayan(itibari)
bir sıfır noktası tanımlanabilir. Bazı değiĢkenlerin doğal sıfırı
değeri bulunmaz. Gerçek sıfır olmadığı halde sıfır kabul edilen
bu değere itibari sıfır denir

Ölçme iĢleminde ölçümün sıfır çıkması gözlenen
özelliğin yokluğunu ifade etmiyorsa; yani sıfır sadece
birilerince belirlenmiĢ bir baĢlangıç noktası ise sıfır
keyfidir.
Eksi ( - ) değer alan her ölçmenin sıfırı BAĞIL
SIFIR‟dır.
BaĢarı ( eğitimde kullanılan testler) testlerinde BAĞIL
SIFIR vardır.
Eğitimde kullanılan baĢarı testlerinin sıfırı neden
bağıl ( keyfi) sorusuna verilecek yanıt Ģudur: Örneğin Ģu an
size 10 sorudan oluĢan bir matematik testi uygulasak ve bu test
sonucunda siz 0 alsanız. Bu durumda sizin matematik
bilginizin hiç olmadığı anlamı çıkar mı? Tabii ki hayır. Çünkü
bir insan matematik testinden 0 alsa da matematik bilgisi
açısından yokluk anlamı çıkmaz.
“Konya‟nın deniz seviyesinden yüksekliği 1030 metredir.”
ġimdi bu cümlede geçen 1030 metre yükseltiye dikkat
edelim. Coğrafya bilginiz varsa yükseltide 0 metre deniz
seviyesidir. ġayet yükseltide 0 metre Dünya‟nın çekirdeği
olsaydı Konya‟nın yükseltisi yaklaĢık 7500 metre olacaktı. Ya
da yükseltide 0 okyanus tabanı kabul edilseydi Konya‟nın
yükseltisi daha farklı olacaktı. Demek ki ortada hiçlik ifade
eden bir sıfır yok KEYFĠ konmuĢ bir sıfır var. Ayrıca
Hollanda’da bazı yerler -4 metre yükseltiye sahiptir
bilginize
Bu gün havanın sıcaklığı 23°C‟dir” cümlesinde sıfır
tanımlanmıĢ sıfırdır. Havanın sıcaklığını sıfır olması
havada herhangi bir sıcaklık değeri olmadığı anlamına
gelmez. – 10 derece olan sıcaklıklar da vardır.
Bağıl sıfır söz konusu ise ölçek eĢit aralıklıdır. Ve
bağıl sıfırlı ölçme iĢlemlerinden elde edilen ölçümler (
ölçme sonuçları) üzerinde ÇARPMA – BÖLME yapamayız
ORANLAMA yapamayız; sadece toplama ve çıkarma
yapabiliriz
Ölçmede sıfır sorularında biraz dikkatli olmak gerekir. Bazı kalıp ifadeler burada insanı yanıltabilir. Örneğin “saat
Ģu an 13.00‟tür.” örneğinde sıfır bağıl iken “Ben 10 saattir ders çalıĢıyorum” örneğinde sıfır mutlaktır. Çünkü bir insan 0 saat
ders çalıĢtım ifadesi kullandığında hiç ders çalıĢmadığı anlamı çıkarken; saat Ģu an 00.00 dendiğinde yokluk anlamı çıkmaz.
Yapılandırma Kutusu: Ölçmenin baĢlangıç noktasını yapılandıralım.
Türkiye 36 – 42 kuzey paraleleri arasında yer alır. Hepinizin bildiği gibi paraleller insanlar tarafından belirlenmiĢ
birimlerdir. Bu birimlerin ölçme baĢlangıcı ise 0 paraleli ya da diğer adı ile Ekvator çizgisidir. Yani bu durumda ölçme
iĢleminin sıfırı bağıldır ( izafi)
PRATĠK BĠLGĠ: Tüm baĢarı, zeka, yetenek vb testlerle yapılacak ölçmelerin baĢlangıç noktası keyfidir ( bağıl – izafi)
Aldığım peynirim ağırlığı 500 gramdır. Ağırlık, uzunluk gibi özelliklerin ölçüldüğü durumlarda sıfır mutlaktır. Bu örnekte de
görüldüğü gibi 0 gram peynir olması durumunda ölçülen özellik olan ağırlık bakımından peynirin yokluğu oluĢur. Bu yüzden
sıfır mutlaktır.
KarĢılaĢtırarak Özet Yapalım:
Mersin Ģu an 29 ºC‟dir. Bir ölçme cümlesidir.
Ölçüm ( Ölçme sonucu): 29‟dur.
Birim
:Yapay bir birim olan Celcius ( Santigrad) kullanılmıĢtır.
Sıfır
: Keyfi
DeğiĢkenler
: Nicel ( sayısal) ve sürekli ( Ġki değer arasında sonsuz sayıda değer alabilen)
Sınıfta 14 öğrenci var. Bir ölçme cümlesidir.
Ölçüm ( Ölçme sonucu) : 14‟tür.
Birim
: Birim olarak “insan” “öğrenci” kullanılmıĢtır. Doğal bir birimdir.
Sıfır
: Mutlak ( Doğal)
DeğiĢkenler
: Nicel ( Sayısal ) ve süreksiz ( Çünkü öğrenci birimi bir değiĢken olarak iki değer arası sonsuz sayıda
değer alamaz ya 1‟dir ya da 2 ... yani hep tam sayı değeri alır.)
Barbut oynarken atılan zar 6 gelmiĢtir. Bir ölçme cümlesidir.
Ölçüm ( Ölçme sonucu) : 6‟dır.
Birim
: Her bir zar sayısı birimdir. Toplamda 6 birim vardır.
Sıfır
: Ne doğal ne de mutlak sıfır vardır. Çünkü ilginç gelebilir ancak tavla üzerindeki sayılar matematiksel
bir sayı değil sadece semboldür. Yani zarın üstüne sayı değil de 6 tane resim konulsa da olurdu. Zaten zarlar sayı ifadesi ile 1 ile
baĢlarlar yani ortada sıfır da yoktur. Ya da baĢka bir ifade ile hangi zar değeri gelirse gelsin bir ifadedir ortada yokluk oluĢmaz.
DeğiĢkenler
: Ortada matematiksel bir sayı olmadığı için ( nitel ) ve zar değerleri 6 tanedir ve bu değerler arasında
bir baĢka değer olmayacağından süreksiz
PRATĠK BĠLGĠ: Tavla zarları, iskanbil desteleri, okey taĢları üzerindeki sayılar aslında gerçek birer sayı
değildirdir; birer kodlama , adlandırma ya da sıralamadır. Bu yüzden bunlar birer nicel değiĢken değildirler.
ÖLÇME KURALI: Ölçme iĢleminde ölçülen özeliğin ne kadarlık miktarına ne değer /puan vb verileceğinin belirlenmesidir.






100 metreyi 15 saniye altında koşanlara 10 puan verilecektir.
İlk dört soru 5 puan sonraki altı soru 15’er puandır.
Kompozisyona başlık koyanlara 5 puan verilecektir.
Üç soruyu doğru yanıtlayana 10 puan verilecektir.
4 yalnış bir doğruyu götürür.
Sınavın süresi 60 dakikadır vb
Öğretmenlerin hazırladıkları cevap anahtarları – dereceli puanlama anahtarları ( rubrik) birer ölçme kuralı belirleme
işlemidir. Ölçme kuralının belirlenmesi ölçme işleminde NESNELLİĞİ sağlar.
ÖLÇME HATASI
Ölçme hatası : Gözlenen özelliğin gerçek değeri ile ölçüm değeri arasındaki fark hatadır. Yani bir masanın gerçek
uzunluğu 3 metre olsun. Masanın uzunluğu bir marangoz çırağı tarafından ölçüldüğünde 3 metre 12 santim çıksın. ( Marangoz
çırağı herhangi bir sebepten kaynaklı hata yapsın ya da kullandığı ölçme aracı arızalı olsun) bu durumda gerçek değer ile ölçüm
değeri arasında 12 santimlik bir fark oluĢtu. ĠĢte bu farka ölçme hatası denir. Ben bir Türkçe öğretmeniyim. 100 üzerinden
yapılan bir Türkçe sınavında ölçülecek olan tüm davranıĢları kazanmıĢ biriyim. Yani benim gerçek değerim bir Türkçe sınavında
100 üzerinden 100’dür. Ancak sınava giriyorum; baĢ ağrısı nedeniyle dikkatimi toplayamadığım için ,sınav salonu sıcak olduğu
için, sınavdaki sorular açık olmadığı için, öğretmen yanlı davrandığı için, seçenekleri iĢaretlerken kaydırma yaptığım için, ya da
daha baĢka birçok sebepten kaynaklı sınavdan 90 alayım. Bu durumda benim gerçek değerim olan 100 ile ölçüm değeri olan 90
puan arasındaki 10 puanlık fark ölçme iĢlemine karıĢmıĢ bir hatadır.
BaĢarı testlerinde bir öğrenci bir soruda yoklanan davranıĢı kazandığı halde o soruyu çözemiyorsa ya da o soru
ile yoklanan davranıĢı kazanmadığı halde soruyu doğru çözüyorsa o ölçme iĢleminde hata olmuĢtur. Uygulanan bir
sınavda soru ile yoklanan davranıĢa sahip olan öğrenciler soruları çözüyor ; soru ile yoklanan davranıĢa sahip öğrenciler
soruları çözemiyorsa ölçme iĢleminde hata yoktur. Ancak hatasız bir ölçme iĢlemi yapmanın ( hele ki eğitimde yani okullarda)
neredeyse imkansız olduğu unutulmasın. Çünkü hata her zaman ölçmeciden ( öğretmen) kaynaklanan bir durum değildir;
baĢka faktörler de etkilidir.
ÖLÇME ĠġLEMĠNE KARIġAN HATALAR
Sabit Hata: Bir ölçme iĢleminden diğerine
miktarı değiĢmeyen tüm ölçümlere mutlak
değer olarak aynı miktarda karıĢan hata
türüdür.
Sistematik Hata: Ölçülen büyüklüğe,
ölçmecinin
yanlılığına
veya
ölçme
koĢullarına ve belli bir duruma bağlı olarak
miktarı değiĢen hatalardır.
Tesadüfi ( Random- Seçkisiz) Hata: Ölçme
sonuçlarına geliĢi güzel karıĢan, kaynağı,
miktarı ve yönü kesin olarak bilinmeyen
hatalardır.

Ölçmeciden Kaynaklı Sistematik Hatalar:
 Bir öğretmenin derse erken gelenlere,
kendi siyasi görüĢünde olanlara,
akrabalarına, sevdiği öğrencilere, yazısı
güzel olanlara, kızlara ya da erkeklere,
fazladan puan vermesi. Örneklere
dikkat ettiyseniz bir yanlılık durumu
vardır.

Ölçülen Özeliliğin Büyüklüğüne Bağlı
Sistematik Hatalar:
 Bir tartının her 10 kilogramlık ölçümde
1 kilogram fazla tartması. Bu cümleyi
dikkatsiz okursanız sabit hata gibi
görünür ancak Ģöyle düĢünelim. Her 10
kiloda 1 kilo veriyorsa ölçtüğümüz
özellik büyüdükçe hata da artacaktır.
Yani 30 kiloluk bir özellik ölçüyorsak 3
kiloluk bir hata oluĢur.
 Bir öğretmenin öğrencilerine yaptığı
sınavdan sonra her öğrenciye aldığı
puanın %10‟unu vermesi sistematik
hatadır. Çünkü sınavdan 70 puan almıĢ
bir öğrenciye 70‟in %10 eklendiğinde 7
puanlık artıĢ olurken 90 almıĢ bir
öğrenciye 90‟ın %10 eklendiğinde 9
puanlık bir artıĢ olur yani tüm
öğrencilere aynı miktarda hata karıĢmaz.




Bir öğretmen sınıf ortalaması düĢük
olduğu için ( yani öğrencilerinin geneli
sınavdan düĢük aldığı için) tüm
öğrencilere 10‟ar puan vermesi sabit
hatadır.
Bir cetvelin ucu kırık olsun ( 2 santim)
Bu durumda cetveli bir defa kullanmak
Ģartıyla yapılacak her ölçme iĢlemi 2
santimlik sabit bir hata verecektir. Yani
tüm cisimler 2 santim kısa görünecektir.
Bir tartının baĢlangıç noktası 10
kilogram olsun. Bu durumda bu tartı ile
tartılan herkes 10 kilogram ağır
görünecektir.
Bir öğretmenin hazırladığı 20 soruluk
bir sınavda tüm öğrencilerin son soruyu
süre yetmediği için boĢ bırakması da
sabit bir hatadır.




Bir öğretmenin dikkatsizlikten kaynaklı
bazı öğrencilere fazla puan vermesi
Bir öğrencinin yorgun olduğu için bazı
soruları ( bildiği halde) yanlıĢ çözmesi
Sınav yapılan ortamın aĢırı sıcak /
soğuk, basık , kirli vb. olmasından
kaynaklı öğrencilerin soruları anlamakta
güçlük çekip bildikleri soruları dahi
yanlıĢ yapmaları.
Bir öğretmenin hazırladığı testteki bazı
ifadelerin açık ve anlaĢılır olmamasından kaynaklı öğrencilerin soruları doğru
yanıtlayamaması
Oldukça uzun bir testten dolayı
öğrencilerin sonlara doğru soruları
algılamakta güçlük çekip hatalar
yapması
Sınavda aĢırı kaygılı, gergin, korkulu ya
da sinirli olan öğrencilerin soruları
çözerken hata yapmaları
SABĠT HATALAR:
 Sabit hatalar, standart sapmayı ve varyansı etkilemezken aritmetik ortalamayı etkiler. ( Bu durum sadece tüm
öğrencilere puan eklenmesi ya da tüm öğrencilerden eĢit miktarda puan düĢürülmesi gibi durumlar için geçerlidir.)
5 öğrencinin aldığı puanlar Ģu Ģekilde olsun: 30 , 40, 70 , 80 , 90 öğretmen herhangi bir sebeple bu öğrencilerin hepsine 10’ar
puan eklesin ya da çıkarsn. ( Eklediğini var sayarsak) Bu durumda öğrencilerin puanları sırasıyla 40, 50, 80, 90 ve 100
olacaktır. Eski aritmetik ortalama 62 iken yeni aritmetik ortalama 72’ye çıkar. Ancak öğrencilerin aritmetik ortalamadan
uzaklıkları değiĢmediği için standart sapma da değiĢmez. ( Yani 30 alan öğrencinin aritmetik ortalamadan uzaklığı 62-30 = 32
iken 10 puan eklenmesi ile 72-40= 32 yani uzaklıkta değiĢen bir Ģey olmadı. Çünkü öğrenciye 10 puan eklerken herkese de
eklediğimizden aritmetik ortalama da 10 puan arttı)


Sabit hatalarda yanlılık yoktur. ( Yani tüm ölçme sonuçlarına eĢit miktarda hata karıĢır birinin diğerine üstünlüğü
yoktur. )
Hatanın miktarı ve kaynağı bilinmektedir. Bu yüzden bir ölçme sonucuna karıĢan sabit hatalar çok rahat düzeltilebilir. Buna
karĢılık miktarı, yönü ve kaynağı bilinmeyen tesadüfi hataların bir ölçme iĢleminden arındırılması zordur.
Bir öğretmen 10 soruluk bir sınav hazırlasın her soru 10 puan üzerinden belirlenmiĢ ve toplamda 100 puan
alınacak. Sınavın süresi yetmediği için tüm örğenciler 10. soruyu yapamamıĢ olsunlar. Bu durumda sınıftaki tüm
öğrencilerin sınavı 100 üzerinden değil 90 üzerinden belirlenecektir. Ya da öğretmen son soruyu tüm sınıfın doğru yaptığını
kabul etmesi de sabit hata örneğidir. Bu noktada o soruyu bilen ya da bilmeyen herkes doğru yapmıĢ kabul edilir. Soruyu
gerçekte çözemeyecek öğrenci de doğru yaptı zaten çözecek olan da bu önemli değildir her türlü sabit hatadır. Bu konuda bazı
kaynaklarda hatalı yorumlar görebilirsiniz. Doğrusu bizim söylediğimiz gibidir.
Sabit hatalar standart sapma ve varyansı etkilemediği için doğrudan güvenirliği etkilemez. Buna karĢılık bilen ile
bilmeyen ayrımının yapılmasını zorlaĢtırdığı için geçerliği direkt etkiler.
SĠSTEMATĠK HATALAR: Sistematik hataların öğretmen yanlılığı ya da ölçülen özelliğin büyüklüğüne göre oluĢtuğunu söylemiĢtik.


Sistematik hatalar hem standart sapmayı hem de aritmetik ortalamayı etkiler.
Sistematik hatalar önceklikle geçerliği düĢürür.
Tek kullanımda sabit hata veren bir ölçme aracı birden fazla kullanımda sistematik hata verir. ġöyle düĢünelim, bir cetver düĢünün 50
santimlik olsun. Yalnız ilk iki santimlik yeri kırık olduğu için her seferde 2 santim eksik ölçüm yapacaktır. Bu cetvelle 50 santimden küçük bir
nesne ölçtüğünüzde ( aracı bir kere kullanmanız yeterlidir) sabit hata verir. Ancak 100 santimlik bir Ģey ölçtüğünüzde aynı cetveli iki kere
kullanırsınız. Bu durumda her kullanımda 2 santimlik hata veren cetvelimiz iki kez kullanıldığı için bu sefer 4 santimlik hata verir.
TESADÜFĠ HATALAR: Tesadüfi hatalar birçok nedenden kaynaklanır. Bu hatanın nedeni öğretmen ya da öğrenci olabileceği gibi ölçme
iĢleminin yapıldığı ortam ya da araç da olabilir.
 ġans faktörü
 Soruların açık anlaĢılır olmaması , testin yönergesinin açık olmaması ya da ölçme aracının bazı hatalar barındırması
 Ölçmecinin puanlama dikkatsizliği
 Öğrencinin heyecansal durumları ya da sağlık koĢulları
 Ölçme koĢullarının kötü olması ( Sıcaklık – ıĢık vb )
 Öğrenci dikkatsizlikleri
 Öğretmenin puanlamayı rastgele yapması ( Kafadan not verme )
Tesadüfi hatalar doğrudan güvenirliği düĢürür.
Sabit ve sistematik hatalar tesadüfi değiĢken olma özelliğine sahip değillerdir. Bu nedenle ölçmede hata kuramları sadece
tesadüfi hata üzerine geliĢtirilmiĢtir. Sabit ve sistematik hatalar üzerine hata kuramı geliĢtirilmemiĢtir. Ölçme ve değerlendirmede
üzerinde en ayrıntılı durulan hata türü tesadüfi hatadır.
HATA KAYNAKLARI




Ölçmeyi yapan kiĢiden kaynaklı hatalar ( Taraflılık – dikkatsizlik vb )
Ölçmenin yapıldığı araçtan kaynaklı hatalar ( Testin açık olmaması, terazinin bozuk olması ya da yanlıĢ araç kullanılması vb)
Ölçmenin yapıldığı ortamdan kaynaklı hatalar ( Ortamın kopya çekmeye uygun olması, sıcaklığı, gürültü vb )
Ölçmenin yapıldığı gruptan ( öğrenciden) kaynaklı hatalar ( Motivasyon, stres, uykusuzluk, sınava karĢı tutum vb)
KARġILAġTIRARAK ÖZET YAPALIM
Sabit Hata:
Sistematik Hata:
Tesadüfi Hata:
Öğrencilerindeki matematik korkusunu
yenmek isteyen bir öğretmenin tüm
öğrencilerine sınavdan aldığınız puana 10
puan ekleyeceğim demesi
Öğretmenin sınıftaki bazı öğrencilere sınav
sorularınının yanıtlarını önceden vermesi
Bir öğrencinin ailevi problemlerinden
kaynaklı sınava dikkatini toplayamaması ve
sorularu yanlıĢ algılaması
Bir arabanın benzin Ģamandırasındaki
arızadan kaynaklı arabadaki benzini sürekli
1 litre düĢük göstermesi
Bir öğretmenin sadece özel derste anlattığı
konulardan soru sorarak özel derse gelen
öğrencilerinin yüksek puan almasını
sağlaması
Sınava giren bir öğrencinin 20. sorudan
sonraki yanıtları kaydırma yaparak yanlıĢ
iĢaretlemesi sonucu puanının düĢük gelmesi
Bir firmanın tüm ürünlerinin fiyatını %10
yüksek yazması
Ölçme için farklı bir tanım: Ölçme aslında nitelikler kümesinin elemanlarının sayı veya semboller kümesinin ( soyut iĢlemler
kümesi) elemanlarıyla eĢlenmesidir. Bu eĢleĢme üzerine ölçmede iki durum ortaya çıkar:
a) Ġzomorfluk
b) Homomorfluk
Ölçmede Ġzomorfluk: Nitelik veya özelliklerin yer aldığı
görgül kümenin her bir elemanı, soyut kümenin içerdiği sayı
ya da sembollerle, bire-bir eĢleĢebiliyorsa ve bu kurala göre
soyut kümenin sayı ya da sembolleriyle gösterilmedik hiçbir
görgül küme kalmıyorsa baĢka bir deyiĢle iki küme arasında
birebir örten bir fonksiyon ( bağıntı ) varsa ölçme izomorftur.
Ölçmede Homomorfluk: Pratikte ölçmede bire-bir örten
bağıntı çok az görülür. Çünkü görgül küme elemanlarıyla
soyut küme elemanları arasında eĢleme çoğu zaman bire-bir
olmaz. Örneğin birbirinden farklı olduğu bilinen iki görgül
küme elemanına ölçülen nitelikleri eĢit olduğu için soyut
iliĢkiler kümesinde aynı sayı – sembol verilebilir. (sınıflama
ölçeklerinde olduğu gibi 5 tane çalıĢkan olabilir)
Baba.
176 cm.
Tam doğru
3 puan
Anne.
162 cm
Yarım doğru
1 puan
Büyük çocuk .
98 cm
BoĢ .
0 puan .
Küçük çocuk.
92 cm
YanlıĢ .
Görgül Küme
Soyut ĠĢlem Kümesi
Yukarıdaki çizimde de görüldüğü gibi nitelikler
kümesinin elemanları sayı kümesinin elemanları ile
bire bir eĢleĢmiĢ ve hiçbir eleman açıkta kalmamıĢ ya
da bir değer iki eleman almamıĢtır. Yani her değer bir
eleman almıĢtır.
Görgül Küme
Soyut ĠĢlem Kümesi
Yukarıdaki çizimde de görüldüğü gibi nitelikler
kümesinin elemanları sayı kümesinin elemanları ile
bire bir eĢleĢmemiĢ görgül kümenin iki elemanı soyut
iĢlem kümesinde aynı eleman ile eĢleĢmiĢ.
GENEL TEKRAR ve YAPILANDIRMA
Bir öğretmen öğrencilerine 5 üzerinden puan verirken Ģöyle bir
yol izlemiĢtir: 0 – 24 arası 0 puan, 25 ile 44 arası 1 puan, 45 ile
54 arası 2 puan, 55 ile 69 arası 3 puan , 70 ile 84 arası 4 puan
ve 85 ve üstü ise 5 puan almaktadır. Buna göre:
AyĢe matematik sınavından 4 aldı. Ölçme cümlesini ölçmenin
temel kavramları açısından analiz edelim:
Sıfır Türü : Bu ölçme iĢlemi matematik bilgi ve becerisini
yoklamaktadır. Bu sınavdan 0 almak matematik bilgisi
açısından yokluğu ifade etmez bu yüzden BAĞIL ( Keyfi)
SIFIR
Yapılan bir sınavda öğrencilerin bir kısmı 26. soruyu , o soru
ile yoklanan davranıĢı kazanamadıkları için yanlıĢ yapmıĢtır.
HATA TÜRÜ: ġimdi bu cümleyi okuyan birçok dikkatsiz
arkadaĢ burda sabit hata olduğunu düĢünecektir. Ancak bu
ölçme durumunda hiçbir hata yoktur. Çünkü öğrencilerin bir
soruyu o soru ile yoklanan davranıĢı kazanamadıkları için
çözememeleri hata değildir; zaten o soru ile yoklanan davranıĢı
kazanmamıĢsa soruyu da çözememesi beklenir. Eğer Ģöyle
olsaydı: “Öğrenciler, süre yetmediği için, hasta oldukları için,
soru açık ve anlaĢılır olmadığı için vb yapamamıĢtır” bu
durumda bir hatadan söz edebilirdik.
DeğiĢken Türü: 4 çıkan ölçme sonucu ( ölçüm) bir sayı ifade
ettiği için NĠCEL DEĞĠġKENDĠR. Ölçüm değeri çıkabilecek
0, 1,2,3,4 ve 5 değerleri arasında sonsuz sayıda değer
bulunamayacağından ( yani bir öğrenci ya 3 ya 4 vb alabilir
4,272 diye bir puan tanımlanmamıĢ) SÜREKSĠZ DEĞĠġKEN
Ġki kent arası uzaklık ölçüleceği zaman uygun birim
kilometredir. Ġstenirse bu ölçümler santimetre birimi ile de
yapılabilir. Yapılırsa ne olur:
KullanıĢlık düĢer: Ġki kent arasını santimetre ile ölçersek
ölçme iĢleminin kullanıĢlığı düĢer. Çünkü daha çok zaman ,
emek ve maliyet gerektirir hale gelir.
Ölçme iĢleminin duyarlığı artar: Küçük birimlerle yapılan
ölçme iĢlemlerinin duyarlığı artar. Ancak bu durum yeni
sorunlar yaratabililir. Örneğin çok küçük birimler üzerinde
çalıĢmak bazı hesaplama hatalarına yol açabilir bu da
dikkatsizlikten kaynaklandığı için tesafdüfi hata doğurabilir.




SIFIR TÜRLERĠNĠ BULUNUZ
( VARSA tabi )
Ahmet sınavda 7. oldu.  Sıfır yok çünkü sıra sayıları
matematiksel iĢlem yapmaya uygun sayılar değildir.
Ahmet Türkçe sınavından 70 aldı  Bağıl sıfır, çünkü
bilgi ölçülmektedir. Sıfır yokluk ifade etmez.
Alpay‟ın TC Kimlik numarası: 66666666666‟dır.  Sıfır
yok; çünkü TC kimlik numaraları gerçek sayı değildir.
Bu ders notu 80 sayfadır.  Gerçek sıfır; çünkü bu ölçüm
0 çıksaydı sayfa sayısı adına yokluk ifade ederdi.
ÖLÇEK ve ÖLÇEK TÜRLERĠ
ÖLÇEK: Ölçek terimi bazen “birim” yerine de kullanılır. Örneğin pilav piĢirirken “bir ölçek pirince iki ölçek su
konulur”cümlesinde ölçek kelimesi “birim” anlamında kullanılmıĢtır. Ancak ölçme konusunda ölçek teriminin tanımı
Ģudur: Ölçme sonuçlarını gösteren sayı ya da sembollerin formal ( matematiksel veya istatistiksel) özellikleridir.

BAŞKA BİR TANIM: Nesnelere verilen sayı ya da sembollerin anlamlarını ya da nesnelere verilen ölçülen özelliğine
göre sayılar tayin etmede ve nesnelere verilen sayıların kullanılmasında uyulması gereken kuralları ve kısıtlamaları
ifade eder.
ÖLÇEK TÜRLERĠ
Sınıflama Ölçeği
Sıralama Ölçeği
EĢit Aralıklı Ölçek
EĢit Oranlı Ölçek
ÖLÇEK KONUSUNA GENEL BAKIġ
Sınıflama Ölçeği : Birey , olay ya da nesnelerin bir özelliğe
Sıralama Ölçeği : Birey, olay ya da nesne vs. bir özelliğe
sahip oluĢları bakımından gruplara ya da sınıflara ayrılması
sahip oluĢ miktarları bakımından sıraya koyduğumuz zaman
ile elde edilen ölçeklerdir.
elde edilen ölçeğe denir.


Nesnelerin, olay ya da kiĢilerin farklılıkları ve benzer
özellikleri belirlenir, benzer özelliği olanlar gruplanır. Bir
EĢit aralıklı ya da eĢit oranlı ölçekle elde edilen puanları
sıraya koymak
sınıftaki baĢarılı ve baĢarısız öğrenciler, kızlar ya da
erkekler, mavi giyinenler ve kırmızı giyinenler gibi.
ÖRNEKLER:

Sanayi bakımından geliĢmiĢ iller

Ortadoğu ülkeleri , Balkan ülkeleri vb diye ülkeleri
ÖRNEKLER:
ayırmak

Alpay, KPSS‟de Türkiye 2.‟si oldu
Öğrencilere okul numarası vermek, futbolculara sırt

Ali, dershanenin en uzun boylu öğrencisidir.
numarası vermek, illere plaka numarası vermek vb.

Müzik listelerinde Top 10‟u belirlemek

KiĢileri siyasi görüĢlerine göre ayırmak

En sık yaptığımız iĢi belirlemek

Öğrencileri göz renklerine göre sınıflamak

Öğrencileri evlerinin okullarına olan uzaklığına göre

Öğrencileri sosyo-ekonomik düzeylerine göre ( zengin –

fakir – orta düzey vb diye) ayırmak

listelemek

KiĢileri kazandıkları paraya göre sıraya koyma
Öğretmenleri konumlarına göre adlandırmak ( Kadrolu –
Ücretli – Geçici Görevli – Ücretsiz Ġzinli )
EĢit Aralıklı Ölçekler: Adından da anlaĢılabileceği gibi bu
EĢit Oranlı Ölçekler: EĢit aralık ölçeğinden daha geliĢmiĢ
ölçekte birimler arası fark birbirine eĢittir.
olan ölçek türü oran ölçeklerdir. Oran ölçekleri eĢit aralık

Sıfır noktası bağıl olan ölçmeler için kullanılır.
ölçeklerine benzemektedir. Farklı olarak burada baĢlangıç

Toplama çıkarma yapılabilir ; çarpma bölme yapılamaz.
noktası olan sıfır ( 0 ) gerçek sıfırdır.
ÖRNEKLER:
ÖRNEKLER:

Tüm baĢarı, yetenek vb testler eĢit aralıklıdır. Yani Ahmet,

Ahmet‟in boy uzunluğu 190 santimetre ( Sıfırı mutlak)
Türkçe dersinden 60 aldı gibi

Elimde 7 tane bilye var ( Sıfırı mutlak )

Z ve T puanları eĢit aralıklıdır.

Yeni doğan bebeğin ağırlığı 4 kilo ( Sıfırı mutlak )

ġu an yıl 2012‟dir. ( Sıfırı bağıl )

Hava sıcaklığı Ģu an 23 derecedir ( Sıfırı bağıl )

Türkiye 36 – 42 kuzey paralellerindedir.

Mankenin bedeni 0‟dır. ( Burdaki sıfır da bağıl gerçek bir
yokluk değil )

A kentinin rakımı 1030 metredir.
SINIFLAMA ÖLÇEĞĠ ( Adlandırma – Gruplama – Kategori – Nominal ) :
Adlandırma, nesnelere sayı ya da kod vermedir: Ġllere plaka numarası verme, silah seri numaraları, öğrenci numaraları,
Türkiye Cumhuriyeti kimlik numarası, futbolcu sırt numaraları gibi nitel değiĢkenlere sahiptir.
Sınıflama ölçeklerinde hiçbir matematiksel iĢlem yapılamaz. Sadece frekans , tepe değer ( mod) ve yüzde bulunur.
Bunlar matematiksel bir iĢlem değildir.
ÖRNEK: Bir sınıfta 100 kiĢi vardır. Bunlardan 15’i sarıĢın , 35’i esmer , 20’si kumral 30’u da siyahidir. ġeklinde bir sınıflama
yapılsa bu sınıflamanın yüzdesi çıkarılabilir. %15’i sarıĢın, %35’i esmer, %20’si kumral, %30’u da siyahidir. Ayrıca bu
ölçümde en çok tekrar eden esmerlerdir yani dağılımın modu esmerler’dir. AYRICA GRUPLAMA ÖLÇEKLERĠ BĠZE
FREKAS ( KiĢi Sayısı) da verir.
Ahmet çalıĢkanlardandır ya da Mehmet kilolular grubundandır gibi sınıflama ölçeği ile yapılmıĢ ölçmelerde örneğin
Ahmet çalıĢanlardandır ölçmesinde Ahmet’in ne kadar çalıĢkan olduğu önemli değildir. Önemli olan Ahmet’in çalıĢkan
olmasıdır. Zaten ölçek bize bu bilgiyi vermez. Yani Ahmet’in en çalıĢkan mı olduğu ya da çalıĢkanlar arasında kaçıncı sırada
olduğu bilgisi yoktur. Aynı Ģekilde Mehmet kiloludur ölçmesi için de geçerlidir. Daha somut bir örnek bulalım; Ahmet sınıfı
geçenler, Mehmet ise kalanlar grubundadır. Bu noktada diyelim ki ders geçme 70 olsun bu durumda Ahmet 70 de alsa 100 de
alsa sınıfı geçmiĢtir. O halde bir sınıftaki tüm üyeler eĢit kabul edilir aralarında sıralama yapılmaz.
Sınıflama ölçekleri için birkaç örnek daha verelim :




Veli erkektir.
AyĢe Galatasaylıdır.
Bu kazak mavidir.
AyĢe yeĢil gözlüdür...
Sınıflama ölçekleri SĠMETRĠKLĠK ÖZELLĠĞĠ TAġIR : A = B  B = A Bir sınıftaki çalıĢkanların sayısı 10‟dur.
Örneğinde sınıflama yapılmıĢtır. Bu on çalıĢkandan Ali ( A) ve Bekir ( B) adlı iki öğrenciyi ele alalım. Bunlar çalıĢkanlar
grubundadır. Bu yüzden biri çalıĢkansa diğeri de çalıĢkandır. Yani A=B  B = A
Sınıflama ölçekleri GEÇĠġLĠLĠK ÖZELLĠĞĠ TAġIR: A = B ve B=C ise A = C Bir okuldaki sigara içenlerin sayısı
3‟tür. Ali , Bekir ve Cengiz. Ali günde 1 paket , Bekir yarım paket, Cengiz ise günde sadece 3 tane içsin. Sonuç itibarı ile hepsi
sigara içenler grubundadır. Ve aralarında sıralama yapılamaz. Bu noktada Ali , Bekir ve Cengiz sigara içiyor. Biri diğerinden
daha fazla içse de sınıflama ölçeklerinde bu üç üye de eĢit kabul edilir. Buna geçiĢlilik denir.
Sınıflama ölçeğinde birimler arasında FARK yoktur. Sigara içenlerle ilgili örneğe yeniden baktığımızda 3 tane
sigara içen vardı” ve bunlar arasında sıra – nitelik vs bakımdan fark yoktur. Hangisinin daha çok sigara içtiğini
bilemezsiniz ( ölçek size bunu vermez ) Bu yüzden birimler eĢit kabul edilir
Sınıflama ölçeklerinde duyarlık çok düĢüktür. “ Bir grup öğrenciyi göz rengine göre sınıfladığımızda “Kahve rengi –
siyah – mavi – yeĢil” gibi kümeler ortaya çıkar. Ancak mavilik kendi içinde derecelere ayrılamaz; az mavi olan da mavidir , çok
mavi olan da . Bu da ölçme iĢleminde duyarlığı düĢürmektedir.
SIRALAMA ( ORDĠNAL ) ÖLÇEĞĠ: Sıralama ölçeği bir bakıma eĢit aralıklı ya da eĢit oranlı ölçeklerle elde edilmiĢ
ölçümlerin sıraya konmasıdır.
YUKARIDAKĠ TANIMI ÖRNEK ÜZERĠNDEN AÇIKLAYALIM:
EĢit Oranlı
Ali‟nin boyu 187 santim
Veli‟nin boyu 192 santim
AyĢe‟nin boyu 175 santim
Sıralama
Veli en uzun ( Birinci)
Ali ortanca ( Ġkinci)
AyĢe en kısa ( Üçüncü )
EĢit Aralıklı
Ali sınavdan 70 aldı
AyĢe sınavdan 90 aldı
Veli sınavdan 82 aldı
Sıralama
En yüksek puan AyĢe‟nin
Ortanca puan Veli‟nin
En düĢük puan Ali‟nin
Televizyon 40 kg
Sehpa 5 kg
Buzdolabı 250 kg
En ağır eĢya buzdolabı
Ortanca ağır eĢya Tv
En hafif eĢya sehpa
Mersin 23 ºC‟dir.
Adana 26 ºC‟dir.
Konya 13ºC‟dir
En sıcak il Adana ( Birinci)
Ortanca sıcak il Mersin ( Ġkinci)
En soğuk il Konya ( Üçüncü)
Sıralama ölçeklerinde kullanılan sıra sayıları matematiksel anlamda bir sayı değildir. Bu yüzden sıralama ölçeklerinde
matematiksel iĢlem( toplama – çıkarma – çarpma – bölme ) yapılamaz.

Sıralama ölçeğinde 0 noktası yoktur ( KULLANILMAZ-ANLAMSIZ 0 ) Kimse sıfırıncı sırada yer almaz.
Sıralama ölçeğinde birim aralığı vardır ancak bu aralık değiĢir.(Aralık EĢit Değildir) Örneğin bir sınıfta yer alan
öğrencileri uzundan kısaya doğru sıraladığımızda 1, 2, 3, 4 öğrenciler arasında birim aralığı vardır; fakat 1.ve 2. öğrenci
arasındaki fark 3.ve4. öğrenci arasındaki farktan farklıdır. Yani birinci ile ikinci arasındaki fark ille de üçüncü ile dördüncü
arasındaki farka eĢit olmak zorunda değildir.
Sıralama ölçeklerinde sabit bir baĢlangıç noktası yoktur ( Ġfadeye dikkat edin baĢlangıç noktası yoktur demiyorum,
sabit bir baĢlangıç noktası yoktur diyorum.) Ne demek istiyoruz: “Sıralama ölçeklerinde bildiğiniz gibi sıraya koymak
birinci ( 1.) ile baĢlar. Diyelim ki sınıftaki on öğrenciyi boy uzunluğuna göre sıraya koyduk. En uzunu Ali olsun ( 187 cm)
Bu durumda Ali birincidir. Ancak birinciliği sabit değildir. Sınıfa Veli adlı öğrenci geldiğinde ( 190 cm) bu durumda Veli
birinci Ali ise ikinci olacaktır. O halde sıralama ölçekleri 1.( birinci) ile baĢlar ancak bu sabit değildir.
Sıralama ölçeklerinde de matematiksel iĢlem yapılamaz. Sadece Ģunlar bulunabilir : Mod, Frekans,Yüzde, MEDYAN
Sıralama ölçekleri ASĠMETRĠKLĠK ÖZELLĠĞĠ TAġIR: A>B ise B <A, Ali , Bekir‟den uzunsa Bekir de Ali‟den
uzundur diyemeyiz; ancak Ģunu deriz: Ali , Bekir‟den uzunsa Bekir de Ali‟den kısadır.
Sıralama ölçekleri GEÇĠġLĠLĠK ÖZELLĠĞĠ TAġIR: A > B ve B > C ise A > C yani Ali , Bekir‟den uzunsa ve Bekir de
Cengiz‟den uzunsa o halde Ali , Cengiz‟den uzundur.
Sınıflama ölçekleri sıra vermeseler de daha önceden sıraya konmuĢ ölçümler sınıflandığında SINIFLAMA
ölçeği de SIRA verebilir. Bu durum ĠSTĠSNAĠ bir durum olduğu için genel bir kural olarak algılanmasın. Ancak ÖSYM
tarafından sorulabilecek nitelikte bir UYARIDIR, Dikkatlice okuyalım....
Bir sınıfta okuyan 40 öğrenciyi Türkçe dersinde aldıkları puanlara göre 1.den , 40.ya kadar sıraladığımızı düĢünün. Ġlk
yirmi geçsin ( GEÇTĠ ) 21. ile 30. bütünlemeye kalsın ( BÜTÜNLEMELĠ) ve son 10 kiĢi de sınıfta kalsın ( KALDI) Bu durumda
sınıf öğrencileri 3 gruba ayrıldı ( Geçti – Bütünlemeli – Kaldı) Yani önce sıralama ölçeği kullanıp ardından sınıflama ölçeği
yaptık. Normalde sınıflama ölçeğinde sıralama yapamayız ancak bu durumda Ģunu rahatlıkla söyleyebiliriz Geçti sınıfındaki
öğrencilerin puanları Kaldı sınıfındaki öğrencilerin puanından yüksektir. Böyle bir durum ancak özel olarak sorulabilir. Yoksa
genel bir soruda sınıflama ölçekleri sıra vermez diyebilirsiniz. Bu bahsettiğim istisnai bir durumdur... BaĢka bir örnek vereyim
sınıfta mavi giyenler ve kırmızı giyenler olsun. ġimdi Kırmızı > Mavi ya da Mavi > Kırmızı diyemeyiz. Çünkü sınıflama
ölçeklerinde sınıflar arasında böyle bir iliĢki kurulmaz. Ancak ilk örneğimizde yani geçti – bütünlemeli – kaldı sınıflamalarında
istisna olan durum bu sınıfların belli bir sıralamaya göre oluĢturulmasıdır.
EġĠT ARALIKLI ( ĠNTERVAL) ÖLÇEĞĠ: Birim aralıkları eĢit olan ve sıfır noktası bağıl olan ölçeklerdir.
EĢit aralıklı ölçeklerde toplama ve çıkarma yapılabildiğini ancak çarpma ve bölme yapılamadığını herkes bilir.
ÖSYM Ģöyle bir soru sorsa: “ EĢit aralıklı ölçeklerde neden toplama ve çıkarma yapılabilmektedir?” Bu soruya birçok
aday yanıt veremeyecektir. Sorunun yanıtı Ģudur: “ ÇÜNKÜ BĠRĠM ARALIKLARI EġĠTTĠR” O halde eĢit oranlı
ölçeklerde toplama ve çıkarma yapılabilir sebebi BĠRĠM ARALIKLARI EġĠTTĠR. Peki neden çarpma ve bölme yapılamaz diye
sorsa onun yanıtı da SIFIR NOKTASI MUTLAK DEĞĠL BAĞIL OLDUĞU içindir.
Matematiksel anlamda düĢünürsek bu ölçekte eĢit birimler olduğu için çıkarma ve toplama iĢlemi yapabiliriz.
Fakat baĢlangıç noktası keyfi olduğu için çarpma ve bölme iĢlemi yapamayız. Örneğin standart bir baĢarı testinde Ahmet’in
25 ve AyĢe’nin 75 puan aldığını düĢünelim. Burada Ahmet AyĢe’den 50 puan daha düĢük almıĢ ve 50 puan daha baĢarısız
diyebiliriz ( 75-25=50) fakat AyĢe Ahmet’ten 3 misli daha baĢarılı diyemeyiz. Oranlayarak karĢılaĢtırmalar yapamayız. Ya da
baĢka bir örnek Hava sıcaklığı bugün 13°C‟dir ifadesinde eĢit aralıklı ölçek kullanılmıĢtır. Çünkü sıcaklıktaki “0”
tanımlanmıĢtır; ayrıca 26°C’lik bir sıcaklık sadece 13°C’lik bir sıcaklıktan 13 fazladır. Ama asla 2 katı değildir.
Bir beden eğitimi öğretmeni 200 metre koĢmanın 10 puan olduğunu belirmiĢtir ( Ölçme kuralı belirledi) Bu noktada
Ahmet 50 puan almıĢtır dediğimizde Ahmet’in en az 1000 metre koĢtuğunu anlarız. Ancak Ahmet 1199 metre koĢsa da 50
alacaktır; çünkü her 200 metre 10 puandır. EĢit aralıklı ölçeğe göre Ahmet 50 puan aldı. Aynı koĢu sınavından Mehmet ise 100
alsın. Bu durumda Mehmet en az 2000 metre koĢmuĢtur ancak 2199 metre koĢsaydı da 100 alacaktı. Bu durumda Mehmet’in
Ahmet’ten iki kat daha fazla koĢtuğunu söyleyemeyiz. Çünkü en baĢta kiĢilerin ne kadar koĢtuğu konusunda eĢit aralıklı
ölçeğimiz bilgi vermemekte. Ayrıca Sınavdan sıfır alan birinin hiç koĢmadığını söyleyemeyiz. 150 metre koĢan Veli bu sınavdan 0
alır ancak 150 metre koĢmuĢtur. Bu durumda Sıfır Bağıldır- Ġzafidir – TanımlanmıĢtır. Burada Ģunu söyleyebiliriz: Mehmet ,
Ahmet’ten 50 puan daha fazla almıĢtır.
Aralıklı ölçütlerin sonuçları ile istatiksel iĢlemler yapılabilir ( Aritmetik ortalama, standart sapma, korelasyon
analizi, mod, medyan, ranj vs )
EġĠT ORANLI ( RATĠO) ÖLÇEK: Birim aralıkları eĢit sıfır noktası da mutlak olan ölçeklerdir. Her türlü matematiksel iĢlem
yapılabilir. ( Toplama – çıkarma – çarpma – bölme) En geliĢmiĢ ölçek türüdür.

EĢit oranlı ölçekle yapılan ölçmelerde rahatlıkla oranlama yapılabilir örneğin Ali‟nin boyu 180 santim Veli‟nin boyu da 90
santim olsun. Bu durumda Ali , Veli‟nin iki katı uzunluktadır denebilir.
TABLODA ÖZET
Ölçek Tipi
ÖLÇEĞĠN YAPISAL ÖZELLĠKLERĠ
BAġLANGIÇ NOKTASI
BĠRĠM ARALIĞI
Var ve eĢit
Var ve eĢit
Var ama değiĢir
Örnekler
Elde edilecek ölçülerin anlamlılık derecesi
Nitelik
Gösterme
Gücü
Var
Var
Var
Var
Nicelik Gösterme Gücü
Sıra
Fark
Oran
Oranlı
EĢit Aralıklı
Sıralama
Sınıflama
Ölçek Tipi
Var ve mutlak
Var ama keyfi
Var ama sabit değil
BaĢlıca Ġstatistik ĠĢlemleri
Sınıflama
Frekans , Mod , Yüzde
Tüm gruplama ve sınıflamalar
Nitel ( Miktar ve sıra yok )
Sıralama
Frekans,Mod, Medyan, Yüzde
Sıralamalar
Nitel ( Miktar yok – Sıra var )
Aralıklı
Art ort, medyan,mod, ranj,
yüzde, standart sapma, Yüzde ,
Vasyans
Tutum , zeka, yetenek, takvim,
sıcaklık vs.
Nicel ( miktar verilir)
Oranlı
Art ort, medyan,mod,ranj, yüzde,
standart sapma, Yüzde , Vasyans
Boy uzunluğu, ağırlık, zaman,
yaĢ ( gerçek sıfırı var )
Nicel ( Miktar verilir)
Var
Var
Var
Var
Var
Ölçme Türü
Var
-
ÖLÇME TÜRLERĠ
DOĞRUDAN ÖLÇME: Ölçülecek özellikle , ölçme aracının
birebir karĢılaĢtırılmasına dayanan, araya baĢka değiĢken
girmeden yapılan ölçme iĢlemidir.
 Ölçme aracı ile ölçülen özellik aynı özelliklere sahip
olmalıdır.
 Doğrudan ölçmede kullandığımız araç ile ölçüm
niteliğimiz aynı özelliktedir. ( Uzunluk baĢka bir
uzunlukla , ağırlık baĢka bir ağırlıkla sayı sayılarak gibi)
ġu an bulunduğunuz ortamda yer alan kiĢi sayısı kadar kalem,
boncuk, kağıt vs masanın üstüne koyun masanın üstüne
koyduğunuz materyallerle kiĢi sayısı aynı ve benzer özellikteler
bu durumda doğrudan ölçme yaptık. Yani kiĢi sayısını boncuk
sayısı ile baĢka bir deyiĢle sayıyı sayarak ölçtük
Kefeli terazide ölçülen ağırlık doğrudan ölçmedir ancak yaylı
ya da dijital terazilerde ölçülen ağırlık dolaylı ölçmeye
örnektir.
Çünkü kefeli terazide terazinin karĢısına koyduğumuz ağırlık
ölçmek istediğimiz nesne ile aynı özellikleri taĢımaktadır. Yaylı
terazide ise ağırlığı esneme – uzunluk ile ölçmekteyiz.
BiliĢsel ve duyuĢsal davranıĢlar doğrudan
ölçülemez ancak psiko-motor “!!!davranıĢlar!!!” doğrudan
ölçülebilir. ġĠMDĠ ÇOK AMA ÇOK DĠKKAT EDĠN.
YETENEK, ĠLGĠ, TUTUM, BAġARI, ZEKA vb soyut özellikler
DOĞRUDAN ÖLÇÜLEMEZ.
Bir kiĢiye yetenek testi uygulayıp yeteneklerinin belirlenmesi
DOLAYLI ÖLÇMEDĠR. Ancak bir kiĢiye resim çizdirip resim
çizmedeki psiko-motor davranıĢlarını belirlemek doğrudandır.
Çünkü resim çizerken gösterdiği psiko-motor davranıĢlar yine
resim çizdirilerek belirlendi. ( Psiko-motor davranıĢ dediğime
dikkat edin yetenek demiyorum)
Bir kiĢinin spora yönelik tutumunu bir tutum ölçeği ile
belirlersek DOLAYLI ÖLÇME ancak bir kiĢinin koĢu hızını –
performasını ölçerken onu koĢturursak DOĞRUDAN ÖLÇME
olur. Çünkü koĢu hızı – performansı – psiko-motor davranıĢları
yine koĢturularak bulundu. ( Psiko-motor davranıĢ ifadesine
dikkat doğrudan ölçülebilen psiko-motor davranıĢtır)
Doğrudan ölçemeye örnekler:
 Üzerimdeki gömlek siyahtır.
 Otoparkta 43 araba vardı. ( Sayıyı sayarak ölçtü)
 Çocuğun okul harçlığı 5 tl‟dir.
 Masanın uzunluğunun cetvelle ölçülmesi
 Odanın uzunluğunun metre ile adım ile karıĢ ile ( yani
herhangi bir uzunlukla) ölçülmesi
 Bir yerde bulunan öğrenci, araç, defter vs. Ģeylerin
sayısının ölçülmesi
 Bir insanın yaĢının ölçülmesi
Bir nesnenin hacmi ölçülürken nesne suya batırılıp
taĢan suyun hacmi üzerinden nesnenin hacmi bulunuyorsa
doğrudan hacim cismin özkütlesi ve kütlesi çarpılarak
bulunuyorsa ( yani formülle ) o zaman doğrudan değil
TÜRETĠLMĠġ.
Formülle
TüretilmiĢtir.
bulunan özellikler
doğrudan
değildir.

Bir asker, hedef ile arasındaki mesafayi ( uzunluk) bulmak
istiyor. Eline aldığı metre ile ( uzunluk ölçen araç) ile
mesafeyi ölçerse DOĞRUDAN ölçmedir. Ancak
merminin namludan çıktığı an ile hedefe vardığı anı
kaydedip ( süreyi) bunu merminin saniyedeki hızı ile
çarparsa ( Km/sn ) çıkan sonuç da uzunluğu verir. Ancak
bu ölçme doğrudan değil TÜRETĠLMĠġTĠR.

Bir kiĢinin dans ederken gösterilmesi gereken davranıĢlara
sahip olma derecesi nasıl ölçülür Bir kiĢinin dans
ederken göstermesi gereken psiko-motor davranıĢlar
yine dans ettirilerek ölçülür. Bu yüzden doğrudan
ölçmedir.
ġimdi size bir soru soracağım ancak bu soruya ve
açıklamamıza çok dikkat etmelisiniz. Ahmet kare biçiminde
bir tarlanın çevresini ( uzunluğunu ölçecektir) . Biliyorsunuz ki
karenin tüm kenarları eĢittir. Bu yüzden de Ahmet, tarlanın
sadece bir kenarını metre ile ( uzunluk ölçerle) ölçüyor.
Buraya kadar olan ölçme iĢlemi doğrudandır. Evet zaten
mesele bundan sonra baĢlıyor. Bir kenarını ölçen Ahmet
bunu 4 ile çarpıyor ve tüm karenin çevresini buluyor. Peki
Ģimdi Ahmet türetilmiĢ ölçme mi yaptı yoksa doğrudan
ölçme mi?
Tabii ki birçok arkadaĢ dikkatsizlik nedeni ile türetilmiĢ ölçme
diyebilir. Ancak bu türetilmiĢ ölçme değildir.Çünkü çarpım
sonucunda kullanılan birim değiĢmedi. Diyelim ki bir kenarı
100 metre olsun bu durumda çevresi 400 metredir. Ancak
karenin ALANI hesaplansaydı. Metre olan birim Metre kareye
dönüĢeceğinden ( yani birim değiĢeceğinden) TüretilmiĢ
olurdu. BaĢka bir örnekle açıklayalım bir kutuda 10 kalem
olsun. ( Doğrudan ölçme) 10 kutu varsa 100 kalem vardır da
doğrudan ölçmedir. O halde çarpımda birim değiĢiyorsa
ancak o zaman TÜRETĠLMĠġ diyebiliriz. AYRINTILAR
ĠÇĠN bkz TÜRETĠLMĠġ ÖLÇME

Bir insanın kütlesini yine baĢka bir kütle ile ( kg
cinsinden) ölçersek bu doğrudan ölçmedir. Bu da ancak
kiĢinin kütlesinin karĢısına bir kütle koymakla olur kefeli
terazilerde olduğu gibi. Ancak bir kiĢinin kütlesini
oturduğu koltukta oluĢan çöküntü ile de ölçebiliriz
( tahmini – yaklaĢık) bu durumda bu ölçme dolaylı
olacaktır.
Doğrudan ölçmeler dolaylı ölçmelere göre daha
geçerli ve güvenilir sonuçlar verir.
DOLAYLI ( GÖSTERGE ile ) ÖLÇME: Ölçülmek istenen
niteliğin kendisinin değil baĢka bir durum üzerinde yarattığı
sonuçların ölçülmesidir.
 Ölçülecek nitelik ; ders baĢarısı, öğrenme düzeyi ,
yetenek vs gibi soyut bir durumsa ölçen kiĢi dolaylı
ölçme yapacaktır
Yaylı terazi neden
değerlendirilmeli?
dolaylı
ölçme
iĢlemi
olarak
Çünkü bu ölçme iĢleminde bir ağırlığın doğrudan baĢka
bir ağırlıkla ölçülmesi değil o ağırlığın bir yay üzerindeki
sonuçları ( yayın gerilmesi - uzunluğu) ölçülmüĢtür.
Bir öğrencinin eğitim bilimlerinin temel kavramları ile ilgili
bilgi ve becerilerini ölçmek isteyelim
Bu durumda bir yazılı kağıdı ya da özel olarak
düzenlenmiĢ sözlü sorular yönelteceğiz. Öğrenme
doğrudan vardanamayan (yordanamayan) ancak davranıĢ
ya da performans ile açığa çıkan bir durum olduğundan
biz ölçme aracımızda bilgiyi doğrudan değil onun
sonuçlarını dolaylı olarak ölçüyoruz.


Sıcaklığın termometre ile ölçülmesi dolaylı ölçmedir.
Çünkü sıcaklığı yine onun kadar sıcak olan bir birimle
değil civanın sıcaklık karĢısında yükselip alçalma sonucu
ile ölçmekteyiz.
Piaget çocukların biliĢsel geliĢimlerini belirlemek için
klinik yöntemi kullanarak onlara bazı güdümlü sorular
sormuĢ ve biliĢsel geliĢim düzeylerini belirlemeye
çalıĢmıĢtır.
Burada biliĢ gibi soyut ve doğrudan gözlenemeyen bir
durum, soru sorularak açığa çıkarılmıĢtır. Bu yüzden ölçe
iĢlemi dolaylıdır.

Eğitimde öğrencilerin biliĢsel ve duyuĢsal kazanımlara
ulaĢmaları nasıl ölçülür?
Öğrencilerin biliĢsel ve duyuĢsal kazanımlara ulaĢmaları,
soru sorularak, testler yapılar vb. ölçülür. Çünkü bu gibi
özellikler soyuttur ve doğrudan gözlenemez. Ancak testler
kullanılarak ölçülür ve yordanır; bu yüzden dolaylıdır.

Bir Türkçe öğretmeni öğrencisinden metinde geçen bazı
kelimelerin anlamını yazmasını istemiĢtir.
Öğretmen öğrencilerinin biliĢsel bir becerisini soru sorarak
ölçmüĢtür. Eğitimde uygulanan testler dolaylı ölçmeye
örnektir.
DeğiĢik Örnekler:



Öğrencilerin Türkçe dersine olan tutum ve ilgilerini
ölçme
KiĢilik testleri ile bir öğrencinin tanınması
Bir öğrencinin zeka puanının belirlenmesi
Piskolojik yapılar (Zeka- yetenek, baĢarı, ilgi , tutum,
kiĢilik vb. ) dolaylı ölçme örneklerini oluĢturur.
TÜRETĠLMĠġ ÖLÇME: Farklı ölçme sonuçlarının oranı ya
da çarpımı sonucunda yeni elde edilen ölçme sonucuna
türetilmiĢ ölçme denir.
TüretilmiĢ ölçme yapabilmek için en az iki ölçme
iĢlemini yapıp sonuçlarını bulmam ve daha sonra bu ölçüm
değerlerini formülde uygulamak gerekir. Ancak dikkat
edilecek nokta türetilmiĢ ölçmenin birimi diğer ölçümlerde
kullanılan birimlerden farklı olmalıdır. NE DEMEK
ĠSTĠYOROZ: ġimdi diyelim ki iki kent arası uzaklığı bulacağız.
( Birim olarak km ) Eğer iki kent arasını bir uzunluk ölçer ile
ölçersek bu doğrudan ölçme olur. Ancak türeterek de iki kent
arası uzaklığı buluruz. Bunun için en az iki ölçme yapmamız
lazım
1. Önce iki kent arasında yolculuk yapan bir aracın
saatteki hızı bulunur ( Birim km/s )
2. Sonra bu aracın bu iki kent arasını ne kadar sürede
aldığını buluruz ( Saat ya da dakika)
3. Bu iki ölçümü birbiri ile çarptığımızda ise karĢımıza
iki kent arası uzaklık çıkar ( Km cinsinden)
Gördüğünüz gibi birinci ölçmemizin birimi ( km/s) ikinci
ölçmemizin birimi ( saat ya da dakika) türettiğimiz ölçmenin
birimi ise ( km)
Yukarıdaki açıklamaları da dikkate alıp daha yalın bir
söylem kullanırsak türetilmiĢ ölçme formül ile bulduğumuz
ölçüm sonuçlarıdır diyebiliriz.
Örnekler:
Yoğunluk ( özkütle ) Bir cismin yoğunluğunu bulmak için
önce o cismin kütlesini ardından da hacmini bulup kütleyi
hacme bölerseniz öz kütlesini bulursunuz. Yani özkütleyi
bulmak için doğrudan değil iki ölçme yapıp bunların oranını
almak zorunda kaldık.
Zeka Bölümü Bir kiĢinin baĢarı testinden aldığı sonucu o
kiĢinin takvim yaĢına bölüp 100 ile çarparsanız kiĢinin zeka
bölümünü bulursunuz. Yani zeka bölümünü doğrudan değil en
az iki ölçümün oranı ve bir çarpımla kısacası formülle bulduk.
Nüfus Yoğunluğu: Bir ülkenin ya da Ģehrin nüfus
yoğunluğunu bulmak için önce o ülkede yaĢayan insanların
kiĢi sayısını sonra ülkenin yüzölçümünü bulup bunların oranını
alırsak karĢımıza nüfus yoğunluğu çıkar.
Bir okulda vize notu %40 , final notu %60 olarak dönem sonu
notunu etkilemektedir. Bu durumda türetilmiĢ ölçme kullanmak
zorundayız.
DEĞERLENDĠRME
Ölçme Sonucu
Ali, sınavdan 54 aldı
Kriter ( Ölçüt)
Sınıf geçmek için en az 60 almak gerekir
AyĢe‟nin boy uzunluğu 175 santimdir.
Polis Akademisine alınmak için boy
uzunluğu en az 170 santim olmalıdır (?)
2013 KPSS‟de Ġngilizce Öğretmeni
olarak ilk 1876‟ya giren atanacaktır.
Bu
iĢyerinde
müdürlük
sınavına
girebilmek için en az 13 yıl çalıĢman
gerekir.
Ölçme sonucumuz kendisi ile aynı
birimden
olan
bir
kriter
ile
karĢılaĢtırılır.
Metin KPSS‟de Ġngilizce öğretmenliği
bölümünde 1876. oldu.
Bu iĢ yerinde 10 senedir çalıĢıyorsun
Değerlendirme
yapabilmemiz
için
elimizde öncelikle bir ölçüm ( ölçme
sonucu ) olmalı
Değerlendirme
Ali geçmek için 60 alınması gereken bir
sınavdan 54 aldığı için sınıfta kaldı.
AyĢe Polis Akademisi‟ne alınabilir.
Metin öğretmen olarak atanabilir.
Bu iĢ yerinde
giremezsin.
müdürlük
sınavına
Bu karĢılaĢtırma sonucunda varılan
yargıya ya da karara değerlendirme
denir.
Değerlendirme ölçmeyi de içine alan daha genel bir süreçtir. Değerlendirmelerin objektif ve sağlıklı olabilmesi için
ölçüm ile kriterin aynı cinsten olması gerekir. Örneğin ölçüm birimi metre ise kriter de metre olmalı ya da en azından
metreye çevrilebilecek bir birim olmalı ( mesela santimetre gibi) Aksi durumda ölçüm hakkında karar verilemez.
Yapılandırma Kutusu: Değerlendirme konusunu örneklerle yapılandıralım.

Ahmet’in sözvarlığı ( kelime dağarcığı) 5000’dir; 10 yaĢındaki bir çocukta bulunması gereken söz varlığının çok
altında olduğu için özel destek alması ve bol kitap okuması gerekmektedir.
Bu cümleyi ölçme ve değerlendirme açısından analiz ettiğimizde:
Ölçüm cümlemiz: Ahmet’in söz varlığı 5000 kelimedir.
Kriterimiz: Cümlede kriter açıkça söylenmemiĢ ama tahminen Ģöyle diyelim “10 yaĢındaki bir çocukta bulunması gereken
kelime sayısı 8.000’dir. Bu durumda Ahmet kriterimizin altındadır.
Değerlendirmemiz ve kararımız: Ahmet’in sahip olduğu söz dağarcığı yaĢının kriterlerinin çok altındadır. Destek almalıdır.
„i

9 yaĢındaki Ali’nin boy uzunluğu 110 santimdir; 9 yaĢındaki Ahmet’in boy uzunluğu ise 155 santimdir.Eğer 9
yaĢındaki çocukların sahip olmaları gereken boy uzunluğunun alt sınırını ve üst sınırını bilmiyorsanız bu ölçme
cümlelerimiz size hiç de garip gelmez ya da bir yargıya ulaĢamazsınız. ġimdi kriteri verelim: 9 yaĢındaki bir erkek
çocuğunun boy uzunluğu en az 123 santim en fazla ise 144 santim olmalıdır. ġimdi Ali ve Ahmet için değerlendirme
yapabilirsiniz. Çünkü artık kriteriniz var. O halde değerlendirmeyi yapalım. Ali yaĢıtlarına göre çok kısa ( cüce)
Ahmet ise yaĢıtlarına göre çok uzundur ( dev) her ikisinin de doktora gösterilmesi gerekmektedir.

Bazen kriterler grubun performasına göre belli olur. Bu tip kriterlere birazdan bağıl kriter ( norm dayanaklı ) diyeceğiz.
Bir örnek verelim. Ahmet’in baĢarı testi sonucu ham puanı 70’tir. Sınavdan baĢarılı olması için aritmetik ortalama ve
onun üzerinde alması gerekmektedir. ġimdi bu durumda Ahmet’in baĢarılı olması artık sınıfım aritmetik
ortalamasının kaç olduğuna bağlıdır. ( Sınıf genel itibari ile yüksek alırsa Ahmet baĢarısız olabilir ya da tam tersi
bakalım ne olacak ... az sonra ) Sınıfın aritmetik ortalaması 50’dir. Bu durumda Ahmet sınıfın ortalamasının çok
üstünde puan aldığı için baĢarılıdır.
ÖLÇÜT ( KRĠTER)
Ölçme iĢlemi ile elde edilen ölçüm hakkında karar verebilmek, değerlendirme yapabilmek için hemcinsinden ( benzer tür – aynı
tür ) bir kriterle karĢılaĢtırma yapmak ve ona göre karar vermek gerekir.

Değerlendirme sırasında, ölçüm değerini anlamlı kılan – ölçüm değeri ile karĢılaĢtırılan kritere ölçüt denir. Ölçüt
olmadan ölçme sonuçları anlamsızdır. Örneğin: “YetiĢkin bir tapirin ağırlığı 400 kilogramdır.” Size Ģu soruyu
soruyorum. Sizce bu tapir ağır mı hafif mi? Bir karara varamıyorsunuz çünkü yetiĢkin bir tapirin olması gereken
ortalama kiloyu bilmiyorsunuz. Bilseydiniz ağır ya da hafif derdiniz. ġimdi ölçütü verelim: “YetiĢkin bir tapir ortalama
1000 kilogram civarındadır. ” Bu ölçütü bilince ölçme sonucumuz da anlam kazandı ve tapirin olması gerekenden hafif
olduğu yargısına ulaĢıyoruz.
MUTLAK ÖLÇÜT: ( Kriter – Ölçüt Bağıntılı) : Mutlak
kriterin temel özelliği ölçme iĢlemi yapılmadan önce puan,
süre, kg vb birimlerle belirlenmiĢ olmasıdır. Ölçme yapılacak
gruptan bağımsız belirlenmiĢtir.
ÇağdaĢ değerlendirme anlayıĢlarında mutlak kriter
daha çok kullanılır. Bağıl kriter belli özel durumlar dıĢında
kullanılmaz.
Mutlak Kriteri Belirleyen Durumlar:
Kazanımlar ( hedef – davranıĢlar) : Tam öğrenme, programlı
öğrenme gibi öğretim yaklaĢımlarında her ünite ya da konu
sonunda yapılan sınavların kriterleri belirlenirken hedef
davranıĢlar dikkate alınır. Bu yüzden bu öğrenme modellerinde
mutlaka mutlak kriter kullanılır. Örneğin: Türkçe dersinin
hedef davranıĢlarının %70‟ini ya da 50 tanesini kazanan
öğrenci dersi geçer. Dikkat ettiyseniz bu kriter tüm grup için
geçerli ve gruptan bağımsız bir referans noktası var
( Kazanımlar)
Soru sayısı: Kriter sınavda sorular soru sayısı üzerinden de
belirlenebilir. Örneğin: Matematik testindeki 20 sorudan
15‟ini yapanlar dersi geçer.
Konu sınırı: Kriter bir konu ya da ders sınırı üzerinden de
belirlenebilir. Örneğin: Türkçe dersini geçenler sınıfı da geçer;
ya da Türkçe dersindeki isim, sıfat, zamir, zarf, edat , bağlaç,
ünlem konuları öğrenenler baĢarılı sayılır gibi
Öğretmen kanısı: Öğretmenin kanısı da mutlak kriterdir.
Çünkü grubun dıĢında bir değerdir. Ancak öğretmen kanısı
duruma göre değiĢebilir yani sabit değildir.
Öğrenme eksiklikleri: Öğrenme eksikliği belirlemek amacıyla
yapılan formatif sınavlarda kullanılacak kriterler mutlaka ama
mutlaka Mutlak Kriter olmalı. Zaten genelde formatif
sınavlarda kazanıma ya da puana göre kriter belirlenir.
ÖRNEKLER:
Mutlak Kriter Örnekleri:
 Hedeflerin %70‟ini kazanan öğrenci tam öğrenmeye
göre baĢarılıdır.
 ĠĢbirlikli çalıĢmalarda öğretmenin bir grup baĢarı
kriteri belirlemesi ( bu kriteri aĢanları baĢarılı
sayması)
 Soruların 5‟ini doğru yanıtlayan öğrenci sınavdan
geçer not alır.
 Partiye katılabilmek için smokin giymek zorunludur.
 Türkçe dersinden 70 alanlar geçer.
Mutlak Değerlendirme Örnekleri: Mutlak kritere göre
yapılan değerlendirmeler mutlak değerlendirmedir. Anlatacak
bir Ģey yok






Ahmet’in boy uzunluğu 1.70’ten fazla olduğu için polis
akademisine alınmıştır.
YSÖP kapsamında bir sınıf açılması için en az 10 öğrenci
gerektiği için sınıf açılmamıştır.
Bu resim kursuna yazılabilmek için ayda 100 tl ücret
ödemek gerektiği için kaydolabilirsin.
Türkçe dersini başaramayan öğrencilerin sınıfta
bırakılması
Ehliyet sınavından en az 70 puan almış olmak gerektiği
için başarılı oldun.
İçeriğin %70’ini sınav kağıdına aktaran öğrencilerin dersi
geçebildiği bir sınavda içeriğin %71’ini yansıttığın için dersi
geçtin
Mutlak kriter ve değerlendirmenin kullanılabileceği durumlar:
 Ölçme kapsamındaki davranışların belli bir oranının
kazanılmış olmasının gerekli olduğu durumlarda.
Başka bir deyişle öğrencilerin YETERLİKLERİ
belirlenecekse kriter mutlak olmalı
 Mutlak değerlendirme yapılabilmesi için testin yüksek
düzeyde kapsam geçerliğine sahip olması gerekir.
 Öğrencilerin aşması gereken bir eşik değeri var ise
yani öğrencilerin belli bir standartın üstünde olması
isteniyorsa mutlak kriter tercih edilir.
Aksi durumların sakıncalarını tartışacağız...
BAĞIL ÖLÇÜT ( NORM BAĞINTILI – DAYANAKLI):
Ölçme iĢleminin sonuçlarına göre çıkartılan ve gruptan gruba
değiĢen ( yani gruba göre belirlenen) kriterdir.
Bağıl Kriterleri Belirleyen Durumlar:
Norm ( Standart) Puanlar: Z ve T puanlarına göre belirlenen
kriterler bağıldır. Sınavdan 70 alanlar geçer mutlak kriter iken ;
T puanı 70 olanlar geçer bağıl kriterdir. Çünkü Z ve T
puanları aritmetik ortalama ve standart sapmaya göre bulunur.
Çaneğrisi kullanımları da bağıldır.
Grup içindeki bireyleri karĢılaĢtırmak sıralamak:
Öğrencileri sırayalarak ya da karĢılaĢtırarak yapılan
değerlendirmeler de bağıldır. “En” ya da “ilk” kelimeleri
anahtardır. Örneğin Sınıfın en uzun boylu öğrencisi basket
takımına seçilir. Buradaki “en uzun boylu” olmak gruba göre
değiĢir. Herkesin 190 santim olduğu bir sınıfta en uzun 195
santimlik iken, herkesin 160 olduğu bir sınıfta en uzun 165
santimlik kiĢi olur. Basketbol takımına eleman seçerken böyle
bir kriter kullanılması da sakıncalı olabilir.
Bu yüzden bağıl kriter kullanmak çoğu kez sakıncalı
olmaktadır.
Grubun standart sapması, ortalaması, medyanı ( ortanca),
modu ( tepe değeri), çeyrek sapması, yüzdelikler vb :
Merkezi eğilim ve dağılım ölçüleri bağıl kriterdir. Örneğin
ortalamanın +1 standart sapma üstünde olanlar baĢarılıdır. Bu
örnekte kimin baĢarılı olacağı yine grubun aritmetik
ortalamasına bağlı olduğu için kriter bağıldır.
Ülke düzeyindeki normlar: Mantık olarak sınıfın
ortalamasına göre not vermeye benzer. Ülke düzeyinde
uygulanan testlerin sonuçlarına ( ortalamsına ) göre öğrenciye
not verme diyebiliriz. Bu düĢünceden kaynaklı standart baĢarı
testleri doğmuĢtur.
Öğrenci yeteneği: Bir sınıfta üstün yetenekli / zekalı ve daha
düĢük yetenekli / zekalı öğrenciler olabilir. Bu öğrencilere not
verirken çoğu öğretmen bunu gözetmez. Söyleyeceğim bazı
öğretmenlere ters gelebilir ( yılların not verme alıĢkanlığından
kaynaklı) ġöyle diyebilirim düĢük yetenekli bir öğrenci 10
soruluk testten 7‟sini yapsın; üstün yetenekli bir öğrenci ise 10
soruluk testten 9‟unu yapsın. Bu noktada bağıl değerlendirme
yaparsak ( yani öğrencilerin yeteneğine göre not verirsek) iki
öğrencinin de aynı puanı alması ya da 7 soru yapan öğrencinin
daha yüksek alması beklenebilir. Sonuçta o kendi yeteneğine
göre iyi bir performans gerçekleĢtirdir. Tabii bu görüĢ genelde
öğretmenler tarafından benimsenmez ve adaletsizlik olarak
görülür.
Sağa ve sola çarpık dağılım gösteren gruplarda
bağıl kriter kullanılması önerilmez. Bağıl kriter normal
dağılım gösteren gruplarda kullanılması daha geçerli
sonuçlar verir. UNUTMAYIN
ÖRNEKLER:
Bağıl Kriter Örnekleri:
 Sınıf aritmetik ortalamasının üzerinde puan alanlar
dersi geçer
 Sınıftaki en uzun boylu öğrenci kapı görevlisi yapılır.
 En çok oy alan öğrenci sınıf temsilcisi seçilir.
 KPSS’ye giren beden eğitimi programı mezunu
öğrencilerden en yüksek not alan ilk 500 kişi
atanacaktır.
 Birinci ligde yer alan en başarısız 3 takım ikinci lige
düşer.
 Medyanın üstünde puan alanlar Ahmet Hoca’dan
çokonat kazanırlar
 FEM Akademi’de deneme sınavında ilk üçe girenlere
kitap hediye edilecektir.
Bağıl Değerlendirme Örnekleri:
 Okulun en uzun boylu 12 öğrencisi okul basketbol
takımına seçilmiştir.
 Yetenek sınavında en yetenekli 5 öğrencinin seçilmesi
 Not ortalaması sınıf ortalamasının altında olanlar dersi
geçememiştir.
 Aritmetik ortalamanın +2 ve +3 standart sapmasında yer
alan öğrencilere 100 puan sözlü notu verilmiştir.
Bağıl kriter ve değerlendirmenin uygun olduğu
durumlar.
 Hız testlerinde bağıl kriter önerilir. Sınavın yanıtlama
süresinin öğrencilerin tümünün soruların tümünü
yanıtlayacakları kadar uzun olmadığı sınama
durumlarınde kriter bağıl olmalıdır.
 Güç testlerinde bağıl kriter önerilir. Soruların güçlük
düzeyinin yüksek ( yani zor) olması durumunda bağıl
kriter kullanılır.
 Seçme ve yerleĢtirme sınavlarında öğrencilerin
belli bir kontenjan dahilinde seçilmesi durumunda
bağıl kriter kullanılır. Yani katılımın çok alımın az
olduğu seçme sınavlarında bağıl kriter kullanıllır.
 GeniĢ ölçekli – ulusal sınavlarda da katılım çok alım
az olduğu için kriter bağıldır. Örneğin beden eğitimi
öğretmenlerinden ilk 4000‟e giren atanır gibi.
AMACINA GÖRE DEĞERLENDĠRME
DĠAGNOSTĠK ( TANIMA – YERLEġTĠRME) : Girdilerin ya da önkoĢul kazazanımların ölçüldüğü sınavlardır. Genelde eğitim öğretim
sürecinin baĢında ya da yeni bir üniteye geçmeden önce önkoĢul kazanımlara sahip olunup olunmadığını belirlemek için yapılır. Çünkü her
önkoĢul bilgi bir sonraki için temeldir. Bu durumda önkoĢul kazanımların değerlendirilip eğitim – öğretime bu Ģekilde baĢlanması ya da yeni
üniteye geçilmesi uygun olacaktır.
AMAÇ: Öğrencilerin derse , üniteye ya da konuya dair önkoĢul bilgilerini ( hazırbulunuĢluklarını) belirlemek varsa eksiklikleri düzeltmektir.
Bu yüzden amaç not verme değil; tanıma ve yerleĢtirmedir.
Örnekler:
 Bir öğretmenin sene baĢında öğrencilerine dersine dönük ilgi ve tutum ölçekleri uygulatıp , öğrencilerin duyuĢsal
hazırbulunuĢluğunu ve bir baĢarı testi uygulayıp biliĢsel hazırbulunuĢluğunu belirlemesi
 Bir üniveristeye giren örğencilere Ġngilizce muhafiyet sınavı uygulanması. Bu sınav sonucu öğrencileri tanıyıp kimlerin hazırlık
okuyacağı kimlerin birinci sınıfa geçeceği belirlenir.
Ölçme Araçları:
HazırbulunuĢluk testi ( Önbilgi , ilgi , tutum, kiĢilik vb) ( Mutlak Kriter)
Seçme testi ( Bağıl da olabilir katılım çok alım az ise )
Tanıma – yerleĢtirme testleri
Muafiyet testleri ( Mutlak Kriter)
HazırbulunuĢluk ve muafiyet testlerinde mutlaka mutlak kriter kullanılmalıdır. Buna karĢılık seçme sınavlarında – katılım çok
alım az ise – bağıl kriter kullanılmalıdır.
Diagnostik testler, öğrencinin önbilgi – hazıroluĢ düzeyini belirlemek içindir. Ayrıca öğrencilerin öğrenme ihityaçlarını da
belirler. Örneğin bir Ġngilizce kursu, kursa baĢlamadan önce uyguladığı bir diagnostik test sayesinde kursiyerinin nasıl bir eğitime ihtiyacı
olduğunu da anlar. Öğrencilerin zayıf ve güçlü yanlarını belirleyerek onların uygun eğitim programlarına yerleĢtirilmesini sağlar.
FORMATĠF ( Biçimlendirme – YetiĢtirme; Ġzleme – GeliĢtirme): Sürecin ya da öğrenme eksikliklerinin değerlendirilmesi de denebilir.
Genelde eğitim öğretim süreci içinde her konu ya da üniteden sonra yapılır. Amaç yine not vermek değil, öğrenme eksikliklerinin ve
aksaklıklarının tespit edilip giderilmesidir. Diagnostikten ayrılan yanı bir eğitim öğretim sürecinden sonra yapılan eğitim öğretim sürecinin ne
kadar amaca ulaĢtığını görmektir. Ayrıca Formatif sınavlar öğrenciye ANINDA DÖNÜT verir.
Amaç: Öğrenme ve öğretme eksikliklerinin tespit edilip giderilmesi. Öğrenciye anında dönüt vererek hatalarını görmesi vb.
Örnekler:
 Tam öğrenmede her ünite bitiminde yapılan sınavlar. Bu sınavlarda o ünitede iĢlenen konulardan soru sorulur ve hedef davranıĢların
ne kadarına ulaĢıldığı tespit edilir. Eksik öğrenmeler var ise ek öğretim yapılarak bir sonraki üniteye geçilir. Bu sınavlarda amaç
öğrenci notunu vermek değil eksik öğrenmeleri gidermektir.
Ölçme Araçları:
Üniteler için özel hazırlanmıĢ izleme testleri
Ġzleme testi
Ünite testi
Formatif testler
Formatif testlerin kapsam bakımından geçerli olabilmesi için o konu ya da ünitede iĢlenen TÜM KRĠTĠK DAVRANIġLARDAN soru
sorulması ZORUNLULUKTUR. Ayrıca daha önce de dediğim gibi FORMATĠF SINAVLARIN TAMAMI MUTLAK KRĠTERE GÖRE
DEĞERLENDĠRĠLĠR.
SÜMMATĠF ( Düzey Belirleme – Değer Biçme ; BütünleĢtirici – Özetleyici) : Çıktıların değerlendirilmesi olarak da adlandırılabilir. Amaç
bir eğitim öğretim programı sonucunda ulaĢılan hedef davranıĢların belirlenmesidir. Bu süreç sonunda öğrencilere diploma, sertifika, belge vb
verilebilir.
Amaç: Amaç öğrencilerin hedef- davranıĢlara ne kadar sahip olduğunu belirleyip not, diploma, belge vb vermektir.
Örnekler:
 Bir bilgisayar kursunun kursiyerlerine sınava hazırlayıp sene sonunda sınav yapması ve bu sınav sonucuna göre belge ya da sertifika
vermesi
 Yeterlik sınavları vb.
Kullanılan ölçme araçları :
Ders veya kurslar için özel olarak hazırlanmıĢ düzey belirleme testleri
EriĢi testi ( Bağıl Kriter Önerilir)
BaĢarı testi
Vize – final sınavları
Bitirme sınavı ( Mutlak Kriter )
Yeterlik testi ( Mutlak Kriter)
Sertifika sınavı ( Mutlak Kriter)
Sümmatif testler
Uzmanlık testleri ( Mutlak Kriter)
EK AÇIKLAMA: Muafiyet ve hazırbulunuĢluk testlerinde neden mutlaka mutlak değerlendirme yapılır. ġöyle diyelim bir
üniversite sene baĢında Ġngilizce dersi için bir muafiyet sınavı hazırlasın; bu sınavda amaç Ġngilizce bilen öğrencileri ayırmak –
tanımaktır. Varsayım yapalım, bu üniversite muafiyet sınavında bağıl ölçüt kullansın. ġimdi bu sınava 100 öğrenci girsin ve 99‟u
0 puan 1 tanesi ise 1 puan alsın. Bu durumda bir kiĢi diğerlerinden baĢarılı olduğu için sınavı geçer. Fakat o kiĢi Ġngilizce biliyor
mu ? Tabii ki hayır. Ancak bu tip sınavlarda 100 üzerinden 80 alanlar baĢarılıdır gibi mutlak bir kriter belirlenmelidir.
EK AÇIKLAMA: Neden izleme amaçlı testlerde mutlak değerlendirme yapılmalıdır. Ġzleme amaçlı testler en çok tam öğrenme
kuramında kullanılır. ġimdi bir öğretmen bir üniteyi bitirdikten sonra öğrenme eksikliklerini tespit edip gidermek için bir izleme
testi yapsın ve bağıl ölçüt kullanmıĢ olsun. Yine yukarıdaki durum gibi 10 öğrencinin girdiği sınavda 9 öğrenci 0 puan 1 öğrenci 1
puan almıĢ olsun. Ölçüt bağıl olursa bir öğrenci sadece 1 puan alsa da baĢarılı sayılır ki bu durum izleme testinin amacına uymaz.
Çünkü 100 üzerinden 1 alan bir kiĢide 99 kritik davranıĢ kazanılmamıĢ demektir. Bu yüzden bu tip sınavlarda da 80 alan bir
sonraki üniteye geçebilir gibi mutlak ölçütler kullanılmalıdır.
Çok kiĢinin baĢvurduğu bir sınavda, az kiĢi alınacaksa nasıl bir
değerlendirme kriteri belirlenmelidir?
Böyle bir sınavda ( diyelim ki sınav 100 üzerinden yapılmıĢ
olsun) mutlak bir kriter belirlemek yanlıĢ olacaktır.
Diyelim ki 80 alan herkes baĢarılı kabul edilsin – yani
mutlak bir kriter belirlensin- Bu durumda sınavda 80 alan
herkes baĢarılı kabul edilir ki sınava giren herkesin 80 alma
ihtimali bile vardır. Bu durumda sınav seçme amacına
ulaĢmaz. Bu durumda böyle bir sınav için bağıl kriter
belirlemek en doğrusu olacaktır. Yani ilk 100 kiĢi baĢarılı
sayılacaktır gibi. Bu durumda sınav amacına ulaĢır ve en iyi
100 kiĢi baĢarılı kabul edilir.
GEÇERLĠK – GÜVENĠRLĠK - KULLANIġLILIK
ÖLÇME ARAÇLARINDA BULUNMASI GEREKEN ÖZELLĠKLER
Güvenirlik
Geçerlik




Duyarlılık
Kararlılık
Tutarlılık
İç Tutarlık





-
Güvenirlik Belirleme Yolları
Test – Tekrar test
Eşdeğer ( Paralel) Formlar
Eşdeğer Yarılar
KR-20 Güvenirliği
KR- 21 Güvenirliği
Cronbach Alfa
Puanlayıcı Güvenirliği

Ölçmenin Standart Hatası
Kapsam Geçerliği
Ölçüt Geçerliği
Yapı Geçerliği
Görünüş Geçerliği
Karar Geçerliği
KullanıĢlık



Ekonomiklik
Uygulanabilirlik
Puanlanabilirlik
GÜVENĠRLĠK

Güvenirlik ölçme aracı ile birbiri ardınca yapılan ölçümlerin aynı – kararlı sonuçları vermesidir. Örneğin bir Türkçe testini
aynı öğrencilere üç kere uyguladığımızda, aynı – benzer – kararlı sonuçlar alıyorsak o testin güvenirlik açısından iyi
olduğunu söyleyebiliriz.

Güvenirlik bir testin hatalardan arınıklık derecesidir. Ölçme iĢlemindeki tesadüfi hatalar testin güvenirliğini düĢürür.
GÜVENĠRLĠK bir testin kendiliğinden sahip olduğu bir nitelik değildir. O ancak bir testin gruba uygulanmasıyla
sahip olduğu bir niteliktir. Buna karĢılık GEÇERLĠK TESTĠN KENDĠNDEN OLAN BĠR DURUMDUR. Bu yüzden Bir
sınava karıĢan hataların miktarının bilinmesi en çok güvenirlikle ilgilidir; çünkü hatalar uygulama ile açığa çıkar !!!
Bir testin güvenilir olmaması, ölçme hatalarının miktarının göstergesidir ve bir testten elde edilen puanların
yorumlanmasında ölçme hatalarının miktarının bilinmesi, o sonuçlara dayanarak doğru karar vermek açısından önemlidir.
ÖLÇME SONUÇLARINA KARIġAN HATA PAYININ BĠLĠNMESĠ en çok GÜVENĠRLĠKLE ĠLGĠLĠDĠR. ÇÜNKÜ
HATALAR UYGULAMADA ORTAYA ÇIKAR ve GÜVENĠRLĠK UYGULAMAYLA ANLAM BULAN BĠR
ÖZELLĠKTĠR

Güvenirlik indeksi gerçek puanlar varyansı ile gözlenen puanlar varyansına oranı olduğu için (-) negatif değer almaz.
Güvenirlik katsayısı 0 ile 1 arasında değer alır.
Güvenirlik Anlamları
Duyarlık
Kararlık
Tutarlık
Güvenirlik bir hata kuramıdır. Tesadüfi hata kuramıdır.
Ġçturarlık
GÜVENĠRLĠĞĠN 4 ÇOCUĞU ( GÜVENĠRLĠĞĠN 4 ANLAMI)
1.
DUYARLIK : Duyarlık ölçme aracının birimi ile ilgili bir kavramdır. Ölçme aracının birimi arttıkça karıĢan hata miktarı
azalır ve daha güvenilir sonuçlar elde edilir.
SORU: Soru sayısını arttırdıkça güvenirlik daima artar mı? ( Kesinlikle artar mı?) Soru sayısının artırılması güvenirliği
kesinlikle artırır diyemeyiz. Soru sayısının artmasının güvenirliği artırmasını kesin olarak söyleyebilmemiz için iki Ģartımız söz
konusudur:
a) Eklediğimiz sorular testin homojen yapısını bozmamalıdır. Örneğin bir 30 sorudan oluĢan bir Türkçe testine 40 tane
matematik sorusu eklersek testimizin iç tutarlığı bozulur – homojen yapı bozulur- ve güvenirlik düĢer.
b) Soru sayısının artması yeni hatalara ( bıkkınlık – yorgunluk vs) yol açmadığı var sayılmalıdır. Örneğin KPSS eğitim
bilimleri testi 120 sorudan oluĢmakta; duyarlığı ( soru sayısını) arttıralım ve 500 soru soralım bu durumda da yorgunluk,
bıkkınlık gibi yeni hata kaynakları ortaya çıkacak ve güvenirlik düĢecektir.
O HALDE SORU SAYISI ARTTIKÇA GÜVENĠRLĠK ARTAR DERĠZ AMA KESĠN ARTAR DĠYEMEYĠZ.
YUKARIDAKĠ ĠKĠ ġART SAĞLANIRSA SORU SAYISI ARTTIKÇA GÜVENĠRLĠK KESĠNLĠKLE ARTAR DERĠZ.
UNUTMAYIN
2.
KARARLILIK: Ölçme sonuçlarının zamandan zamana değiĢmemesidir. Örneğin bir sınav aynı gruba uzun bir zaman
geçtikten sonra bir daha uygulandığında benzer sonuçlar vermesidir.
Bir testi bir öğrenci grubuna 3 ay ara ile uygulayalım. ġayet bu iki uygulamanın korelasyonu yüksek çıkarsa yani
benzer sonuçlar elde edilirse güvenirlik kararlık açısından yüksektir.
3.
TUTARLIK : Bir testin , kendi eĢ değeri ile aynı sonuçları vermesidir. Yani iki benzer test arasındaki benzer sonuçlardır.
Örneğin bir öğretmen KPSS’ye yönelik Eğitim Bilimleri Deneme Sınavı HazırlamıĢ olsun. Hazırladığı bu deneme sınavının
çok benzerini ( EĢdeğerini ) de hazırlasın. Yani toplamda iki sınav hazırlasın ve bu sınavları aynı gruba uygulasın. Eğer bu
iki sınavdan da öğrenciler benzer sonuçlar alıyorsa bu test Tutarlı sonuçlar vermektedir, denir.
4.
ĠÇ TUTARLIK : Bir testin iki yarısından alınan puanlar arasında yüksek düzey bir korelasyon olmasıdır. Maddelerin
( soruların ) birbiri ile olan tutarlığı. Bir testin homojen ( benzer özellik – tek boyutlu yapı) yapı arz etmesidir.
Güvenirlik 0 ile +1 arasında değer alır. Güvenirlik katsayısının en az kaç olması gerektiği konusunda bir Ģey söylemek
doğru değildir. ġöyle diyebiliriz 0,70 ve üstü yüksek kabul edilir ancak 0,90 olması istenir. Ancak 0,90 kat sayısına
öğretmen yapımı testler çok seyrek çıkabilmektedir.
GÜVENĠRLĠĞĠN ANLAMLARI SORU ÇÖZERKEN DĠKKAT EDĠLECEKLER

Güvenirlik yöntemlerini iyi bilmemiz lazım. Hangi yöntemde nasıl bir uygulama yapılıyor bilmemiz lazım. Soruda diyelim ki
test – tekrar test uygulamasından bahsediliyorsa yanıtımız GÜVENĠRLĠK olacaktır.

Güvenirliğin anlamları iyi bilinmelidir. ( Duyarlık, kararlılık , tutarlılık, iç tutarlılık )
GÜVENĠRLĠK NELERDEN ETKĠLENĠR – NASIL ARTIRIRIZ
1.
Testin Uzunluğu: ( Soru sayısı)(DUYARLILIK) Testte kapsanan madde sayısı testin güvenirliği ile doğrudan ilgilidir.
Eğer güvenirliği etkileyen diğer tüm etmenler kontrol edilmiĢse ve teste sonradan konan sorular öncekiler gibi aynı
davranıĢı ölçüyorsa ( içtutarlılık) soru sayısı arttıkça güvenirlik artar.
Testimizin güvenirliğini artırmak için soru sayısını artırmamız gerekir. Ancak teste eklediğimiz sorular içtutarlılığı
bozmamalı yani aynı davranıĢı ölçmelidir. Yani sorular HOMOJEN olmalıdır.
Spearman- Brown Formülü: Bu formül geçerliği a‟dan b‟ye yükseltmek için testteki soruların kaç katına çıkarılacağını
verir.
𝑛𝑟𝑠
ÇOK ÖNEMLĠ UYARI: Kaynaklarda
𝑟𝑛 =
soru sayısının armasının güvenirliği
𝑛 − 1 𝑟𝑠 + 1
artırdığı söylenir. Bu ifade genel itibarı
ile yanlıĢ olmasa da eksiktir. Ġki Ģart
yerine gelirse soru sayısı artarsa
güvenirlik kesinlikle artar deriz. 1.
Eklenen
sorular
homojen
yapıyı
bozmayacak 2. Soru sayısının artması
sıkılma, bıkma gibi baĢka hatalara yol
açmayacaktır.
𝒓𝒔 : Uzatılacak olan kısa testin güvenirlik katsayısı
𝒓𝒏 : Kısa testin n katı uzatılan testin güvenirlik katsayısı
n : Kısa testin soruları kaç kat uzatılacaksa o sayı
Bir Örnek: Güvenirliği 0,50‟den 0,90‟a çıkarılmak istenen bir test ilk uzunluğunun kaç katı uzunluğa çıkarmak gerekir?
( Teste eklenecek soruların öncekilerle aynı davranıĢları ölçtüğü, yeni soruların ortalama güçlüklerinin öncekilere
denk olduğu, test uzatıldığında cevaplayıcıların ona cevap verme biçiminin değiĢmediği var sayılmıĢtır) Yanıt 9 kat
( Formülden çıkan sonuç : n= 9 ) ( Matematiği iyi olan arkadaĢlarınızdan destek alın)
HEYYY hemen korkma : Formül çok mu karıĢık geldi bir de Ģunu dene :
𝑛=
𝑟𝑖(1 − 𝑟𝑚)
𝑟𝑚(1 − 𝑟𝑖)
n: Kaç katına çıkarılacaksa o sayı
ri: Ġstenen güvenirlik katsayısı
rm: Mevcut güvenirlik katsayısı
Buna göre yukarıdaki soruyu bir daha çözelim:
n=
𝟎,𝟗𝟎 𝟏−𝟎,𝟓𝟎
𝟎,𝟓𝟎(𝟏−𝟎,𝟗𝟎)
Burdan
𝟎,𝟗𝟎.𝟎,𝟓𝟎
𝟎,𝟓𝟎.𝟎,𝟏𝟎
0,50’ler sadeleĢir.
𝟎,𝟗𝟎
𝟎,𝟏𝟎
kalır bölme iĢlemini gerçekleĢtirirsek çıkan sonuç 9 Bu sonucu
Ģöyle yorumlayacağız.
Diyelim ki soru sayımız 20 olsun demek ki 9 katına yani 180’e çıkaracağız yani 160 soru ekleyeceğiz. ( 20 tane vardı
160 eklersen 9 katına çıkar )
2.
ġans Faktörü: Tesadüfi hata kaynağı olan Ģans faktörünün , kopya çekmenin vs önüne geçilmeli. Düzeltme formülü
uygulanmalıdır. ( 4 yanlıĢ 1 doğruyu götürür gibi ) ġans faktörür bilen öğrenci ile bilmeyen öğrenci ayrımını ortadan
kaldırdığı için güvenirliği zedeler.
3.
Testik Standart Özellikleri:
Sorular Açık ve AnlaĢılır Olmalı: Tesadüfi hatanın önüne geçmek için soruların bilen öğrencileri yanılmayacak
Ģekilde sade ve açık olması gerekmektedir. Aksi durumda öğrenci tesadüfen hata yapabilir.
b) Sorular Kolaydan Zora Doğru Olmalıdır: Doğrudan yukarıdaki madde ile ilgili bir durumdur. Zor soruların testin
baĢında yer alması öğrencinin motivasyonunu bozar ve bildiği halde yanlıĢ yapmaya baĢlar.
c) Testtin Yönergesi Açık ve AnlaĢılır Olmalı: Testin yönergesinin açık olmaması örneğin sınav süresinin yazmaması,
soruların nasıl yanıtlanacağının açık belirtilmemesi vs güvenirliği de etkiler. ( KULLANIġLILIĞI da ETKĠLER)
a)
4.
Öğrencinin Psikolojik Durumu Desteklenmelidir: Tesadüfi hata kaynağı olan psikolojik durumlar testin güvenirliği için
önemlidir. Öğrenci motive edilmeli ve öyle sınava sokulmalıdır.
5.
Sınav Ortamı : Sınav ortamı tüm öğrenciler için uygun olmalı, ısı , ıĢık vs dengeli olmalı, gürültülü ortamda sınav
uygulamak ölçmeye yine tesadüfi hata karıĢtırır.
6.
Tüm Öğrencilere Yetecek Kadar Süre Tanınmalıdır: Sınav süresi tüm öğrencilerin soruları yanıtlayabileceği bir zaman
olmalıdır
7.
Soruların Zorluk Derecesi: Sınav orta güçlükte 0,50 olmalıdır. ġöyle diyelim; çok zor soruları bilenler de yapamaz; çok
kolay soruları bilmeyenler de yapar bu durumda ayırt edicilik düĢer. Güvenirlik de düĢer. Güvenirliği en yüksek sorular 0,50
( orta zorlukta ) sorulardır.
8.
Grubun Yapısı:. Grubun heterojen olması güvenirliği artırır. Öğrenciler benzer özellik taĢırsa ( Örneğin hepsi üstün zekalı
ve baĢarılı ise) sınavın bilen ve bilmeyen öğrencileri ayırıp ayırmadığını kestirmemiz güç olur. Bu yüzden güvenirlik
hesaplaması yaparken örneklem grubun heterojen olması uygundur.
9.
Ranjın ve Standart Sapmanın Artması: Güvenirliği artırır. Çünkü ranj ve sapma arttıkça sonuçlar daha heterojen olur. Bu
da bilen ve bilmeyen örğencilerin ayırt edildiğini gösterir.
10. Puanlamada Nesnellik: Ölçmecinin değer yargılarından, psikolojik hatalarından arınık olarak testi puanlaması ya da
tarafsız olması puanlama güvenirliği için önemlidir. Çünkü değer yargılarımızın puanlamaya karıĢması ölçümlerin bir
puanlayıdan diğerine göre değiĢmesine yol açar. Bu da PUANLAMA GÜVENĠRLĠĞĠNĠ düĢüĢür. Bu durumu azaltmak için
ayrıntılı puanlama anahtarı kullanmak, öğrenci ismini kapatmak gibi yollar denenebilir. Ġlerde daha ayrıntılı konuĢacağız.
11. Madde Ayırt Ediciliği ve Güçlük: Madde ayırt ediciliğinin artması güvenirliği de artırır. Güçlük düzeyi ise orta düzeyde
olması idealdir.
12. Kopya: Bilen ile bilmeyen öğrenciyi ayırt etmeyi engellediği için kopyanın önüne geçilmeldir.
GÜVENĠRLĠK BELĠRLEME YÖNTEMLERĠ
Ġki Uygulamaya Dayananlar
a)
Test – Tekrar Test ( Kararlık Katsayısı )
b) Paralel Testler ( Tutarlık Katsayısı)
Tek Uygulama
a)
Eşdeğer Yarılar ( İç Tutarlık )
b) KR-20 ( İç Tutarlık)
c)
KR- 21 ( İç Tutarlı)
d) Cronbach – Alfa ( İç Tutarlık)
Güvenirlik Hesaplama Yöntemleri
( ĠKĠ UYGULAMAYA DAYANANLAR)
TEST – TEKRAR TEST: Aynı test , aynı gruba farklı zamanlarda tekrarlı olarak uygulanır. Bir test tesadüfi
hatalardan arınıksa iki uygulama arasında çok fark olmamalıdır.
- KARARLILIK KATSAYISI ( ĠSTĠKRARLILIK KATSAYISI) verir.
Ġki uygulama sonuçları ne kadar benzerse güvenirlik ifade eden korelasyon katsayısı da artar. Bu da testin
güvenilir olduğu anlamına gelir.
Test – tekrar test yöntemi kolay değiĢen özellikleri ( örneğin çocuklardaki ilgi ) ölçen testlerde yanıltıcı sonuçlar
verebilir. Örneğin 1 ay gibi kısa bir sürede bireyde değiĢme gösterebilecek bir özelliği ölçen bir testi aynı gruba 1 ay
arayla iki kera uyguladık. Bu durumda ilk uygulama ile ikinci uygulama farklı çıkacak ve korelasyon değeri düĢecektir.
Ancak bu durum testimizin güvenirliğinin düĢük olduğu anlamına gelmez, öğrencilerin değiĢtiği anlamına gelir. !!!
Test – Tekrar Test uygulamasının en sıkıntılı yanı iki uygulama arasındaki süredir. Bu sürenin ne kadar
olacağı konusunda kesin bir Ģey söylenemez. Çok kısa olursa sorulan soruların ve yanıtlarının hatırlanmasına ; çok uzun olursa
da öğrencilerin yeni kazanımlar elde etmesine neden olur. Bu yüzden acaba testimiz mi güvenilir değil yoksa öğrenciler mi
değiĢiyor anlayamayız. Bazı konu anlatım kitaplarında test-tekrar test yöntemi için 3 ay 6 ay gibi süreler verilmektedir. Bu belki
soru çözmenizi kolaylaĢtırır ama böyle bir süre konması uygun değildir. Sürenin ne olacağı uzmanlarca belirlenmeli örneğin
ilgilerin ölçüldüğü bir test için konan süre yeteneklerin ölçüldüğü bir test için konan süreye göre kısa olabilir.
TEST – TEKRAR TEST KATSAYISI HANGĠ DURUMLARDA DÜġÜK ya da YÜKSEK ÇIKAR
DÜġÜK ÇIKAR

Sorular her okumada farklı anlama geliyorsa, ya da
sorular açık ve anlaĢılır değilse ( Testin güvenirliğinin
düĢük olduğu anlamına gelir. )

Grup ölçülen özellik açısından değiĢme göstermiĢse.
(Bu durumda güvenirlik katsayısının düĢük çıkası
testimden kaynaklı değil öğrenciden kaynaklıdır.
Güvenirlik indeksinin bu sebeple düĢük çıkması aslında
testin güvenirliğinin düĢük olduğu anlamına gelmez. )

Ġki uygulama arası olması gerekenden uzun tutulursa
güvenirlik indeksi bir üstteki maddeden kaynaklı
düĢük çıkar. ( Süre uzarsa öğrenci de değiĢir )

Ölçülen özellik kolay değiĢen bir özellikse Bu durumda
güvenirlik katsayısının düĢük çıkası testimden kaynaklı
değil ölçtüğüm özellikten kaynaklıdır. Güvenirlik
indeksinin bu sebeple düĢük çıkması aslında testin
güvenirliğinin düĢük olduğu anlamına gelmez.

Teste herhangi bir sebeple hata karıĢıyorsa.

Ġki uygulama koĢulları benzer değilse

Ġki uygulamadan birinde öğrenci gerçekçi yanıt
vermemiĢse ( Örneğin bir ilgi envanteri uygulandı siz
soruları ciddiyetle yanıtladınız. Ġkinci kere aynı envanter
önünüze geldi ve bu sefer gerçekçi yanıtlar vermediniz.
Bu durumda iki uygulama sonuçları farklı çıkar indeks
düĢer. Ancak bu da testin gerçek güvenirliği hakkında
bilgi vermez. Testin güvenilir olmadığı anlamına gelmez.
Sorun sensin dostum testin suçu değil 
YÜKSEK ÇIKAR

Sorular açık ve anlaĢılır ise ya da hatalardan arınık
ise ( Test açık ve anlaĢılır ya da hatalardan arınık ise
farklı uygulamalarda farklı sonuçlar vermez. Bu durum
testin güvenilir olduğu anlamına gelir.

Ġki uygulama arası süre çok kısa ise ( Süre çok kısa
tutulursa korelasyon yüksek çıkar. Ancak bu durum testin
gerçek güvenirliğini vermez. Yanıltıcıdır. O yüzden süre
iyi ayarlanmalıdır.

Ölçülen özellik kolay değiĢme göstermiyorsa örneğin
yetenek ya da zeka gibi.

Ġki uygulama koĢulları benzer ise

Ġki uygulamada da öğrenciler gerçekçi yanıtlar
verirse.
EġDEĞER ( PARALEL ) FORMLAR GÜVENĠRLĠĞĠ: Test – tekrar testin en büyük sınırlılığı olan aynı testi
kullanma durumuna karĢı geliĢtirilen benzer test ( paralel test – eĢ değer test) uygulamasıdır.

Ġki eĢ değer testin aynı gruba uygulanmasına dayanır. EġDEĞERLĠK KATSAYISI. Ya da TUTARLIK KATSAYISI

Sorular eĢ değer ama farklı olduğu için soruların hatırlanması riski yoktur.

Ġki uygulama arka arkaya uygulanabilir. Ancak; peĢi sıra uygulamak , bıkkınlık – yorgunluk gibi durumlara yol
açabilir. Ġki uygulama arası çok uzatılırsa da bireylerde ölçülen özellik bakımından meydana gelen değiĢmeler test
puanlarını etkileyecektir.

EĢdeğer Testler uygulaması hem zaman içindeki KARARLILIĞI hem de yanıtların TUTARLILIĞININ ölçüsünü verir.
Ama asıl amacı TUTARLILIĞI VERMESĠDĠR.
EĢ değer form hazırlamanın en büyük sıkıntısı: iki testin kapsamlarının, ortalamalarının, varyanslarının, madde
sayılarının, ve tiplerinin ; madde güçlüklerinin ve diğer istatistiklerinin bir birine eĢit olması gerekliliğidir.
EĢdeğer test hazırlamanın zor olduğu durumlarda SÖZDE ya da YALANCI EġDEĞER FORM hazırlanabilir.
Sorular aynı ancak seçeneklerin sırası soruların yeri değiĢik.
I.
1.

Test
II.
Ali okula gitmedi cümlesinin öğeleri hangisinde
doğru verilmiĢtir?
A) Özne – Yüklem – Tümleç
B) Özne – Tümleç – Yüklem
C) Yüklem – Tümleç – Özne
D) Tümleç – Özne – Yüklem
1.
Test ( 1. Testin EĢdeğeri)
AyĢe seni sordu cümlesinin öğeleri hangisinde doğru
verilmiĢtir?
A) Yüklem – Nesne – Özne
B) Özne – Nesne – Yüklem
C) Özne – Yüklem – Nesne
D) Nesne – Yüklem – Özne
Bu iki testten öğrencilerin aldıkları puanlar ne kadar benzerse testin tutarlık anlamında güvenirliğinin yüksek olduğunu
söyleyebiliriz.
ÖNEMLĠ NOKTALAR
Bir öğretmen test – tekrar test yöntemi ile güvenirlik
hesaplamak istemektedir. Her iki uygulamada da öğrenci
puanlarına 10’ar puan vazladan vermiĢtir ( Sabit hata
yapmıĢtır ) Bu durumda güvenirlik değiĢir mi ?

Güvenirlik katsayısı bu durumda etkilenmeyecektir. Her
iki uygulamada da öğrenci puanlarına sabit bir puan
eklemesi puanlar arası korelasyonu bozmayacaktır. Çünkü
her puan aynı Ģekilde artmaktadır. Zaten sabit hatalar
güvenirliği değil geçerliği etkiler.
Güvenirlik Geçerliği Sınırlandırır Bir test
güvenilir değilse geçerli de değildir. Ancak bir testin
güvenilir olması onun geçerli olduğu anlamına gelmez.
Yani her güvenilir test geçerli olmayabilir. Ama her
geçerli test güvenilirdir.
Ayrıca: Bir testin geçerlik katsayısı o testin güvenirlik
katsayısının kare kökünden büyük olamaz. Örneğin.
Güvenirlik katsayısı 0,64 olan bir testin geçerliği en fazla
0,64‟ün karekökü olan 0,80‟den büyük olamaz. Bu
duruma da güvenirliğin geçerliği sınırlaması denir.
(TEK UYGULAMAYA DAYANANLAR)
Eġ DEĞER YARILAR ( TESTĠ YARILAMA ): Tek oturumda uygulamaya dayanır. Testi eĢit iki yarıya bölmek
suretiyle her bir bireye ait iki test puanı elde etmek söz konusudur. ĠÇTUTARLILIK KATSAYISI

Testin bütününe dair bir güvenirlik katsayısı değil, eĢ değer yarılara ait güvenirlik katsayısını verir.

100 soruluk bir testi 1, 3, 5, 7 ...99 ve 2, 4, 6, 8 ... 100 diye iki yarıya böleriz ( 50 +50 =100 ) Elde ettiğimiz kat sayı
100 soruluk sınavın değil 50 soruluk sınavın katsayısıdır. Bu yüzden ,duyarlığı düĢürdümüzden, eĢ değer yarılar ile
elde edilen güvenirlik karsayısı her zaman testin tümünden elde ettiğimiz güvenirlik katsayısından düĢük olur.

Yukarıdaki ayırma iĢlemini yapmadan önce soruları zorluk düzeyine göre sıralamak ve sonra ayırmak gerekir.
Spearman Brown Formülü: Testin yarısından elde edilen güvenirlik katsayısı r ise :
2𝑟
1+𝑟
formülü ile testin tamamına ait güvenirlik katsayısı elde edilebilir.
Örnek: Testi yarılama ( eĢ değer yarılar) yöntemi ile elde edilmiĢ güvenirlik katsayısı 0,60 ise testin tamamından elde edilecek
güvenirlik katsayısı kaçtır?
Yanıt: 0,75  Matematiği iyi olan arkadaĢlarınızdan yardım alın.
Bu uygulamada testin iki yarısına giden maddelerin güçlük düzeyleri farklılaĢırsa korelasyon düĢük çıkar. Bu
uygulamanın en sıkıntılı yanı iki yarıya dağılan soruların homojen yapıda olmasını sağlamaktır.
1.
Test
puanlarının
güvenirliği
için
aĢağıdaki
değerlendirmelerden hangisi hatalıdır?
A) 60 maddelik bir testin, benzer nitelikte sorulardan
oluĢan 40 maddelik bir testten daha güvenilir sonuçlar
vermesi beklenir.
B) Objektif olmayan testlerle yapılan ölçme iĢlemlerde
yanıtlayıcıya verilecek puana puanlayıcının takdiri
karıĢtığı için bu tip ölçmeler genelde güvenilir
olmayan sonuçlar verir.
C) Öğrencilerin yeterince güdülenmediği sınavlarda
cevaplar tesadüfe kalacağı ya da birçok soru cevapsız
bırakılacağı için sınav puanlarının güvenirliği düĢer.
D) Açık ve anlaĢılır olmayan sorular ile oluĢturulmuĢ bir
ölçme aracı ile yapılan ölçme iĢlemlerinde puanların
güvenirliği düĢük çıkar.
E) Öğrencilerin test ile yoklanması amaçlanan
davranıĢlara sahip olmaması testin güvenirliğini
düĢürür.
Yanıt : E
2.
Eğitimdeki ölçme iĢlemlerinin güvenirliğini ya da
ölçme iĢlemine karıĢan hata miktarını kestirebilmek
için aĢağıdakilerden hangisinin yapılması daha
uygundur?
A) Sınava giren öğrencilere girdikleri sınavla ilgili bir
anket uygulanıp uygulanan sınavın amaca uygun olup
olmadığının belirlenmesi
B) Sınava giren öğrencilerin puanları ile öğrencilerin
girdikleri sınavla iliĢkili yetenek testlerinden aldıkları
puanların karĢılaĢtırılması
C) Ölçme iĢleminin tekrarı ya da hiç değilse ölçmenin
tekrarı sayılabilecek bazı yöntemler kullanmak
D) Sınava giren her bir öğrenci ile verdikleri yanıtlarla
ilgili görüĢmeler yapmak
E) Öğrencilere uygulanan ölçme aracının ölçme istediği
hedef davranıĢları ne kadar kapsadığına bakmak.
Yanıt: C
KR – 20 GÜVENĠRLĠĞĠ: Testin kapsamı ne kadar homojen ise maddeler ( sorular ) birbiri ile o derece yüksek iliĢkili
olacağından maddeler arası tutarlılık da o derece yüksek olacaktır. ĠÇ TUTARLILIK – TESTĠN HOMOJEN YAPISINI
GÖSTERĠR. KR-20 KAT SAYISI YÜKSEK ĠSE TESTĠN TEK BOYUTLU BĠR YAPIYI ÖLÇTÜĞÜ SÖYLENEBĠLĠR.
KR-20 güvenirlik katsayısının yüksek çıkması yapı geçerliğinin yüksek olacağına iĢarettir ANCAK KESĠN KANIT
DEĞĠLDĠR. ZATEN GÜVENĠRLĠK , GEÇERLĠK ĠÇĠN KESĠN KANIT OLUġTURMAZ. UNUTMAYIN KR-20 yapı
geçerliği için bir kanıttır ANCAK KESĠN KANIT DEĞĠLDĠR.
ġimdi daha yalın bir dille konuyu ele alalım. 10 soruluk Türkçe, 10 soruluk matematik, 10 soruluk sosyal, 10 soruluk da fizik
testi bulunan bir sınav düĢünün . HETEROJEN YAPIDA TOPLAM 40 soru var ve her soru 1 puan olsun. Ali bu sınavdan 10
AyĢe de 10 almıĢ olsun. Ali ve AyĢe’nin performansları eĢit mi sorusuna verilecek yanıt belirsizdir. Çünkü testimiz heterojen.
Yani Ali bu 10 puanı Türkçeden mi Matematikten mi aldı belli değildir. Aynı durum AyĢe için de geçerlidir. Ancak öğrenciler
40 soruluk bir Türkçe ya da 40 soruluk matematik gibi HOMOJEN yapıda bir sınava alınsalardı performanslarını
karĢılaĢtırmada daha sağlıklı yargılara ulaĢabilirdik.

ĠĢte tam bu noktada KR-20 güvenirlik hesaplama yöntemi karĢımıza çıkmakta ve maddelerin birbiriyle uyumunu
belirlememize yarar. Testin içtutarlılığını verir.
KR-20 hesaplaması yapmak için belli önkoĢullar vardır.
1.
Test bir kez uygulanmıĢ olmalıdır.
2.
Soruların en az %90‟ı yanıtlanmıĢ olmalıdır.
3.
Testeki sorular 0-1 puanlama yöntemine göre puanlanmalıdır. ( Yani her bir sorunun doğru yanıtına verilen puan
eĢitse. Her bir sorunun puan değeri farklı ise KR-20 kullanılmaz. )
4.
Testteki soruların madde güçlük indeksi ya da madde varyansı bilinmelidir. ( Madde istatistikleri bilinen testlerde
kullanılır. )
FORMÜLÜ:
KR-20=
𝑲
𝑲−𝟏
. 𝟏−
𝒑.𝒒
𝒔𝟐
K: Teste bulunan madde sayısı
p: Madde güçlük indeksi
𝒑. 𝒒: Madde varyansları toplamı
𝒔𝟐 : Test puanlarının dağılımı ( Standart sapmanın karesi)
q: 1-p
p.q: Madde varyansı (𝒔𝟐 )
50 soruluk bir testin madde varyansları toplamı 1,8 ve testin standart sapması 3 ise bu testin
güvenirlik katsayısı kaçtır?  0,82 ( Matematiği iyi olan arkadaĢınızdan yardım alın)
PÜF NOKTALARI:
 Madde güçlük indeksi bilinen testlerde
 Madde istatistiği yapılmıĢ testlerde kullanılır.
KR-21GÜVENĠRLĠĞĠ: KR-20 madde güçlük indeksi hesaplanan testler için kullanılırken KR-21 madde güçlük indeksi
hesaplanmayan ( Madde güçlük indeksinin tüm maddeler için aynı olduğu varsayılır) testlerin ĠÇ TUTARLILIĞINI verir.


Aritmetik ortalama, standart sapma ve soru sayısı belirlenmiĢse kullanılabilir.
KR-20 madde istatistiğine göre bulunurken KR-21 Test istatistiğine göre bulunur. ( Öğrencilerin test puanları
ortalaması ve varyans )
Formülü: KR-21 =
𝑲
𝑲−𝟏
. 𝟏−
𝑲.𝒙− 𝒙𝟐
𝑲.𝒔𝟐
50 sorudan oluĢan bir Türkçe testinin test puanları ortalaması ( 𝒙) 25, varyansı (𝒔𝟐 ) 25 ise bu testin
güvenirliği kaçtır?  0,51 ( Matematiği iyi olan arkadaĢınızdan yardım alın)
KR-20 ile KR-21 ARASINDAKĠ ĠLĠġKĠ

KR-20 ile hesaplanan güvenirlik katsayısı genellikle KR-21 ile hesaplanandan yüksek çıkar
KR-21 neden KR-20’den düĢük çıkar: KR-21 madde güçlükleri indekslerinin eĢit olduğu varsayımına dayandığı için
testi oluĢturan madde güçlükleri arasındaki farklılıklara duyarlı değildir. Bu nedenle KR-21 KR-20’den daha düĢük çıkma
eğilimdedir. BaĢka bir deyiĢle testteki maddelerin güçlük indekslerinin birbirine eĢit olmadığı durumda KR-21 ile hesaplanan
güvenirlik katsayısı KR-20 ile hesaplanan güvenirlik katsayısından küçük çıkar. O HALDE Madde güçlükleri birbirine eĢit
olan bir testte KR-20 ile KR-21 birbirine eĢit çıkar.
 KR-21 güvenirliğin ( içtutarlık bakımından) alt sınırıdır.
 KR-20 ve 21 ile elde edilen sonuçların yorumları aynıdır ( Ġkisi de içtutarlığa dair bilgi verir)
 KR- 20 ve 21 hesaplamalarının her ikisi de 0-1 puanlama tipi için uygundur.
 Her ikisinde de soruların %90 çözülmüĢ olmalıdır.
 Madde güçlüğü, madde varyansı, madde ayırt ediciliğine dayalı olarak hesaplanan KR-20 ; testin ortalaması, testin sapma
ya da varyasına dayalı olarak hesaplanan ise KR-21‟dir.

KR-20 ya da KR-21 yüksek ise :
a) Uygulanan test hatalardan arınıktır ( Güvenirlik)
b) Testi oluĢturan maddeler homojendir ( içtutarlık)
c) Test tek boyutlu bir yapıdan oluĢuyordur.
YUKARIDA VERĠLENLERE DAYALI ġU SORULARI YANITLAYINIZ.
1.
Bir öğretmen her bir soru için madde istatistiği çıkarmıĢ ancak bunları kaybetmiĢtir. Elinde sadece öğrenci puanları vardır.
Buna göre iç tutarlığı hangi yöntemle belirler 
a) KR-20
b) KR-21
2.
Madde güçlük indeksleri birbirine eĢit bir testtin KR-20 güvenirlik indeksi 0,82 bulunmuĢtur. Buna göre Bu testin KR-21
değeri kaçtır ?
3.
KR-20 değeri neden 21 değerinden yüksek çıkma eğilimindedir?
4.
KR- 20 ile 21 ne zaman eĢit çıkar?
5.
Bir öğretmen ayrıntılı bir Ģekilde madde analizi çıkarmıĢtır. Buna göre hangi yöntemi kullanacaktır?
a) KR-20
b) KR-21
CRONBACH ALFA GÜVENĠRLĠĞĠ: KR-20 ve KR-21 , 0-1 puanlama yöntemine göre yapıldığı durumlarda kullanılır. Ancak
puanlamanın böyle yapılmadığı durumlarda Cronbach Alfa güvenirliği kullanılır. Yani Cronbach‟ın alfa katsayısı her bir soruya
farklı puanların verildiği testlerde kullanılır.

Doğru cevabı olmayan ( tutum-ilgi – kiĢilik) testlerinin ĠÇTUTARLILIĞINI belirlemek için kullanılır. Örneğin
ilgi testlerinde yanıt Ģudur diyemezsiniz. Katılıyorum, katılmıyorum ya da kısmen gibi dereceli yanıtlardan biri seçilir
ve bu yanıtlar her kiĢi için doğru olabilir.

Çoklu ( polytomous) puanlanabilen maddelerden oluĢan testlerde de kullanılabilir. ( Tutum – ilgi vs testlerinde
tek bir yanıt yoktur çok yanıt vardır)
PUANLAYICI GÜVENĠRLĠĞĠ: Tesadüfi hatanın kaynağı puanlayıcıların her bir test maddesini puanlamaları arasındaki
farklılıklar da olabilir. Bir testte puanlayıcı hatalarının olmadığını söylemek için iki veya daha fazla puanlayıcının puanladıkları
test ve madde puanlarının aynı olması gerekir.


Öznel etkilerin olduğu yazılı ve sözlü sınavlarda birden fazla puanlayıcıya sınavların değerlendirilmesi gerekebilir.
Öğretmenlerin yanıt anahtarlarına göre , ayrıntılı düzenlenmiĢ puanlama anahtarlarına göre ( rubrik) puanlama
yapması yansızlığı – objektifliği sağlar. Bu durumda puanlayıcı güvenirliği artar. Yazılı , sözlü testlerini portfolyo
ve projelerin puanlayıcı güvenirliği, çoktan seçmeli, kısa cevaplı, boĢluk doldurmalı testlere göre daha düĢüktür.
Puanlayıcıların sınıflama düzeyinde ölçme yapmaları durumunda iki puanlayıcının puanlamaları arasındaki
arasındaki puanlayıcı güvenirliğine iliĢkin katsayıyı belirlemek için kappa istatistiği kullanılabilir. Po; gözlenen uyum
𝒑𝒐−𝑷𝒄
oranı, Pc; Ģansla beklenen uyum oranı ifade etmek üzere 𝑲 =
𝟏−𝑷𝒄
AġAĞIDA VERĠLEN TEST TÜRLERĠNĠ PUANLAMA GÜVENĠRLĠĞĠ AÇISINDAN ANALĠZ EDELĠM
Yazılı Yoklamalar: Yazı güzelliği, öğrenci adını bilme ve ölçülen özelliklerin üst düzey olması gibi sebeplerle yazılı
yoklamalarda puanlama güvenirliği düĢüktür. Örneğin kompozisyon sınavında öğrencinin aynı kağıdına farklı puanlayıcılar farklı
puanlar verebilir. Ayrıntılı bir yanıtlama anahtarı bu öznelliğin önüne kısmen geçebilir tamamen değil.
Sözlü Sınavlar: Puanlayıcının önyargılarından kaynaklı puanlama güvenirliği düĢüktür. Öğrencinin söyledikleri farklı algılanıp
farklı puanlayıcılar tarafından aynı öğrenciye farklı puanlar verilebilir.
Kısa Cevaplı ya da BoĢluk Doldurmalı Sınavlar: Yanıtların net ve yoruma açık olmaması nedeniyle puanlama güvenirliği
yüksektir. Ancak bunlara da kısmen de olsa puanlayıcı yanlılığı karıĢabilir.
Çoktan Seçmeli – Doğru YanlıĢ – EĢleĢtirmeli Testler: Yanıtlar net olduğu için puanlayıcı güvenirliği yüksektir. Puanlayıcıdan
puanlayıcıya değiĢecek bir öznellik yoktur. Birinci soru A ise A‟dır gibi.
Proje – Performans –Portfolyo gibi ÇağdaĢ Değerlendirme Türleri: Ölçülen özellikler üst düzey olduğu için puanlayıcı
güvenirliği düĢüktür. Jürinin ( puanlayıcıların) puanları biribirinden farklı olabilir.
Puanlama Öznelliği Ġçin Ġlginç Bir Örnek: Charlie Chaplin, Monte Carlo‟da düzenlenen Charlie Chaplin‟e benzeyen
yarıĢmasına diğer adaylarla birlikte katılır. Jüri onun gerçek Charlie Chaplin olduğunu bilmez. Sonuç puanlama güvenirliği adına
bir rezalettir. Çünkü bizim gerçek Chaplin bu yarıĢmada 3. olur. YarıĢmanın puanlama güvenirliği düĢüktür.
ÖLÇÜMLERĠN STANDART HATASI: Standart hata da güvenirlik gibi hata ölçüsünü veren bir istatistiktir. Fakat standart
hata , hata miktarını bir oran olarak değil, test puanı biriminde verir.
Se = 𝑆𝑥 1 − 𝑟 Formülü ile hesaplanır.
Se= Standart hata
Sx = Standart sapma
r = Güvenirlik katsayısı
Standart sapma artarsa standart hata artar ( standart sapma azalırsa hata azalır) ; güvenirlik katsayısı arttıkça
standart hata azalır ( güvenirlik azaldıkça standart hata artar).
PUANLARIN STANDART SAPMA GÜVEN ARALIKLARI: Standart hata kullanılarak bulunur. Ty : Gerçek puanın
olabileceği en yüksek değer, Ta: gerçek puanın alabileceği en düĢük değer. Bireyin gerçek puanı Ty ve Ta arasındadır. B
 %68 olasılıkla: Öğrencinin puanının 1 standart hata fazlası ile 1 standart hata eksiği arasındadır.
 % 95 olasılıkla: Öğrencinin puanının 2 standart hata fazlası ile 2 standart hata eksiği arasındadır.
 % 99 olasılıkla: Öğrencinin puanının 3 standart hata fazlası ile 3 standart hata eksiği arasındadır.
Bir örnekle ele alalım: Güvenirlik katsayısı 0,75 olan bir testin standart sapması 4 dir. Ali bu sınavdan 70 almıĢtır.
I.
II.
III.
Testin standart hatası nedir?
Öğrencinin puan güven aralığı %68, %95 ve %99 olasılıkla nedir?
Ty ve Ta aralığı kaçtır?
Önce Se( Standart hatayı bulalım) Formüldeki değerler yerleĢtirildiğinde Se = 4 1 − 0,75 ise buradan standart hatamız
(Se) = 2 çıkar. ( Matematiği iyi olan arkadaĢlarınızdan yardım alın)
Öğrencilerin puan güven aralığı
%68 Ali 70 almıĢ ise standart hatayı bir ile çarpıp, ekleyip çıkartıyoruz: o halde 68 – 72
%95 ise standart hatayı iki ile çarpıp ekleriz o halde 66 – 74
% 99 ise standart hatayı üç ile çarpıp ekleyip çıkartırız o halde 64 – 76 çıkar.
Ty ve Ta olabilecek en düĢük ve en yüksek puanlar arası fark olduğu için %99 olasılıkla belirlenmiĢ aralık ( 64 – 76 ) aynı
zamanda Ty – Ta aralığını verir.
Standart hata, hatayı bir oran cinsinden değil öğrenci puanı cinsinden verir. Neden
Çünkü standar hatalar öğrenci puanlarına eklenir. Yukarıda yaptığımız gibi öğrenci puanına hata miktarını ekleyip
çıkardığımızda güven aralığı bulmaktayız. Eğer standar hata , hata miktarını öğrenci puanı cinsinden vermeseydi, böyle bir
ekleme çıkarma yapamazdık.
Puanların güven aralığı ya da standart hatayı bilmem benim ne iĢime yarayacak ?
Diyelim ki geçme notumuz 70 olsun, standart hatanın da 5 olduğu bir sınavdan 69 alan kiĢiyi bırakmak sizce doğru bir karar
mıdır. Tabii ki hayır.Bu yüzden geçecek ya da kalacak öğrenciye karar verirken sınavımızdaki standart hataları dikkate almamız
gerekir. Örneğin 65 alan bir çocuğu geçirmek 5 puanlık standart hatayı dikkate almaktır. UNUTMAAAAAA
GEÇERLĠK TÜRLERĠ
Kapsam Geçerliği
Ölçüt Geçerliği
-
Yapı Geçerliği
GörünüĢ Geçerliği
Karar Geçerliği
Sonuçsal Geçerlik
Yordama
Uygunluk
GEÇERLĠK: Bir ölçme aracının amaca hizmet etme derecesidir.
 Ölçülmesi istenen bir özelliğin baĢka özelliklerle karıĢtırmadan doğru olarak ölçebilme derecesidir. Örneğin Türkçe
baĢarısını ölçmek için geliĢtirilmiĢ bir testten Türkçe baĢarısı yüksek bireylerin yüksek not alması gerekir. Türkçe baĢarısı
yüksek kiĢiler bu testten düĢük not alıyorsa test amacına hizmet etmiyor demektir.

Bir aracın geçerliği ölçmek istediği özellikle ve amaçla bağlantılıdır. Bir amaç için geliĢtirilmiĢ bir test baĢka bir amaç için
geçerli olmayabilir. Örneğin diksiyon becerisi için geliĢtirilmiĢ ve geçerli olan bir test yazılı anlatım becerisi ölçmek için
geçersiz olabilir.
 Geçerlik – 1 ile +1 arasında değer alır. +1 e yaklaĢması geçerliği yükseltirken -1 e yaklaĢması geçerliği düĢürür.
KONUYU YAPILANDIRALIM
Lise 4. sınıf öğrencilerinin matematik bilgi ve becerilerini
ölçmek amacıyla hazırlanmıĢ bir test ilköğretim 8. sınıf
öğrencilerine ve lise 4. sınıf öğrencilerine uygulanıyor.
Öğrencilerin aldıkları puanların korelasyonu 0,91 çıkıyor. Yani
8‟ler ile lise 4‟ler aynı testten benzer sonuçlar alıyor. Sizce bu
test geçerli midir yani amacına uygun mudur?
Analiz edelim: Lise 4‟ler içi geliĢtirilmiĢ bir testten eğer 8‟ler
de benzer puan alıyorsa ayırt ediciliği düĢük demektir. Ya da
amacına hizmet etmiyordur. Yani test geçerli değildir. Lise
4‟lerle 8‟lerin puanları farklı çıkmalıydı geçerli olabilmesi için
Ahmet yıllardır, yüksek lisans sınavlarına katılır ancak her
sınavdan ( mülakat) benzer sonuç alır. 5. giriĢinde artık
baĢvurmaktan vazgeçer. Aradan geçen günlerde yüksek lisansı
kazananları görür ki hiçbiri kendi gibi yeterli kiĢiler değildir.
Ancak hepsinin torpili vardır.
Analiz edelim: Mülakatlar, yüksek lisans becerisine sahip
kiĢileri değil torpili olan kiĢileri seçmiĢtir. Bu da sınavın
amacına uygun değildir. Ayrıca ölçme iĢlemine baĢka
değiĢkenler ( torpil ) karıĢmıĢtır.
Ek Açıklama: Bazı arkadaĢlar burdaki 0,91 korelasyon
değerine aldanmıĢ olabilir. Bu değer testin geçerlik katsayısı
değil iki uygulama arasındaki korelasyondur. Biri 8‟ler diğeri
lise 4 olan iki grubun puanlarının benzerlik derecesini ifade
ediyor ( 0,91 yani çok benzer) Bu yüzden geçerlik düĢüktür.
GeliĢtirilmiĢ bir zeka testi zekası düĢük ( ZD) olduğundan
emin olunan bir gruba 6 ay arayla iki defa uygulanıyor. Birinci
ve ikinci uygulamanın korelasyon değeri 0,89 yani oldukça
yüksek ve benzer. Zekası yüksek ( ZY) olduğundan emin
olunan gruba da 6 ay ara ile uygulanıyor ve ilk uygulama ile
ikinci uygulama arasındaki korelasyon burda da oldukça
yüksek çıkıyor. Daha sonra ZD ile ZY gruplarının zeka
puanları korelasyonuna bakıldığında 0,89 çıkıyor. Yani ZD –
ZY korelasyonu da yüksek ( benzer puanlar almıĢlar)
Bir banka kendine eleman seçmek için bir sınav uygulamıĢtır.
Bu sınavın amacı en yüksek çalıĢma performansını gösterecek
elemanı seçmektir. Bu sınavdan yüksek puan alan 10 kiĢi iĢe
alınmıĢ ancak bu 10 kiĢiden ancak 1‟i çalıĢma performansı
testinden yüksek puan almıĢtır.
Testin amacı performansı yüksek birey seçmekti. Ve bu
testten yüksek alanların performansının da yüksek olacağı
varsayılmıĢtı. Ancak durum öyle olmadı. Yani test amacına
hizmet etmedi.
Bu durumda geçerlik ve güvenirlik için ne söylenebilir:
Testler tekrarlı uygulamalarda benzer sonuçlar verdiği için
güvenilirdir. Ancak Zekası düĢükler ile zekası yüksekler aynı
testten benzer sonuçlar aldığı için testin geçerliği düĢüktür.
Birazdan geçerlik türlerini iĢleyeceğiz. Geçerlik türlerinin özelliklerini bilmek ve geçerlik hesaplama yöntemlerini
bilmek soruları çözmede iĢinizi çok kolaylaĢtırır. O yüzden hem geçerlik türlerinin özelliklerini hem de geçerlik hesaplama
yöntemlerini ve bu yöntemlerin hangi geçerlik türüne ait olduğunu bilmek OLDUKÇA ama OLDUKÇA ÖNEMLĠDĠR.
KAPSAM GEÇERLĠĞĠ: Testeki sorular ölçülecek konu içindeki hedefleri – davranıĢları ne kadar örnekliyor, soruların tamamı
ölçülmek istenen alanı ne kadar ölçüyor sorularına yanıt aranır.

Ġzleme ( formatif) testler konu ya da ünite sonunda yapılır. Bu tip sınavlarda iĢlenilen konu ya da ünite ile ilgili tüm
davranıĢlar yoklanmalıdır. Çünkü bunlarda amaç öğrenme eksikliğini gidermektir.

BaĢarı ( eriĢi – sümmatif) testler izleme testlerinde olduğu gibi tüm davranıĢları değil davranıĢlar arasından kritik olanların
teste alınması ile yapılır.
Bir sınavda konu dıĢı soru varsa, soru sayısı azsa, bazı kritik davranıĢlar ( önemli konular) soru olarak ölçülmemiĢse
kapsam geçerliği düĢer.
Kapsam geçerliğini sadece niceliksel ( duyarlıkla ilgili – soru sayısı ) olarak düĢünmek yanlıĢtır. Aynı zamanda
kapsam geçerliği bir testin ölçmek istediği davranıĢı ölçüyor olmasıdır. Örneğin bir sınavda 100 tane 1000 tane soru
olması kapsam geçerliğini kanıtlamaz. Soruların niteliği ( önemli konular ve hedeflerden mi yoksa kıyıda kenarda kalmıĢ
önemsiz konulardan mı ) önemlidir.
KAPSAM GEÇERLĠĞĠ HESAPLAMA YOLLARI
A) Rasyonel Yollar :
1.
2.
Belirke Tablosu Kullanma: Belirke tablosu konuların ve hedef – davranıĢların yer aldığı iki boyutlu bir tablodur.
Öğretmen bu tabloda her bir konu ve hedef davranıĢa ne kadar ağırlık vermesi gerektiğini görür. Buna göre de hangi
konudan ve davranıĢtan ne kadar soru hazırlaması gerektiğine ulaĢır.
Uzman KiĢilere BaĢvurma: ( Benzer bir yöntem yapı geçerliğinde de vardır ) Konu alanı uzmanlarına ölçme
değerlendirme uzmanlarına fikirleri sorularak testin kapsam bakımından geçerli olup olmadığı anlaĢılabilir. Testin
ölçmek istediği örneklemi ölçüp ölçmediği uzmanlara sorulur onlar da katılıyorum, kısmen katılıyorum , katılmıyorum
gibi yanıtlar verir. Verilen yanıtlar içinde “katılıyorum” sayısı kapsam geçerliğinin yüksekliğine iĢarettir.
B) Ġstatiksel YaklaĢım:
1.
Bilinen Testlerle Korelasyon: ( Benzer bir yöntem yapı geçerliğinde de vardır) Yeni geliĢtirdiğimiz testle kapsam
geçerliğinin yüksek olduğundan emin olduğumuz bir test gruba uygulanır. Ölçümlerin korelasyonuna bakılır.
Korelasyon yüksek ise yani puanlar benzer ise kapsam geçerliği yüksektir.
Dikkat ettiyseniz kapsam geçerliği için belirlenmiĢ 4 yoldan 3’ü yapı geçerliği için de kullanılmaktadır. Böyle bir
durumda ya seçeneklere ikisinden biri olacaktır ya da ikisi de seçeneklerde varsa farklı bir ipucu kullanacaktır.
Geçerlik hesaplaması Ģayet belirtke tablosuna göre yapılıyorsa düĢüneceğimiz seçenek doğrudan Kapsam
Geçerliğidir.
ÖLÇÜT GEÇERLĠĞĠ: Geçerliği belirlemek için baĢka bir test puanının ya da performansın ölçüt olarak kullanılmasıdır.
Geçerliği kanıtlanacak puanların bir ölçütle karĢılaĢtırılmasına dayanır.
Uygunluk ( ZamandaĢlık) : Ölçüt , geçerliği kanıtlanacak puandan önce belirlenmiĢtir.
Yordama : Ölçüt geçerliği kanıtlanacak puandan sonra belirlenmiĢtir.
1.
2.
1.
Uygunluk Geçerliği ( ZamandaĢlık) : Ölçüt puanlarının
, geçerliği kanıtlanacak puanlarla aynı zamanda ya da
daha önce elde edilmiĢse belirlenen geçerlik türü
uygunluktur.
OÖBP ( Orta Öğretim BaĢarı Puanları) ÖSS puanlarına
uygun mu ?
2.
Yordama Geçerliği ( Tahmin): Ölçüt olan puanlarınperformansın, geçerliği kanıtlanacak puanlardan sonra
elde edilmesiyle belirlenen geçerlik türüdür.
ÖSS puanlarına bakarak
performansını tahmin etmek
Üniversitedeki
paunlarını
–
SBS puanlarına bakarak Lise baĢarısını tahmin etmek
ĠÖBP ( Ġlk Öğretim BaĢarı Puanları ) SBS puanlarına uygun
mu ?
ĠĢe alım sınavındaki puanlarına bakarak , ilerdeki iĢ
performansını yordamak
Bir banka iĢ alımı için neden sınav yapar. Amacı
senin üniversitede edindiğin bilgileri değerlendirmek mi
yoksa seni iĢe aldığında göstereceğin performansı
kestirmek mi? Tabii ki ikincisidir. Bu yüzden bu
bankanın yaptığı sınavın yordama geçerliği düĢük olursa
bankada sürekli olarak hesapları birbirine karıĢtıran
bankacılar olur.
ÖLÇÜT
–
KRĠTER
/
YORDANAN
Üniversitedeki baĢarı puanlarını ölçüt
olarak kabul edersem ve buna göre
geçerliği belirlersem KPSS‟nin uygunluk
– zamandaĢlık – halihazırlık geçerliğini
belirlemiĢ olurum.
Geçerliği
Belirlenecek
Sınav – Puan
KPSS
( YORDAYICI)
Lisedeki baĢarı puanlarını ölçüt kabul
ediyorsam ÖSS‟nin uygunluk geçerliğini
belirlemeye çalıĢıyorumdur.
ÖSS
( YORDAYICI)
Ġlköğretim ikinci kademedeki puanlarını ,
performansını ölçüt kabul ediyorsam
SBS‟nin uygunluk geçerliğini belirlemeye
çalıĢıyorum
SBS
( YORDAYICI)
ÖĞRETĠCĠ SORU
3. AĢağıda verilenlerden hangisi bahsi geçen sınavların
yordama geçerliğini ifade eden bir örnektir?
A) LYS‟ye giren öğrencilerin bu sınavdan aldıkları
puanlar ile lise not ortalamaları arasındaki iliĢki
B) KPSS‟ye giren adayların bir soraki yıl KPSS‟den
aldıkları puanlar arası korelasyon
C) LYS‟ye giren öğrencilerin aldıkları puanlarla bir
sonraki yıl LYS‟ye giren öğrencilerin aldıkları
puanlar arasındaki iliĢki
D) KPSS‟ye giren adayların aldıkları puanlar ile göreve
baĢladıklarında aldıkları sicil notları ya da hizmet içi
eğitim puanları arasındaki iliĢki
E) LYS‟ye giren öğrencilerin aldıkları puanlar ile ile o
yıl üniversite 1. sınıfta olan öğrencilerin ders notları
arasındaki iliĢki
Yanıt: D

ÖLÇÜT
–
KRĠTER
/
YORDANAN
ġayet,
memur
olduktan
sonraki
performansını, sicil notlarını, teftiĢ notlarını
ölçüt kabul edersem ve buna göre geçerliği
belirlersem KPSS‟nin yordama – tahmin
geçerliğini belirlemiĢ olurum. BU KADAR
NET UZATMAYA GEREK YOK.
Üniversitedeki
baĢarı
puanlarını,
performansını ölçüt kabul ediyorsam
ÖSS‟nin yordama geçerliğini belirlemeye
çalıĢıyorum.
Lisedeki puanlarını ve performasını ölçüt
kabul
ediyorsam
SBS‟nin
yordama
geçerliğini belirlemeye çalıĢıyorum.
ÖNEMLĠ NOTLAR
Yordama ya da uygunluk geçerliğini hesaplamak
istediğiniz testte ölçülen özelliklerle kriter olarak
kullandığınız özellikler benzer olmalıdır.

Ölçüt geçerliğinde ölçütünüz yordamak
özellikle anlamlı bir iliĢki içermelidir.

Yordama geçerliğine iliĢkin katsayının büyüklüğü,
yordayıcı ve ölçütün ( yordanan) güvenirliği ile sınırlıdır.
Bu değer yordayıcı ve ölçüt puanlarının güvenirliklerinin
çarpımının karekökünden fazla olamaz. Örneğin:
istediğiniz
Yordayıcı güvenirliği 0,60 ve ölçüt güvenirliği 0,80 olan bir
testtin yordama geçerliği en fazla kaç olur?
0,60 . 0,80 = 0,48  𝟎, 𝟒𝟖 = 0, 69 ( yaklaĢık)
YAPI GEÇERLĠĞĠ ( TANIMSAL GEÇERLĠK) : Birçok ölçme kitabında yapı geçerliği sadece psikolojik ölçmelerle ilgili
görülmüĢ, eğitimsel ölçmelerde bu tür geçerlik pek söz konusu edilmemiĢtir. Ancak yapı geçerliğinin, geçerliğin tamamı
olarak görülmesi doğru olacaktır. TESTĠN ÖLÇMEK ĠSTEDĠĞĠ YAPIYI ölçüp ölçmediği meselesi
Bir testin yapı geçerliğini belirleme süreci bir ölçüde, bilimsel kuram geliĢtirme süreci ile aynıdır. Yapı geçerliğini
belirlemede Ģu yol izlenir:
a)
b)
c)
d)
e)
f)
Yapı hakkında kuramsal ve iĢevuruk tanımlama yapılır.
ĠĢevuruk tanımlara dayalı hipotezler kurulmalı
Hipotezleri test etmek için araç geliĢtirilmeli
Araç uygun bir gruba uygulanmalı ve veriler toplanmalı
Elde edilen verilerin hipotezi destekleyip desteklemediği belirlenmeli
Destekliyorsa yapının ortaya çıkan özellikleri ortaya konmalıdır.
Yukarıdaki süreci bir örnekle ele alalım: Söz gelimi eğitimin genel hedefleri arasında bulunan “eleĢtirel düĢünme gücü” ele
aldığımızda Ġlkin “EleĢtirel düĢünmenin” kuramsal bir tanımı yapılmalıdır. Sonra “eleĢtirel düĢünen ne yapar?” sorusunu
sorarız. Bu soru soyut bir yapı olan “eleĢtirel düĢünme becerisinin” davranıĢa çevrilmesi ( iĢevuruklaĢtırılmasıdır) yani
hipotezlerin oluĢturulmalıdır. Gözlenebilir tüm davranıĢları sıraladığımızı düĢünelim ( eleĢtirel düĢünen ... yapar vs ) Bu
davranıĢlardan bir tanesi olan “ Çözümü olanaksız problemleri çözüm olanağı olan problemlerden ayırt etme” olsun. Sonra
bu davranıĢı ölçmek için Ģu soruyu sorduk: “ Hangi üç tek sayının toplamı 50 eder?” ( Bu problemin çözümü yoktur toplamı 50
eden üç tek tam sayı yoktur) Bir öğrencinin bu soruya verdiği yanıta göre eleĢtirel düĢünme gücü hakkında yargıda bulunuyoruz:
“ EleĢtirel düĢünebilen kiĢi bu sorunun çözümü olmadığını söyler; ya da bu sorunun çözümü olmadığını söyleyen eleĢtirel
düĢünebiliyordur”
Yapı geçerliği: Doğrudan gözlenemeyen teorik yapıların ( kiĢilik, yaratıcılık, yetenek, ilgi, zeka, tutum, sevgi, merak, problem
çözme, eleĢtirel düĢünme, sosyal uyum, ruh sağlığı, güven – güvensizlik, içedönüklük, dıĢa dönüklük vb) iliĢki içinde olduğu
varsayılan davranıĢlar arasındaki korelasyon değeri yapı geçerliğini verir.
Yapı geçerliği; teste ölçülmek istenen yapının ortaya konulma derecesi olarak tanımlanabilir. Binet’e sormuĢlar zeka nedir?
Yanıt vermiĢ: “ Benim testlerimin ölçtüğü Ģeydir” Buradan çıkaracağımız sonuç Ģudur “ Binet , geliĢtirdiği zeka testlerinin; zeki
insanların davranıĢlarını içerdiğini kabul etmektedir; zeki bireyler onun testlerinde yer alan davranıĢları gösterir; ya da Binet’in
testlerindeki davranıĢları gösteriyorsan zekisin”
Yapı geçerliği; gözlenemeyen ancak kuramsal olarak açıklanan bir psikolojik yapıyı ( örneğin yaratıcılık, otoriterlik vb)
ölçmeyi hedefleyen bir ölçü aracının amacına ne denli ulaĢtığıdır. Yapı geçerliği analizi karmaĢık ve çok yönlü bir süreçtir;
kuramsal olarak varlığı öne sürülen yapının davranıĢlara ne derece yansıdığının ve ölçü aracının maddelerinin
özelliklerinin incelenmesini gerektirir.

Cronbach Alfa, KR-20 , KR-21 güvenirlik katsayılarının yüksek olması ölçme aracının homojenliğine ve dolayısıyla yapı
geçerliğine bir göstergedir ancak kesin kanıt değildir. Yani KR-20 yüksek ise yapı geçerliği kesinlikle yüksektir
diyemezsiniz.
DĠKKAT DĠKKAT DĠKKAT: Birçok konu anlatım kitabında KR-20 yüksek ise yapı geçerliği de yüksektir gibi
HATALI bir ĠFADE GEÇMEKTEDĠR. KR-20 bir güvenirlik ölçüsüdür ki güvenirliğin yüksek olması geçerliğin de
yüksek olacağı anlamına GELMEZ. AMAN DĠKKAT ARKADAġLAR hatalı YORUMLARA aldanmayın...


Ölçme aracından elde edilen puanların kararlılığı ( test – tekrar test güvenirliği) da yapı geçerliği için bir kanıttır. Ancak
kesin kanıt değildir.
Ölçme aracının homojenliği yapı geçerliği için bir kanıttır. Ama kesin kanıt değildir.
Bir Örnekle Daha DüĢünelim: Zeka üzerine geliĢtirilmiĢ birçok kuram vardır. Bu durumda bir zeka testi hazırlanacağı zaman
öncelikle zekanın tanımı ( kuramsal tanımı ) yapılmalı. Daha sonra yaptığımız tanıma göre zeki insanın davranıĢları belirlenmeli
( iĢevuruklaĢtırılmalı ) Sonra bu davranıĢları ölçen bir test hazırlamalıyız. Bu testi zeki olduğunu bildiğimiz ve zeki
olmadıklarından emin olduğumuz iki gruba uygularız. ġayet zeki olduğunu bildiğimiz bireyler bu testten yüksek puan alıyorsa ve
zeki olmayanlar düĢük puan alıyorsa yapı tanımlamamız ve bu tanıma uygun geliĢtirdiğimiz davranıĢlar geçerlidir, deriz.
Yapı geçerliği geçerliği tamamı olarak görülmelidir. ÖSYM’nin geçen sene sorduğu yapı geçerliği sorusu
göstermiĢtir ki birçok kaynakta (defalarca uyarmamıza rağmen) yanlıĢ anlatılmaktadır. Birçok kaynak yapı geçerliğini
sadece psikolojik testlerle ( tutum , ilgi vb ) sınırlı tutmuĢlardır. Yapı gelerliği tanımımızın en baĢını dikkatli okursanız
yapı geçerliği için GEÇERLĠĞĠN TAMAMI ifadesi geçmektedir. YAPI GEÇERLĠĞĠ = GEÇERLĠĞĠN KENDĠSĠ
YAPI GEÇERLĠĞĠNĠ BELĠRLEMEYE YARAYAN BAZI TEKNĠKLER
Bir ölçme aracının yapı geçerliği, bir tek katsayıyla ifade edilmez. Yapı geçerliği belirlenirken birçok yönteme
baĢvurulabilir ve elde edilen sonuçlar, ölçme aracının ölçmek istediği yapıya iliĢkin ya da ölçmek istediği yapıyı ölçüp
ölçmediğine iliĢkin kanıt olarak kullanılabilir.
I.
Ölçme Aracının Homojenliği: Bir testi oluĢturan madde puanları ile toplam test puanları arasındaki korelasyon ( çift
serili korelasyon katsayısı) ölçme aracının homojenliğine, dolayısıyla yapı geçerliğine iliĢkin bir kanıt olarak
kullanılabilir. Madde puanları ile test puanları arasında pozitif yönde ve yüksek bir korelasyon varsa , bu korelasyon
katsayıları, maddelerin aynı yapıyı ölçtüğünün bir göstergesidir.
Ġç tutarlık anlamında kullanılan güvenirlik katsayıları da yapı geçerliğine kanıt olarak kullanılabilir. Alfa, KR-20 ,
KR-21 gibi güvenirlik belirleme yöntemleri ile elde edilmiĢ katsayılar da yapı geçerliğinin göstergesidir. Ancak kesin
kanıt değildir.
II.
Diğer Testlerle Korelasyon: GeliĢtirilen ölçme aracından elde edilen puanlar, aynı yapıyı ölçtüğü bilinen baĢka bir
ölçme aracından elde edilen puanlar arasındaki korelasyon, yapı geçerliğine iliĢkin kanıttır.
III.
Grup Farklılıkları: Deneysel bir yöntemdir ( Deney grubu – kontrol grubu gibi) Bu yöntemde ölçme aracı , ölçülmek
istenen yapı ( mesela zeka ) açısından farklı olduğu bilinen gruplara ( Yüksek zeka düzeyine sahip ve düĢük zeka
düzeyine sahip bireylerden oluĢan gruplara) uygulanır. Ölçülen özelliğe sahip olan grubun puan ortalaması ( zeki
grubun puanları ) ölçülen özelliğe sahip olmayan grubun puan ortalamasından ( zeki olmayan grubun puanları) anlamlı
bir düzeyde farklı olması beklenir.
IV.
Ölçme Aracından Elde Edilen Puanların Kararlılığı: Test – tekrar test yöntemi ile belirlenmiĢ kararlılık katsayısı
yapı geçerliğine bir iĢaret kabul edilir. Ancak kesin kanıt değildir.
V.
Pratik Ölçülerle Korelasyon: Ölçme aracı ile ölçülmek istenen yapı ile onunla yakından iliĢkisi olduğu düĢünülen
baĢka değiĢkenler arasındaki korelasyona bakmak suretiyle, yapı geçerliğine iliĢkin kanıt sağlanır. Örneğin; Bir zeka
testi geliĢtirildiğini farz edelim, zeka testinden elde edilen puanlar ile bir matematik testinden elde edilen puanlar veya
zeka testi ile bir yetenek testinden elde edilen puanların korelasyonuna dayanır. ( Ek açıklama: Zeki insanların
matematik testini yapabileceği var sayılır bu aslında zeka tanımının sayısal zeka Ģeklinde yapıldığını da gösterir.
Buna göre bir ölçme uzmanı geliĢtirdiği zeka testini bir dil testi ile karĢılaĢtırıyorsa zeka tanımını ve iĢevuruk
davranıĢlarını sözel zekaya göre yapmıĢtır) Bu korelasyon yüksek ise yapı geçerliği yüksek kabul edilir.
VI.
Faktör Analizi: Ölçme aracının, ölçtüğü değiĢkenlerin sayısı ve bunların her birinin testin bütününden elde edilen
toplam puanlara katkısı, testin ölçtüğü yapı ve yapıları ortaya çıkarmada kullanılabilir. Açıklayıcı faktör analizinde:
gerçek yapısı bilinmeyen bir kuramsal yapı, ona dönük geliĢtirilen ölçme aracından elde edilen verilere dayanarak
açıklanmaya çalıĢılır. Doğrulayıcı faktör analizinde ise daha önceden var olan ya da bilinen veya kuramsal olarak öne
sürülen bir kuramsal yapıyı, bu yapıyı ortaya çıkarmak amacıyla geliĢtirilen ölçme aracından elde edilen sonuçlara
dayanarak doğrulamaya çalıĢır.
Testteki tüm soruların aynı faktörü ölçüp ölçmediğinin belirlenmesi ya da aynı faktörü ölçen maddelerin bir araya
getirilmesidir. Amaca hizmet eden maddelerin bir araya getirilip amaca hizmet etmeyen maddelerin ayıklanmasıdır.
VII.
Testi cevaplayanlarla nasıl cevapladıkları hakkında görüĢme: Testi çözenlere soruları çözerken nasıl düĢündükleri
sorularak, neden bu yanıtı verdin verirken ne düĢündün gibi sorular yöneltilerek de yapı geçerliği anlaĢılabilir.
VIII.
Uzman görüĢüne baĢvurma:
GÖRÜNÜġ GEÇERLĠĞĠ: “Bundan yıllar yıllar önce, ÖSS’ye hazırlanırken, bir deneme sınavına girmiĢtim. Deneme sınavında
geometri kısmındaki soruları çözerken bir çember sorusu ile karĢılaĢtım. Çember konusuna hakim olmama rağmen analitik
bilgim olmadığı için o soruyu okumadım bile. Çünkü soruya baktığımda analitik bilgisi ölçüyor gibi görünüyordu ancak soru
meğersem çemberde açı bilgisini ölçüyormuĢ”
Yukarıda verilen bir anı örneğinden de anlaĢılabileceği gibi görünüĢ geçerliği bir testin gerçekten ne ölçüğü ile ilgili değil,
onun ne ölçüyormuĢ gibi göründüğü ile ilgilidir.
Matematikle ilgili bir soru hazırlanıyorsa fizik , kimya gibi derslerin kavramları geçmemelidir. Ya da matematikte
temel kavramlarla ilgili soru hazırlıyorsak kullandığımız semboller buna uygun olmalıdır.
Örneğin matematikte sayı problemleri “a+b= 3 , x.y = z” gibi semboller kullanılır. Bir öğretmen tutar da bu semboller yerine hiç
“i + ç = 3 ya da l.u= k” gibi hiç alıĢık olmadığımız semboller kullanırsa görünüĢ geçerliği düĢer. BaĢka bir örnekle ele alalım “
𝑖 2 +3
𝑖 2 = −1 𝑖𝑠𝑒 2 kaçtır?” Sorusu bir karmaĢık sayı sorusu mu yoksa temel matematik becerisi sorusu mu olduğu belli değildir.
𝑖
Yani sorunun görünüĢ geçerliği düĢüktür. Bu yüzden bazı öğrenciler bu soruyu karmaĢık sayı sorusu algıladığı için
yapamamıĢtır.
Ben çarpanlara ayırma konusuna oldukça hakim bir öğrenciyim. Ancak polinomlar konusunu bilmiyorum. Girdiğim bir
sınavda polinom sorusu gibi görünen ancak aslında çarpanlara ayırmayı ölçtüğünü sonradan öğrendiğin bir soruyu sırf polinom
bilgisi ölçüyor gibi göründüğünden yapamamıĢtım.
Yukarıda verilen anı örneğinden de anlaĢılabileceği gibi testin bütünü için söz konusu olan görünüĢ geçerliği testteki her
bir soru için de söz konusudur. Yani matematik testi yazan bir kitapçıktan matematik sorusu gibi görünen sorular
beklenir aynı zamanda o testteki her bir madde neyi ölçmek istiyorsa görünüĢ olarak da öyle olmalıdır.
SORU: “Yarılanma süresi 20 yıl olan bir radyoaktif maddenin 200 yıl sonra ne kadarı kalır?” sorusu hangi alanla ilgilidir
Ģeklinde bir soru 30 öğrenciye sorulmuĢ. Öğrencilerin 16’sı bu sorunun fizik sorusu olduğunu, 10’u kimya sorusu
olduğunu 4’ü de matematik sorusu olduğunu söylemiĢtir. Bu maddenin görünüĢ geçerliği düĢüktür.
GÖRÜNÜġ Geçerliği belirleme yollarından biri de yukarıdaki gibi ANKET uygulamaktır. Anket sınava girenlere
uygulanabileceği gibi paydaĢlara da ( Aile – öğretmen vb ) uygulanabilir.
SORU: “Dün gece Mersin‟de iki taksici gasp edildi” cümlesindeki anlatım bozukluğunun nedeni nedir? Sorusu hangi alanla
ilgilidir? --------------Türkçe dediğinizi duyar gibiyim o halde bu testin görünüĢ geçerliği yüksektir. ( Bu arada hadi bakalım
buradaki anlatım bozukluğunun nedenini de bulun) 
ÇOK ÖNEMLĠ UYARI: Bir baĢarı ( Türkçe – Tarih – Coğrafya – Matematik – Fizik vs) testini piyasaya kabul ettirmek
istiyorsak GÖRÜNÜġ GEÇERLĠĞĠNĠ ARTIRMAK ZORUNDAYIZ. Ancak bir psikolojik testi ( Tutum ölçeği – KiĢilik Testi)
piyasaya kabul ettirmek istiyorsak GÖRÜNÜġ GEÇERLĠĞĠNĠ DÜġÜRMEK ZORUNDAYIZ. Çünkü psikolojik testlerde
görünüĢ geçerliği yüksek olursa testi çözen kiĢi gerçekçi yanıt vermez ( Sosyal kabul hatası ) . Bir örnekle ele alalım:
Bir kiĢilik testinde Ģöyle bir soru sorulsa: “Paraya mala mülke değer verir misin?” Bu sorunun görünüĢ geçerliği oldukça
yüksektir ve bu soruyu yönelttiğimiz kiĢi muhtemelen “Değer vermem ” diyecektir.Ancak bu sorunun görünüĢünü
gizlemek ( görünüĢ geçerliğini düĢürmek) gerekir. DüĢürelim bakalım ne olacak  Bir gün otobanda kendi araban ile
giderken yolda bir adamın yaralı yattığını gördün. Adamın baĢında bir doktor ve önceden beri hayranlık duyduğun bir kız var.
Arabanda yalnızca bir kiĢilik yer var, yaralıyı alırsan kızı kaçıracaksın, kızı alırsan yaralıya yardım edemeyeceksin ne yaparsın?
Bu soruya genelde kiĢilerin yaralıyı alırdım dediği gözlenmiĢtir. Ancak birçok kiĢi arabamı doktora veririm hem yaralı hastaneye
gider hem de sevdiğim kızla zaman geçirir – tanıĢırım dememiĢtir. Yani malları onlar için kıymetli ĠĢte bu yüzden psikolojik
testlerin görünüĢ geçerliği düĢürülmelidir. !!!
Sınıflama ve Sıralamaya Dayalı KARAR GEÇERLĠĞĠ: Eğitimde ve psikolojide, ölçme araçlarından elde edilen sonuçlara
dayanarak bireyler hakkında karara varılır. Yapılan ölçmelerin iki temel problemi;
1.
2.
Testin ölçmek istediği değiĢkeni ya da özelliği ne derece ölçebildiği
Testin doğru kararlar verebilmek için ne derecede kullanılabilir olduğu yani testi kullanarak ne derece doğru kararlar
verilebileceğinin belirlenmesidir.
Testlerin sonucuna göre verilen kararların doğruluğu eğitim ve psikoloji açısından çok önemlidir. Testlerin sonucuna göre
verilecek kararların doğruluğu testlerin geçerliliği ile doğrudan iliĢkilidir. Karar vericiler açısından bakıldığında, geçersiz bir
testin sonunda verilen kararların etkisiz olacağı, bireyler açısından bakıldığında ise geçersiz bir testin sonucunda verilen
kararların adil olmayacağı ileri sürülebilir.


Eğitimde bireyler hakkında verilen kararların çoğu; geçti – kaldı veya baĢarılı – baĢarısız gibi sınıflama düzeyindedir. Ölçme
sonuçları hangi ölçek düzeyinde olursa olsun, bir ölçüte dayanarak veriler sınıflama düzeyine indirgenebilir. Bu aĢama
değerlendirme aĢamasını oluĢturur ve asıl amaç da bu nihai karara ulaĢmaktır.
Ölçme sonuçları ikili düzeye indirgendiği için aslında geçecek birey için kaldı, kalacak birey için de geçti demek gibi,
ölçütün altında veya üstünde kalan bireylerin hatalı sınıflanma olasılığı da vardır. Bazen eğitimde, kullanılan ölçme aracına
dayalı ölçülen özellik açısından bireyler sıralanabilir. Ölçme aracı ne kadar güvenilir olursa olsun bireyleri ölçülen özellik
açısından doğru ya da yeterli sınıflamıyor ya da sıralamıyor olabilir. Ölçme aracının bu özelliği ölçülen özellik açısından
bireylere dönük alınacak kararlar üzerinde son derece etkilidir. Bu durumda ölçme aracının belli ölçüt ya da ölçüt
takımlarına göre ölçülen özellik açısından bireyleri doğru sınıflayıp sınıflamadığı ya da sıralayıp sıralamadığı
araĢtırılmalıdır.
KULLANIġLILIK: Geçerlik ve güvenirlik gibi teknik özelliklerin yanında bir ölçme aracında bulunması gereken bir diğer özellik de
kullanıĢlıktır. KullanıĢlık özelliğini, ölçme aracını kullanmasını gerektirecek durumlara iliĢkin gereksinimleri tatmin edici bir Ģekilde hizmet
etme derecesi olarak tanımlamıĢtır.

Bir testin kullanıĢlığı; onun geliĢtirilmesi, çoğaltılması, uygulanması ve puanlanmasının kolay ve ekonomik olması Ģeklinde tanımlanır.

Ekonomiklik, uygulanabilirlik ve puanlanabilirlik açısından ele alınmalıdır.
Ekonomiklik: Ölçme aracının zaman, Uygulanabilirlik: Bir ölçme aracı ya Puanlanabilirlik: Ölçme aracının puanlanabilirlik
para, emek açısından ekonomik olması da testin uygulanabilirlik özelliğine özelliğine sahip olabilmesi için ölçme aracı veya yanıt
demektir. Ölçme aracı hazırlayan sahip olabilmesi için ölçme aracının ya kağıdı ( formu) öğrenci yanıtlarını uygun biçimde almak
kiĢiye ve diğer okul personeline çok da testin yönergesi ve test ile ilgili için öğrencinin kolayca anlayabileceği ve algılayabile-ceği
fazla mali yük getirmemelidir. açıklamalar açık seçik ve öğrencinin biçimde düzenlenmeli. Yanıt anahtarı dikkatli ve özenle
Ekonomiklik ne ucuz test ve anlayabileceği Ģekilde olmalı, ölçme doğru hazırlanmalı, kullanımı kolay, anlaĢılır ve pratik
yöntemleri geliĢi güzel kullanmayla aracının ya da testin biçimsel olmalı, güvenilir bir puanlamaya olanak sağlamalı
sağlanabilir ne de pahalı araçları ya da özellikleri ( formatı) uygun ve anlaĢılır
yöntemleri
tercih
doğrudur. olmalı , eğer ölçme aracı ya da test 
Puanlayıcı ölçme aracına iliĢkin puanları kolay doğru
Ekonomiklik ölçme aracının geçerlik çeĢitli materyalleri veya parçaları
ve hızlı elde edebilmelidir. Bir testin puanlamasını
ve güvenirlik gibi teknik özelliklerinin içeriyorsa bu parça veya materyaller
kolaylaĢtırabilmek için bir çok yöntem vardır. ÇeĢitli
göz önünde tutularak olabildiğince kolayca ve anlamlı bir biçimde
test tipleri ve uygun puanlama yöntemleri üzerinde
ucuza mal edilmesidir.
birleĢtirilebilir
ve
kullanılabilir
ileriki bölümde durulacaktır.
olmalıdır. Testi uygulayan kiĢi ya da
kiĢiler gereksiz çaba sarf etmeden testi

Ekonomiklik ucuzculuk olarak
kullanabilmeli
ya
da
düĢünülmesin
geçerlik
ve
güvenirlik açısından iyi bir testi uygulayabilmelidir.

en uygun maliyete mal etmektir.
Yazılı
yoklamalar
hazırlanıĢ
açısından ekonomik iken çoktan
seçmeli testler hazırlanıĢ açsından
maliyetli olabilir.

Testin sayfa düzeni, yazı düzeni,
satır aralıkları yazı stili ve puntosu
gibi genel biçimsel özelliklerine
dikkat edilmeli, öğrencilerin test
maddelerini kolayca algılayacağı
biçimde düzenlenmelidir.
Özetle kullanıĢlık bir testin hazırlanıĢ, uygulanıĢ ve puanlanıĢ aĢamalarında öğretmen ve öğrencilerin iĢini en az maliyet , zaman ve
emekle görmelerine dönük bir kavramdır. Bazen kullanıĢlığın artırılması geçerliği ve güvenirliği düĢürebilir ya da geçerlik ve
güvenirliğin artırılması kullanıĢlığı düĢürebilir.