ÖLÇME ve DEĞERLENDĠRME ( 1 ) Bilimsel AraĢtırma Yöntemleri Ölçme ve Değerlendirmenin Temel Kavramları Ölçme Araçlarında Bulunması Gereken Özellikler ÇalıĢma ve Yapılandırma soruları ÖLÇME ve DEĞERLENDĠRME ( 1) 1. 2. 3. 4. Alpay KÖSE Ölçme ve Değerlendirme 2 Kapsadığı Konular BĠLĠMSEL ARAġTIRMA YÖNTEMLERĠ Bu dergide geçen konuları birçok yayında GeliĢim Psikolojisi baĢlığında iĢlendiği dikkatinizi çekmiĢtir. Ben bu konuyu Ölçme ve Değerlendirme kapsamında ele alacağım. Ancak bahsettiğimiz Ģeylerin psikolojide kullanılan araĢtırma yöntemleri olduğunu unutmayın. Neden burada anlatıyoruz; burada bahsettiklerimizle ölçmede bahsedeceklerimiz sıkı iliĢkili. Ayrıca burada bahsedeceklerimiz her alanda karşınıza çıkabilir ( Rehberlik – öğretim – gelişim vs) Önemli bir konudur. Hakim olmanızda fayda var. Önceleri daha çok yüksek lisans öğrencilerine verilen bilimsel araĢtırma yöntemleri dersi artık birçok üniversitede lisans düzeyinde de verilmektedir. Bu yüzden ÖSYM konu ile ilgili soru sormaya baĢlamıĢtır. Konu olduça önemlidir. Birkaç kısmı dıĢında oldukça da kolaydır. EĞĠTĠM PSĠKOLOJĠSĠNDE KULLANILAN ARAġTIRMA YÖNTEMLERĠ Betimsel YaklaĢımlar Deneysel Yöntemler Betimsel araĢtırma, belli durumlara iliĢkin ayrıntılı bilgi toplayan çalıĢmalardır ve sıklıkla tarama, görüĢme, kayıt tutma, gözlem, testler, anket, örnek olay, vaka incelemesi, ya da bunların birleĢimi kullanılır. Bağımlı değiĢken Bağımsız değiĢken Ara değiĢken Deney grubu Kontrol grubu Plasebo DeğiĢkeni ve Placebo Grupları Deneysel ya da ilişkisel ( korelasyon) çalışmaları kadar bilimsel bir nesnelliğe sahip olmasa da bu zayıflığını, zengin ayrıntı ve yorumla kapatır. Yani Betimsel yaklaşımlar bize ayrıntılı bilgiler sunarken çok bilimsel yöntemler değildir. ĠliĢkisel Yöntem ( Korelasyon) Yüksek korelasyon DüĢük korelasyon ĠliĢkisizlik ( Nötr) Bilimsel Yöntemin AĢamaları 1. 2. 3. 4. Çözülecek problemleri ya da araĢtırmada yanıtlanacak soruları belirleme Sınanacak önermeler Ģeklinde denence ( hipotez) geliĢtirme Önermelerin doğrulunu ya da yanlıĢlığını belirlemek için araĢtırma yaparak denenceleri test etme AraĢtırmada elde edilen sonuçları bir kuram Ģekilde ifade etme A. BETİMSEL YÖNTEMLER Gözlem: Bireyin kiĢi, eĢya ve olaylar hakkındaki gözlemlerini sayısal olarak belirlemeye çalıĢan yöntemlerdir. Gözlem kendi içinde kendiliğinden oluĢan ( doğal) ya da bilinçli olarak hazırlanan ( Sistematik) olayları belirlenen sırada, sistematik ve amaçlı bir Ģekilde incelemektir. Bilimsel gözlem sistemli ve amaçlı yapılır. Yani ister doğal gözlem ister sistematik gözlem olsun tüm gözlemler sistemli ve amaçlıdır. ġayet gözlenecek olayı gözlemci tasarlamıĢsa ( deney – laboratuvar ortamında olduğu gibi ) bu sistematik gözlemdir. Ancak doğadaki kuĢların yuva yapma davranıĢlarını gözleyen bir gözlemci de bu gözlemlerini sitemli Ģekilde kaydeder ve bir amaçla bu gözlemi yapar.Ancak bu sefer ortama müdahale etmez buna da doğal gözlem denir. Doğal Gözlem: Çoğu geliĢimcinin tercih ettiği yöntem doğal gözlemdir. Doğal gözlem insanları kendi doğal ortamlarında ( örneğin evde, okulda ya da oyun alanında) günlük etkinliklerini yaparken gözlemlemek ve hipotezleri test etmektir. Gözlemci kendi duyu organları ile bunu yapabileceği gibi teknolojik kayıt cihazları ( kamera vs) kullanabilir. Gözlemlerde her davranıĢ kayda alınmaz; önemli davranıĢlara dikkat edilir. Örneğin “Çocuklarda saldırganlık davranıĢlarını inceliyorsak bu tip ya da saldırganlıkla ilgili davranıĢları kayda alınırken, önemsiz Ģeyler kayıt altına alınmaz” Bu yöntemin iki önemli faydası vardır; birincisi sözel beceriler gerektiren yöntemlerle incelenemeyen bebeklere kolayca uygulanması ve insanların ( gözlendiklerinden haberdar olmadıkları için) günlük yaĢamlarında gerçekten nasıl davrandıklarını ortaya koyabilmesidir. Etnografya: AraĢtırmacının bir kültür ya da alt kültürün kendine özgü değerlerini, gelenek ve sosyal süreçlerini anlamak için o kültürün üyeleriyle yaĢayarak ve yoğun gözlemler yaparak ve notlar tutarak yaptığı araĢtırma yöntemidir. Aylar hatta yıllar boyu sürebilir. Örneğin Afrika‟da bir kabilenin dilini araĢtıran bir araĢtırmacı orada 4 yıl kalmıĢ ve o kabile üyeleri ile yaĢamıĢtır. Bu yönüyle baktığımızda gerçekleĢen durum doğal bir gözlemdir. Sınırlı yanları ise araĢtırmacının o kütlüde dönük önyargılarının araĢtırmanın nesnelliğini zedelemesi ve elde edilen bulgular sadece o kültüre özgü olması diğer kültürlere genellenememesi. Sistematik Gözlem ( YapılandırılmıĢ Gözlem) : AraĢtırmacının deneğin tepkilerini bir laboratuvar ortamında gözlemlediği ve ilgilenilen davranıĢın ipuçlarını topladığı bir gözlem türüdür. Örneklemdeki her katılımcı, aynı uyarıcıya maruz kalır ve böylece hedef davranıĢı göstermede eĢit fırsatlara sahip olurlar. KoĢullar herkes için aynıdır. YapılandırılmıĢ gözlemde her katılımcı, araĢtırılacak davranıĢa ipucu olabilecek bir ortama ( gözlemci tarafından düzenlenmiĢ bir ortama – laboratuvar – özel düzenlenmiĢ bir ortam) konur. Sonra gizli bir kamera ya da tek yönlü bir ayna (Ġçerden bakındığında dıĢarının görülmediği - ayna sanıldığı ; filmlerde polislerin durduğu ve içerdeki zanlıyı gözlemledikleri aynalı camlar) ile gizlice gözlenir. Yani gözlenen gözlendiğinin farkına varmaz. Doğal ortamda sıkça gösterilmeyen davranıĢların araĢtırılmasında kullanılır. Sistematik gözlemler doğal gözleme göre daha ekonomiktir. Yine sistematik gözlemlerde sonuca daha çabul eriĢilir. Testler: Psikologlar bireylerin zeka, baĢarı, mesleki ilgi, yetenek ve kiĢilik gibi belirli özelliklerini ölçmek için çok çeĢitli testler geliĢtirmiĢlerdir. Bilimsel araĢtırma yapılırken testler kullanılır. Testlerin geçerli ve güvenilir olması Ģarttır. Örneğin bir zeka testinden beklediğimiz matematik bilgisini ölçmesi değil zekayı ölçmesidir. Ve bu ölçümleri yaparken , tutarlı ve kararlı olması gerekir. ( Ġlerde geçerlik ve güvenirlik konusunda ayrıntılı iĢleriz. ) Anket ( Survey): Anketler, yaĢça büyük çocuklar ve ergenlerden bilgi toplamak üzere kullanılır ( GeliĢim psikolojisi için ) AraĢtırmaya katılanlardan daha önceden hazırlanmıĢ sorulara yanıt vermeleri beklenir. Anketler bilimsel araĢtırma amaçlı herkese uygulanır. Ancak program geliĢtirme dersinde göreceğimiz anketler Programın Ġhtiyaçlarını saptama amaçlı kullanılır. Bu yüzden program geliĢtirme çalıĢmalarında anketler sadece uzmanlara uygulanır. Ġki durumu karıĢtırmayalım !!! Anketler, çok sayıda kiĢinin oldukça kolay bir Ģekilde posta yoluyla ya da en az düzeyde maliyetle incelenmesi taranması) olumlu bir yönüdür. ( Anketlerde çok sayıda soru bulunur. Soru listeleri ise; verilerin hızlıca ve kolayca elde edildiği anketin kısaltılmıĢ formlarıdır. Vaka ( Olay ) Ġncelemesi: Bir kiĢinin özel olarak ve çok detaylı davranıĢ boyutlarında incelenmesidir. Yani kapsam çok geniĢ değildir; bir durum üzerinde derinliğine inceleme söz konusudur. Bireyin yaĢamındaki önemli olaylar derinliğine incelenir. ( Örneğin bireyin çocukluk döneminde duygusal geliĢimine yönelik bazı olaylar çok derin bir Ģekilde incelenir – analiz edilir.) Bilirsiniz ki psikologlar sizin çocukluğunuza bir inelim derler ve çocukluk döneminizi derinliğine incelerler iĢte o esnada yaptıkları vaka incelemesidir. Sizin çocukluğunuzdaki önemli olayları derinliğine inceliyorlardır. Bu durum bir sınırlılığı ortaya koyuyor. Vaka incelemelerinde elde edilen sonuçlar diğer bireylere genellenemez. Çünkü ele alınan olaylar o kiĢiyi ilgilendirmektedir. Freud ve Darwin çalıĢmalarında bu yöntemi kullanmıĢlardır: Vaka çalıĢmaları TEK BĠR KĠġĠ üzerine de yapılabilir. Örneğin: Freud’un yaklaĢımına getirilen eleĢtirilerden biri, duygusal yönden rahatsızlığı olan hastaların yaĢamlarından verilerin elde edilmesi ve bu verilerin genel evreni yansıtmamasıdır. Bu nedenle olay incelemelerinden çıkarılan sonuçlar diğer araĢtırma teknikleri kullanılarak desteklendiğinde geçerli kabul edilmelidir . Vaka incelemesi yapmadan önce kiĢinin kimlik bilgilerinden aile bilgisine, yeteneklerine, ilgilerine, arkadaĢ çevresine, geçirdiği hastalıklara kadar birçok konuda kiĢi hakkında bilgi toplanır. Bu toplanan bilgilerin hepsine VAKA TARĠHÇESĠ denir. Psikofizyolojik Yöntemler: Çocuğun algısal, biliĢsel ve duyuĢsal tepkileri altındaki biyolojik durumları anlatmak için, fizyolojik tepkiler ile davranıĢları arasındaki iliĢkiyi araĢtırır. Buna en güzel örnek olarak yalan makineleri verilebilir. KiĢinin söyledikleri ile fizyolojik tepkileri ( kalp atıĢı ) arasındaki bağ belirlenir. Örneğin bir banka soyguncusuna önce konu dıĢı sorular sorulur ( Anne adı, baba adı, kardeĢ sayısı, tuttuğu takım vs vs sonra bankayı çağrıĢtıracak bir soru sorulur ne kadar para kazanıyorsun Ģayet kiĢi bu soruyu yanıtlarken kalp atıĢında önceki sorulardan farklı bir hızlanma olursa yalan söylediğine dair bir ipucu kabul edilir) Son zamanlarda beyin dalgaları ile yapılan ölçümler de geliĢtirilmiĢtir. DavranıĢlarımızla beyin dalgalarımız arasındaki iliĢki ortaya konur. ( Bir nevi düĢünce okuma ; ama bugünkü teknoloji ile kesin bilgiler elde edildiği iddia edilmez) GörüĢme: GörüĢme yüz yüze yapıldığından tepkileri netleĢtirmek için açımlayıcı sorular sorularak ayrıntılı ve kiĢisel bilgiler elde edilebilmektedir. GörüĢmede olaylardan çok bireylerin olaylara iliĢkin duyguları, düĢünceleri ve tutumları ele alınmaktadır. GörüĢmenin bir diğer üstünlüğü ise, görüĢmecinin ihtiyacına bağlı olarak, çok çeĢitli konuların incelenmesine fırsat veren esnek bir yöntemdir. Çocukla görüĢme ( biraz zaman alıcı olabilir) , aile ile görüĢme , yaĢıt ve öğretmenle görüĢme gibi türleri vardır. Klinik Yöntem: Bir katılımcının her aĢamalı soruya verdiği cevaba göre, araĢtırmacının bir sonrasında ne soracağını belirlediği bir görüĢme türüdür. Bu yöntemle tek bir insanın o andaki davranıĢı gözlenir ve anlamaya çalıĢılır. Katılımcının cevabından sonra araĢtırmacı katılımcıya tipik olan ikinci bir soru sorar ya da katılımcının ilk cevabını belirgin hale getirmek için ona yeni bir görev ( iĢ ) verir. Piaget tarafından sıklıkla kullanılan bu yöntem, uygulayıcının öznel yorumlarına – bilgi birikimine bağlı olduğu için diğer araĢtırma tekniklerinden elde edilen verileri de kullanarak desteklemek her zaman arzu edilir. Piaget’nin en çok eleĢtirilen yanlarından biri de Klinik Yönteme çok güvenmesi ve bu yöntemi çok sık kullanmasıdır. Örnek: - Piaget: Yalanın ne olduğunu biliyor musun? - Çocuk: O, doğru olmayan Ģeyi söylediğinde olur. - P: 2+2=5 bir yalan mı? - Ç: Evet bu bir yalan - P: Niçin? - Ç: Çünkü bu doğru değil. - P: 2+2=5 diyen bir çocuk bunun doğru olmadığını mı söyledi yoksa bir yanlıĢ mı yaptı? - Ç: O yanlıĢ yaptı - P: Eğer o bir yanlıĢ yaptıysa, bir yalan mı söyledi ya da söylemedi mi? - Ç: Evet, o bir yalan söyledi. B. ĠLĠġKĠSEL ( KORELASYON) YÖNTEM KORELASYON Pozitif Korelasyon : DeğiĢkenlerin birlikte azalıp birlikte çoğaldığı bağıntıdır. Doğru Orantı Katsayı iĢareti + yöndedir. +1 e yaklaĢtıkça güçlenen pozitif korelasyon vardır. Yemek yeme – Kilo Sigara içme – Kanser riski Para – Refah Eğitim düzeyi – ĠĢ olanakları Negatif Korelasyon: DeğiĢkenlerden biri artarken diğeri azalır. Ters Orantı Katsayı iĢareti – yöndedir. -1 e yaklaĢtıkça güçlenen negatif korelasyon vardır. Ders çalıĢmaya istek – zayıf not Spor yapma – kilo alma Eğitim düzeyi – kavgacı yapı Ekonomik refah – terör Korelasyon deneysel çalıĢmaya konu olabilecek iki değiĢkenin birbiri ile ilgileĢimidir. Korelasyon katsayısı 0’a yaklaĢtıkça korelasyonun gücü azalmaktadır. -0,99 - 0,54 - 0,089 Büyükten küçüğe doğru sıralama ( Sayıların Mutlak Değeri Önemlidir) +0,99 + 0,54 + 0,099 Büyükten küçüğe doğru sıralama ( Sayıların Mutlak Değeri Önemlidir) ĠliĢkisizlik ( Korelasyon Katsayısının 0 Olması ) : Ġki değiĢken arasında herhangi bir ilgileĢim yoktur. Katsayı 0‟dır Sağlıklı beslenme – okunan kitap sayısı Boy uzunluğu – zekâ A B C D E A 0,45 0, 30 0,20 -0,40 B 0,45 -0,90 0,85 -0,50 C 0,30 -0,90 0,25 -0,70 D 0,20 0,85 0,25 -0,43 E -0,40 -0,50 -0,70 -0,43 Yukarıda beĢ harfle ifade edilmiĢ değiĢkenlerin birbirleriyle olan korelasyon (ilgileĢim) katsayıları verilmiĢtir. Buna göre tablodan aĢağıdakilerden hangisi çıkarılamaz? A) En güçlü korelasyon B ile C arasındadır. ( Doğru = -0,90 ile en güçlü iliĢki ( Mutlak değer) B) E‟nin en güçlü korelasyonu A iledir. ( YanlıĢ = E’nin en güçlü iliĢkisi C iledir ; - 0,70 ( Mutlak değer) C) B ile D arasında güçlü + korelasyon vardır. ( Doğru= B ile D arasında + yönde korelasyon vardır) D) En zayıf korelasyon A ile D arasındadır. ( Doğru = A ile D arasındaki korelasyon katsayısı 0,20 ) E) E değiĢkeni artarken C değiĢkeni azalmaktadır. ( Doğru= E ile C arasında – iliĢki var o halde test orantı olur ve biri artarken diğeri azalır ) Bir araĢtırmada A ve B değiĢkenleri arasındaki korelasyon değeri sıfıra ( 0 ) yakın bulunmuĢtur. Bu değiĢkenler aĢağıdakilerin hangisinde verilenler olabilir? A) Boy - Ağırlık B) Dengeli beslenme – sağlık C) Sigara içme – sağlık D) Yüzük takma – deri hastalıkları E) Kalkınmışlık – Eğitim düzeyi Korelasyon 0’a yakın çıkmıĢsa, A ile B arasında bir iliĢki yok ya da çok düĢük bir iliĢki vardır. ġimdi 1000 kiĢi üzerinde bir araĢtırma yapsak ( Deri hastalığı olan) kaçının deri hastalığının sebebi yüzük takması olur? Tabi ki ya hiçbirinin ya da birkaçının bu da yüzük takma ile deri hastalıkları arasında düĢük bir korelasyon çıkmasına neden olur. Korelasyon 0’a yakın çıkar. ( Yanıt D) AĢağıda verilen korelasyon katsayılarından hangisi kilolu olma ile resim yeteneği arasındaki ilgileĢimi verebilir? A) 0,90 B) -0,89 C) 0,30 D) 0,04 E) 0,70 Kilolu olma ile resim yeteneği arasında çok bir iliĢki yoktur. Bu yüzden 0’a yakın bir değer çıkmalı 0’a en yakın değer de 0,04’tür. ( Matematiği iyi olmayan arkadaĢlar için uyarı 0,3 ; 0,04‟ten büyüktür. Pratik olarak nasıl ayırırız. Ġkisinin de virgülden sonraki ilk rakamına bakın 0,04 – 0,3 birinin 0 diğerinin 3 bu durumda 0,04‟ün virgülden sonraki ilk rakamı 0 olduğu için o daha küçüktür. ; baĢka bir örnek 0,19 mu büyük 0,2 mi? Tabii ki 0,2 daha büyük çünkü virgülden sonraki ilk rakamı 2 diğerinin ise 1) C. DENEYSEL YÖNTEMLER Neden sonuç iliĢkilerini test etmek için pek çok araĢtırmacının baĢvurduğu bir araĢtırma desenidir. Katılımcılar iki gruba ayrılır ( Deney ve Kontrol ) ve deney grubundaki deneklere müdahalede edilir ( maniple edilir) Bu müdahalenin etkisi araĢtırılır. Bir örnekle ele alalım: “Okullarda sınıf içi mesleki rehberlik etkinliklerinin öğrencilerin mesleki olgunluklarına etkisini araĢtıran bir deneysel çalıĢmada” Öncelikle Ģunu belirtelim ki deneysel çalıĢmalar bir neden sonuç iliĢkisi kurmaya yarar. Ve deneysel çalıĢmalara konu olacak cümleler bir neden sonuç cümlesi niteliğinde olmalıdır. Bu örnekte de bir neden sonuç iliĢkisi vardır. “Mesleki rehberlik uygulamalarının” “Mesleki olgunluğa” etkisi araĢtırılmaktadır. Bağımsız DeğiĢken: Etkisi olan, faktör vs. Sebep – sonuç iliĢkisindeki sebep ifadesidir. Bağımlı DeğiĢken : Etkilenen, Sebep – sonuç iliĢkisindeki sonuç ifadesidir. Ara DeğiĢken ( Konrol DeğiĢkenler) : Bağımlı değiĢkeni aynen bağımsız değiĢken gibi etkileyen ancak araĢtırmada ele alınmadığı için kontrol altında tutulması gereken değiĢkendir. ġimdi yukarıdaki örneğimize geri dönelim. AraĢtırmada mesleki rehberlik uygulamalarının , mesleki olgunluk üzerindeki etkisi araĢtırılıyordu. Bu durumda mesleki olgunluğu etkileyen faktör “mesleki rehberlik uygulamalarıdır” Bu durumda, mesleki rehberlik uygulamaları sebep olduğu için bağımsız değiĢken, mesleki olgunluk da bu değiĢkene bağlı olarak değiĢeceğinden “mesleki olgunluk” bağımlı değiĢkendir. ġimdi çok dikkatli okuyun. Bir insanın “mesleki olgunluğunu” sadece “ mesleki rehberlik hizmetleri” mi belirler. Tabii ki hayır. Bir kiĢinin “mesleki olgunluğunu” etkileyen birçok faktör vardır. Ancak araĢtırmamızın bağımsız değiĢkeni bir tanedir. Bu durumda araĢtırmacıya düĢen görev “deneysel kontrol” sağlaması ve “ara değiĢkenleri” kontrol etmesidir.. Yani mesleki olgunluğu etkileyen diğer tüm faktörleri kontrol etmeli ve araĢtırma sonuçlarını etkilemesinin önüne geçmelidir. ( Yani diyelim ki çocuklar üzerinde 3 aylık süren bir çalıĢma olsun. Bu 3 ayda çocuklarda meydana gelen değiĢikliğin “verdiğimiz mesleki rehberlik hizmetlerinden” olduğundan emin olmamız gerekir. ġayet çocuklardaki değiĢme araĢtırma konumuzun dıĢındaki bir değiĢkenden kaynaklandı ise DENEYSEL KONTROL sağlanmamıĢ demektir. Deney Grubu : AraĢtırmada kullanılan bağımsız değiĢken ile müdahale edilen gruptur. Yani deney grubu araĢtırmacı tarafından belirlenen bir etkinliğe katılan gruptur. Kontrol Grubu: AraĢtırmada kullanılan bağımsız değiĢken ile müdahale edilmez. Sadece kontrol amaçlı olan gruptur. Yukarıda verdiğimiz örneğe geri dönersek: bir grup öğrenciye eğitsel rehberlik etkinlikleri verilirse bu grup ( Deney grubu) diğer grup öğrenciye ise eğitsel rehberlik etkinlikleri verilmeyip baĢka Ģeyler yaptırılırsa ( Kontrol Grubu) ÇOK ÖNEMLĠ UYARI: Yaptığınız çalıĢma sonunda deney grubu öğrencileri ile kontrol grubu öğrencileri arasında anlamlı bir fark oluĢmuyorsa ya kurduğunuz neden sonuç iliĢkisi anlamsızdır ya da deneysel çalıĢmanıza kontrol edemediğiniz değiĢkenler karıĢmıĢtır ( Ara değiĢkenler) Placebo Kontrol Grubu nedir? Tıp dünyasında kullanılan bir terim olan placebo etkisini önce kısaca anlatayım. Placebo etkisi, herhangi bir biyolojik etkisi olmayan bir Ģekerin vb. hastaya ağrı kesici olarak verilmesi ve hastanın bu hapı ağrı kesici sanarak içtiği için psikolojik olarak rahatlamasıdır. Farklı örnekler de verilebilir en yalın söylemi ile budur. Placebo Grubu ise bilimsel araĢtırmaların deneysel çalıĢmalarında yer alan bir tür kontrol grubudur. Hatta bilimsel çalıĢmalarda Placebo Kontrol Grubu (PKG)olarak da geçer. Bir örnekle ele alalım: “BiliĢsel davranıĢçı yaklaĢımla bütünleĢtirilen hobi-terapi uygulamalarının örgüt depresyonuna etkisi” konulu bir deneysel çalıĢmanın Bağımsız DeğiĢkeni: BiliĢsel davranıĢçı yaklaĢımla bütünleĢtirilen hobi-terapi uygulamaları Bağımlı DeğiĢkeni: Örgütsel depresyon Ġki okuldan seçilen öğretmenler random yoluyla ( Rastgele) deney ve kontrol grubu olarak oluĢturulur. Deney grubu öğretmenlerine 6 hafta boyunca “ BiliĢsel DavranıĢçı YaklaĢımla BütünleĢtirilen Hobiterapi Uygulaması” yapılırken kontrol grubu öğretmenlerine oturumluk “Sınıf Yönetimi” eğitimi verilir. ĠĢte burda deney grubuna verilen ve aslında örgüt depresyonu üzerinde etkisi pek olmayan ( ?!) “Sınıf Yönetim” eğitimi placebo niteliğindedir. Bu noktada kontrol grubumuz aynı zamanda placebo grubu ya da placebo kontrol grubudur. Örnek Durum ( Analiz ÇalıĢması Yapacağız Dikkatli Olun) Deney Konusu: “Tam öğrenme uygulamalarının öğrencilerin Türkçe dersi baĢarı testlerine etkisi” Hipotez: “Tam öğrenme uygulaması yaptığımız öğrencilerden oluĢan deney grubu öğrencilerinin Türkçe dersi baĢarı testlerinden elde ettikleri puanlar, tam öğrenme uygulaması vermediğimiz öğrencilerden oluĢan kontrol grubu öğrencilerinin Türkçe dersi baĢarı testlerinden elde ettikleri puanlardan fazla olacaktır.” Analiz: Deneyin bağımsız değiĢkeni “ tam öğrenme uygulamaları” bağımlı değiĢkeni “Türkçe dersi baĢarı puanı”dır. I. AĢama : Deney ve kontrol gruplarına deney öncesinde bir ön test uygulanır. Ve sonuçlarına bakılır. Grup D Grubu K Grubu Türkçe Dersi Öntest A.O Türkçe Öntest (Standart Sapma) 56 55 12 11,5 Testi S.S NOT: Dikkat ettiyseniz deneyin baĢında uygulanan öntestte kontrol ve deney grubu öğrencilerinin baĢarı puanları ve standart sapmaları birbirine yakın. Zaten olması gereken de budur. ġayet birbirinden farklı çıksaydı grupların yeniden oluĢturulması gerekirdi. Çünkü deneysel çalıĢmalarda deneyin baĢlangıcında DENEY GRUBU ve KONTROL GRUBU öğrencileri her açıdan EġĠTLENMELĠDĠR. ( HOMOJEN OLMALILAR) II. AĢama : Deney grubu öğrencilerine tam öğrenme uygulamaları ile ders anlatılır ( 2 ay boyunca) Kontrol grubu öğrencilerine ise tam öğrenme uygulamaları yaptırılmaz. III. AĢama: 2 ay sonra deney grubu ve kontrol grubu öğrencilerine son test uygulanır. Türkçe Dersi Öntest A.O Türkçe Testi Öntest S.S Grup (Standart Sapma) D Grubu K Grubu 81 57 19 12.1 NOT: ġayet deneysel çalıĢmamızın sonucunda böyle bir tablo oluĢursa hipotezimiz doğrulanır. Dikkat ettiyseniz kontrol grubunda kayda değer bir değiĢme olmadığı halde deney grubunun Türkçe dersi baĢarı testi puan ortalamasında artıĢ olmuĢtur. Demek ki “tam öğrenme uygulamaları” ( Bağımsız değiĢken) “Türkçe dersi baĢarı puanlarını” ( Bağımlı değiĢken) etkilemektedir. SORU: Diyelim ki Kontrol grubunun puanları da artmıĢ olsaydı yani son testte kontrol grubu öğrencileri de 80 puan alsaydı, bu durumda deneysel çalıĢmamıza kontrol edilemeyen bazı değiĢkenlerin karıĢtığını söyleyebiliriz. ( Kontrol değiĢkenleri) O zaman deneysel çalıĢmanın geçerliği düĢer. Deneyci deneysel kontrolü sağlayamamıĢ olmalıdır. Ayrıca Deney grubu öğrencilerindeki bu puan artıĢının “Tam öğrenme uygulamalarından” kaynaklı olduğundan da emin olmalıyız. 2 ay içersinde özel ders aldıkları için puanları artmıĢsa deneysel çalıĢmamız yine geçerli değil; çünkü yine deneysel kontrol sağlanamamıĢ olurdu. O HALDE DENEY YAPARKEN BAĞIMSIZ DEĞĠġKEN DIġINDA TÜM FAKTÖRLERĠ KONTROL ALTINDA TUTMAMIZ GEREKĠYOR… ! Problem çözme yöntemlerinin öğretilmesi, zekâ testinden alınan puanı artırır. hipotezini yoklamak (test etmek) isteyen bir araĢtırmacı sırasıyla aĢağıdaki iĢlemleri yapmıĢtır. I. II. III. IV. V. VI. Öğretim yılı başında öğrencileri kura ile ( random) olarak eşit büyüklükte iki gruba ayırmıştır. Gruplardan kura ile ( random olarak ) belirlediği öğrencileri deney grubu ( D) , Kontrol Grubu ( K) yapmıştır. D ve K gruplarındaki öğrencilere bir zeka testi uygulamıştır. (Öntest) D grubundaki öğrencilere öğretim yılı boyunca belli aralıklarla problem çözme yöntemlerini öğretmiş ve bu süreç içinde K grubundaki öğrencilere ilgi duydukları başka bir çalışma yaptırmıştır. Öğretim yılı sonunda, D ve K gruplarındaki öğrencilere bir problem çözme testi uygulamıştır. Öğretim yılı sonunda ( problem çözme testini yaptıktan sonra) D ve K grubu öğrencilerine önceki zeka testinin değişik bir formunu ( paralelini) uygulamıştır. ( Son test) Semboller ve açıklamaları: XD : Deneysel iĢlem grubu öntest ortalaması XK : Kontrol grubu öntest ortalaması sD : Deneysel iĢlem grubu öntest standart sapması sK : Kontrol grubu öntest standart sapması nD : Deneysel iĢlem grubundaki öğrenci sayısı nK : Kontrol grubundaki öğrenci sayısı SORULAR 1. 2. 3. 4. 5. Yukarıdaki çalıĢmada bağımlı ve bağımsız değiĢkenler nelerdir? Yanıt: Sadece deney grubu öğrencilerine uygulanan “ Problem çözme yöntemleri” bağımsız değiĢkendir. Ön test ve son test olarak uygulanan “ zeka testi” puanı ise bağımlı değiĢkendir. AraĢtırmacı Problem çözme yöntemlerinin zeka testi puanları üzerindeki etkisini araĢtırmaktadır. AraĢtırmacının ilk iki aĢamada yaptığı uygulamaların amacı nedir? Yanıt: AraĢtırmacı grupları seçerken random ( kura ) yöntemini belirmiĢ. Bu Ģekilde deney ve kontrol gruplarını oluĢtururken bir grubun diğerinden üstün ya da farklı olmasının önüne geçmeye çalıĢmıĢ. Amacı XD = XK ve sD = sK eĢitliğini sağlamaktır. Bildiğiniz gibi öntestlerde aritmetik ortalama ve standart sapmaların yakın ya da eĢit çıkması beklenir. AraĢtırmacının 5. aĢamada “Problem çözme testi uygulamasının amacı nedir? Yanıt: Söylediğimiz gibi deneyin bağımsız değiĢkeni “Problem çözme” becerisiydi. Ve araĢtırmacı Deney grubu öğrencilerine problem çözme becerisine dönük etkinlikler yapmıĢtı. Bu etkinliklerin iĢe yarayıp yaramadığını belirlemek istiyor. ġayet iĢe yaramamıĢsa zeka üzerindeki etkisini de araĢtıramazdık. Deneyin sonunda uygulanan sontest sonuçlarının nasıl çıkması gerekir? Yanıt: Deney grubu öğrencilerinin ilk ve son testleri arasında pozitif yönde anlamlı bir artıĢ olmalı. Çünkü hipotezimize göre “Problem çözme yöntemleri” “Zeka testi” sonuçlarını etkiler. Bu durumda problem çözme yöntemlerimizi anlattığımız deney grubunun puanlarında artıĢ beklenir. Buna karĢılık Kontrol grubunun ön test ve son test sonuçları arasında çok bir fark olmamalıdır. Deneysel araĢtırmanın gereklerinin gerçekleĢip gerçekleĢmedi hangi basamaklarda kontrol edilmiĢtir? Yanıt: Deneysel bir araĢtırmanın birincil gereği deney ve kontrol gruplarının eĢitlenmesidir ( homojen – aynı ) AraĢtırmacı III. basamakta yaptığı zeka testi ile ( öntest) oluĢturduğu grupların benzer – eĢit olup olmadığını kontrol etmiĢtir. Deneysel bir araĢtırmanın ikinci gereği ise deney grubunun bağımsız değiĢkendeki beceriyi kazanıp kazanmadığının belirlenmesidir. Bildiğiniz gibi bağımsız değiĢkenimiz “Problem çözme yöntemleri” idi. Bu becerinin kazanılıp kazanılmadığı da 5. aĢamada uygulanan “Problem çözme” testi ile ölçülmüĢtür. D. GELİŞİMSEL YAKLAŞIMLAR Kesitsel Yöntem ( Kesitsel Desen) : GeliĢim psikolojisinde en çok kullanılan araĢtırma desenidir. Kesitsel desende araĢtırmacılar farklı yaĢ gruplarındaki insanları aynı anda seçip aynı zaman diliminde inceler. PÜF NOKTASI: Farklı yaĢ gruplarına 1 kere inceleme yapılır 2. bir inceleme yapılmaz. Boylamsal Yöntem ( Boylamsal Desen) : Aynı yaĢ grubunda olan bir grup deneğin, aylar ya da yıllar boyunca değiĢik yaĢlarda aralıklı olarak incelendiği bir araĢtırma desenidir. Bu süre 6 ay 1 yıl olabileceği gibi ömür boyu da olabilir. Örneğin ; çevre ve saldırganlık davranıĢlarının sıklığının yaĢla farklılık gösterip göstermediği farklı yaĢlardaki ( 5, 7, 9 ve 11) çocuklarının saldırganlık davranıĢları ölçülerek incelenir. Eğer 5 ve 7 yaĢ çocuklarındaki saldırganlık 9 ve 11 yaĢlarındaki çocuklardan daha yüksek çıkarsa saldırganlığın yaĢa bağlı olarak azaldığı söylenebilir. Örneğin çocukların biliĢsel geliĢimlerini incelemek isteyen bir araĢtırmacı, bir grup çocuğu doğumdan itibaren 15 yıl süreyle bu amaç kapsamında gözlediği takdirde (diyelim ki 15 yıl boyunca 10 kere gözlesin) boylamsal bir araĢtırma yapmıĢ olur. Kesitsel yöntem sadece yaĢa bağlı değiĢmeleri incelemek için uygundur. DeğiĢim tarihsel zaman etkisinden kaynaklanıyorsa Kesitsel Yöntem etkisiz kalır. ( Birazdan açıklayacağım) Bölük: Aynı zaman aralığında doğan, aynı tarihsel ve toplumsal koĢulları yaĢayan, aynı yaĢtaki insanların oluĢturduğu grup ya da özel bir yaĢ grubunun üyeleri. Bölük Etkisi: Tarihsel zaman etkisi de denebilir. Bölükler arasındaki farklılıklar sadece geliĢimin yol açtığı farklılıklar üzerinde odaklaĢmak isteyen araĢtırmaları zor duruma sokabilmektedir. Bu karıĢıklığa bölük etkisi denir. Örneğin 35 ve 65 yaĢlarındaki insanların iĢ ve finansal güvence konusundaki tutumları araĢtırıldığını düĢünün. 65 yaĢındaki insanların (bölük) geçmiĢte ağır bir ülkesel ekonomik kriz ya da savaĢ yaĢadıklarını düĢünün, 35 yaĢındakilerin ise böyle olaylar yaĢamadıklarını düĢünün. ġimdi bu iki grubun finansal güvence üzerindeki görüĢlerinin farklı olmasını sadece yaĢ ile açıklayamayız. Bu duruma BÖLÜK ETKĠSĠ DENĠR. BaĢka bir örnek verelim 10 ve 15 yaĢlarındaki çocuklar üzerinde yapılan kesitsel bir araĢtırmada 15 yaĢındaki çocukların Ģiddete dönük tutumlarının daha yüksek çıktığını düĢünelim. Ancak araĢtırdığımızda 15 yaĢındaki çocukların geçmiĢte televizyonda oynayan ancak birkaç yıl sonra yayından kaldırılan bir tv programını izlediklerini düĢünelim. Bu durumda saldırgan eğilimlerinin sebebi yaĢ değil geçmiĢte izledikleri tv programıdır. Bu durum da BÖLÜK ETKĠSĠNE örnektir. PÜF NOKTASI: Aynı gruba birden fazla inceleme yapılır Çocukların geliĢimi hakkında pek çok bilgi verse de bir kiĢi ya da grubun uzun sürelerce gözlenmesi maliyetlidir. Sıralamalı ( Sırasal) Yöntem: Kesitsel ve boylamsal yöntemlerin iyi yanlarının bir sentezidir denebilir. Yani farklı yaĢ gruplarındaki deneklerin, seçilerek (Kesitsel) aylar ya da yıllar boyunca tekrar tekrar incelenmesi ( Boylamsal) ile yapılan araĢtırma yöntemidir. PÜF NOKTASI: Farklı yaĢ grubundaki bireylere birden fazla inceleme yapılır. GeliĢimsel yaklaĢımlar anlatılırken genelde uzun yıllar sürüyorsa boylamsal, kısa sürüyorsa kesitsel gibi sığ ve yetersiz açıklamalar yapılıyor. Pratikte test sorularını çözerken tabii ki iĢinize yarar. Yukarıda da belirttiğim gibi 6 ay hatta 1 ay süren boylamsal çalıĢmalar vardır. O halde dikkat edeceğimiz Ģey ne kadar sürdüğü değil deneklerin kaç kere gözlendiğidir. Eğer denekler farklı yaĢ grubunda iseler ve sadece bir kere inceleniyorlarsa kesitsel; hem farklı yaĢ gruplarında iseler hem de birden fazla inceleniyorlarsa sıralamalı ( sırasal) aynı yaĢ grubu birden fazla inceleniyorsa boylamsaldır. YaĢları 10 – 15 ve 20 olan 30‟ar kiĢilik üç denek grubuna bir anket yapılır ve incelenir. Bu örnekte dikkat edeceğiniz kaç grup var 3 kaç kere incelenmiĢler ( Sadece 1 kere anket yapılmıĢ) o halde kesitsel YaĢları 10 – 15 ve 20 olan 30‟ar kiĢilik üç denek grubuna altı ay ara ile 4 kere ilgi envanteri uygulanır. Bu örnekte dikkat edeceğiniz kaç grup var 3 kaç kere incelenmiĢler altı ay ara ile 4 kere hem birden fazla yaĢ grubu hem de birden fazla inceleme o halde sıralamalı 1980 yılında doğmuĢ bir gruba 10 yaĢından beri 2‟Ģer yıl ara ile yetenek testleri uygulanmıĢtır. Bu örnekte dikkat edeceğiniz nokta kaç grup var 1980 doğumlulardan oluĢan 1 grup, kaç kere incelenmiĢler 2‟Ģer yıl ara ile birden fazla yetenek testi uygulanmıĢ o halde 1 grup birden fazla gözlem boylamsal. Desen Kesitsel ĠĢlem Farklı yaĢlardaki insanları zamanın bir anında gözleme. Farklı yaĢ gruplarını bir kere gözleme Boylamsal Bir bölükteki insanları bir zaman boyunca tekrar tekrar gözlemleme. Bir yaĢ grubunu birden fazla gözleme Sıralamalı Farklı bölükleri, zaman boyunca tekrarlayarak gözlemesi nedeniyle kesitsel ve boylamsal ( uzunlamalı) desenlerin birleĢtirmesi . Birden fazla yaĢ grubunun birden fazla gözlenmesi Güçlü Yanı YaĢ farklılıklarını, geliĢimsel eğilimlerdeki belirtileri gösterir. Nispeten masrafsızdır, uygulaması kolaydır. Bireylerin geliĢimi konusunda veri sağlar. Ġlk yaĢantılarla sonraki yaĢantılar arasında bağlantıları ortaya çıkarır. Bireylerin zaman boyunca olan değiĢim sekilerli yönünden ne kadar benzer ya da farklı olduklarını gösterir. YaĢın, büyüklüğün ve toplumsal değiĢmelerin etkilerini ortaya çıkarır. Boylamsal yaklaĢıma göre az zaman alıcı ve az masraflıdır. Zayıf Yanı Farklılıklar geliĢimsel değiĢmelerden çok, bölükler arasındaki değiĢmeleri ( bölük etkisi) yansıtabilir. Farklılıklar toplumdaki değiĢimleri yansıtabilir. Temsil özelliği olmayan örneklem ortaya çıkabilir. Bu da sonuçların genellenebilirliğini sınırlayabilir. Kesitsel denese göre daha masraflı ve zaman alıcıdır. En güçlü desen olmasına rağmen, bir geliĢimsel değiĢimin araĢtırılan bölüklerin dıĢına genellemesinin yapılıp yapılmayacağı ile ilgili problemleri vardır. Meta – Analiz: Meta-analizi, belirli bir konuda yapılmıĢ, birbirinden bağımsız, birden çok çalıĢmanın sonuçlarını birleĢtirme ve elde edilen araĢtırma bulgularının istatistiksel analizini yapma yöntemidir. Meta-analizi, klinikçilere ve tıbbi araĢtırmacılara çeĢitli çalıĢmaların sonuçlarını özetleyen nicel yöntemler sunar ve sonuçların birleĢtirilmesi ile ortak yargıya ulaĢmalarını sağlar Meta-analizi, ayrı çalışmaların bulgularının birleştirilmesi ve eleştirilerin yeniden gözden geçirilmesi yöntemidir Belirli bir konuda yapılmış, birbirinden bağımsız birden çok çalışmanın sonuçları birbirine uygun düşmediği zaman belirsizlik hakkında karar vermek amacıyla meta – analiz yapılabilir. Bilimsel AraĢtırmalarda Örneklem ve Evren Evren: Bilimsel araĢtırmaya konu olan bireylerin tamamı. Diyelim ki Türkiye‟deki orta yaĢ düzeyindeki kadınlar üzerinde bir araĢtırma yapılacaksa Türkiye‟de bulunan orta yaĢtaki tüm kadınlar evreni oluĢturur. Ya da öğrenciler üzerinde bir araĢtırma yapılacaksa tüm öğrenciler evreni oluĢturur. Örneklem: Tabii ki tüm evrenle araĢtırma yapmak masraflı hatta imkansızdır. O halde evreni temsil eden örnek bir grup seçilir. ( Kapsam geçerliği olmalı yani örnek seçtiklerimiz evrenin küçük bir maketi – modeli – temsili olmalı ) Ve seçilen bu grup üzerinde bilimsel araĢtırma yapılır. Ancak örneklem belirleme iĢi uzmanlık gerektirir. Seçim anketi yapan bir firma tabii ki Türkiye‟deki tüm seçmenlere ( EVREN) ulaĢamaz. Bu durumda 5000 kiĢilik bir örneklem belirler. Ve bu 5000 kiĢinin eğitim düzeyi, cinsiyeti, yaĢadığı Ģehir, iĢ vs açıdan Türkiye‟deki tüm seçmenlerin mini bir maketi olması gerekir. Aksi olursa ne olur: Örneklem ağırlılık olarak Konya’dan seçilirse AK Parti birinci parti çıkar Örneklem ağırlıklı olarak Ġzmir’den seçilirse CHP birinci parti çıkar Örneklem ağırlıklı olarak Osmaniye’den seçilirse MHP birinci parti çıkar. O halde tüm iller ve her düzeyde insan dikkate alınarak örneklem oluĢturulmalıdır. Bu duruma Örneklemin Kapsam Geçerliği ya da Örneklemin Evreni temsil edebilmesi denir. TEMEL KAVRAMLAR ÖLÇMENĠN TEMEL KAVRAMLARI Ölçme Ölçüm (Ölçme Sonucu ) Ölçme Kuralı Birim Ölçek Ölçme Hatası - Sabit - Sistematik - Seçkisiz ( Random – Tesadüfi) Ölçmede Sıfır Ölçme Türleri - Doğrudan Ölçme - Dolaylı Ölçme - TüretilmiĢ Ölçme Ölçmede Ġzomorfluk ve Homomorfluk DEĞERLENDĠRMENĠN TEMEL KAVRAMLARI Ölçüt Değerlendirme Türleri - Mutlak Değerlendirme - Bağıl Değerlendirme Değerlendirme Türleri - Diagnostik - Formatif - Sümmatif ÖLÇME : Geçerli görgül yollarla test edilebilecek kurallar çerçevesinde nesnelere belli özelliklere sahip oluĢ derecelerine göre sayı veya semboller vermektir. Ölçme bir betimleme iĢlemidir. GeniĢ anlamda ölçme belli bir nesnenin ya da nesnelerin belli bir özelliğe sahip olup olmadığının sahipse sahip oluĢ derecesinin gözlenip gözlem sonuçlarının sembol ya da sayı ifade edilmesidir Ölçme farktan doğmuĢ bir durumdur. Ölçülecek nesneler arasında bir fark yok ise ölçmeye de gerek kalmazdı. Ölçme aynı zamanda bir betimleme , adlandırma, sınıflama, sıralama durumudur. Ölçme kavramını sadece eğitim uygulamaları noktasında düĢünmek çok dar olacaktır. Ölçme, bir insanın boy uzunluğundan cinsiyetine, bir yerdeki sıcaklık değerinden o yerin yükseltisine, bir ortamdaki nesne sayısından bir insanın üzerindeki kıyafetin rengine kadar birçok noktada sayı ya da sembol atama olarak düĢünülmelidir. Ölçme bir niteliğin gözlenip gözlem sonucunun sayılarla ya da baĢka sembollerle gösterilmesidir. Yapılandırma Kutusu: Ölçme iĢleminin aĢamalarını anlatarak ölçme kavramını yapılandıralım... 1. 2. 3. AĢama : Ölçülecek özelliğin tanımlanması: Ölçmeci kiĢi hangi nesnenin hangi özelliğini ölçecek buna karar vermelidir. Örneğin: Bir öğrencinin Türkçe baĢarısı, bir masanın uzunluğu, bir kazağın rengi, bir insanın cinsiyeti, bir arabanın fiyatı, bir okuldaki sınıf sayısı vb. AĢama: Ölçme aracı belirleyip ölçme aracı ile gözlemin yapılması: Ölçmeci bu aĢamada aracı ile gözlem yapar. Örneğin: Türkçe baĢarı testi hazırlayıp uygulamak, cetvel ile masanın uzunluğunu gözlemek, bir kazağa bakarak rengini anlamak, bir insana bakarak cinsiyetini anlamak, arabanın fiyatını sormak, okuldaki sınıfları saymak AĢama: Sonucun sayı ya da sembolle ifade edilmesi: Ölçmeci yaptığı gözlem sonucu çıkan değere sayı ya da sembol atar. Örneğin: Türkçe sınavından 70 aldı, masa 3 metre, kazak yeĢil, Ali erkektir, Araba 70.000Tl, okulda 35 sınıf var. PRATĠK BĠR ÇALIġMA ĠLE ÖLÇME ĠFADE EDEN CÜMLELER Ölçülecek Nitelik Bir öğrencinin yaĢı Bir öğrencinin tarih bilgisi Öğrencilerin okul numarası Öğrencilerin boyu Bir kiĢinin sınıfı Bir kredi numarası kartının kart Durum Ġfade Eden Ölçme Cümleleri Bir öğrencinin yaĢının saptanması/belirlenmesi Bir öğrencinin tarih sınavından aldığı puanın sayı ile ifade edilmesi Okuldaki tüm öğrencilere numara verilmesi Sınıftaki öğrencileri boylarına göre sıralamak ĠĢyerindeki insanları sigara içenler ve içmeyenler diye sınıflamak Bir kiĢinin kredi kartı numarasını belirlemek Ölçüm (Sayı - Sembol) Ġfade Eden Ölçme Cümleleri Alpay‟ın yaĢı 19‟dur. Ahmet, tarihten 92 aldı. AyĢe‟nin okul numarası 535‟tir. Metin sınıfta boy bakımından üçüncüdür. Alpay sigara içenler sınıfındadır. Alpay‟ın kredi kartı numarası 42xxxxxxxxxxxx46‟dır. Yukarıdaki örneklerde olduğu gibi ÖSYM ölçme testlerinde ölçme ifade eden cümle sorularında bazen durumu anlatan bazen de ölçümü ifade eden cümleler istemektedir. Son bir örnekle açıklayalım “Bir insanın boy uzunluğunun belirlenmesi” cümlesi ile “Ali’nin boy uzunluğu 198 santimdir” cümlelerinin ikisi de ölçme cümlesidir. Çünkü bir insanın boy uzunluğunun belirlenmesi yine o kiĢinin boy uzunluğunun yazılması ile aynıdır. Yani teknik olarak iki cümle de ölçme cümlesidir. ÖLÇMEDE DEĞĠġKENLER Nicel DeğiĢken: Bir değiĢken sayı ile ifade ediliyorsa niceldir. Nitel DeğiĢken: Bir değiĢken matematiksel sayı değil de sembolle ifade ediliyorsa niteldir. O halde, ölçmedeki semboller nitel değiĢken; sayılar ise nicel değiĢkendir. Ahmet‟in boyu 186 cm‟dir, Arabanın fiyatı 23.000 Türk lirasıdır gibi örneklerdeki değiĢkenler niceldir. Ali Ġngilizceden pek iyi aldı, iyi not aldı, AyĢe‟nin üstündeki gömlek siyah renklidir gibi örneklerdeki değiĢkenler niteldir. ÇOK ÖNEMLĠ: Ahmet‟in okul numarası 234‟tür örneğindeki 234 bir sayı değil semboldür yani nitel değiĢkendir. Çünkü buradaki matematiksel bir sayı değil öğrenciye verilmiĢ bir isimdir ( Ġsimlendirme yapılırken sayılar seçilmiĢ memurların sicil numaraları, askeriyede kullanılan silahların seri numaraları da buna örnektir yani sadece sayılarla isim vermedir; bu yüzden bir matematiksel sayı olarak değil isim olarak kabul edilir ) ya da Ahmet 1. ( birinci) oldu tarzı sıra sayıları bir matematiksel sayı değil semboldür. BUNLARI UNUTMAYIN. Sürekli (Kesiksiz) DeğiĢken: Bir değiĢkenin alabileceği iki değer arasında baĢka değerler de (Sonsuz sayıda) alabilmesi onu sürekli yapar. BaĢka bir tanımla kullandığımız birim ondalıklı ifadeleri kullanmamıza olanak sağlıyorsa değiĢkenimiz süreklidir. Örneğin: Ağırlık, uzunluk, zeka düzeyi , yaĢ ifadeleri istenirse daha duyarlı hale getirilebilir ve ondalıklı ifade edilebilir. Ya da iki değer arasında sonsuz sayıda değer verilebilir. Süreksiz ( Kesikli) DeğiĢken: Bir değiĢkenin alabileceği iki değer arasında baĢka değerler alamıyorsa ( ya da çok az değer alabiliyorsa) bu değiĢken süreksizdir. Kullandığımız birim ondalıklı ifadeleri – sonsuz sayıda – kullanmamıza olanak sağlamıyorsa değiĢkenimiz süreksizdir. Örneğin: Cinsiyet , bazı nesne – canlı sayıları , renk Ahmet‟in boy uzunluğu 167 cm‟dir. Bu örneği ele aldığımızda 167 ile 168 arasında ( 167,1 – 167,2 – 167,3 .. gibi) birçok ondalıklı değer olabilir bu durumda bu değiĢken süreklidir. Ahmet‟in 2 tane bilgisayarı var. Bu örneği ele aldığınızda ise kullandığımız birim olan bilgisayar ondalıklı ifade kullanmamızı engelliyor ( 2,13 tane bilgisayarım var diyemeyiz) bu durumda bu değiĢken süreksizdir. Yapılandırma Kutusu: DeğiĢkenler kavramını yapılandıralım. Masada 7 tane kalem var. Bu örnekte ölçümü yapılan kalem sayısının alabileceği değerler tam sayı olmak zorundadır. Yani masada 7 ya da 8 ya da 9 kalem olabilir. 7,3 gibi bir kalem sayısı olamaz. Bu yüzden iki değer arasında sonsuz sayıda değer alamamakta. DeğiĢkenimiz süreksizdir. Öğrencinin yaĢı 18’dir. Bu örnekte ölçümü yapılan, bir insanın yaĢıdır. YaĢ yıl birimi ile ifade edilmiĢ ancak yıl gün ay hatta saat olarak daha küçük birimlerle ifade edildiğinde rahatlıkla 18,5 gibi ya da 18,6 gibi ondalıklı değerlerle ifade edilebilir. Bu yüzden değiĢkenimiz süreklidir. ÖLÇMEDE BĠRĠM: Ölçmede birim ölçme aracının en küçük bölümü için kullanılır. Ölçülecek özelliğin standartlarıdır. Birimler ÖLÇMEDE STANDARTI SAĞLAR Ölçmede birim özellikle de doğal birim kavramı biraz zor anlaĢılmaktadır. Bir örnek durum ile birim kavramını açıklamaya çalıĢacağız. Ġki kent arası uzaklığı ölçmek istiyorsunuz. Hangi birimi kullanırsınız. Bir kere kullanacağınız birim bir uzunluk birimi olmalıdır. Peki iki kent arası uzaklık santimetre ya da metre ile ölçülebilir mi? Ġstenirse ölçülebilir ama bu kadar küçük bir bölme ( birim) seçmek hiç kullanıĢlı olmayacaktır. Bu durumda sizin seçebileceğiniz en küçük bölme kilometre olmalıdır. Örnekten de anlaĢıldığı gibi hangi özelliği ölçeceksek birimimizi ( ek küçük bölmemizi) ona göre seçiyoruz. Ġki kent arası değil de bir masanın uzunluğunu ölçecek olsaydık metre ya da santimetreyi birim ( en küçük bölme) olarak seçerdik. BaĢka bir örnek verelim, bir iĢyerinde çalıĢan insanların sayısını ölçeceksiniz. Bu durumda en küçük bölmenin ( birim) insan olmalıdır. Yani iĢ yerindeki insanları sayarsanız ölçme iĢleminizi gerçekleĢtirebilirsiniz. Yok ben iĢ yerindeki insanları ölçerken daha küçük bir bölme kullanacağım diyorsanız bir düĢünün bakalım oluyor mu? Bir arkadaĢım ordan Ģöyle diyebilir iĢ yerindeki kolları sayarım toplam 100 kol varsa 50 insan vardır. Tabii ki bu örnekte olduğu gibi kol da bir birim olabilir ama insan sayısı ölçeceksek hiç de kullanıĢlı bir birim olmuyor. A) Doğal Birim: Ölçülecek değiĢkenlerin bazılarının doğal birimleri vardır. Ayrı olarak birim oluĢturmaya gerek yoktur. Genellikle kesikli ( Süreksiz) değiĢkenlerin birimleri doğaldır. Birer ardıĢık olarak saydığımız ölçmelerde doğal birim kullanırız. Örneğin “Bu sınıfta üç masa var” derken kullandığımız masa doğal bir birimdir. Ya da “Bu kitaptaki bölüm sayısı 3‟tür derken kullandığımız bölüm doğal bir birimdir” Bu birimler uzmanlar tarafından belirlenmiĢ birimlerden değildir. Uzunluk, zaman, öğrenci baĢarısı gibi değiĢkenlerin ölçümünde doğal birim kullanılmaz. AnlaĢma sağlanması adına belirlenmiĢ birimler kullanılır. Bunlara YAPAY BĠRĠM adı verilir. B) Yapay Birim: Örneğin ne kadar uzunluğa 1 metre, kilometre, mil, fersah deneceği, ne kadar ağırlığa 1 kilo, gram deneceği , kaç paralık birime 1 lira ya da kuruĢ deneceği, ne kadar süreye 1 saat, dakika vs deneceği keyfi olarak belirlenmiĢtir. Bazen doğal birim kullanabileceğimiz değiĢkenlerde bir yapay birimi tercih ederiz. Yani bazı durumlarda yapay birim daha kullanıĢlı olabilir. Örneğin: Manava gittiniz ve elma alacaksınız. Ġsterseniz 3 tane elma diyip doğal birim kullanarak alabilirsiniz ancak 1 kilo elma diyip yapay birim kullanmak bazen alıĢveriĢ adına daha kullanıĢlı olabilir. BĠRĠMLERĠN TAġIMASI GEREKEN ÖZELLĠKLER: a) EĢitlik: Ölçme aracının tüm bölümleri aynı büyüklükte olmalıdır. Örneğin, zaman ölçümlerinde birim olarak yapay bir birim olan saat kullanılmaktadır. Saat birimi her yerde ve durumda eĢittir. 5 saat dediğimizde 5 tane 60 dakika düĢünülür. BaĢka bir örnek olarak metre ya da ºC verilebilir. - KarıĢ, kulaç, adım da birer birimdir ancak eĢitlik ilkesine uygun olmayan birimlerdir EĢitlik ilkesi genelde yapay birimlerdedir. Doğal birimlerde eĢitliği yakalamak zordur. b) Genellik: Ölçme iĢleminde kullandığımız birimlerin herkesçe kabul gören, ulusal ya da uluslararası standartlarda karĢılığının olmasıdır. Örneğin uzunluk için metre – kilometre gibi birimler ulusal ya da uluslararası arenada yaygın kullanılmaktadır. Bir uzunluk birimi olarak kullanılan mil tüm dünyada kullanılmasa da kullanıldıkları ülkeler için genellik özelliği taĢırlar. Genellik ilkesine uymayan birimler genelde dar gruplar için geçerlidir. c) KullanıĢlık: Birimin ölçülecek niteliğe uygun olmasıdır. Birimin ölçülecek değiĢkenin büyüklüğüne göre duyarlığının değiĢmesidir. BaĢka bir ifade ile bir objeyi ölçerken kullandığımız ölçü aracının en küçük bölmesinin bu ölçme iĢlemini yapmak konusunda iĢimizi kolaylaĢtırmasıdır. Ġki kent arası uzaklığı santimetre ya da milimetre ile ölçmek belki mümkün olabilir ancak böyle bir ölçme iĢlemi oldukça maliyetli olur; ancak ölçme aracımızın en küçük bölmesini ( yani birimini ) kilometre olarak seçmemiz bu ölçme iĢlemini kolaylaĢtıracaktır. Ya da bir kuyumcunun altınlarını kilogram birimi ile ölçü yapan bir tartı ile tartması yerine gram hatta miligram birimlerinde ölçü yapan bir tartı ile tartması daha kullanıĢlı ve uygun olacaktır. ÖLÇME ĠġLEMĠNDE SIFIR BAġLANGIÇ NOKTASI MUTLAK ( Doğal – Gerçek) SIFIR: Ölçmeye bu Ģekilde formal anlamda yaklaĢtığımızda, ampirik anlamda sıfır, söz konusu niceliğin hiç bulunmaması halidir. Ampirik kümede ölçme konusu niceliğe hiç sahip olmayan bir eleman sıfır değerli elemandır. Bu değere doğal sıfır denir. Aynı anlamda mutlak sıfır yada gerçek sıfır terimleri de kullanılır. Ölçme iĢleminde ölçümün sıfır çıkması gözlenen özelliğin yokluğunu ifade ediyorsa sıfır, mutlaktır. Benim cebimde 15 tl var” ölçme ifade eden cümle irdelendiğinde bu ölçmede 0 bir yokluğu ifade etmektedir. Kitap 350 sayfa , 4 kazağım var , boyumun uzunluğu 186cm, bu maçta 6 gol oldu, bilgisayarın 55 tuĢu vardı, giydiği montta 24 cep var, bizim eve 3 km var gibi. Benim cebimde 0 lira var Para yok Bu kitapta 0 sayfa var Sayfa yok Maçta 0 gol var Gol yok Benim boyum 0 cm Boy yok Bilgisayarın 0 tuĢu var TuĢ yok KARġILAġTIRALIM ġu an saat 13.00‟dır. Saat 00.00 olması hiçliği mi ifade ediyor ; hayır. O halde bağıl sıfır kullanılmıĢ. Ali 8 saat ders çalıĢtı. Ali 0 saat ders çalıĢtı hiçliği mi ifade ediyor; evet hiç çalıĢmamıĢ. Gerçek sıfır Aradan 30 yıl geçti. Aradan 0 yıl geçti yani hiç ayrılık olmadı gerçek sıfır. ġu an 2012 yılındayız. Diyelim ki Ģu an 0 yılında olalım. Buradaki 0 hiçliği mi ifade eder. Hayır 0 tanımlanmıĢtır ve Ġsa’nın doğumu kabul edilir. Ayrıca takvim – (eksi) değer de alır ( M.Ö 3000 gibi ) O halde sıfırı gerçek sıfır değil. Bağıl sıfır. TANIMLANMIġ ( Bağıl – Ġtibari – Keyfi) SIFIR : Bazen ampirik kümede gerçek sıfır bilindiği halde, ölçümleri ifade etmede kolaylık sağladığı için gerçek değerde olmayan(itibari) bir sıfır noktası tanımlanabilir. Bazı değiĢkenlerin doğal sıfırı değeri bulunmaz. Gerçek sıfır olmadığı halde sıfır kabul edilen bu değere itibari sıfır denir Ölçme iĢleminde ölçümün sıfır çıkması gözlenen özelliğin yokluğunu ifade etmiyorsa; yani sıfır sadece birilerince belirlenmiĢ bir baĢlangıç noktası ise sıfır keyfidir. Eksi ( - ) değer alan her ölçmenin sıfırı BAĞIL SIFIR‟dır. BaĢarı ( eğitimde kullanılan testler) testlerinde BAĞIL SIFIR vardır. Eğitimde kullanılan baĢarı testlerinin sıfırı neden bağıl ( keyfi) sorusuna verilecek yanıt Ģudur: Örneğin Ģu an size 10 sorudan oluĢan bir matematik testi uygulasak ve bu test sonucunda siz 0 alsanız. Bu durumda sizin matematik bilginizin hiç olmadığı anlamı çıkar mı? Tabii ki hayır. Çünkü bir insan matematik testinden 0 alsa da matematik bilgisi açısından yokluk anlamı çıkmaz. “Konya‟nın deniz seviyesinden yüksekliği 1030 metredir.” ġimdi bu cümlede geçen 1030 metre yükseltiye dikkat edelim. Coğrafya bilginiz varsa yükseltide 0 metre deniz seviyesidir. ġayet yükseltide 0 metre Dünya‟nın çekirdeği olsaydı Konya‟nın yükseltisi yaklaĢık 7500 metre olacaktı. Ya da yükseltide 0 okyanus tabanı kabul edilseydi Konya‟nın yükseltisi daha farklı olacaktı. Demek ki ortada hiçlik ifade eden bir sıfır yok KEYFĠ konmuĢ bir sıfır var. Ayrıca Hollanda’da bazı yerler -4 metre yükseltiye sahiptir bilginize Bu gün havanın sıcaklığı 23°C‟dir” cümlesinde sıfır tanımlanmıĢ sıfırdır. Havanın sıcaklığını sıfır olması havada herhangi bir sıcaklık değeri olmadığı anlamına gelmez. – 10 derece olan sıcaklıklar da vardır. Bağıl sıfır söz konusu ise ölçek eĢit aralıklıdır. Ve bağıl sıfırlı ölçme iĢlemlerinden elde edilen ölçümler ( ölçme sonuçları) üzerinde ÇARPMA – BÖLME yapamayız ORANLAMA yapamayız; sadece toplama ve çıkarma yapabiliriz Ölçmede sıfır sorularında biraz dikkatli olmak gerekir. Bazı kalıp ifadeler burada insanı yanıltabilir. Örneğin “saat Ģu an 13.00‟tür.” örneğinde sıfır bağıl iken “Ben 10 saattir ders çalıĢıyorum” örneğinde sıfır mutlaktır. Çünkü bir insan 0 saat ders çalıĢtım ifadesi kullandığında hiç ders çalıĢmadığı anlamı çıkarken; saat Ģu an 00.00 dendiğinde yokluk anlamı çıkmaz. Yapılandırma Kutusu: Ölçmenin baĢlangıç noktasını yapılandıralım. Türkiye 36 – 42 kuzey paraleleri arasında yer alır. Hepinizin bildiği gibi paraleller insanlar tarafından belirlenmiĢ birimlerdir. Bu birimlerin ölçme baĢlangıcı ise 0 paraleli ya da diğer adı ile Ekvator çizgisidir. Yani bu durumda ölçme iĢleminin sıfırı bağıldır ( izafi) PRATĠK BĠLGĠ: Tüm baĢarı, zeka, yetenek vb testlerle yapılacak ölçmelerin baĢlangıç noktası keyfidir ( bağıl – izafi) Aldığım peynirim ağırlığı 500 gramdır. Ağırlık, uzunluk gibi özelliklerin ölçüldüğü durumlarda sıfır mutlaktır. Bu örnekte de görüldüğü gibi 0 gram peynir olması durumunda ölçülen özellik olan ağırlık bakımından peynirin yokluğu oluĢur. Bu yüzden sıfır mutlaktır. KarĢılaĢtırarak Özet Yapalım: Mersin Ģu an 29 ºC‟dir. Bir ölçme cümlesidir. Ölçüm ( Ölçme sonucu): 29‟dur. Birim :Yapay bir birim olan Celcius ( Santigrad) kullanılmıĢtır. Sıfır : Keyfi DeğiĢkenler : Nicel ( sayısal) ve sürekli ( Ġki değer arasında sonsuz sayıda değer alabilen) Sınıfta 14 öğrenci var. Bir ölçme cümlesidir. Ölçüm ( Ölçme sonucu) : 14‟tür. Birim : Birim olarak “insan” “öğrenci” kullanılmıĢtır. Doğal bir birimdir. Sıfır : Mutlak ( Doğal) DeğiĢkenler : Nicel ( Sayısal ) ve süreksiz ( Çünkü öğrenci birimi bir değiĢken olarak iki değer arası sonsuz sayıda değer alamaz ya 1‟dir ya da 2 ... yani hep tam sayı değeri alır.) Barbut oynarken atılan zar 6 gelmiĢtir. Bir ölçme cümlesidir. Ölçüm ( Ölçme sonucu) : 6‟dır. Birim : Her bir zar sayısı birimdir. Toplamda 6 birim vardır. Sıfır : Ne doğal ne de mutlak sıfır vardır. Çünkü ilginç gelebilir ancak tavla üzerindeki sayılar matematiksel bir sayı değil sadece semboldür. Yani zarın üstüne sayı değil de 6 tane resim konulsa da olurdu. Zaten zarlar sayı ifadesi ile 1 ile baĢlarlar yani ortada sıfır da yoktur. Ya da baĢka bir ifade ile hangi zar değeri gelirse gelsin bir ifadedir ortada yokluk oluĢmaz. DeğiĢkenler : Ortada matematiksel bir sayı olmadığı için ( nitel ) ve zar değerleri 6 tanedir ve bu değerler arasında bir baĢka değer olmayacağından süreksiz PRATĠK BĠLGĠ: Tavla zarları, iskanbil desteleri, okey taĢları üzerindeki sayılar aslında gerçek birer sayı değildirdir; birer kodlama , adlandırma ya da sıralamadır. Bu yüzden bunlar birer nicel değiĢken değildirler. ÖLÇME KURALI: Ölçme iĢleminde ölçülen özeliğin ne kadarlık miktarına ne değer /puan vb verileceğinin belirlenmesidir. 100 metreyi 15 saniye altında koşanlara 10 puan verilecektir. İlk dört soru 5 puan sonraki altı soru 15’er puandır. Kompozisyona başlık koyanlara 5 puan verilecektir. Üç soruyu doğru yanıtlayana 10 puan verilecektir. 4 yalnış bir doğruyu götürür. Sınavın süresi 60 dakikadır vb Öğretmenlerin hazırladıkları cevap anahtarları – dereceli puanlama anahtarları ( rubrik) birer ölçme kuralı belirleme işlemidir. Ölçme kuralının belirlenmesi ölçme işleminde NESNELLİĞİ sağlar. ÖLÇME HATASI Ölçme hatası : Gözlenen özelliğin gerçek değeri ile ölçüm değeri arasındaki fark hatadır. Yani bir masanın gerçek uzunluğu 3 metre olsun. Masanın uzunluğu bir marangoz çırağı tarafından ölçüldüğünde 3 metre 12 santim çıksın. ( Marangoz çırağı herhangi bir sebepten kaynaklı hata yapsın ya da kullandığı ölçme aracı arızalı olsun) bu durumda gerçek değer ile ölçüm değeri arasında 12 santimlik bir fark oluĢtu. ĠĢte bu farka ölçme hatası denir. Ben bir Türkçe öğretmeniyim. 100 üzerinden yapılan bir Türkçe sınavında ölçülecek olan tüm davranıĢları kazanmıĢ biriyim. Yani benim gerçek değerim bir Türkçe sınavında 100 üzerinden 100’dür. Ancak sınava giriyorum; baĢ ağrısı nedeniyle dikkatimi toplayamadığım için ,sınav salonu sıcak olduğu için, sınavdaki sorular açık olmadığı için, öğretmen yanlı davrandığı için, seçenekleri iĢaretlerken kaydırma yaptığım için, ya da daha baĢka birçok sebepten kaynaklı sınavdan 90 alayım. Bu durumda benim gerçek değerim olan 100 ile ölçüm değeri olan 90 puan arasındaki 10 puanlık fark ölçme iĢlemine karıĢmıĢ bir hatadır. BaĢarı testlerinde bir öğrenci bir soruda yoklanan davranıĢı kazandığı halde o soruyu çözemiyorsa ya da o soru ile yoklanan davranıĢı kazanmadığı halde soruyu doğru çözüyorsa o ölçme iĢleminde hata olmuĢtur. Uygulanan bir sınavda soru ile yoklanan davranıĢa sahip olan öğrenciler soruları çözüyor ; soru ile yoklanan davranıĢa sahip öğrenciler soruları çözemiyorsa ölçme iĢleminde hata yoktur. Ancak hatasız bir ölçme iĢlemi yapmanın ( hele ki eğitimde yani okullarda) neredeyse imkansız olduğu unutulmasın. Çünkü hata her zaman ölçmeciden ( öğretmen) kaynaklanan bir durum değildir; baĢka faktörler de etkilidir. ÖLÇME ĠġLEMĠNE KARIġAN HATALAR Sabit Hata: Bir ölçme iĢleminden diğerine miktarı değiĢmeyen tüm ölçümlere mutlak değer olarak aynı miktarda karıĢan hata türüdür. Sistematik Hata: Ölçülen büyüklüğe, ölçmecinin yanlılığına veya ölçme koĢullarına ve belli bir duruma bağlı olarak miktarı değiĢen hatalardır. Tesadüfi ( Random- Seçkisiz) Hata: Ölçme sonuçlarına geliĢi güzel karıĢan, kaynağı, miktarı ve yönü kesin olarak bilinmeyen hatalardır. Ölçmeciden Kaynaklı Sistematik Hatalar: Bir öğretmenin derse erken gelenlere, kendi siyasi görüĢünde olanlara, akrabalarına, sevdiği öğrencilere, yazısı güzel olanlara, kızlara ya da erkeklere, fazladan puan vermesi. Örneklere dikkat ettiyseniz bir yanlılık durumu vardır. Ölçülen Özeliliğin Büyüklüğüne Bağlı Sistematik Hatalar: Bir tartının her 10 kilogramlık ölçümde 1 kilogram fazla tartması. Bu cümleyi dikkatsiz okursanız sabit hata gibi görünür ancak Ģöyle düĢünelim. Her 10 kiloda 1 kilo veriyorsa ölçtüğümüz özellik büyüdükçe hata da artacaktır. Yani 30 kiloluk bir özellik ölçüyorsak 3 kiloluk bir hata oluĢur. Bir öğretmenin öğrencilerine yaptığı sınavdan sonra her öğrenciye aldığı puanın %10‟unu vermesi sistematik hatadır. Çünkü sınavdan 70 puan almıĢ bir öğrenciye 70‟in %10 eklendiğinde 7 puanlık artıĢ olurken 90 almıĢ bir öğrenciye 90‟ın %10 eklendiğinde 9 puanlık bir artıĢ olur yani tüm öğrencilere aynı miktarda hata karıĢmaz. Bir öğretmen sınıf ortalaması düĢük olduğu için ( yani öğrencilerinin geneli sınavdan düĢük aldığı için) tüm öğrencilere 10‟ar puan vermesi sabit hatadır. Bir cetvelin ucu kırık olsun ( 2 santim) Bu durumda cetveli bir defa kullanmak Ģartıyla yapılacak her ölçme iĢlemi 2 santimlik sabit bir hata verecektir. Yani tüm cisimler 2 santim kısa görünecektir. Bir tartının baĢlangıç noktası 10 kilogram olsun. Bu durumda bu tartı ile tartılan herkes 10 kilogram ağır görünecektir. Bir öğretmenin hazırladığı 20 soruluk bir sınavda tüm öğrencilerin son soruyu süre yetmediği için boĢ bırakması da sabit bir hatadır. Bir öğretmenin dikkatsizlikten kaynaklı bazı öğrencilere fazla puan vermesi Bir öğrencinin yorgun olduğu için bazı soruları ( bildiği halde) yanlıĢ çözmesi Sınav yapılan ortamın aĢırı sıcak / soğuk, basık , kirli vb. olmasından kaynaklı öğrencilerin soruları anlamakta güçlük çekip bildikleri soruları dahi yanlıĢ yapmaları. Bir öğretmenin hazırladığı testteki bazı ifadelerin açık ve anlaĢılır olmamasından kaynaklı öğrencilerin soruları doğru yanıtlayamaması Oldukça uzun bir testten dolayı öğrencilerin sonlara doğru soruları algılamakta güçlük çekip hatalar yapması Sınavda aĢırı kaygılı, gergin, korkulu ya da sinirli olan öğrencilerin soruları çözerken hata yapmaları SABĠT HATALAR: Sabit hatalar, standart sapmayı ve varyansı etkilemezken aritmetik ortalamayı etkiler. ( Bu durum sadece tüm öğrencilere puan eklenmesi ya da tüm öğrencilerden eĢit miktarda puan düĢürülmesi gibi durumlar için geçerlidir.) 5 öğrencinin aldığı puanlar Ģu Ģekilde olsun: 30 , 40, 70 , 80 , 90 öğretmen herhangi bir sebeple bu öğrencilerin hepsine 10’ar puan eklesin ya da çıkarsn. ( Eklediğini var sayarsak) Bu durumda öğrencilerin puanları sırasıyla 40, 50, 80, 90 ve 100 olacaktır. Eski aritmetik ortalama 62 iken yeni aritmetik ortalama 72’ye çıkar. Ancak öğrencilerin aritmetik ortalamadan uzaklıkları değiĢmediği için standart sapma da değiĢmez. ( Yani 30 alan öğrencinin aritmetik ortalamadan uzaklığı 62-30 = 32 iken 10 puan eklenmesi ile 72-40= 32 yani uzaklıkta değiĢen bir Ģey olmadı. Çünkü öğrenciye 10 puan eklerken herkese de eklediğimizden aritmetik ortalama da 10 puan arttı) Sabit hatalarda yanlılık yoktur. ( Yani tüm ölçme sonuçlarına eĢit miktarda hata karıĢır birinin diğerine üstünlüğü yoktur. ) Hatanın miktarı ve kaynağı bilinmektedir. Bu yüzden bir ölçme sonucuna karıĢan sabit hatalar çok rahat düzeltilebilir. Buna karĢılık miktarı, yönü ve kaynağı bilinmeyen tesadüfi hataların bir ölçme iĢleminden arındırılması zordur. Bir öğretmen 10 soruluk bir sınav hazırlasın her soru 10 puan üzerinden belirlenmiĢ ve toplamda 100 puan alınacak. Sınavın süresi yetmediği için tüm örğenciler 10. soruyu yapamamıĢ olsunlar. Bu durumda sınıftaki tüm öğrencilerin sınavı 100 üzerinden değil 90 üzerinden belirlenecektir. Ya da öğretmen son soruyu tüm sınıfın doğru yaptığını kabul etmesi de sabit hata örneğidir. Bu noktada o soruyu bilen ya da bilmeyen herkes doğru yapmıĢ kabul edilir. Soruyu gerçekte çözemeyecek öğrenci de doğru yaptı zaten çözecek olan da bu önemli değildir her türlü sabit hatadır. Bu konuda bazı kaynaklarda hatalı yorumlar görebilirsiniz. Doğrusu bizim söylediğimiz gibidir. Sabit hatalar standart sapma ve varyansı etkilemediği için doğrudan güvenirliği etkilemez. Buna karĢılık bilen ile bilmeyen ayrımının yapılmasını zorlaĢtırdığı için geçerliği direkt etkiler. SĠSTEMATĠK HATALAR: Sistematik hataların öğretmen yanlılığı ya da ölçülen özelliğin büyüklüğüne göre oluĢtuğunu söylemiĢtik. Sistematik hatalar hem standart sapmayı hem de aritmetik ortalamayı etkiler. Sistematik hatalar önceklikle geçerliği düĢürür. Tek kullanımda sabit hata veren bir ölçme aracı birden fazla kullanımda sistematik hata verir. ġöyle düĢünelim, bir cetver düĢünün 50 santimlik olsun. Yalnız ilk iki santimlik yeri kırık olduğu için her seferde 2 santim eksik ölçüm yapacaktır. Bu cetvelle 50 santimden küçük bir nesne ölçtüğünüzde ( aracı bir kere kullanmanız yeterlidir) sabit hata verir. Ancak 100 santimlik bir Ģey ölçtüğünüzde aynı cetveli iki kere kullanırsınız. Bu durumda her kullanımda 2 santimlik hata veren cetvelimiz iki kez kullanıldığı için bu sefer 4 santimlik hata verir. TESADÜFĠ HATALAR: Tesadüfi hatalar birçok nedenden kaynaklanır. Bu hatanın nedeni öğretmen ya da öğrenci olabileceği gibi ölçme iĢleminin yapıldığı ortam ya da araç da olabilir. ġans faktörü Soruların açık anlaĢılır olmaması , testin yönergesinin açık olmaması ya da ölçme aracının bazı hatalar barındırması Ölçmecinin puanlama dikkatsizliği Öğrencinin heyecansal durumları ya da sağlık koĢulları Ölçme koĢullarının kötü olması ( Sıcaklık – ıĢık vb ) Öğrenci dikkatsizlikleri Öğretmenin puanlamayı rastgele yapması ( Kafadan not verme ) Tesadüfi hatalar doğrudan güvenirliği düĢürür. Sabit ve sistematik hatalar tesadüfi değiĢken olma özelliğine sahip değillerdir. Bu nedenle ölçmede hata kuramları sadece tesadüfi hata üzerine geliĢtirilmiĢtir. Sabit ve sistematik hatalar üzerine hata kuramı geliĢtirilmemiĢtir. Ölçme ve değerlendirmede üzerinde en ayrıntılı durulan hata türü tesadüfi hatadır. HATA KAYNAKLARI Ölçmeyi yapan kiĢiden kaynaklı hatalar ( Taraflılık – dikkatsizlik vb ) Ölçmenin yapıldığı araçtan kaynaklı hatalar ( Testin açık olmaması, terazinin bozuk olması ya da yanlıĢ araç kullanılması vb) Ölçmenin yapıldığı ortamdan kaynaklı hatalar ( Ortamın kopya çekmeye uygun olması, sıcaklığı, gürültü vb ) Ölçmenin yapıldığı gruptan ( öğrenciden) kaynaklı hatalar ( Motivasyon, stres, uykusuzluk, sınava karĢı tutum vb) KARġILAġTIRARAK ÖZET YAPALIM Sabit Hata: Sistematik Hata: Tesadüfi Hata: Öğrencilerindeki matematik korkusunu yenmek isteyen bir öğretmenin tüm öğrencilerine sınavdan aldığınız puana 10 puan ekleyeceğim demesi Öğretmenin sınıftaki bazı öğrencilere sınav sorularınının yanıtlarını önceden vermesi Bir öğrencinin ailevi problemlerinden kaynaklı sınava dikkatini toplayamaması ve sorularu yanlıĢ algılaması Bir arabanın benzin Ģamandırasındaki arızadan kaynaklı arabadaki benzini sürekli 1 litre düĢük göstermesi Bir öğretmenin sadece özel derste anlattığı konulardan soru sorarak özel derse gelen öğrencilerinin yüksek puan almasını sağlaması Sınava giren bir öğrencinin 20. sorudan sonraki yanıtları kaydırma yaparak yanlıĢ iĢaretlemesi sonucu puanının düĢük gelmesi Bir firmanın tüm ürünlerinin fiyatını %10 yüksek yazması Ölçme için farklı bir tanım: Ölçme aslında nitelikler kümesinin elemanlarının sayı veya semboller kümesinin ( soyut iĢlemler kümesi) elemanlarıyla eĢlenmesidir. Bu eĢleĢme üzerine ölçmede iki durum ortaya çıkar: a) Ġzomorfluk b) Homomorfluk Ölçmede Ġzomorfluk: Nitelik veya özelliklerin yer aldığı görgül kümenin her bir elemanı, soyut kümenin içerdiği sayı ya da sembollerle, bire-bir eĢleĢebiliyorsa ve bu kurala göre soyut kümenin sayı ya da sembolleriyle gösterilmedik hiçbir görgül küme kalmıyorsa baĢka bir deyiĢle iki küme arasında birebir örten bir fonksiyon ( bağıntı ) varsa ölçme izomorftur. Ölçmede Homomorfluk: Pratikte ölçmede bire-bir örten bağıntı çok az görülür. Çünkü görgül küme elemanlarıyla soyut küme elemanları arasında eĢleme çoğu zaman bire-bir olmaz. Örneğin birbirinden farklı olduğu bilinen iki görgül küme elemanına ölçülen nitelikleri eĢit olduğu için soyut iliĢkiler kümesinde aynı sayı – sembol verilebilir. (sınıflama ölçeklerinde olduğu gibi 5 tane çalıĢkan olabilir) Baba. 176 cm. Tam doğru 3 puan Anne. 162 cm Yarım doğru 1 puan Büyük çocuk . 98 cm BoĢ . 0 puan . Küçük çocuk. 92 cm YanlıĢ . Görgül Küme Soyut ĠĢlem Kümesi Yukarıdaki çizimde de görüldüğü gibi nitelikler kümesinin elemanları sayı kümesinin elemanları ile bire bir eĢleĢmiĢ ve hiçbir eleman açıkta kalmamıĢ ya da bir değer iki eleman almamıĢtır. Yani her değer bir eleman almıĢtır. Görgül Küme Soyut ĠĢlem Kümesi Yukarıdaki çizimde de görüldüğü gibi nitelikler kümesinin elemanları sayı kümesinin elemanları ile bire bir eĢleĢmemiĢ görgül kümenin iki elemanı soyut iĢlem kümesinde aynı eleman ile eĢleĢmiĢ. GENEL TEKRAR ve YAPILANDIRMA Bir öğretmen öğrencilerine 5 üzerinden puan verirken Ģöyle bir yol izlemiĢtir: 0 – 24 arası 0 puan, 25 ile 44 arası 1 puan, 45 ile 54 arası 2 puan, 55 ile 69 arası 3 puan , 70 ile 84 arası 4 puan ve 85 ve üstü ise 5 puan almaktadır. Buna göre: AyĢe matematik sınavından 4 aldı. Ölçme cümlesini ölçmenin temel kavramları açısından analiz edelim: Sıfır Türü : Bu ölçme iĢlemi matematik bilgi ve becerisini yoklamaktadır. Bu sınavdan 0 almak matematik bilgisi açısından yokluğu ifade etmez bu yüzden BAĞIL ( Keyfi) SIFIR Yapılan bir sınavda öğrencilerin bir kısmı 26. soruyu , o soru ile yoklanan davranıĢı kazanamadıkları için yanlıĢ yapmıĢtır. HATA TÜRÜ: ġimdi bu cümleyi okuyan birçok dikkatsiz arkadaĢ burda sabit hata olduğunu düĢünecektir. Ancak bu ölçme durumunda hiçbir hata yoktur. Çünkü öğrencilerin bir soruyu o soru ile yoklanan davranıĢı kazanamadıkları için çözememeleri hata değildir; zaten o soru ile yoklanan davranıĢı kazanmamıĢsa soruyu da çözememesi beklenir. Eğer Ģöyle olsaydı: “Öğrenciler, süre yetmediği için, hasta oldukları için, soru açık ve anlaĢılır olmadığı için vb yapamamıĢtır” bu durumda bir hatadan söz edebilirdik. DeğiĢken Türü: 4 çıkan ölçme sonucu ( ölçüm) bir sayı ifade ettiği için NĠCEL DEĞĠġKENDĠR. Ölçüm değeri çıkabilecek 0, 1,2,3,4 ve 5 değerleri arasında sonsuz sayıda değer bulunamayacağından ( yani bir öğrenci ya 3 ya 4 vb alabilir 4,272 diye bir puan tanımlanmamıĢ) SÜREKSĠZ DEĞĠġKEN Ġki kent arası uzaklık ölçüleceği zaman uygun birim kilometredir. Ġstenirse bu ölçümler santimetre birimi ile de yapılabilir. Yapılırsa ne olur: KullanıĢlık düĢer: Ġki kent arasını santimetre ile ölçersek ölçme iĢleminin kullanıĢlığı düĢer. Çünkü daha çok zaman , emek ve maliyet gerektirir hale gelir. Ölçme iĢleminin duyarlığı artar: Küçük birimlerle yapılan ölçme iĢlemlerinin duyarlığı artar. Ancak bu durum yeni sorunlar yaratabililir. Örneğin çok küçük birimler üzerinde çalıĢmak bazı hesaplama hatalarına yol açabilir bu da dikkatsizlikten kaynaklandığı için tesafdüfi hata doğurabilir. SIFIR TÜRLERĠNĠ BULUNUZ ( VARSA tabi ) Ahmet sınavda 7. oldu. Sıfır yok çünkü sıra sayıları matematiksel iĢlem yapmaya uygun sayılar değildir. Ahmet Türkçe sınavından 70 aldı Bağıl sıfır, çünkü bilgi ölçülmektedir. Sıfır yokluk ifade etmez. Alpay‟ın TC Kimlik numarası: 66666666666‟dır. Sıfır yok; çünkü TC kimlik numaraları gerçek sayı değildir. Bu ders notu 80 sayfadır. Gerçek sıfır; çünkü bu ölçüm 0 çıksaydı sayfa sayısı adına yokluk ifade ederdi. ÖLÇEK ve ÖLÇEK TÜRLERĠ ÖLÇEK: Ölçek terimi bazen “birim” yerine de kullanılır. Örneğin pilav piĢirirken “bir ölçek pirince iki ölçek su konulur”cümlesinde ölçek kelimesi “birim” anlamında kullanılmıĢtır. Ancak ölçme konusunda ölçek teriminin tanımı Ģudur: Ölçme sonuçlarını gösteren sayı ya da sembollerin formal ( matematiksel veya istatistiksel) özellikleridir. BAŞKA BİR TANIM: Nesnelere verilen sayı ya da sembollerin anlamlarını ya da nesnelere verilen ölçülen özelliğine göre sayılar tayin etmede ve nesnelere verilen sayıların kullanılmasında uyulması gereken kuralları ve kısıtlamaları ifade eder. ÖLÇEK TÜRLERĠ Sınıflama Ölçeği Sıralama Ölçeği EĢit Aralıklı Ölçek EĢit Oranlı Ölçek ÖLÇEK KONUSUNA GENEL BAKIġ Sınıflama Ölçeği : Birey , olay ya da nesnelerin bir özelliğe Sıralama Ölçeği : Birey, olay ya da nesne vs. bir özelliğe sahip oluĢları bakımından gruplara ya da sınıflara ayrılması sahip oluĢ miktarları bakımından sıraya koyduğumuz zaman ile elde edilen ölçeklerdir. elde edilen ölçeğe denir. Nesnelerin, olay ya da kiĢilerin farklılıkları ve benzer özellikleri belirlenir, benzer özelliği olanlar gruplanır. Bir EĢit aralıklı ya da eĢit oranlı ölçekle elde edilen puanları sıraya koymak sınıftaki baĢarılı ve baĢarısız öğrenciler, kızlar ya da erkekler, mavi giyinenler ve kırmızı giyinenler gibi. ÖRNEKLER: Sanayi bakımından geliĢmiĢ iller Ortadoğu ülkeleri , Balkan ülkeleri vb diye ülkeleri ÖRNEKLER: ayırmak Alpay, KPSS‟de Türkiye 2.‟si oldu Öğrencilere okul numarası vermek, futbolculara sırt Ali, dershanenin en uzun boylu öğrencisidir. numarası vermek, illere plaka numarası vermek vb. Müzik listelerinde Top 10‟u belirlemek KiĢileri siyasi görüĢlerine göre ayırmak En sık yaptığımız iĢi belirlemek Öğrencileri göz renklerine göre sınıflamak Öğrencileri evlerinin okullarına olan uzaklığına göre Öğrencileri sosyo-ekonomik düzeylerine göre ( zengin – fakir – orta düzey vb diye) ayırmak listelemek KiĢileri kazandıkları paraya göre sıraya koyma Öğretmenleri konumlarına göre adlandırmak ( Kadrolu – Ücretli – Geçici Görevli – Ücretsiz Ġzinli ) EĢit Aralıklı Ölçekler: Adından da anlaĢılabileceği gibi bu EĢit Oranlı Ölçekler: EĢit aralık ölçeğinden daha geliĢmiĢ ölçekte birimler arası fark birbirine eĢittir. olan ölçek türü oran ölçeklerdir. Oran ölçekleri eĢit aralık Sıfır noktası bağıl olan ölçmeler için kullanılır. ölçeklerine benzemektedir. Farklı olarak burada baĢlangıç Toplama çıkarma yapılabilir ; çarpma bölme yapılamaz. noktası olan sıfır ( 0 ) gerçek sıfırdır. ÖRNEKLER: ÖRNEKLER: Tüm baĢarı, yetenek vb testler eĢit aralıklıdır. Yani Ahmet, Ahmet‟in boy uzunluğu 190 santimetre ( Sıfırı mutlak) Türkçe dersinden 60 aldı gibi Elimde 7 tane bilye var ( Sıfırı mutlak ) Z ve T puanları eĢit aralıklıdır. Yeni doğan bebeğin ağırlığı 4 kilo ( Sıfırı mutlak ) ġu an yıl 2012‟dir. ( Sıfırı bağıl ) Hava sıcaklığı Ģu an 23 derecedir ( Sıfırı bağıl ) Türkiye 36 – 42 kuzey paralellerindedir. Mankenin bedeni 0‟dır. ( Burdaki sıfır da bağıl gerçek bir yokluk değil ) A kentinin rakımı 1030 metredir. SINIFLAMA ÖLÇEĞĠ ( Adlandırma – Gruplama – Kategori – Nominal ) : Adlandırma, nesnelere sayı ya da kod vermedir: Ġllere plaka numarası verme, silah seri numaraları, öğrenci numaraları, Türkiye Cumhuriyeti kimlik numarası, futbolcu sırt numaraları gibi nitel değiĢkenlere sahiptir. Sınıflama ölçeklerinde hiçbir matematiksel iĢlem yapılamaz. Sadece frekans , tepe değer ( mod) ve yüzde bulunur. Bunlar matematiksel bir iĢlem değildir. ÖRNEK: Bir sınıfta 100 kiĢi vardır. Bunlardan 15’i sarıĢın , 35’i esmer , 20’si kumral 30’u da siyahidir. ġeklinde bir sınıflama yapılsa bu sınıflamanın yüzdesi çıkarılabilir. %15’i sarıĢın, %35’i esmer, %20’si kumral, %30’u da siyahidir. Ayrıca bu ölçümde en çok tekrar eden esmerlerdir yani dağılımın modu esmerler’dir. AYRICA GRUPLAMA ÖLÇEKLERĠ BĠZE FREKAS ( KiĢi Sayısı) da verir. Ahmet çalıĢkanlardandır ya da Mehmet kilolular grubundandır gibi sınıflama ölçeği ile yapılmıĢ ölçmelerde örneğin Ahmet çalıĢanlardandır ölçmesinde Ahmet’in ne kadar çalıĢkan olduğu önemli değildir. Önemli olan Ahmet’in çalıĢkan olmasıdır. Zaten ölçek bize bu bilgiyi vermez. Yani Ahmet’in en çalıĢkan mı olduğu ya da çalıĢkanlar arasında kaçıncı sırada olduğu bilgisi yoktur. Aynı Ģekilde Mehmet kiloludur ölçmesi için de geçerlidir. Daha somut bir örnek bulalım; Ahmet sınıfı geçenler, Mehmet ise kalanlar grubundadır. Bu noktada diyelim ki ders geçme 70 olsun bu durumda Ahmet 70 de alsa 100 de alsa sınıfı geçmiĢtir. O halde bir sınıftaki tüm üyeler eĢit kabul edilir aralarında sıralama yapılmaz. Sınıflama ölçekleri için birkaç örnek daha verelim : Veli erkektir. AyĢe Galatasaylıdır. Bu kazak mavidir. AyĢe yeĢil gözlüdür... Sınıflama ölçekleri SĠMETRĠKLĠK ÖZELLĠĞĠ TAġIR : A = B B = A Bir sınıftaki çalıĢkanların sayısı 10‟dur. Örneğinde sınıflama yapılmıĢtır. Bu on çalıĢkandan Ali ( A) ve Bekir ( B) adlı iki öğrenciyi ele alalım. Bunlar çalıĢkanlar grubundadır. Bu yüzden biri çalıĢkansa diğeri de çalıĢkandır. Yani A=B B = A Sınıflama ölçekleri GEÇĠġLĠLĠK ÖZELLĠĞĠ TAġIR: A = B ve B=C ise A = C Bir okuldaki sigara içenlerin sayısı 3‟tür. Ali , Bekir ve Cengiz. Ali günde 1 paket , Bekir yarım paket, Cengiz ise günde sadece 3 tane içsin. Sonuç itibarı ile hepsi sigara içenler grubundadır. Ve aralarında sıralama yapılamaz. Bu noktada Ali , Bekir ve Cengiz sigara içiyor. Biri diğerinden daha fazla içse de sınıflama ölçeklerinde bu üç üye de eĢit kabul edilir. Buna geçiĢlilik denir. Sınıflama ölçeğinde birimler arasında FARK yoktur. Sigara içenlerle ilgili örneğe yeniden baktığımızda 3 tane sigara içen vardı” ve bunlar arasında sıra – nitelik vs bakımdan fark yoktur. Hangisinin daha çok sigara içtiğini bilemezsiniz ( ölçek size bunu vermez ) Bu yüzden birimler eĢit kabul edilir Sınıflama ölçeklerinde duyarlık çok düĢüktür. “ Bir grup öğrenciyi göz rengine göre sınıfladığımızda “Kahve rengi – siyah – mavi – yeĢil” gibi kümeler ortaya çıkar. Ancak mavilik kendi içinde derecelere ayrılamaz; az mavi olan da mavidir , çok mavi olan da . Bu da ölçme iĢleminde duyarlığı düĢürmektedir. SIRALAMA ( ORDĠNAL ) ÖLÇEĞĠ: Sıralama ölçeği bir bakıma eĢit aralıklı ya da eĢit oranlı ölçeklerle elde edilmiĢ ölçümlerin sıraya konmasıdır. YUKARIDAKĠ TANIMI ÖRNEK ÜZERĠNDEN AÇIKLAYALIM: EĢit Oranlı Ali‟nin boyu 187 santim Veli‟nin boyu 192 santim AyĢe‟nin boyu 175 santim Sıralama Veli en uzun ( Birinci) Ali ortanca ( Ġkinci) AyĢe en kısa ( Üçüncü ) EĢit Aralıklı Ali sınavdan 70 aldı AyĢe sınavdan 90 aldı Veli sınavdan 82 aldı Sıralama En yüksek puan AyĢe‟nin Ortanca puan Veli‟nin En düĢük puan Ali‟nin Televizyon 40 kg Sehpa 5 kg Buzdolabı 250 kg En ağır eĢya buzdolabı Ortanca ağır eĢya Tv En hafif eĢya sehpa Mersin 23 ºC‟dir. Adana 26 ºC‟dir. Konya 13ºC‟dir En sıcak il Adana ( Birinci) Ortanca sıcak il Mersin ( Ġkinci) En soğuk il Konya ( Üçüncü) Sıralama ölçeklerinde kullanılan sıra sayıları matematiksel anlamda bir sayı değildir. Bu yüzden sıralama ölçeklerinde matematiksel iĢlem( toplama – çıkarma – çarpma – bölme ) yapılamaz. Sıralama ölçeğinde 0 noktası yoktur ( KULLANILMAZ-ANLAMSIZ 0 ) Kimse sıfırıncı sırada yer almaz. Sıralama ölçeğinde birim aralığı vardır ancak bu aralık değiĢir.(Aralık EĢit Değildir) Örneğin bir sınıfta yer alan öğrencileri uzundan kısaya doğru sıraladığımızda 1, 2, 3, 4 öğrenciler arasında birim aralığı vardır; fakat 1.ve 2. öğrenci arasındaki fark 3.ve4. öğrenci arasındaki farktan farklıdır. Yani birinci ile ikinci arasındaki fark ille de üçüncü ile dördüncü arasındaki farka eĢit olmak zorunda değildir. Sıralama ölçeklerinde sabit bir baĢlangıç noktası yoktur ( Ġfadeye dikkat edin baĢlangıç noktası yoktur demiyorum, sabit bir baĢlangıç noktası yoktur diyorum.) Ne demek istiyoruz: “Sıralama ölçeklerinde bildiğiniz gibi sıraya koymak birinci ( 1.) ile baĢlar. Diyelim ki sınıftaki on öğrenciyi boy uzunluğuna göre sıraya koyduk. En uzunu Ali olsun ( 187 cm) Bu durumda Ali birincidir. Ancak birinciliği sabit değildir. Sınıfa Veli adlı öğrenci geldiğinde ( 190 cm) bu durumda Veli birinci Ali ise ikinci olacaktır. O halde sıralama ölçekleri 1.( birinci) ile baĢlar ancak bu sabit değildir. Sıralama ölçeklerinde de matematiksel iĢlem yapılamaz. Sadece Ģunlar bulunabilir : Mod, Frekans,Yüzde, MEDYAN Sıralama ölçekleri ASĠMETRĠKLĠK ÖZELLĠĞĠ TAġIR: A>B ise B <A, Ali , Bekir‟den uzunsa Bekir de Ali‟den uzundur diyemeyiz; ancak Ģunu deriz: Ali , Bekir‟den uzunsa Bekir de Ali‟den kısadır. Sıralama ölçekleri GEÇĠġLĠLĠK ÖZELLĠĞĠ TAġIR: A > B ve B > C ise A > C yani Ali , Bekir‟den uzunsa ve Bekir de Cengiz‟den uzunsa o halde Ali , Cengiz‟den uzundur. Sınıflama ölçekleri sıra vermeseler de daha önceden sıraya konmuĢ ölçümler sınıflandığında SINIFLAMA ölçeği de SIRA verebilir. Bu durum ĠSTĠSNAĠ bir durum olduğu için genel bir kural olarak algılanmasın. Ancak ÖSYM tarafından sorulabilecek nitelikte bir UYARIDIR, Dikkatlice okuyalım.... Bir sınıfta okuyan 40 öğrenciyi Türkçe dersinde aldıkları puanlara göre 1.den , 40.ya kadar sıraladığımızı düĢünün. Ġlk yirmi geçsin ( GEÇTĠ ) 21. ile 30. bütünlemeye kalsın ( BÜTÜNLEMELĠ) ve son 10 kiĢi de sınıfta kalsın ( KALDI) Bu durumda sınıf öğrencileri 3 gruba ayrıldı ( Geçti – Bütünlemeli – Kaldı) Yani önce sıralama ölçeği kullanıp ardından sınıflama ölçeği yaptık. Normalde sınıflama ölçeğinde sıralama yapamayız ancak bu durumda Ģunu rahatlıkla söyleyebiliriz Geçti sınıfındaki öğrencilerin puanları Kaldı sınıfındaki öğrencilerin puanından yüksektir. Böyle bir durum ancak özel olarak sorulabilir. Yoksa genel bir soruda sınıflama ölçekleri sıra vermez diyebilirsiniz. Bu bahsettiğim istisnai bir durumdur... BaĢka bir örnek vereyim sınıfta mavi giyenler ve kırmızı giyenler olsun. ġimdi Kırmızı > Mavi ya da Mavi > Kırmızı diyemeyiz. Çünkü sınıflama ölçeklerinde sınıflar arasında böyle bir iliĢki kurulmaz. Ancak ilk örneğimizde yani geçti – bütünlemeli – kaldı sınıflamalarında istisna olan durum bu sınıfların belli bir sıralamaya göre oluĢturulmasıdır. EġĠT ARALIKLI ( ĠNTERVAL) ÖLÇEĞĠ: Birim aralıkları eĢit olan ve sıfır noktası bağıl olan ölçeklerdir. EĢit aralıklı ölçeklerde toplama ve çıkarma yapılabildiğini ancak çarpma ve bölme yapılamadığını herkes bilir. ÖSYM Ģöyle bir soru sorsa: “ EĢit aralıklı ölçeklerde neden toplama ve çıkarma yapılabilmektedir?” Bu soruya birçok aday yanıt veremeyecektir. Sorunun yanıtı Ģudur: “ ÇÜNKÜ BĠRĠM ARALIKLARI EġĠTTĠR” O halde eĢit oranlı ölçeklerde toplama ve çıkarma yapılabilir sebebi BĠRĠM ARALIKLARI EġĠTTĠR. Peki neden çarpma ve bölme yapılamaz diye sorsa onun yanıtı da SIFIR NOKTASI MUTLAK DEĞĠL BAĞIL OLDUĞU içindir. Matematiksel anlamda düĢünürsek bu ölçekte eĢit birimler olduğu için çıkarma ve toplama iĢlemi yapabiliriz. Fakat baĢlangıç noktası keyfi olduğu için çarpma ve bölme iĢlemi yapamayız. Örneğin standart bir baĢarı testinde Ahmet’in 25 ve AyĢe’nin 75 puan aldığını düĢünelim. Burada Ahmet AyĢe’den 50 puan daha düĢük almıĢ ve 50 puan daha baĢarısız diyebiliriz ( 75-25=50) fakat AyĢe Ahmet’ten 3 misli daha baĢarılı diyemeyiz. Oranlayarak karĢılaĢtırmalar yapamayız. Ya da baĢka bir örnek Hava sıcaklığı bugün 13°C‟dir ifadesinde eĢit aralıklı ölçek kullanılmıĢtır. Çünkü sıcaklıktaki “0” tanımlanmıĢtır; ayrıca 26°C’lik bir sıcaklık sadece 13°C’lik bir sıcaklıktan 13 fazladır. Ama asla 2 katı değildir. Bir beden eğitimi öğretmeni 200 metre koĢmanın 10 puan olduğunu belirmiĢtir ( Ölçme kuralı belirledi) Bu noktada Ahmet 50 puan almıĢtır dediğimizde Ahmet’in en az 1000 metre koĢtuğunu anlarız. Ancak Ahmet 1199 metre koĢsa da 50 alacaktır; çünkü her 200 metre 10 puandır. EĢit aralıklı ölçeğe göre Ahmet 50 puan aldı. Aynı koĢu sınavından Mehmet ise 100 alsın. Bu durumda Mehmet en az 2000 metre koĢmuĢtur ancak 2199 metre koĢsaydı da 100 alacaktı. Bu durumda Mehmet’in Ahmet’ten iki kat daha fazla koĢtuğunu söyleyemeyiz. Çünkü en baĢta kiĢilerin ne kadar koĢtuğu konusunda eĢit aralıklı ölçeğimiz bilgi vermemekte. Ayrıca Sınavdan sıfır alan birinin hiç koĢmadığını söyleyemeyiz. 150 metre koĢan Veli bu sınavdan 0 alır ancak 150 metre koĢmuĢtur. Bu durumda Sıfır Bağıldır- Ġzafidir – TanımlanmıĢtır. Burada Ģunu söyleyebiliriz: Mehmet , Ahmet’ten 50 puan daha fazla almıĢtır. Aralıklı ölçütlerin sonuçları ile istatiksel iĢlemler yapılabilir ( Aritmetik ortalama, standart sapma, korelasyon analizi, mod, medyan, ranj vs ) EġĠT ORANLI ( RATĠO) ÖLÇEK: Birim aralıkları eĢit sıfır noktası da mutlak olan ölçeklerdir. Her türlü matematiksel iĢlem yapılabilir. ( Toplama – çıkarma – çarpma – bölme) En geliĢmiĢ ölçek türüdür. EĢit oranlı ölçekle yapılan ölçmelerde rahatlıkla oranlama yapılabilir örneğin Ali‟nin boyu 180 santim Veli‟nin boyu da 90 santim olsun. Bu durumda Ali , Veli‟nin iki katı uzunluktadır denebilir. TABLODA ÖZET Ölçek Tipi ÖLÇEĞĠN YAPISAL ÖZELLĠKLERĠ BAġLANGIÇ NOKTASI BĠRĠM ARALIĞI Var ve eĢit Var ve eĢit Var ama değiĢir Örnekler Elde edilecek ölçülerin anlamlılık derecesi Nitelik Gösterme Gücü Var Var Var Var Nicelik Gösterme Gücü Sıra Fark Oran Oranlı EĢit Aralıklı Sıralama Sınıflama Ölçek Tipi Var ve mutlak Var ama keyfi Var ama sabit değil BaĢlıca Ġstatistik ĠĢlemleri Sınıflama Frekans , Mod , Yüzde Tüm gruplama ve sınıflamalar Nitel ( Miktar ve sıra yok ) Sıralama Frekans,Mod, Medyan, Yüzde Sıralamalar Nitel ( Miktar yok – Sıra var ) Aralıklı Art ort, medyan,mod, ranj, yüzde, standart sapma, Yüzde , Vasyans Tutum , zeka, yetenek, takvim, sıcaklık vs. Nicel ( miktar verilir) Oranlı Art ort, medyan,mod,ranj, yüzde, standart sapma, Yüzde , Vasyans Boy uzunluğu, ağırlık, zaman, yaĢ ( gerçek sıfırı var ) Nicel ( Miktar verilir) Var Var Var Var Var Ölçme Türü Var - ÖLÇME TÜRLERĠ DOĞRUDAN ÖLÇME: Ölçülecek özellikle , ölçme aracının birebir karĢılaĢtırılmasına dayanan, araya baĢka değiĢken girmeden yapılan ölçme iĢlemidir. Ölçme aracı ile ölçülen özellik aynı özelliklere sahip olmalıdır. Doğrudan ölçmede kullandığımız araç ile ölçüm niteliğimiz aynı özelliktedir. ( Uzunluk baĢka bir uzunlukla , ağırlık baĢka bir ağırlıkla sayı sayılarak gibi) ġu an bulunduğunuz ortamda yer alan kiĢi sayısı kadar kalem, boncuk, kağıt vs masanın üstüne koyun masanın üstüne koyduğunuz materyallerle kiĢi sayısı aynı ve benzer özellikteler bu durumda doğrudan ölçme yaptık. Yani kiĢi sayısını boncuk sayısı ile baĢka bir deyiĢle sayıyı sayarak ölçtük Kefeli terazide ölçülen ağırlık doğrudan ölçmedir ancak yaylı ya da dijital terazilerde ölçülen ağırlık dolaylı ölçmeye örnektir. Çünkü kefeli terazide terazinin karĢısına koyduğumuz ağırlık ölçmek istediğimiz nesne ile aynı özellikleri taĢımaktadır. Yaylı terazide ise ağırlığı esneme – uzunluk ile ölçmekteyiz. BiliĢsel ve duyuĢsal davranıĢlar doğrudan ölçülemez ancak psiko-motor “!!!davranıĢlar!!!” doğrudan ölçülebilir. ġĠMDĠ ÇOK AMA ÇOK DĠKKAT EDĠN. YETENEK, ĠLGĠ, TUTUM, BAġARI, ZEKA vb soyut özellikler DOĞRUDAN ÖLÇÜLEMEZ. Bir kiĢiye yetenek testi uygulayıp yeteneklerinin belirlenmesi DOLAYLI ÖLÇMEDĠR. Ancak bir kiĢiye resim çizdirip resim çizmedeki psiko-motor davranıĢlarını belirlemek doğrudandır. Çünkü resim çizerken gösterdiği psiko-motor davranıĢlar yine resim çizdirilerek belirlendi. ( Psiko-motor davranıĢ dediğime dikkat edin yetenek demiyorum) Bir kiĢinin spora yönelik tutumunu bir tutum ölçeği ile belirlersek DOLAYLI ÖLÇME ancak bir kiĢinin koĢu hızını – performasını ölçerken onu koĢturursak DOĞRUDAN ÖLÇME olur. Çünkü koĢu hızı – performansı – psiko-motor davranıĢları yine koĢturularak bulundu. ( Psiko-motor davranıĢ ifadesine dikkat doğrudan ölçülebilen psiko-motor davranıĢtır) Doğrudan ölçemeye örnekler: Üzerimdeki gömlek siyahtır. Otoparkta 43 araba vardı. ( Sayıyı sayarak ölçtü) Çocuğun okul harçlığı 5 tl‟dir. Masanın uzunluğunun cetvelle ölçülmesi Odanın uzunluğunun metre ile adım ile karıĢ ile ( yani herhangi bir uzunlukla) ölçülmesi Bir yerde bulunan öğrenci, araç, defter vs. Ģeylerin sayısının ölçülmesi Bir insanın yaĢının ölçülmesi Bir nesnenin hacmi ölçülürken nesne suya batırılıp taĢan suyun hacmi üzerinden nesnenin hacmi bulunuyorsa doğrudan hacim cismin özkütlesi ve kütlesi çarpılarak bulunuyorsa ( yani formülle ) o zaman doğrudan değil TÜRETĠLMĠġ. Formülle TüretilmiĢtir. bulunan özellikler doğrudan değildir. Bir asker, hedef ile arasındaki mesafayi ( uzunluk) bulmak istiyor. Eline aldığı metre ile ( uzunluk ölçen araç) ile mesafeyi ölçerse DOĞRUDAN ölçmedir. Ancak merminin namludan çıktığı an ile hedefe vardığı anı kaydedip ( süreyi) bunu merminin saniyedeki hızı ile çarparsa ( Km/sn ) çıkan sonuç da uzunluğu verir. Ancak bu ölçme doğrudan değil TÜRETĠLMĠġTĠR. Bir kiĢinin dans ederken gösterilmesi gereken davranıĢlara sahip olma derecesi nasıl ölçülür Bir kiĢinin dans ederken göstermesi gereken psiko-motor davranıĢlar yine dans ettirilerek ölçülür. Bu yüzden doğrudan ölçmedir. ġimdi size bir soru soracağım ancak bu soruya ve açıklamamıza çok dikkat etmelisiniz. Ahmet kare biçiminde bir tarlanın çevresini ( uzunluğunu ölçecektir) . Biliyorsunuz ki karenin tüm kenarları eĢittir. Bu yüzden de Ahmet, tarlanın sadece bir kenarını metre ile ( uzunluk ölçerle) ölçüyor. Buraya kadar olan ölçme iĢlemi doğrudandır. Evet zaten mesele bundan sonra baĢlıyor. Bir kenarını ölçen Ahmet bunu 4 ile çarpıyor ve tüm karenin çevresini buluyor. Peki Ģimdi Ahmet türetilmiĢ ölçme mi yaptı yoksa doğrudan ölçme mi? Tabii ki birçok arkadaĢ dikkatsizlik nedeni ile türetilmiĢ ölçme diyebilir. Ancak bu türetilmiĢ ölçme değildir.Çünkü çarpım sonucunda kullanılan birim değiĢmedi. Diyelim ki bir kenarı 100 metre olsun bu durumda çevresi 400 metredir. Ancak karenin ALANI hesaplansaydı. Metre olan birim Metre kareye dönüĢeceğinden ( yani birim değiĢeceğinden) TüretilmiĢ olurdu. BaĢka bir örnekle açıklayalım bir kutuda 10 kalem olsun. ( Doğrudan ölçme) 10 kutu varsa 100 kalem vardır da doğrudan ölçmedir. O halde çarpımda birim değiĢiyorsa ancak o zaman TÜRETĠLMĠġ diyebiliriz. AYRINTILAR ĠÇĠN bkz TÜRETĠLMĠġ ÖLÇME Bir insanın kütlesini yine baĢka bir kütle ile ( kg cinsinden) ölçersek bu doğrudan ölçmedir. Bu da ancak kiĢinin kütlesinin karĢısına bir kütle koymakla olur kefeli terazilerde olduğu gibi. Ancak bir kiĢinin kütlesini oturduğu koltukta oluĢan çöküntü ile de ölçebiliriz ( tahmini – yaklaĢık) bu durumda bu ölçme dolaylı olacaktır. Doğrudan ölçmeler dolaylı ölçmelere göre daha geçerli ve güvenilir sonuçlar verir. DOLAYLI ( GÖSTERGE ile ) ÖLÇME: Ölçülmek istenen niteliğin kendisinin değil baĢka bir durum üzerinde yarattığı sonuçların ölçülmesidir. Ölçülecek nitelik ; ders baĢarısı, öğrenme düzeyi , yetenek vs gibi soyut bir durumsa ölçen kiĢi dolaylı ölçme yapacaktır Yaylı terazi neden değerlendirilmeli? dolaylı ölçme iĢlemi olarak Çünkü bu ölçme iĢleminde bir ağırlığın doğrudan baĢka bir ağırlıkla ölçülmesi değil o ağırlığın bir yay üzerindeki sonuçları ( yayın gerilmesi - uzunluğu) ölçülmüĢtür. Bir öğrencinin eğitim bilimlerinin temel kavramları ile ilgili bilgi ve becerilerini ölçmek isteyelim Bu durumda bir yazılı kağıdı ya da özel olarak düzenlenmiĢ sözlü sorular yönelteceğiz. Öğrenme doğrudan vardanamayan (yordanamayan) ancak davranıĢ ya da performans ile açığa çıkan bir durum olduğundan biz ölçme aracımızda bilgiyi doğrudan değil onun sonuçlarını dolaylı olarak ölçüyoruz. Sıcaklığın termometre ile ölçülmesi dolaylı ölçmedir. Çünkü sıcaklığı yine onun kadar sıcak olan bir birimle değil civanın sıcaklık karĢısında yükselip alçalma sonucu ile ölçmekteyiz. Piaget çocukların biliĢsel geliĢimlerini belirlemek için klinik yöntemi kullanarak onlara bazı güdümlü sorular sormuĢ ve biliĢsel geliĢim düzeylerini belirlemeye çalıĢmıĢtır. Burada biliĢ gibi soyut ve doğrudan gözlenemeyen bir durum, soru sorularak açığa çıkarılmıĢtır. Bu yüzden ölçe iĢlemi dolaylıdır. Eğitimde öğrencilerin biliĢsel ve duyuĢsal kazanımlara ulaĢmaları nasıl ölçülür? Öğrencilerin biliĢsel ve duyuĢsal kazanımlara ulaĢmaları, soru sorularak, testler yapılar vb. ölçülür. Çünkü bu gibi özellikler soyuttur ve doğrudan gözlenemez. Ancak testler kullanılarak ölçülür ve yordanır; bu yüzden dolaylıdır. Bir Türkçe öğretmeni öğrencisinden metinde geçen bazı kelimelerin anlamını yazmasını istemiĢtir. Öğretmen öğrencilerinin biliĢsel bir becerisini soru sorarak ölçmüĢtür. Eğitimde uygulanan testler dolaylı ölçmeye örnektir. DeğiĢik Örnekler: Öğrencilerin Türkçe dersine olan tutum ve ilgilerini ölçme KiĢilik testleri ile bir öğrencinin tanınması Bir öğrencinin zeka puanının belirlenmesi Piskolojik yapılar (Zeka- yetenek, baĢarı, ilgi , tutum, kiĢilik vb. ) dolaylı ölçme örneklerini oluĢturur. TÜRETĠLMĠġ ÖLÇME: Farklı ölçme sonuçlarının oranı ya da çarpımı sonucunda yeni elde edilen ölçme sonucuna türetilmiĢ ölçme denir. TüretilmiĢ ölçme yapabilmek için en az iki ölçme iĢlemini yapıp sonuçlarını bulmam ve daha sonra bu ölçüm değerlerini formülde uygulamak gerekir. Ancak dikkat edilecek nokta türetilmiĢ ölçmenin birimi diğer ölçümlerde kullanılan birimlerden farklı olmalıdır. NE DEMEK ĠSTĠYOROZ: ġimdi diyelim ki iki kent arası uzaklığı bulacağız. ( Birim olarak km ) Eğer iki kent arasını bir uzunluk ölçer ile ölçersek bu doğrudan ölçme olur. Ancak türeterek de iki kent arası uzaklığı buluruz. Bunun için en az iki ölçme yapmamız lazım 1. Önce iki kent arasında yolculuk yapan bir aracın saatteki hızı bulunur ( Birim km/s ) 2. Sonra bu aracın bu iki kent arasını ne kadar sürede aldığını buluruz ( Saat ya da dakika) 3. Bu iki ölçümü birbiri ile çarptığımızda ise karĢımıza iki kent arası uzaklık çıkar ( Km cinsinden) Gördüğünüz gibi birinci ölçmemizin birimi ( km/s) ikinci ölçmemizin birimi ( saat ya da dakika) türettiğimiz ölçmenin birimi ise ( km) Yukarıdaki açıklamaları da dikkate alıp daha yalın bir söylem kullanırsak türetilmiĢ ölçme formül ile bulduğumuz ölçüm sonuçlarıdır diyebiliriz. Örnekler: Yoğunluk ( özkütle ) Bir cismin yoğunluğunu bulmak için önce o cismin kütlesini ardından da hacmini bulup kütleyi hacme bölerseniz öz kütlesini bulursunuz. Yani özkütleyi bulmak için doğrudan değil iki ölçme yapıp bunların oranını almak zorunda kaldık. Zeka Bölümü Bir kiĢinin baĢarı testinden aldığı sonucu o kiĢinin takvim yaĢına bölüp 100 ile çarparsanız kiĢinin zeka bölümünü bulursunuz. Yani zeka bölümünü doğrudan değil en az iki ölçümün oranı ve bir çarpımla kısacası formülle bulduk. Nüfus Yoğunluğu: Bir ülkenin ya da Ģehrin nüfus yoğunluğunu bulmak için önce o ülkede yaĢayan insanların kiĢi sayısını sonra ülkenin yüzölçümünü bulup bunların oranını alırsak karĢımıza nüfus yoğunluğu çıkar. Bir okulda vize notu %40 , final notu %60 olarak dönem sonu notunu etkilemektedir. Bu durumda türetilmiĢ ölçme kullanmak zorundayız. DEĞERLENDĠRME Ölçme Sonucu Ali, sınavdan 54 aldı Kriter ( Ölçüt) Sınıf geçmek için en az 60 almak gerekir AyĢe‟nin boy uzunluğu 175 santimdir. Polis Akademisine alınmak için boy uzunluğu en az 170 santim olmalıdır (?) 2013 KPSS‟de Ġngilizce Öğretmeni olarak ilk 1876‟ya giren atanacaktır. Bu iĢyerinde müdürlük sınavına girebilmek için en az 13 yıl çalıĢman gerekir. Ölçme sonucumuz kendisi ile aynı birimden olan bir kriter ile karĢılaĢtırılır. Metin KPSS‟de Ġngilizce öğretmenliği bölümünde 1876. oldu. Bu iĢ yerinde 10 senedir çalıĢıyorsun Değerlendirme yapabilmemiz için elimizde öncelikle bir ölçüm ( ölçme sonucu ) olmalı Değerlendirme Ali geçmek için 60 alınması gereken bir sınavdan 54 aldığı için sınıfta kaldı. AyĢe Polis Akademisi‟ne alınabilir. Metin öğretmen olarak atanabilir. Bu iĢ yerinde giremezsin. müdürlük sınavına Bu karĢılaĢtırma sonucunda varılan yargıya ya da karara değerlendirme denir. Değerlendirme ölçmeyi de içine alan daha genel bir süreçtir. Değerlendirmelerin objektif ve sağlıklı olabilmesi için ölçüm ile kriterin aynı cinsten olması gerekir. Örneğin ölçüm birimi metre ise kriter de metre olmalı ya da en azından metreye çevrilebilecek bir birim olmalı ( mesela santimetre gibi) Aksi durumda ölçüm hakkında karar verilemez. Yapılandırma Kutusu: Değerlendirme konusunu örneklerle yapılandıralım. Ahmet’in sözvarlığı ( kelime dağarcığı) 5000’dir; 10 yaĢındaki bir çocukta bulunması gereken söz varlığının çok altında olduğu için özel destek alması ve bol kitap okuması gerekmektedir. Bu cümleyi ölçme ve değerlendirme açısından analiz ettiğimizde: Ölçüm cümlemiz: Ahmet’in söz varlığı 5000 kelimedir. Kriterimiz: Cümlede kriter açıkça söylenmemiĢ ama tahminen Ģöyle diyelim “10 yaĢındaki bir çocukta bulunması gereken kelime sayısı 8.000’dir. Bu durumda Ahmet kriterimizin altındadır. Değerlendirmemiz ve kararımız: Ahmet’in sahip olduğu söz dağarcığı yaĢının kriterlerinin çok altındadır. Destek almalıdır. „i 9 yaĢındaki Ali’nin boy uzunluğu 110 santimdir; 9 yaĢındaki Ahmet’in boy uzunluğu ise 155 santimdir.Eğer 9 yaĢındaki çocukların sahip olmaları gereken boy uzunluğunun alt sınırını ve üst sınırını bilmiyorsanız bu ölçme cümlelerimiz size hiç de garip gelmez ya da bir yargıya ulaĢamazsınız. ġimdi kriteri verelim: 9 yaĢındaki bir erkek çocuğunun boy uzunluğu en az 123 santim en fazla ise 144 santim olmalıdır. ġimdi Ali ve Ahmet için değerlendirme yapabilirsiniz. Çünkü artık kriteriniz var. O halde değerlendirmeyi yapalım. Ali yaĢıtlarına göre çok kısa ( cüce) Ahmet ise yaĢıtlarına göre çok uzundur ( dev) her ikisinin de doktora gösterilmesi gerekmektedir. Bazen kriterler grubun performasına göre belli olur. Bu tip kriterlere birazdan bağıl kriter ( norm dayanaklı ) diyeceğiz. Bir örnek verelim. Ahmet’in baĢarı testi sonucu ham puanı 70’tir. Sınavdan baĢarılı olması için aritmetik ortalama ve onun üzerinde alması gerekmektedir. ġimdi bu durumda Ahmet’in baĢarılı olması artık sınıfım aritmetik ortalamasının kaç olduğuna bağlıdır. ( Sınıf genel itibari ile yüksek alırsa Ahmet baĢarısız olabilir ya da tam tersi bakalım ne olacak ... az sonra ) Sınıfın aritmetik ortalaması 50’dir. Bu durumda Ahmet sınıfın ortalamasının çok üstünde puan aldığı için baĢarılıdır. ÖLÇÜT ( KRĠTER) Ölçme iĢlemi ile elde edilen ölçüm hakkında karar verebilmek, değerlendirme yapabilmek için hemcinsinden ( benzer tür – aynı tür ) bir kriterle karĢılaĢtırma yapmak ve ona göre karar vermek gerekir. Değerlendirme sırasında, ölçüm değerini anlamlı kılan – ölçüm değeri ile karĢılaĢtırılan kritere ölçüt denir. Ölçüt olmadan ölçme sonuçları anlamsızdır. Örneğin: “YetiĢkin bir tapirin ağırlığı 400 kilogramdır.” Size Ģu soruyu soruyorum. Sizce bu tapir ağır mı hafif mi? Bir karara varamıyorsunuz çünkü yetiĢkin bir tapirin olması gereken ortalama kiloyu bilmiyorsunuz. Bilseydiniz ağır ya da hafif derdiniz. ġimdi ölçütü verelim: “YetiĢkin bir tapir ortalama 1000 kilogram civarındadır. ” Bu ölçütü bilince ölçme sonucumuz da anlam kazandı ve tapirin olması gerekenden hafif olduğu yargısına ulaĢıyoruz. MUTLAK ÖLÇÜT: ( Kriter – Ölçüt Bağıntılı) : Mutlak kriterin temel özelliği ölçme iĢlemi yapılmadan önce puan, süre, kg vb birimlerle belirlenmiĢ olmasıdır. Ölçme yapılacak gruptan bağımsız belirlenmiĢtir. ÇağdaĢ değerlendirme anlayıĢlarında mutlak kriter daha çok kullanılır. Bağıl kriter belli özel durumlar dıĢında kullanılmaz. Mutlak Kriteri Belirleyen Durumlar: Kazanımlar ( hedef – davranıĢlar) : Tam öğrenme, programlı öğrenme gibi öğretim yaklaĢımlarında her ünite ya da konu sonunda yapılan sınavların kriterleri belirlenirken hedef davranıĢlar dikkate alınır. Bu yüzden bu öğrenme modellerinde mutlaka mutlak kriter kullanılır. Örneğin: Türkçe dersinin hedef davranıĢlarının %70‟ini ya da 50 tanesini kazanan öğrenci dersi geçer. Dikkat ettiyseniz bu kriter tüm grup için geçerli ve gruptan bağımsız bir referans noktası var ( Kazanımlar) Soru sayısı: Kriter sınavda sorular soru sayısı üzerinden de belirlenebilir. Örneğin: Matematik testindeki 20 sorudan 15‟ini yapanlar dersi geçer. Konu sınırı: Kriter bir konu ya da ders sınırı üzerinden de belirlenebilir. Örneğin: Türkçe dersini geçenler sınıfı da geçer; ya da Türkçe dersindeki isim, sıfat, zamir, zarf, edat , bağlaç, ünlem konuları öğrenenler baĢarılı sayılır gibi Öğretmen kanısı: Öğretmenin kanısı da mutlak kriterdir. Çünkü grubun dıĢında bir değerdir. Ancak öğretmen kanısı duruma göre değiĢebilir yani sabit değildir. Öğrenme eksiklikleri: Öğrenme eksikliği belirlemek amacıyla yapılan formatif sınavlarda kullanılacak kriterler mutlaka ama mutlaka Mutlak Kriter olmalı. Zaten genelde formatif sınavlarda kazanıma ya da puana göre kriter belirlenir. ÖRNEKLER: Mutlak Kriter Örnekleri: Hedeflerin %70‟ini kazanan öğrenci tam öğrenmeye göre baĢarılıdır. ĠĢbirlikli çalıĢmalarda öğretmenin bir grup baĢarı kriteri belirlemesi ( bu kriteri aĢanları baĢarılı sayması) Soruların 5‟ini doğru yanıtlayan öğrenci sınavdan geçer not alır. Partiye katılabilmek için smokin giymek zorunludur. Türkçe dersinden 70 alanlar geçer. Mutlak Değerlendirme Örnekleri: Mutlak kritere göre yapılan değerlendirmeler mutlak değerlendirmedir. Anlatacak bir Ģey yok Ahmet’in boy uzunluğu 1.70’ten fazla olduğu için polis akademisine alınmıştır. YSÖP kapsamında bir sınıf açılması için en az 10 öğrenci gerektiği için sınıf açılmamıştır. Bu resim kursuna yazılabilmek için ayda 100 tl ücret ödemek gerektiği için kaydolabilirsin. Türkçe dersini başaramayan öğrencilerin sınıfta bırakılması Ehliyet sınavından en az 70 puan almış olmak gerektiği için başarılı oldun. İçeriğin %70’ini sınav kağıdına aktaran öğrencilerin dersi geçebildiği bir sınavda içeriğin %71’ini yansıttığın için dersi geçtin Mutlak kriter ve değerlendirmenin kullanılabileceği durumlar: Ölçme kapsamındaki davranışların belli bir oranının kazanılmış olmasının gerekli olduğu durumlarda. Başka bir deyişle öğrencilerin YETERLİKLERİ belirlenecekse kriter mutlak olmalı Mutlak değerlendirme yapılabilmesi için testin yüksek düzeyde kapsam geçerliğine sahip olması gerekir. Öğrencilerin aşması gereken bir eşik değeri var ise yani öğrencilerin belli bir standartın üstünde olması isteniyorsa mutlak kriter tercih edilir. Aksi durumların sakıncalarını tartışacağız... BAĞIL ÖLÇÜT ( NORM BAĞINTILI – DAYANAKLI): Ölçme iĢleminin sonuçlarına göre çıkartılan ve gruptan gruba değiĢen ( yani gruba göre belirlenen) kriterdir. Bağıl Kriterleri Belirleyen Durumlar: Norm ( Standart) Puanlar: Z ve T puanlarına göre belirlenen kriterler bağıldır. Sınavdan 70 alanlar geçer mutlak kriter iken ; T puanı 70 olanlar geçer bağıl kriterdir. Çünkü Z ve T puanları aritmetik ortalama ve standart sapmaya göre bulunur. Çaneğrisi kullanımları da bağıldır. Grup içindeki bireyleri karĢılaĢtırmak sıralamak: Öğrencileri sırayalarak ya da karĢılaĢtırarak yapılan değerlendirmeler de bağıldır. “En” ya da “ilk” kelimeleri anahtardır. Örneğin Sınıfın en uzun boylu öğrencisi basket takımına seçilir. Buradaki “en uzun boylu” olmak gruba göre değiĢir. Herkesin 190 santim olduğu bir sınıfta en uzun 195 santimlik iken, herkesin 160 olduğu bir sınıfta en uzun 165 santimlik kiĢi olur. Basketbol takımına eleman seçerken böyle bir kriter kullanılması da sakıncalı olabilir. Bu yüzden bağıl kriter kullanmak çoğu kez sakıncalı olmaktadır. Grubun standart sapması, ortalaması, medyanı ( ortanca), modu ( tepe değeri), çeyrek sapması, yüzdelikler vb : Merkezi eğilim ve dağılım ölçüleri bağıl kriterdir. Örneğin ortalamanın +1 standart sapma üstünde olanlar baĢarılıdır. Bu örnekte kimin baĢarılı olacağı yine grubun aritmetik ortalamasına bağlı olduğu için kriter bağıldır. Ülke düzeyindeki normlar: Mantık olarak sınıfın ortalamasına göre not vermeye benzer. Ülke düzeyinde uygulanan testlerin sonuçlarına ( ortalamsına ) göre öğrenciye not verme diyebiliriz. Bu düĢünceden kaynaklı standart baĢarı testleri doğmuĢtur. Öğrenci yeteneği: Bir sınıfta üstün yetenekli / zekalı ve daha düĢük yetenekli / zekalı öğrenciler olabilir. Bu öğrencilere not verirken çoğu öğretmen bunu gözetmez. Söyleyeceğim bazı öğretmenlere ters gelebilir ( yılların not verme alıĢkanlığından kaynaklı) ġöyle diyebilirim düĢük yetenekli bir öğrenci 10 soruluk testten 7‟sini yapsın; üstün yetenekli bir öğrenci ise 10 soruluk testten 9‟unu yapsın. Bu noktada bağıl değerlendirme yaparsak ( yani öğrencilerin yeteneğine göre not verirsek) iki öğrencinin de aynı puanı alması ya da 7 soru yapan öğrencinin daha yüksek alması beklenebilir. Sonuçta o kendi yeteneğine göre iyi bir performans gerçekleĢtirdir. Tabii bu görüĢ genelde öğretmenler tarafından benimsenmez ve adaletsizlik olarak görülür. Sağa ve sola çarpık dağılım gösteren gruplarda bağıl kriter kullanılması önerilmez. Bağıl kriter normal dağılım gösteren gruplarda kullanılması daha geçerli sonuçlar verir. UNUTMAYIN ÖRNEKLER: Bağıl Kriter Örnekleri: Sınıf aritmetik ortalamasının üzerinde puan alanlar dersi geçer Sınıftaki en uzun boylu öğrenci kapı görevlisi yapılır. En çok oy alan öğrenci sınıf temsilcisi seçilir. KPSS’ye giren beden eğitimi programı mezunu öğrencilerden en yüksek not alan ilk 500 kişi atanacaktır. Birinci ligde yer alan en başarısız 3 takım ikinci lige düşer. Medyanın üstünde puan alanlar Ahmet Hoca’dan çokonat kazanırlar FEM Akademi’de deneme sınavında ilk üçe girenlere kitap hediye edilecektir. Bağıl Değerlendirme Örnekleri: Okulun en uzun boylu 12 öğrencisi okul basketbol takımına seçilmiştir. Yetenek sınavında en yetenekli 5 öğrencinin seçilmesi Not ortalaması sınıf ortalamasının altında olanlar dersi geçememiştir. Aritmetik ortalamanın +2 ve +3 standart sapmasında yer alan öğrencilere 100 puan sözlü notu verilmiştir. Bağıl kriter ve değerlendirmenin uygun olduğu durumlar. Hız testlerinde bağıl kriter önerilir. Sınavın yanıtlama süresinin öğrencilerin tümünün soruların tümünü yanıtlayacakları kadar uzun olmadığı sınama durumlarınde kriter bağıl olmalıdır. Güç testlerinde bağıl kriter önerilir. Soruların güçlük düzeyinin yüksek ( yani zor) olması durumunda bağıl kriter kullanılır. Seçme ve yerleĢtirme sınavlarında öğrencilerin belli bir kontenjan dahilinde seçilmesi durumunda bağıl kriter kullanılır. Yani katılımın çok alımın az olduğu seçme sınavlarında bağıl kriter kullanıllır. GeniĢ ölçekli – ulusal sınavlarda da katılım çok alım az olduğu için kriter bağıldır. Örneğin beden eğitimi öğretmenlerinden ilk 4000‟e giren atanır gibi. AMACINA GÖRE DEĞERLENDĠRME DĠAGNOSTĠK ( TANIMA – YERLEġTĠRME) : Girdilerin ya da önkoĢul kazazanımların ölçüldüğü sınavlardır. Genelde eğitim öğretim sürecinin baĢında ya da yeni bir üniteye geçmeden önce önkoĢul kazanımlara sahip olunup olunmadığını belirlemek için yapılır. Çünkü her önkoĢul bilgi bir sonraki için temeldir. Bu durumda önkoĢul kazanımların değerlendirilip eğitim – öğretime bu Ģekilde baĢlanması ya da yeni üniteye geçilmesi uygun olacaktır. AMAÇ: Öğrencilerin derse , üniteye ya da konuya dair önkoĢul bilgilerini ( hazırbulunuĢluklarını) belirlemek varsa eksiklikleri düzeltmektir. Bu yüzden amaç not verme değil; tanıma ve yerleĢtirmedir. Örnekler: Bir öğretmenin sene baĢında öğrencilerine dersine dönük ilgi ve tutum ölçekleri uygulatıp , öğrencilerin duyuĢsal hazırbulunuĢluğunu ve bir baĢarı testi uygulayıp biliĢsel hazırbulunuĢluğunu belirlemesi Bir üniveristeye giren örğencilere Ġngilizce muhafiyet sınavı uygulanması. Bu sınav sonucu öğrencileri tanıyıp kimlerin hazırlık okuyacağı kimlerin birinci sınıfa geçeceği belirlenir. Ölçme Araçları: HazırbulunuĢluk testi ( Önbilgi , ilgi , tutum, kiĢilik vb) ( Mutlak Kriter) Seçme testi ( Bağıl da olabilir katılım çok alım az ise ) Tanıma – yerleĢtirme testleri Muafiyet testleri ( Mutlak Kriter) HazırbulunuĢluk ve muafiyet testlerinde mutlaka mutlak kriter kullanılmalıdır. Buna karĢılık seçme sınavlarında – katılım çok alım az ise – bağıl kriter kullanılmalıdır. Diagnostik testler, öğrencinin önbilgi – hazıroluĢ düzeyini belirlemek içindir. Ayrıca öğrencilerin öğrenme ihityaçlarını da belirler. Örneğin bir Ġngilizce kursu, kursa baĢlamadan önce uyguladığı bir diagnostik test sayesinde kursiyerinin nasıl bir eğitime ihtiyacı olduğunu da anlar. Öğrencilerin zayıf ve güçlü yanlarını belirleyerek onların uygun eğitim programlarına yerleĢtirilmesini sağlar. FORMATĠF ( Biçimlendirme – YetiĢtirme; Ġzleme – GeliĢtirme): Sürecin ya da öğrenme eksikliklerinin değerlendirilmesi de denebilir. Genelde eğitim öğretim süreci içinde her konu ya da üniteden sonra yapılır. Amaç yine not vermek değil, öğrenme eksikliklerinin ve aksaklıklarının tespit edilip giderilmesidir. Diagnostikten ayrılan yanı bir eğitim öğretim sürecinden sonra yapılan eğitim öğretim sürecinin ne kadar amaca ulaĢtığını görmektir. Ayrıca Formatif sınavlar öğrenciye ANINDA DÖNÜT verir. Amaç: Öğrenme ve öğretme eksikliklerinin tespit edilip giderilmesi. Öğrenciye anında dönüt vererek hatalarını görmesi vb. Örnekler: Tam öğrenmede her ünite bitiminde yapılan sınavlar. Bu sınavlarda o ünitede iĢlenen konulardan soru sorulur ve hedef davranıĢların ne kadarına ulaĢıldığı tespit edilir. Eksik öğrenmeler var ise ek öğretim yapılarak bir sonraki üniteye geçilir. Bu sınavlarda amaç öğrenci notunu vermek değil eksik öğrenmeleri gidermektir. Ölçme Araçları: Üniteler için özel hazırlanmıĢ izleme testleri Ġzleme testi Ünite testi Formatif testler Formatif testlerin kapsam bakımından geçerli olabilmesi için o konu ya da ünitede iĢlenen TÜM KRĠTĠK DAVRANIġLARDAN soru sorulması ZORUNLULUKTUR. Ayrıca daha önce de dediğim gibi FORMATĠF SINAVLARIN TAMAMI MUTLAK KRĠTERE GÖRE DEĞERLENDĠRĠLĠR. SÜMMATĠF ( Düzey Belirleme – Değer Biçme ; BütünleĢtirici – Özetleyici) : Çıktıların değerlendirilmesi olarak da adlandırılabilir. Amaç bir eğitim öğretim programı sonucunda ulaĢılan hedef davranıĢların belirlenmesidir. Bu süreç sonunda öğrencilere diploma, sertifika, belge vb verilebilir. Amaç: Amaç öğrencilerin hedef- davranıĢlara ne kadar sahip olduğunu belirleyip not, diploma, belge vb vermektir. Örnekler: Bir bilgisayar kursunun kursiyerlerine sınava hazırlayıp sene sonunda sınav yapması ve bu sınav sonucuna göre belge ya da sertifika vermesi Yeterlik sınavları vb. Kullanılan ölçme araçları : Ders veya kurslar için özel olarak hazırlanmıĢ düzey belirleme testleri EriĢi testi ( Bağıl Kriter Önerilir) BaĢarı testi Vize – final sınavları Bitirme sınavı ( Mutlak Kriter ) Yeterlik testi ( Mutlak Kriter) Sertifika sınavı ( Mutlak Kriter) Sümmatif testler Uzmanlık testleri ( Mutlak Kriter) EK AÇIKLAMA: Muafiyet ve hazırbulunuĢluk testlerinde neden mutlaka mutlak değerlendirme yapılır. ġöyle diyelim bir üniversite sene baĢında Ġngilizce dersi için bir muafiyet sınavı hazırlasın; bu sınavda amaç Ġngilizce bilen öğrencileri ayırmak – tanımaktır. Varsayım yapalım, bu üniversite muafiyet sınavında bağıl ölçüt kullansın. ġimdi bu sınava 100 öğrenci girsin ve 99‟u 0 puan 1 tanesi ise 1 puan alsın. Bu durumda bir kiĢi diğerlerinden baĢarılı olduğu için sınavı geçer. Fakat o kiĢi Ġngilizce biliyor mu ? Tabii ki hayır. Ancak bu tip sınavlarda 100 üzerinden 80 alanlar baĢarılıdır gibi mutlak bir kriter belirlenmelidir. EK AÇIKLAMA: Neden izleme amaçlı testlerde mutlak değerlendirme yapılmalıdır. Ġzleme amaçlı testler en çok tam öğrenme kuramında kullanılır. ġimdi bir öğretmen bir üniteyi bitirdikten sonra öğrenme eksikliklerini tespit edip gidermek için bir izleme testi yapsın ve bağıl ölçüt kullanmıĢ olsun. Yine yukarıdaki durum gibi 10 öğrencinin girdiği sınavda 9 öğrenci 0 puan 1 öğrenci 1 puan almıĢ olsun. Ölçüt bağıl olursa bir öğrenci sadece 1 puan alsa da baĢarılı sayılır ki bu durum izleme testinin amacına uymaz. Çünkü 100 üzerinden 1 alan bir kiĢide 99 kritik davranıĢ kazanılmamıĢ demektir. Bu yüzden bu tip sınavlarda da 80 alan bir sonraki üniteye geçebilir gibi mutlak ölçütler kullanılmalıdır. Çok kiĢinin baĢvurduğu bir sınavda, az kiĢi alınacaksa nasıl bir değerlendirme kriteri belirlenmelidir? Böyle bir sınavda ( diyelim ki sınav 100 üzerinden yapılmıĢ olsun) mutlak bir kriter belirlemek yanlıĢ olacaktır. Diyelim ki 80 alan herkes baĢarılı kabul edilsin – yani mutlak bir kriter belirlensin- Bu durumda sınavda 80 alan herkes baĢarılı kabul edilir ki sınava giren herkesin 80 alma ihtimali bile vardır. Bu durumda sınav seçme amacına ulaĢmaz. Bu durumda böyle bir sınav için bağıl kriter belirlemek en doğrusu olacaktır. Yani ilk 100 kiĢi baĢarılı sayılacaktır gibi. Bu durumda sınav amacına ulaĢır ve en iyi 100 kiĢi baĢarılı kabul edilir. GEÇERLĠK – GÜVENĠRLĠK - KULLANIġLILIK ÖLÇME ARAÇLARINDA BULUNMASI GEREKEN ÖZELLĠKLER Güvenirlik Geçerlik Duyarlılık Kararlılık Tutarlılık İç Tutarlık - Güvenirlik Belirleme Yolları Test – Tekrar test Eşdeğer ( Paralel) Formlar Eşdeğer Yarılar KR-20 Güvenirliği KR- 21 Güvenirliği Cronbach Alfa Puanlayıcı Güvenirliği Ölçmenin Standart Hatası Kapsam Geçerliği Ölçüt Geçerliği Yapı Geçerliği Görünüş Geçerliği Karar Geçerliği KullanıĢlık Ekonomiklik Uygulanabilirlik Puanlanabilirlik GÜVENĠRLĠK Güvenirlik ölçme aracı ile birbiri ardınca yapılan ölçümlerin aynı – kararlı sonuçları vermesidir. Örneğin bir Türkçe testini aynı öğrencilere üç kere uyguladığımızda, aynı – benzer – kararlı sonuçlar alıyorsak o testin güvenirlik açısından iyi olduğunu söyleyebiliriz. Güvenirlik bir testin hatalardan arınıklık derecesidir. Ölçme iĢlemindeki tesadüfi hatalar testin güvenirliğini düĢürür. GÜVENĠRLĠK bir testin kendiliğinden sahip olduğu bir nitelik değildir. O ancak bir testin gruba uygulanmasıyla sahip olduğu bir niteliktir. Buna karĢılık GEÇERLĠK TESTĠN KENDĠNDEN OLAN BĠR DURUMDUR. Bu yüzden Bir sınava karıĢan hataların miktarının bilinmesi en çok güvenirlikle ilgilidir; çünkü hatalar uygulama ile açığa çıkar !!! Bir testin güvenilir olmaması, ölçme hatalarının miktarının göstergesidir ve bir testten elde edilen puanların yorumlanmasında ölçme hatalarının miktarının bilinmesi, o sonuçlara dayanarak doğru karar vermek açısından önemlidir. ÖLÇME SONUÇLARINA KARIġAN HATA PAYININ BĠLĠNMESĠ en çok GÜVENĠRLĠKLE ĠLGĠLĠDĠR. ÇÜNKÜ HATALAR UYGULAMADA ORTAYA ÇIKAR ve GÜVENĠRLĠK UYGULAMAYLA ANLAM BULAN BĠR ÖZELLĠKTĠR Güvenirlik indeksi gerçek puanlar varyansı ile gözlenen puanlar varyansına oranı olduğu için (-) negatif değer almaz. Güvenirlik katsayısı 0 ile 1 arasında değer alır. Güvenirlik Anlamları Duyarlık Kararlık Tutarlık Güvenirlik bir hata kuramıdır. Tesadüfi hata kuramıdır. Ġçturarlık GÜVENĠRLĠĞĠN 4 ÇOCUĞU ( GÜVENĠRLĠĞĠN 4 ANLAMI) 1. DUYARLIK : Duyarlık ölçme aracının birimi ile ilgili bir kavramdır. Ölçme aracının birimi arttıkça karıĢan hata miktarı azalır ve daha güvenilir sonuçlar elde edilir. SORU: Soru sayısını arttırdıkça güvenirlik daima artar mı? ( Kesinlikle artar mı?) Soru sayısının artırılması güvenirliği kesinlikle artırır diyemeyiz. Soru sayısının artmasının güvenirliği artırmasını kesin olarak söyleyebilmemiz için iki Ģartımız söz konusudur: a) Eklediğimiz sorular testin homojen yapısını bozmamalıdır. Örneğin bir 30 sorudan oluĢan bir Türkçe testine 40 tane matematik sorusu eklersek testimizin iç tutarlığı bozulur – homojen yapı bozulur- ve güvenirlik düĢer. b) Soru sayısının artması yeni hatalara ( bıkkınlık – yorgunluk vs) yol açmadığı var sayılmalıdır. Örneğin KPSS eğitim bilimleri testi 120 sorudan oluĢmakta; duyarlığı ( soru sayısını) arttıralım ve 500 soru soralım bu durumda da yorgunluk, bıkkınlık gibi yeni hata kaynakları ortaya çıkacak ve güvenirlik düĢecektir. O HALDE SORU SAYISI ARTTIKÇA GÜVENĠRLĠK ARTAR DERĠZ AMA KESĠN ARTAR DĠYEMEYĠZ. YUKARIDAKĠ ĠKĠ ġART SAĞLANIRSA SORU SAYISI ARTTIKÇA GÜVENĠRLĠK KESĠNLĠKLE ARTAR DERĠZ. UNUTMAYIN 2. KARARLILIK: Ölçme sonuçlarının zamandan zamana değiĢmemesidir. Örneğin bir sınav aynı gruba uzun bir zaman geçtikten sonra bir daha uygulandığında benzer sonuçlar vermesidir. Bir testi bir öğrenci grubuna 3 ay ara ile uygulayalım. ġayet bu iki uygulamanın korelasyonu yüksek çıkarsa yani benzer sonuçlar elde edilirse güvenirlik kararlık açısından yüksektir. 3. TUTARLIK : Bir testin , kendi eĢ değeri ile aynı sonuçları vermesidir. Yani iki benzer test arasındaki benzer sonuçlardır. Örneğin bir öğretmen KPSS’ye yönelik Eğitim Bilimleri Deneme Sınavı HazırlamıĢ olsun. Hazırladığı bu deneme sınavının çok benzerini ( EĢdeğerini ) de hazırlasın. Yani toplamda iki sınav hazırlasın ve bu sınavları aynı gruba uygulasın. Eğer bu iki sınavdan da öğrenciler benzer sonuçlar alıyorsa bu test Tutarlı sonuçlar vermektedir, denir. 4. ĠÇ TUTARLIK : Bir testin iki yarısından alınan puanlar arasında yüksek düzey bir korelasyon olmasıdır. Maddelerin ( soruların ) birbiri ile olan tutarlığı. Bir testin homojen ( benzer özellik – tek boyutlu yapı) yapı arz etmesidir. Güvenirlik 0 ile +1 arasında değer alır. Güvenirlik katsayısının en az kaç olması gerektiği konusunda bir Ģey söylemek doğru değildir. ġöyle diyebiliriz 0,70 ve üstü yüksek kabul edilir ancak 0,90 olması istenir. Ancak 0,90 kat sayısına öğretmen yapımı testler çok seyrek çıkabilmektedir. GÜVENĠRLĠĞĠN ANLAMLARI SORU ÇÖZERKEN DĠKKAT EDĠLECEKLER Güvenirlik yöntemlerini iyi bilmemiz lazım. Hangi yöntemde nasıl bir uygulama yapılıyor bilmemiz lazım. Soruda diyelim ki test – tekrar test uygulamasından bahsediliyorsa yanıtımız GÜVENĠRLĠK olacaktır. Güvenirliğin anlamları iyi bilinmelidir. ( Duyarlık, kararlılık , tutarlılık, iç tutarlılık ) GÜVENĠRLĠK NELERDEN ETKĠLENĠR – NASIL ARTIRIRIZ 1. Testin Uzunluğu: ( Soru sayısı)(DUYARLILIK) Testte kapsanan madde sayısı testin güvenirliği ile doğrudan ilgilidir. Eğer güvenirliği etkileyen diğer tüm etmenler kontrol edilmiĢse ve teste sonradan konan sorular öncekiler gibi aynı davranıĢı ölçüyorsa ( içtutarlılık) soru sayısı arttıkça güvenirlik artar. Testimizin güvenirliğini artırmak için soru sayısını artırmamız gerekir. Ancak teste eklediğimiz sorular içtutarlılığı bozmamalı yani aynı davranıĢı ölçmelidir. Yani sorular HOMOJEN olmalıdır. Spearman- Brown Formülü: Bu formül geçerliği a‟dan b‟ye yükseltmek için testteki soruların kaç katına çıkarılacağını verir. 𝑛𝑟𝑠 ÇOK ÖNEMLĠ UYARI: Kaynaklarda 𝑟𝑛 = soru sayısının armasının güvenirliği 𝑛 − 1 𝑟𝑠 + 1 artırdığı söylenir. Bu ifade genel itibarı ile yanlıĢ olmasa da eksiktir. Ġki Ģart yerine gelirse soru sayısı artarsa güvenirlik kesinlikle artar deriz. 1. Eklenen sorular homojen yapıyı bozmayacak 2. Soru sayısının artması sıkılma, bıkma gibi baĢka hatalara yol açmayacaktır. 𝒓𝒔 : Uzatılacak olan kısa testin güvenirlik katsayısı 𝒓𝒏 : Kısa testin n katı uzatılan testin güvenirlik katsayısı n : Kısa testin soruları kaç kat uzatılacaksa o sayı Bir Örnek: Güvenirliği 0,50‟den 0,90‟a çıkarılmak istenen bir test ilk uzunluğunun kaç katı uzunluğa çıkarmak gerekir? ( Teste eklenecek soruların öncekilerle aynı davranıĢları ölçtüğü, yeni soruların ortalama güçlüklerinin öncekilere denk olduğu, test uzatıldığında cevaplayıcıların ona cevap verme biçiminin değiĢmediği var sayılmıĢtır) Yanıt 9 kat ( Formülden çıkan sonuç : n= 9 ) ( Matematiği iyi olan arkadaĢlarınızdan destek alın) HEYYY hemen korkma : Formül çok mu karıĢık geldi bir de Ģunu dene : 𝑛= 𝑟𝑖(1 − 𝑟𝑚) 𝑟𝑚(1 − 𝑟𝑖) n: Kaç katına çıkarılacaksa o sayı ri: Ġstenen güvenirlik katsayısı rm: Mevcut güvenirlik katsayısı Buna göre yukarıdaki soruyu bir daha çözelim: n= 𝟎,𝟗𝟎 𝟏−𝟎,𝟓𝟎 𝟎,𝟓𝟎(𝟏−𝟎,𝟗𝟎) Burdan 𝟎,𝟗𝟎.𝟎,𝟓𝟎 𝟎,𝟓𝟎.𝟎,𝟏𝟎 0,50’ler sadeleĢir. 𝟎,𝟗𝟎 𝟎,𝟏𝟎 kalır bölme iĢlemini gerçekleĢtirirsek çıkan sonuç 9 Bu sonucu Ģöyle yorumlayacağız. Diyelim ki soru sayımız 20 olsun demek ki 9 katına yani 180’e çıkaracağız yani 160 soru ekleyeceğiz. ( 20 tane vardı 160 eklersen 9 katına çıkar ) 2. ġans Faktörü: Tesadüfi hata kaynağı olan Ģans faktörünün , kopya çekmenin vs önüne geçilmeli. Düzeltme formülü uygulanmalıdır. ( 4 yanlıĢ 1 doğruyu götürür gibi ) ġans faktörür bilen öğrenci ile bilmeyen öğrenci ayrımını ortadan kaldırdığı için güvenirliği zedeler. 3. Testik Standart Özellikleri: Sorular Açık ve AnlaĢılır Olmalı: Tesadüfi hatanın önüne geçmek için soruların bilen öğrencileri yanılmayacak Ģekilde sade ve açık olması gerekmektedir. Aksi durumda öğrenci tesadüfen hata yapabilir. b) Sorular Kolaydan Zora Doğru Olmalıdır: Doğrudan yukarıdaki madde ile ilgili bir durumdur. Zor soruların testin baĢında yer alması öğrencinin motivasyonunu bozar ve bildiği halde yanlıĢ yapmaya baĢlar. c) Testtin Yönergesi Açık ve AnlaĢılır Olmalı: Testin yönergesinin açık olmaması örneğin sınav süresinin yazmaması, soruların nasıl yanıtlanacağının açık belirtilmemesi vs güvenirliği de etkiler. ( KULLANIġLILIĞI da ETKĠLER) a) 4. Öğrencinin Psikolojik Durumu Desteklenmelidir: Tesadüfi hata kaynağı olan psikolojik durumlar testin güvenirliği için önemlidir. Öğrenci motive edilmeli ve öyle sınava sokulmalıdır. 5. Sınav Ortamı : Sınav ortamı tüm öğrenciler için uygun olmalı, ısı , ıĢık vs dengeli olmalı, gürültülü ortamda sınav uygulamak ölçmeye yine tesadüfi hata karıĢtırır. 6. Tüm Öğrencilere Yetecek Kadar Süre Tanınmalıdır: Sınav süresi tüm öğrencilerin soruları yanıtlayabileceği bir zaman olmalıdır 7. Soruların Zorluk Derecesi: Sınav orta güçlükte 0,50 olmalıdır. ġöyle diyelim; çok zor soruları bilenler de yapamaz; çok kolay soruları bilmeyenler de yapar bu durumda ayırt edicilik düĢer. Güvenirlik de düĢer. Güvenirliği en yüksek sorular 0,50 ( orta zorlukta ) sorulardır. 8. Grubun Yapısı:. Grubun heterojen olması güvenirliği artırır. Öğrenciler benzer özellik taĢırsa ( Örneğin hepsi üstün zekalı ve baĢarılı ise) sınavın bilen ve bilmeyen öğrencileri ayırıp ayırmadığını kestirmemiz güç olur. Bu yüzden güvenirlik hesaplaması yaparken örneklem grubun heterojen olması uygundur. 9. Ranjın ve Standart Sapmanın Artması: Güvenirliği artırır. Çünkü ranj ve sapma arttıkça sonuçlar daha heterojen olur. Bu da bilen ve bilmeyen örğencilerin ayırt edildiğini gösterir. 10. Puanlamada Nesnellik: Ölçmecinin değer yargılarından, psikolojik hatalarından arınık olarak testi puanlaması ya da tarafsız olması puanlama güvenirliği için önemlidir. Çünkü değer yargılarımızın puanlamaya karıĢması ölçümlerin bir puanlayıdan diğerine göre değiĢmesine yol açar. Bu da PUANLAMA GÜVENĠRLĠĞĠNĠ düĢüĢür. Bu durumu azaltmak için ayrıntılı puanlama anahtarı kullanmak, öğrenci ismini kapatmak gibi yollar denenebilir. Ġlerde daha ayrıntılı konuĢacağız. 11. Madde Ayırt Ediciliği ve Güçlük: Madde ayırt ediciliğinin artması güvenirliği de artırır. Güçlük düzeyi ise orta düzeyde olması idealdir. 12. Kopya: Bilen ile bilmeyen öğrenciyi ayırt etmeyi engellediği için kopyanın önüne geçilmeldir. GÜVENĠRLĠK BELĠRLEME YÖNTEMLERĠ Ġki Uygulamaya Dayananlar a) Test – Tekrar Test ( Kararlık Katsayısı ) b) Paralel Testler ( Tutarlık Katsayısı) Tek Uygulama a) Eşdeğer Yarılar ( İç Tutarlık ) b) KR-20 ( İç Tutarlık) c) KR- 21 ( İç Tutarlı) d) Cronbach – Alfa ( İç Tutarlık) Güvenirlik Hesaplama Yöntemleri ( ĠKĠ UYGULAMAYA DAYANANLAR) TEST – TEKRAR TEST: Aynı test , aynı gruba farklı zamanlarda tekrarlı olarak uygulanır. Bir test tesadüfi hatalardan arınıksa iki uygulama arasında çok fark olmamalıdır. - KARARLILIK KATSAYISI ( ĠSTĠKRARLILIK KATSAYISI) verir. Ġki uygulama sonuçları ne kadar benzerse güvenirlik ifade eden korelasyon katsayısı da artar. Bu da testin güvenilir olduğu anlamına gelir. Test – tekrar test yöntemi kolay değiĢen özellikleri ( örneğin çocuklardaki ilgi ) ölçen testlerde yanıltıcı sonuçlar verebilir. Örneğin 1 ay gibi kısa bir sürede bireyde değiĢme gösterebilecek bir özelliği ölçen bir testi aynı gruba 1 ay arayla iki kera uyguladık. Bu durumda ilk uygulama ile ikinci uygulama farklı çıkacak ve korelasyon değeri düĢecektir. Ancak bu durum testimizin güvenirliğinin düĢük olduğu anlamına gelmez, öğrencilerin değiĢtiği anlamına gelir. !!! Test – Tekrar Test uygulamasının en sıkıntılı yanı iki uygulama arasındaki süredir. Bu sürenin ne kadar olacağı konusunda kesin bir Ģey söylenemez. Çok kısa olursa sorulan soruların ve yanıtlarının hatırlanmasına ; çok uzun olursa da öğrencilerin yeni kazanımlar elde etmesine neden olur. Bu yüzden acaba testimiz mi güvenilir değil yoksa öğrenciler mi değiĢiyor anlayamayız. Bazı konu anlatım kitaplarında test-tekrar test yöntemi için 3 ay 6 ay gibi süreler verilmektedir. Bu belki soru çözmenizi kolaylaĢtırır ama böyle bir süre konması uygun değildir. Sürenin ne olacağı uzmanlarca belirlenmeli örneğin ilgilerin ölçüldüğü bir test için konan süre yeteneklerin ölçüldüğü bir test için konan süreye göre kısa olabilir. TEST – TEKRAR TEST KATSAYISI HANGĠ DURUMLARDA DÜġÜK ya da YÜKSEK ÇIKAR DÜġÜK ÇIKAR Sorular her okumada farklı anlama geliyorsa, ya da sorular açık ve anlaĢılır değilse ( Testin güvenirliğinin düĢük olduğu anlamına gelir. ) Grup ölçülen özellik açısından değiĢme göstermiĢse. (Bu durumda güvenirlik katsayısının düĢük çıkası testimden kaynaklı değil öğrenciden kaynaklıdır. Güvenirlik indeksinin bu sebeple düĢük çıkması aslında testin güvenirliğinin düĢük olduğu anlamına gelmez. ) Ġki uygulama arası olması gerekenden uzun tutulursa güvenirlik indeksi bir üstteki maddeden kaynaklı düĢük çıkar. ( Süre uzarsa öğrenci de değiĢir ) Ölçülen özellik kolay değiĢen bir özellikse Bu durumda güvenirlik katsayısının düĢük çıkası testimden kaynaklı değil ölçtüğüm özellikten kaynaklıdır. Güvenirlik indeksinin bu sebeple düĢük çıkması aslında testin güvenirliğinin düĢük olduğu anlamına gelmez. Teste herhangi bir sebeple hata karıĢıyorsa. Ġki uygulama koĢulları benzer değilse Ġki uygulamadan birinde öğrenci gerçekçi yanıt vermemiĢse ( Örneğin bir ilgi envanteri uygulandı siz soruları ciddiyetle yanıtladınız. Ġkinci kere aynı envanter önünüze geldi ve bu sefer gerçekçi yanıtlar vermediniz. Bu durumda iki uygulama sonuçları farklı çıkar indeks düĢer. Ancak bu da testin gerçek güvenirliği hakkında bilgi vermez. Testin güvenilir olmadığı anlamına gelmez. Sorun sensin dostum testin suçu değil YÜKSEK ÇIKAR Sorular açık ve anlaĢılır ise ya da hatalardan arınık ise ( Test açık ve anlaĢılır ya da hatalardan arınık ise farklı uygulamalarda farklı sonuçlar vermez. Bu durum testin güvenilir olduğu anlamına gelir. Ġki uygulama arası süre çok kısa ise ( Süre çok kısa tutulursa korelasyon yüksek çıkar. Ancak bu durum testin gerçek güvenirliğini vermez. Yanıltıcıdır. O yüzden süre iyi ayarlanmalıdır. Ölçülen özellik kolay değiĢme göstermiyorsa örneğin yetenek ya da zeka gibi. Ġki uygulama koĢulları benzer ise Ġki uygulamada da öğrenciler gerçekçi yanıtlar verirse. EġDEĞER ( PARALEL ) FORMLAR GÜVENĠRLĠĞĠ: Test – tekrar testin en büyük sınırlılığı olan aynı testi kullanma durumuna karĢı geliĢtirilen benzer test ( paralel test – eĢ değer test) uygulamasıdır. Ġki eĢ değer testin aynı gruba uygulanmasına dayanır. EġDEĞERLĠK KATSAYISI. Ya da TUTARLIK KATSAYISI Sorular eĢ değer ama farklı olduğu için soruların hatırlanması riski yoktur. Ġki uygulama arka arkaya uygulanabilir. Ancak; peĢi sıra uygulamak , bıkkınlık – yorgunluk gibi durumlara yol açabilir. Ġki uygulama arası çok uzatılırsa da bireylerde ölçülen özellik bakımından meydana gelen değiĢmeler test puanlarını etkileyecektir. EĢdeğer Testler uygulaması hem zaman içindeki KARARLILIĞI hem de yanıtların TUTARLILIĞININ ölçüsünü verir. Ama asıl amacı TUTARLILIĞI VERMESĠDĠR. EĢ değer form hazırlamanın en büyük sıkıntısı: iki testin kapsamlarının, ortalamalarının, varyanslarının, madde sayılarının, ve tiplerinin ; madde güçlüklerinin ve diğer istatistiklerinin bir birine eĢit olması gerekliliğidir. EĢdeğer test hazırlamanın zor olduğu durumlarda SÖZDE ya da YALANCI EġDEĞER FORM hazırlanabilir. Sorular aynı ancak seçeneklerin sırası soruların yeri değiĢik. I. 1. Test II. Ali okula gitmedi cümlesinin öğeleri hangisinde doğru verilmiĢtir? A) Özne – Yüklem – Tümleç B) Özne – Tümleç – Yüklem C) Yüklem – Tümleç – Özne D) Tümleç – Özne – Yüklem 1. Test ( 1. Testin EĢdeğeri) AyĢe seni sordu cümlesinin öğeleri hangisinde doğru verilmiĢtir? A) Yüklem – Nesne – Özne B) Özne – Nesne – Yüklem C) Özne – Yüklem – Nesne D) Nesne – Yüklem – Özne Bu iki testten öğrencilerin aldıkları puanlar ne kadar benzerse testin tutarlık anlamında güvenirliğinin yüksek olduğunu söyleyebiliriz. ÖNEMLĠ NOKTALAR Bir öğretmen test – tekrar test yöntemi ile güvenirlik hesaplamak istemektedir. Her iki uygulamada da öğrenci puanlarına 10’ar puan vazladan vermiĢtir ( Sabit hata yapmıĢtır ) Bu durumda güvenirlik değiĢir mi ? Güvenirlik katsayısı bu durumda etkilenmeyecektir. Her iki uygulamada da öğrenci puanlarına sabit bir puan eklemesi puanlar arası korelasyonu bozmayacaktır. Çünkü her puan aynı Ģekilde artmaktadır. Zaten sabit hatalar güvenirliği değil geçerliği etkiler. Güvenirlik Geçerliği Sınırlandırır Bir test güvenilir değilse geçerli de değildir. Ancak bir testin güvenilir olması onun geçerli olduğu anlamına gelmez. Yani her güvenilir test geçerli olmayabilir. Ama her geçerli test güvenilirdir. Ayrıca: Bir testin geçerlik katsayısı o testin güvenirlik katsayısının kare kökünden büyük olamaz. Örneğin. Güvenirlik katsayısı 0,64 olan bir testin geçerliği en fazla 0,64‟ün karekökü olan 0,80‟den büyük olamaz. Bu duruma da güvenirliğin geçerliği sınırlaması denir. (TEK UYGULAMAYA DAYANANLAR) Eġ DEĞER YARILAR ( TESTĠ YARILAMA ): Tek oturumda uygulamaya dayanır. Testi eĢit iki yarıya bölmek suretiyle her bir bireye ait iki test puanı elde etmek söz konusudur. ĠÇTUTARLILIK KATSAYISI Testin bütününe dair bir güvenirlik katsayısı değil, eĢ değer yarılara ait güvenirlik katsayısını verir. 100 soruluk bir testi 1, 3, 5, 7 ...99 ve 2, 4, 6, 8 ... 100 diye iki yarıya böleriz ( 50 +50 =100 ) Elde ettiğimiz kat sayı 100 soruluk sınavın değil 50 soruluk sınavın katsayısıdır. Bu yüzden ,duyarlığı düĢürdümüzden, eĢ değer yarılar ile elde edilen güvenirlik karsayısı her zaman testin tümünden elde ettiğimiz güvenirlik katsayısından düĢük olur. Yukarıdaki ayırma iĢlemini yapmadan önce soruları zorluk düzeyine göre sıralamak ve sonra ayırmak gerekir. Spearman Brown Formülü: Testin yarısından elde edilen güvenirlik katsayısı r ise : 2𝑟 1+𝑟 formülü ile testin tamamına ait güvenirlik katsayısı elde edilebilir. Örnek: Testi yarılama ( eĢ değer yarılar) yöntemi ile elde edilmiĢ güvenirlik katsayısı 0,60 ise testin tamamından elde edilecek güvenirlik katsayısı kaçtır? Yanıt: 0,75 Matematiği iyi olan arkadaĢlarınızdan yardım alın. Bu uygulamada testin iki yarısına giden maddelerin güçlük düzeyleri farklılaĢırsa korelasyon düĢük çıkar. Bu uygulamanın en sıkıntılı yanı iki yarıya dağılan soruların homojen yapıda olmasını sağlamaktır. 1. Test puanlarının güvenirliği için aĢağıdaki değerlendirmelerden hangisi hatalıdır? A) 60 maddelik bir testin, benzer nitelikte sorulardan oluĢan 40 maddelik bir testten daha güvenilir sonuçlar vermesi beklenir. B) Objektif olmayan testlerle yapılan ölçme iĢlemlerde yanıtlayıcıya verilecek puana puanlayıcının takdiri karıĢtığı için bu tip ölçmeler genelde güvenilir olmayan sonuçlar verir. C) Öğrencilerin yeterince güdülenmediği sınavlarda cevaplar tesadüfe kalacağı ya da birçok soru cevapsız bırakılacağı için sınav puanlarının güvenirliği düĢer. D) Açık ve anlaĢılır olmayan sorular ile oluĢturulmuĢ bir ölçme aracı ile yapılan ölçme iĢlemlerinde puanların güvenirliği düĢük çıkar. E) Öğrencilerin test ile yoklanması amaçlanan davranıĢlara sahip olmaması testin güvenirliğini düĢürür. Yanıt : E 2. Eğitimdeki ölçme iĢlemlerinin güvenirliğini ya da ölçme iĢlemine karıĢan hata miktarını kestirebilmek için aĢağıdakilerden hangisinin yapılması daha uygundur? A) Sınava giren öğrencilere girdikleri sınavla ilgili bir anket uygulanıp uygulanan sınavın amaca uygun olup olmadığının belirlenmesi B) Sınava giren öğrencilerin puanları ile öğrencilerin girdikleri sınavla iliĢkili yetenek testlerinden aldıkları puanların karĢılaĢtırılması C) Ölçme iĢleminin tekrarı ya da hiç değilse ölçmenin tekrarı sayılabilecek bazı yöntemler kullanmak D) Sınava giren her bir öğrenci ile verdikleri yanıtlarla ilgili görüĢmeler yapmak E) Öğrencilere uygulanan ölçme aracının ölçme istediği hedef davranıĢları ne kadar kapsadığına bakmak. Yanıt: C KR – 20 GÜVENĠRLĠĞĠ: Testin kapsamı ne kadar homojen ise maddeler ( sorular ) birbiri ile o derece yüksek iliĢkili olacağından maddeler arası tutarlılık da o derece yüksek olacaktır. ĠÇ TUTARLILIK – TESTĠN HOMOJEN YAPISINI GÖSTERĠR. KR-20 KAT SAYISI YÜKSEK ĠSE TESTĠN TEK BOYUTLU BĠR YAPIYI ÖLÇTÜĞÜ SÖYLENEBĠLĠR. KR-20 güvenirlik katsayısının yüksek çıkması yapı geçerliğinin yüksek olacağına iĢarettir ANCAK KESĠN KANIT DEĞĠLDĠR. ZATEN GÜVENĠRLĠK , GEÇERLĠK ĠÇĠN KESĠN KANIT OLUġTURMAZ. UNUTMAYIN KR-20 yapı geçerliği için bir kanıttır ANCAK KESĠN KANIT DEĞĠLDĠR. ġimdi daha yalın bir dille konuyu ele alalım. 10 soruluk Türkçe, 10 soruluk matematik, 10 soruluk sosyal, 10 soruluk da fizik testi bulunan bir sınav düĢünün . HETEROJEN YAPIDA TOPLAM 40 soru var ve her soru 1 puan olsun. Ali bu sınavdan 10 AyĢe de 10 almıĢ olsun. Ali ve AyĢe’nin performansları eĢit mi sorusuna verilecek yanıt belirsizdir. Çünkü testimiz heterojen. Yani Ali bu 10 puanı Türkçeden mi Matematikten mi aldı belli değildir. Aynı durum AyĢe için de geçerlidir. Ancak öğrenciler 40 soruluk bir Türkçe ya da 40 soruluk matematik gibi HOMOJEN yapıda bir sınava alınsalardı performanslarını karĢılaĢtırmada daha sağlıklı yargılara ulaĢabilirdik. ĠĢte tam bu noktada KR-20 güvenirlik hesaplama yöntemi karĢımıza çıkmakta ve maddelerin birbiriyle uyumunu belirlememize yarar. Testin içtutarlılığını verir. KR-20 hesaplaması yapmak için belli önkoĢullar vardır. 1. Test bir kez uygulanmıĢ olmalıdır. 2. Soruların en az %90‟ı yanıtlanmıĢ olmalıdır. 3. Testeki sorular 0-1 puanlama yöntemine göre puanlanmalıdır. ( Yani her bir sorunun doğru yanıtına verilen puan eĢitse. Her bir sorunun puan değeri farklı ise KR-20 kullanılmaz. ) 4. Testteki soruların madde güçlük indeksi ya da madde varyansı bilinmelidir. ( Madde istatistikleri bilinen testlerde kullanılır. ) FORMÜLÜ: KR-20= 𝑲 𝑲−𝟏 . 𝟏− 𝒑.𝒒 𝒔𝟐 K: Teste bulunan madde sayısı p: Madde güçlük indeksi 𝒑. 𝒒: Madde varyansları toplamı 𝒔𝟐 : Test puanlarının dağılımı ( Standart sapmanın karesi) q: 1-p p.q: Madde varyansı (𝒔𝟐 ) 50 soruluk bir testin madde varyansları toplamı 1,8 ve testin standart sapması 3 ise bu testin güvenirlik katsayısı kaçtır? 0,82 ( Matematiği iyi olan arkadaĢınızdan yardım alın) PÜF NOKTALARI: Madde güçlük indeksi bilinen testlerde Madde istatistiği yapılmıĢ testlerde kullanılır. KR-21GÜVENĠRLĠĞĠ: KR-20 madde güçlük indeksi hesaplanan testler için kullanılırken KR-21 madde güçlük indeksi hesaplanmayan ( Madde güçlük indeksinin tüm maddeler için aynı olduğu varsayılır) testlerin ĠÇ TUTARLILIĞINI verir. Aritmetik ortalama, standart sapma ve soru sayısı belirlenmiĢse kullanılabilir. KR-20 madde istatistiğine göre bulunurken KR-21 Test istatistiğine göre bulunur. ( Öğrencilerin test puanları ortalaması ve varyans ) Formülü: KR-21 = 𝑲 𝑲−𝟏 . 𝟏− 𝑲.𝒙− 𝒙𝟐 𝑲.𝒔𝟐 50 sorudan oluĢan bir Türkçe testinin test puanları ortalaması ( 𝒙) 25, varyansı (𝒔𝟐 ) 25 ise bu testin güvenirliği kaçtır? 0,51 ( Matematiği iyi olan arkadaĢınızdan yardım alın) KR-20 ile KR-21 ARASINDAKĠ ĠLĠġKĠ KR-20 ile hesaplanan güvenirlik katsayısı genellikle KR-21 ile hesaplanandan yüksek çıkar KR-21 neden KR-20’den düĢük çıkar: KR-21 madde güçlükleri indekslerinin eĢit olduğu varsayımına dayandığı için testi oluĢturan madde güçlükleri arasındaki farklılıklara duyarlı değildir. Bu nedenle KR-21 KR-20’den daha düĢük çıkma eğilimdedir. BaĢka bir deyiĢle testteki maddelerin güçlük indekslerinin birbirine eĢit olmadığı durumda KR-21 ile hesaplanan güvenirlik katsayısı KR-20 ile hesaplanan güvenirlik katsayısından küçük çıkar. O HALDE Madde güçlükleri birbirine eĢit olan bir testte KR-20 ile KR-21 birbirine eĢit çıkar. KR-21 güvenirliğin ( içtutarlık bakımından) alt sınırıdır. KR-20 ve 21 ile elde edilen sonuçların yorumları aynıdır ( Ġkisi de içtutarlığa dair bilgi verir) KR- 20 ve 21 hesaplamalarının her ikisi de 0-1 puanlama tipi için uygundur. Her ikisinde de soruların %90 çözülmüĢ olmalıdır. Madde güçlüğü, madde varyansı, madde ayırt ediciliğine dayalı olarak hesaplanan KR-20 ; testin ortalaması, testin sapma ya da varyasına dayalı olarak hesaplanan ise KR-21‟dir. KR-20 ya da KR-21 yüksek ise : a) Uygulanan test hatalardan arınıktır ( Güvenirlik) b) Testi oluĢturan maddeler homojendir ( içtutarlık) c) Test tek boyutlu bir yapıdan oluĢuyordur. YUKARIDA VERĠLENLERE DAYALI ġU SORULARI YANITLAYINIZ. 1. Bir öğretmen her bir soru için madde istatistiği çıkarmıĢ ancak bunları kaybetmiĢtir. Elinde sadece öğrenci puanları vardır. Buna göre iç tutarlığı hangi yöntemle belirler a) KR-20 b) KR-21 2. Madde güçlük indeksleri birbirine eĢit bir testtin KR-20 güvenirlik indeksi 0,82 bulunmuĢtur. Buna göre Bu testin KR-21 değeri kaçtır ? 3. KR-20 değeri neden 21 değerinden yüksek çıkma eğilimindedir? 4. KR- 20 ile 21 ne zaman eĢit çıkar? 5. Bir öğretmen ayrıntılı bir Ģekilde madde analizi çıkarmıĢtır. Buna göre hangi yöntemi kullanacaktır? a) KR-20 b) KR-21 CRONBACH ALFA GÜVENĠRLĠĞĠ: KR-20 ve KR-21 , 0-1 puanlama yöntemine göre yapıldığı durumlarda kullanılır. Ancak puanlamanın böyle yapılmadığı durumlarda Cronbach Alfa güvenirliği kullanılır. Yani Cronbach‟ın alfa katsayısı her bir soruya farklı puanların verildiği testlerde kullanılır. Doğru cevabı olmayan ( tutum-ilgi – kiĢilik) testlerinin ĠÇTUTARLILIĞINI belirlemek için kullanılır. Örneğin ilgi testlerinde yanıt Ģudur diyemezsiniz. Katılıyorum, katılmıyorum ya da kısmen gibi dereceli yanıtlardan biri seçilir ve bu yanıtlar her kiĢi için doğru olabilir. Çoklu ( polytomous) puanlanabilen maddelerden oluĢan testlerde de kullanılabilir. ( Tutum – ilgi vs testlerinde tek bir yanıt yoktur çok yanıt vardır) PUANLAYICI GÜVENĠRLĠĞĠ: Tesadüfi hatanın kaynağı puanlayıcıların her bir test maddesini puanlamaları arasındaki farklılıklar da olabilir. Bir testte puanlayıcı hatalarının olmadığını söylemek için iki veya daha fazla puanlayıcının puanladıkları test ve madde puanlarının aynı olması gerekir. Öznel etkilerin olduğu yazılı ve sözlü sınavlarda birden fazla puanlayıcıya sınavların değerlendirilmesi gerekebilir. Öğretmenlerin yanıt anahtarlarına göre , ayrıntılı düzenlenmiĢ puanlama anahtarlarına göre ( rubrik) puanlama yapması yansızlığı – objektifliği sağlar. Bu durumda puanlayıcı güvenirliği artar. Yazılı , sözlü testlerini portfolyo ve projelerin puanlayıcı güvenirliği, çoktan seçmeli, kısa cevaplı, boĢluk doldurmalı testlere göre daha düĢüktür. Puanlayıcıların sınıflama düzeyinde ölçme yapmaları durumunda iki puanlayıcının puanlamaları arasındaki arasındaki puanlayıcı güvenirliğine iliĢkin katsayıyı belirlemek için kappa istatistiği kullanılabilir. Po; gözlenen uyum 𝒑𝒐−𝑷𝒄 oranı, Pc; Ģansla beklenen uyum oranı ifade etmek üzere 𝑲 = 𝟏−𝑷𝒄 AġAĞIDA VERĠLEN TEST TÜRLERĠNĠ PUANLAMA GÜVENĠRLĠĞĠ AÇISINDAN ANALĠZ EDELĠM Yazılı Yoklamalar: Yazı güzelliği, öğrenci adını bilme ve ölçülen özelliklerin üst düzey olması gibi sebeplerle yazılı yoklamalarda puanlama güvenirliği düĢüktür. Örneğin kompozisyon sınavında öğrencinin aynı kağıdına farklı puanlayıcılar farklı puanlar verebilir. Ayrıntılı bir yanıtlama anahtarı bu öznelliğin önüne kısmen geçebilir tamamen değil. Sözlü Sınavlar: Puanlayıcının önyargılarından kaynaklı puanlama güvenirliği düĢüktür. Öğrencinin söyledikleri farklı algılanıp farklı puanlayıcılar tarafından aynı öğrenciye farklı puanlar verilebilir. Kısa Cevaplı ya da BoĢluk Doldurmalı Sınavlar: Yanıtların net ve yoruma açık olmaması nedeniyle puanlama güvenirliği yüksektir. Ancak bunlara da kısmen de olsa puanlayıcı yanlılığı karıĢabilir. Çoktan Seçmeli – Doğru YanlıĢ – EĢleĢtirmeli Testler: Yanıtlar net olduğu için puanlayıcı güvenirliği yüksektir. Puanlayıcıdan puanlayıcıya değiĢecek bir öznellik yoktur. Birinci soru A ise A‟dır gibi. Proje – Performans –Portfolyo gibi ÇağdaĢ Değerlendirme Türleri: Ölçülen özellikler üst düzey olduğu için puanlayıcı güvenirliği düĢüktür. Jürinin ( puanlayıcıların) puanları biribirinden farklı olabilir. Puanlama Öznelliği Ġçin Ġlginç Bir Örnek: Charlie Chaplin, Monte Carlo‟da düzenlenen Charlie Chaplin‟e benzeyen yarıĢmasına diğer adaylarla birlikte katılır. Jüri onun gerçek Charlie Chaplin olduğunu bilmez. Sonuç puanlama güvenirliği adına bir rezalettir. Çünkü bizim gerçek Chaplin bu yarıĢmada 3. olur. YarıĢmanın puanlama güvenirliği düĢüktür. ÖLÇÜMLERĠN STANDART HATASI: Standart hata da güvenirlik gibi hata ölçüsünü veren bir istatistiktir. Fakat standart hata , hata miktarını bir oran olarak değil, test puanı biriminde verir. Se = 𝑆𝑥 1 − 𝑟 Formülü ile hesaplanır. Se= Standart hata Sx = Standart sapma r = Güvenirlik katsayısı Standart sapma artarsa standart hata artar ( standart sapma azalırsa hata azalır) ; güvenirlik katsayısı arttıkça standart hata azalır ( güvenirlik azaldıkça standart hata artar). PUANLARIN STANDART SAPMA GÜVEN ARALIKLARI: Standart hata kullanılarak bulunur. Ty : Gerçek puanın olabileceği en yüksek değer, Ta: gerçek puanın alabileceği en düĢük değer. Bireyin gerçek puanı Ty ve Ta arasındadır. B %68 olasılıkla: Öğrencinin puanının 1 standart hata fazlası ile 1 standart hata eksiği arasındadır. % 95 olasılıkla: Öğrencinin puanının 2 standart hata fazlası ile 2 standart hata eksiği arasındadır. % 99 olasılıkla: Öğrencinin puanının 3 standart hata fazlası ile 3 standart hata eksiği arasındadır. Bir örnekle ele alalım: Güvenirlik katsayısı 0,75 olan bir testin standart sapması 4 dir. Ali bu sınavdan 70 almıĢtır. I. II. III. Testin standart hatası nedir? Öğrencinin puan güven aralığı %68, %95 ve %99 olasılıkla nedir? Ty ve Ta aralığı kaçtır? Önce Se( Standart hatayı bulalım) Formüldeki değerler yerleĢtirildiğinde Se = 4 1 − 0,75 ise buradan standart hatamız (Se) = 2 çıkar. ( Matematiği iyi olan arkadaĢlarınızdan yardım alın) Öğrencilerin puan güven aralığı %68 Ali 70 almıĢ ise standart hatayı bir ile çarpıp, ekleyip çıkartıyoruz: o halde 68 – 72 %95 ise standart hatayı iki ile çarpıp ekleriz o halde 66 – 74 % 99 ise standart hatayı üç ile çarpıp ekleyip çıkartırız o halde 64 – 76 çıkar. Ty ve Ta olabilecek en düĢük ve en yüksek puanlar arası fark olduğu için %99 olasılıkla belirlenmiĢ aralık ( 64 – 76 ) aynı zamanda Ty – Ta aralığını verir. Standart hata, hatayı bir oran cinsinden değil öğrenci puanı cinsinden verir. Neden Çünkü standar hatalar öğrenci puanlarına eklenir. Yukarıda yaptığımız gibi öğrenci puanına hata miktarını ekleyip çıkardığımızda güven aralığı bulmaktayız. Eğer standar hata , hata miktarını öğrenci puanı cinsinden vermeseydi, böyle bir ekleme çıkarma yapamazdık. Puanların güven aralığı ya da standart hatayı bilmem benim ne iĢime yarayacak ? Diyelim ki geçme notumuz 70 olsun, standart hatanın da 5 olduğu bir sınavdan 69 alan kiĢiyi bırakmak sizce doğru bir karar mıdır. Tabii ki hayır.Bu yüzden geçecek ya da kalacak öğrenciye karar verirken sınavımızdaki standart hataları dikkate almamız gerekir. Örneğin 65 alan bir çocuğu geçirmek 5 puanlık standart hatayı dikkate almaktır. UNUTMAAAAAA GEÇERLĠK TÜRLERĠ Kapsam Geçerliği Ölçüt Geçerliği - Yapı Geçerliği GörünüĢ Geçerliği Karar Geçerliği Sonuçsal Geçerlik Yordama Uygunluk GEÇERLĠK: Bir ölçme aracının amaca hizmet etme derecesidir. Ölçülmesi istenen bir özelliğin baĢka özelliklerle karıĢtırmadan doğru olarak ölçebilme derecesidir. Örneğin Türkçe baĢarısını ölçmek için geliĢtirilmiĢ bir testten Türkçe baĢarısı yüksek bireylerin yüksek not alması gerekir. Türkçe baĢarısı yüksek kiĢiler bu testten düĢük not alıyorsa test amacına hizmet etmiyor demektir. Bir aracın geçerliği ölçmek istediği özellikle ve amaçla bağlantılıdır. Bir amaç için geliĢtirilmiĢ bir test baĢka bir amaç için geçerli olmayabilir. Örneğin diksiyon becerisi için geliĢtirilmiĢ ve geçerli olan bir test yazılı anlatım becerisi ölçmek için geçersiz olabilir. Geçerlik – 1 ile +1 arasında değer alır. +1 e yaklaĢması geçerliği yükseltirken -1 e yaklaĢması geçerliği düĢürür. KONUYU YAPILANDIRALIM Lise 4. sınıf öğrencilerinin matematik bilgi ve becerilerini ölçmek amacıyla hazırlanmıĢ bir test ilköğretim 8. sınıf öğrencilerine ve lise 4. sınıf öğrencilerine uygulanıyor. Öğrencilerin aldıkları puanların korelasyonu 0,91 çıkıyor. Yani 8‟ler ile lise 4‟ler aynı testten benzer sonuçlar alıyor. Sizce bu test geçerli midir yani amacına uygun mudur? Analiz edelim: Lise 4‟ler içi geliĢtirilmiĢ bir testten eğer 8‟ler de benzer puan alıyorsa ayırt ediciliği düĢük demektir. Ya da amacına hizmet etmiyordur. Yani test geçerli değildir. Lise 4‟lerle 8‟lerin puanları farklı çıkmalıydı geçerli olabilmesi için Ahmet yıllardır, yüksek lisans sınavlarına katılır ancak her sınavdan ( mülakat) benzer sonuç alır. 5. giriĢinde artık baĢvurmaktan vazgeçer. Aradan geçen günlerde yüksek lisansı kazananları görür ki hiçbiri kendi gibi yeterli kiĢiler değildir. Ancak hepsinin torpili vardır. Analiz edelim: Mülakatlar, yüksek lisans becerisine sahip kiĢileri değil torpili olan kiĢileri seçmiĢtir. Bu da sınavın amacına uygun değildir. Ayrıca ölçme iĢlemine baĢka değiĢkenler ( torpil ) karıĢmıĢtır. Ek Açıklama: Bazı arkadaĢlar burdaki 0,91 korelasyon değerine aldanmıĢ olabilir. Bu değer testin geçerlik katsayısı değil iki uygulama arasındaki korelasyondur. Biri 8‟ler diğeri lise 4 olan iki grubun puanlarının benzerlik derecesini ifade ediyor ( 0,91 yani çok benzer) Bu yüzden geçerlik düĢüktür. GeliĢtirilmiĢ bir zeka testi zekası düĢük ( ZD) olduğundan emin olunan bir gruba 6 ay arayla iki defa uygulanıyor. Birinci ve ikinci uygulamanın korelasyon değeri 0,89 yani oldukça yüksek ve benzer. Zekası yüksek ( ZY) olduğundan emin olunan gruba da 6 ay ara ile uygulanıyor ve ilk uygulama ile ikinci uygulama arasındaki korelasyon burda da oldukça yüksek çıkıyor. Daha sonra ZD ile ZY gruplarının zeka puanları korelasyonuna bakıldığında 0,89 çıkıyor. Yani ZD – ZY korelasyonu da yüksek ( benzer puanlar almıĢlar) Bir banka kendine eleman seçmek için bir sınav uygulamıĢtır. Bu sınavın amacı en yüksek çalıĢma performansını gösterecek elemanı seçmektir. Bu sınavdan yüksek puan alan 10 kiĢi iĢe alınmıĢ ancak bu 10 kiĢiden ancak 1‟i çalıĢma performansı testinden yüksek puan almıĢtır. Testin amacı performansı yüksek birey seçmekti. Ve bu testten yüksek alanların performansının da yüksek olacağı varsayılmıĢtı. Ancak durum öyle olmadı. Yani test amacına hizmet etmedi. Bu durumda geçerlik ve güvenirlik için ne söylenebilir: Testler tekrarlı uygulamalarda benzer sonuçlar verdiği için güvenilirdir. Ancak Zekası düĢükler ile zekası yüksekler aynı testten benzer sonuçlar aldığı için testin geçerliği düĢüktür. Birazdan geçerlik türlerini iĢleyeceğiz. Geçerlik türlerinin özelliklerini bilmek ve geçerlik hesaplama yöntemlerini bilmek soruları çözmede iĢinizi çok kolaylaĢtırır. O yüzden hem geçerlik türlerinin özelliklerini hem de geçerlik hesaplama yöntemlerini ve bu yöntemlerin hangi geçerlik türüne ait olduğunu bilmek OLDUKÇA ama OLDUKÇA ÖNEMLĠDĠR. KAPSAM GEÇERLĠĞĠ: Testeki sorular ölçülecek konu içindeki hedefleri – davranıĢları ne kadar örnekliyor, soruların tamamı ölçülmek istenen alanı ne kadar ölçüyor sorularına yanıt aranır. Ġzleme ( formatif) testler konu ya da ünite sonunda yapılır. Bu tip sınavlarda iĢlenilen konu ya da ünite ile ilgili tüm davranıĢlar yoklanmalıdır. Çünkü bunlarda amaç öğrenme eksikliğini gidermektir. BaĢarı ( eriĢi – sümmatif) testler izleme testlerinde olduğu gibi tüm davranıĢları değil davranıĢlar arasından kritik olanların teste alınması ile yapılır. Bir sınavda konu dıĢı soru varsa, soru sayısı azsa, bazı kritik davranıĢlar ( önemli konular) soru olarak ölçülmemiĢse kapsam geçerliği düĢer. Kapsam geçerliğini sadece niceliksel ( duyarlıkla ilgili – soru sayısı ) olarak düĢünmek yanlıĢtır. Aynı zamanda kapsam geçerliği bir testin ölçmek istediği davranıĢı ölçüyor olmasıdır. Örneğin bir sınavda 100 tane 1000 tane soru olması kapsam geçerliğini kanıtlamaz. Soruların niteliği ( önemli konular ve hedeflerden mi yoksa kıyıda kenarda kalmıĢ önemsiz konulardan mı ) önemlidir. KAPSAM GEÇERLĠĞĠ HESAPLAMA YOLLARI A) Rasyonel Yollar : 1. 2. Belirke Tablosu Kullanma: Belirke tablosu konuların ve hedef – davranıĢların yer aldığı iki boyutlu bir tablodur. Öğretmen bu tabloda her bir konu ve hedef davranıĢa ne kadar ağırlık vermesi gerektiğini görür. Buna göre de hangi konudan ve davranıĢtan ne kadar soru hazırlaması gerektiğine ulaĢır. Uzman KiĢilere BaĢvurma: ( Benzer bir yöntem yapı geçerliğinde de vardır ) Konu alanı uzmanlarına ölçme değerlendirme uzmanlarına fikirleri sorularak testin kapsam bakımından geçerli olup olmadığı anlaĢılabilir. Testin ölçmek istediği örneklemi ölçüp ölçmediği uzmanlara sorulur onlar da katılıyorum, kısmen katılıyorum , katılmıyorum gibi yanıtlar verir. Verilen yanıtlar içinde “katılıyorum” sayısı kapsam geçerliğinin yüksekliğine iĢarettir. B) Ġstatiksel YaklaĢım: 1. Bilinen Testlerle Korelasyon: ( Benzer bir yöntem yapı geçerliğinde de vardır) Yeni geliĢtirdiğimiz testle kapsam geçerliğinin yüksek olduğundan emin olduğumuz bir test gruba uygulanır. Ölçümlerin korelasyonuna bakılır. Korelasyon yüksek ise yani puanlar benzer ise kapsam geçerliği yüksektir. Dikkat ettiyseniz kapsam geçerliği için belirlenmiĢ 4 yoldan 3’ü yapı geçerliği için de kullanılmaktadır. Böyle bir durumda ya seçeneklere ikisinden biri olacaktır ya da ikisi de seçeneklerde varsa farklı bir ipucu kullanacaktır. Geçerlik hesaplaması Ģayet belirtke tablosuna göre yapılıyorsa düĢüneceğimiz seçenek doğrudan Kapsam Geçerliğidir. ÖLÇÜT GEÇERLĠĞĠ: Geçerliği belirlemek için baĢka bir test puanının ya da performansın ölçüt olarak kullanılmasıdır. Geçerliği kanıtlanacak puanların bir ölçütle karĢılaĢtırılmasına dayanır. Uygunluk ( ZamandaĢlık) : Ölçüt , geçerliği kanıtlanacak puandan önce belirlenmiĢtir. Yordama : Ölçüt geçerliği kanıtlanacak puandan sonra belirlenmiĢtir. 1. 2. 1. Uygunluk Geçerliği ( ZamandaĢlık) : Ölçüt puanlarının , geçerliği kanıtlanacak puanlarla aynı zamanda ya da daha önce elde edilmiĢse belirlenen geçerlik türü uygunluktur. OÖBP ( Orta Öğretim BaĢarı Puanları) ÖSS puanlarına uygun mu ? 2. Yordama Geçerliği ( Tahmin): Ölçüt olan puanlarınperformansın, geçerliği kanıtlanacak puanlardan sonra elde edilmesiyle belirlenen geçerlik türüdür. ÖSS puanlarına bakarak performansını tahmin etmek Üniversitedeki paunlarını – SBS puanlarına bakarak Lise baĢarısını tahmin etmek ĠÖBP ( Ġlk Öğretim BaĢarı Puanları ) SBS puanlarına uygun mu ? ĠĢe alım sınavındaki puanlarına bakarak , ilerdeki iĢ performansını yordamak Bir banka iĢ alımı için neden sınav yapar. Amacı senin üniversitede edindiğin bilgileri değerlendirmek mi yoksa seni iĢe aldığında göstereceğin performansı kestirmek mi? Tabii ki ikincisidir. Bu yüzden bu bankanın yaptığı sınavın yordama geçerliği düĢük olursa bankada sürekli olarak hesapları birbirine karıĢtıran bankacılar olur. ÖLÇÜT – KRĠTER / YORDANAN Üniversitedeki baĢarı puanlarını ölçüt olarak kabul edersem ve buna göre geçerliği belirlersem KPSS‟nin uygunluk – zamandaĢlık – halihazırlık geçerliğini belirlemiĢ olurum. Geçerliği Belirlenecek Sınav – Puan KPSS ( YORDAYICI) Lisedeki baĢarı puanlarını ölçüt kabul ediyorsam ÖSS‟nin uygunluk geçerliğini belirlemeye çalıĢıyorumdur. ÖSS ( YORDAYICI) Ġlköğretim ikinci kademedeki puanlarını , performansını ölçüt kabul ediyorsam SBS‟nin uygunluk geçerliğini belirlemeye çalıĢıyorum SBS ( YORDAYICI) ÖĞRETĠCĠ SORU 3. AĢağıda verilenlerden hangisi bahsi geçen sınavların yordama geçerliğini ifade eden bir örnektir? A) LYS‟ye giren öğrencilerin bu sınavdan aldıkları puanlar ile lise not ortalamaları arasındaki iliĢki B) KPSS‟ye giren adayların bir soraki yıl KPSS‟den aldıkları puanlar arası korelasyon C) LYS‟ye giren öğrencilerin aldıkları puanlarla bir sonraki yıl LYS‟ye giren öğrencilerin aldıkları puanlar arasındaki iliĢki D) KPSS‟ye giren adayların aldıkları puanlar ile göreve baĢladıklarında aldıkları sicil notları ya da hizmet içi eğitim puanları arasındaki iliĢki E) LYS‟ye giren öğrencilerin aldıkları puanlar ile ile o yıl üniversite 1. sınıfta olan öğrencilerin ders notları arasındaki iliĢki Yanıt: D ÖLÇÜT – KRĠTER / YORDANAN ġayet, memur olduktan sonraki performansını, sicil notlarını, teftiĢ notlarını ölçüt kabul edersem ve buna göre geçerliği belirlersem KPSS‟nin yordama – tahmin geçerliğini belirlemiĢ olurum. BU KADAR NET UZATMAYA GEREK YOK. Üniversitedeki baĢarı puanlarını, performansını ölçüt kabul ediyorsam ÖSS‟nin yordama geçerliğini belirlemeye çalıĢıyorum. Lisedeki puanlarını ve performasını ölçüt kabul ediyorsam SBS‟nin yordama geçerliğini belirlemeye çalıĢıyorum. ÖNEMLĠ NOTLAR Yordama ya da uygunluk geçerliğini hesaplamak istediğiniz testte ölçülen özelliklerle kriter olarak kullandığınız özellikler benzer olmalıdır. Ölçüt geçerliğinde ölçütünüz yordamak özellikle anlamlı bir iliĢki içermelidir. Yordama geçerliğine iliĢkin katsayının büyüklüğü, yordayıcı ve ölçütün ( yordanan) güvenirliği ile sınırlıdır. Bu değer yordayıcı ve ölçüt puanlarının güvenirliklerinin çarpımının karekökünden fazla olamaz. Örneğin: istediğiniz Yordayıcı güvenirliği 0,60 ve ölçüt güvenirliği 0,80 olan bir testtin yordama geçerliği en fazla kaç olur? 0,60 . 0,80 = 0,48 𝟎, 𝟒𝟖 = 0, 69 ( yaklaĢık) YAPI GEÇERLĠĞĠ ( TANIMSAL GEÇERLĠK) : Birçok ölçme kitabında yapı geçerliği sadece psikolojik ölçmelerle ilgili görülmüĢ, eğitimsel ölçmelerde bu tür geçerlik pek söz konusu edilmemiĢtir. Ancak yapı geçerliğinin, geçerliğin tamamı olarak görülmesi doğru olacaktır. TESTĠN ÖLÇMEK ĠSTEDĠĞĠ YAPIYI ölçüp ölçmediği meselesi Bir testin yapı geçerliğini belirleme süreci bir ölçüde, bilimsel kuram geliĢtirme süreci ile aynıdır. Yapı geçerliğini belirlemede Ģu yol izlenir: a) b) c) d) e) f) Yapı hakkında kuramsal ve iĢevuruk tanımlama yapılır. ĠĢevuruk tanımlara dayalı hipotezler kurulmalı Hipotezleri test etmek için araç geliĢtirilmeli Araç uygun bir gruba uygulanmalı ve veriler toplanmalı Elde edilen verilerin hipotezi destekleyip desteklemediği belirlenmeli Destekliyorsa yapının ortaya çıkan özellikleri ortaya konmalıdır. Yukarıdaki süreci bir örnekle ele alalım: Söz gelimi eğitimin genel hedefleri arasında bulunan “eleĢtirel düĢünme gücü” ele aldığımızda Ġlkin “EleĢtirel düĢünmenin” kuramsal bir tanımı yapılmalıdır. Sonra “eleĢtirel düĢünen ne yapar?” sorusunu sorarız. Bu soru soyut bir yapı olan “eleĢtirel düĢünme becerisinin” davranıĢa çevrilmesi ( iĢevuruklaĢtırılmasıdır) yani hipotezlerin oluĢturulmalıdır. Gözlenebilir tüm davranıĢları sıraladığımızı düĢünelim ( eleĢtirel düĢünen ... yapar vs ) Bu davranıĢlardan bir tanesi olan “ Çözümü olanaksız problemleri çözüm olanağı olan problemlerden ayırt etme” olsun. Sonra bu davranıĢı ölçmek için Ģu soruyu sorduk: “ Hangi üç tek sayının toplamı 50 eder?” ( Bu problemin çözümü yoktur toplamı 50 eden üç tek tam sayı yoktur) Bir öğrencinin bu soruya verdiği yanıta göre eleĢtirel düĢünme gücü hakkında yargıda bulunuyoruz: “ EleĢtirel düĢünebilen kiĢi bu sorunun çözümü olmadığını söyler; ya da bu sorunun çözümü olmadığını söyleyen eleĢtirel düĢünebiliyordur” Yapı geçerliği: Doğrudan gözlenemeyen teorik yapıların ( kiĢilik, yaratıcılık, yetenek, ilgi, zeka, tutum, sevgi, merak, problem çözme, eleĢtirel düĢünme, sosyal uyum, ruh sağlığı, güven – güvensizlik, içedönüklük, dıĢa dönüklük vb) iliĢki içinde olduğu varsayılan davranıĢlar arasındaki korelasyon değeri yapı geçerliğini verir. Yapı geçerliği; teste ölçülmek istenen yapının ortaya konulma derecesi olarak tanımlanabilir. Binet’e sormuĢlar zeka nedir? Yanıt vermiĢ: “ Benim testlerimin ölçtüğü Ģeydir” Buradan çıkaracağımız sonuç Ģudur “ Binet , geliĢtirdiği zeka testlerinin; zeki insanların davranıĢlarını içerdiğini kabul etmektedir; zeki bireyler onun testlerinde yer alan davranıĢları gösterir; ya da Binet’in testlerindeki davranıĢları gösteriyorsan zekisin” Yapı geçerliği; gözlenemeyen ancak kuramsal olarak açıklanan bir psikolojik yapıyı ( örneğin yaratıcılık, otoriterlik vb) ölçmeyi hedefleyen bir ölçü aracının amacına ne denli ulaĢtığıdır. Yapı geçerliği analizi karmaĢık ve çok yönlü bir süreçtir; kuramsal olarak varlığı öne sürülen yapının davranıĢlara ne derece yansıdığının ve ölçü aracının maddelerinin özelliklerinin incelenmesini gerektirir. Cronbach Alfa, KR-20 , KR-21 güvenirlik katsayılarının yüksek olması ölçme aracının homojenliğine ve dolayısıyla yapı geçerliğine bir göstergedir ancak kesin kanıt değildir. Yani KR-20 yüksek ise yapı geçerliği kesinlikle yüksektir diyemezsiniz. DĠKKAT DĠKKAT DĠKKAT: Birçok konu anlatım kitabında KR-20 yüksek ise yapı geçerliği de yüksektir gibi HATALI bir ĠFADE GEÇMEKTEDĠR. KR-20 bir güvenirlik ölçüsüdür ki güvenirliğin yüksek olması geçerliğin de yüksek olacağı anlamına GELMEZ. AMAN DĠKKAT ARKADAġLAR hatalı YORUMLARA aldanmayın... Ölçme aracından elde edilen puanların kararlılığı ( test – tekrar test güvenirliği) da yapı geçerliği için bir kanıttır. Ancak kesin kanıt değildir. Ölçme aracının homojenliği yapı geçerliği için bir kanıttır. Ama kesin kanıt değildir. Bir Örnekle Daha DüĢünelim: Zeka üzerine geliĢtirilmiĢ birçok kuram vardır. Bu durumda bir zeka testi hazırlanacağı zaman öncelikle zekanın tanımı ( kuramsal tanımı ) yapılmalı. Daha sonra yaptığımız tanıma göre zeki insanın davranıĢları belirlenmeli ( iĢevuruklaĢtırılmalı ) Sonra bu davranıĢları ölçen bir test hazırlamalıyız. Bu testi zeki olduğunu bildiğimiz ve zeki olmadıklarından emin olduğumuz iki gruba uygularız. ġayet zeki olduğunu bildiğimiz bireyler bu testten yüksek puan alıyorsa ve zeki olmayanlar düĢük puan alıyorsa yapı tanımlamamız ve bu tanıma uygun geliĢtirdiğimiz davranıĢlar geçerlidir, deriz. Yapı geçerliği geçerliği tamamı olarak görülmelidir. ÖSYM’nin geçen sene sorduğu yapı geçerliği sorusu göstermiĢtir ki birçok kaynakta (defalarca uyarmamıza rağmen) yanlıĢ anlatılmaktadır. Birçok kaynak yapı geçerliğini sadece psikolojik testlerle ( tutum , ilgi vb ) sınırlı tutmuĢlardır. Yapı gelerliği tanımımızın en baĢını dikkatli okursanız yapı geçerliği için GEÇERLĠĞĠN TAMAMI ifadesi geçmektedir. YAPI GEÇERLĠĞĠ = GEÇERLĠĞĠN KENDĠSĠ YAPI GEÇERLĠĞĠNĠ BELĠRLEMEYE YARAYAN BAZI TEKNĠKLER Bir ölçme aracının yapı geçerliği, bir tek katsayıyla ifade edilmez. Yapı geçerliği belirlenirken birçok yönteme baĢvurulabilir ve elde edilen sonuçlar, ölçme aracının ölçmek istediği yapıya iliĢkin ya da ölçmek istediği yapıyı ölçüp ölçmediğine iliĢkin kanıt olarak kullanılabilir. I. Ölçme Aracının Homojenliği: Bir testi oluĢturan madde puanları ile toplam test puanları arasındaki korelasyon ( çift serili korelasyon katsayısı) ölçme aracının homojenliğine, dolayısıyla yapı geçerliğine iliĢkin bir kanıt olarak kullanılabilir. Madde puanları ile test puanları arasında pozitif yönde ve yüksek bir korelasyon varsa , bu korelasyon katsayıları, maddelerin aynı yapıyı ölçtüğünün bir göstergesidir. Ġç tutarlık anlamında kullanılan güvenirlik katsayıları da yapı geçerliğine kanıt olarak kullanılabilir. Alfa, KR-20 , KR-21 gibi güvenirlik belirleme yöntemleri ile elde edilmiĢ katsayılar da yapı geçerliğinin göstergesidir. Ancak kesin kanıt değildir. II. Diğer Testlerle Korelasyon: GeliĢtirilen ölçme aracından elde edilen puanlar, aynı yapıyı ölçtüğü bilinen baĢka bir ölçme aracından elde edilen puanlar arasındaki korelasyon, yapı geçerliğine iliĢkin kanıttır. III. Grup Farklılıkları: Deneysel bir yöntemdir ( Deney grubu – kontrol grubu gibi) Bu yöntemde ölçme aracı , ölçülmek istenen yapı ( mesela zeka ) açısından farklı olduğu bilinen gruplara ( Yüksek zeka düzeyine sahip ve düĢük zeka düzeyine sahip bireylerden oluĢan gruplara) uygulanır. Ölçülen özelliğe sahip olan grubun puan ortalaması ( zeki grubun puanları ) ölçülen özelliğe sahip olmayan grubun puan ortalamasından ( zeki olmayan grubun puanları) anlamlı bir düzeyde farklı olması beklenir. IV. Ölçme Aracından Elde Edilen Puanların Kararlılığı: Test – tekrar test yöntemi ile belirlenmiĢ kararlılık katsayısı yapı geçerliğine bir iĢaret kabul edilir. Ancak kesin kanıt değildir. V. Pratik Ölçülerle Korelasyon: Ölçme aracı ile ölçülmek istenen yapı ile onunla yakından iliĢkisi olduğu düĢünülen baĢka değiĢkenler arasındaki korelasyona bakmak suretiyle, yapı geçerliğine iliĢkin kanıt sağlanır. Örneğin; Bir zeka testi geliĢtirildiğini farz edelim, zeka testinden elde edilen puanlar ile bir matematik testinden elde edilen puanlar veya zeka testi ile bir yetenek testinden elde edilen puanların korelasyonuna dayanır. ( Ek açıklama: Zeki insanların matematik testini yapabileceği var sayılır bu aslında zeka tanımının sayısal zeka Ģeklinde yapıldığını da gösterir. Buna göre bir ölçme uzmanı geliĢtirdiği zeka testini bir dil testi ile karĢılaĢtırıyorsa zeka tanımını ve iĢevuruk davranıĢlarını sözel zekaya göre yapmıĢtır) Bu korelasyon yüksek ise yapı geçerliği yüksek kabul edilir. VI. Faktör Analizi: Ölçme aracının, ölçtüğü değiĢkenlerin sayısı ve bunların her birinin testin bütününden elde edilen toplam puanlara katkısı, testin ölçtüğü yapı ve yapıları ortaya çıkarmada kullanılabilir. Açıklayıcı faktör analizinde: gerçek yapısı bilinmeyen bir kuramsal yapı, ona dönük geliĢtirilen ölçme aracından elde edilen verilere dayanarak açıklanmaya çalıĢılır. Doğrulayıcı faktör analizinde ise daha önceden var olan ya da bilinen veya kuramsal olarak öne sürülen bir kuramsal yapıyı, bu yapıyı ortaya çıkarmak amacıyla geliĢtirilen ölçme aracından elde edilen sonuçlara dayanarak doğrulamaya çalıĢır. Testteki tüm soruların aynı faktörü ölçüp ölçmediğinin belirlenmesi ya da aynı faktörü ölçen maddelerin bir araya getirilmesidir. Amaca hizmet eden maddelerin bir araya getirilip amaca hizmet etmeyen maddelerin ayıklanmasıdır. VII. Testi cevaplayanlarla nasıl cevapladıkları hakkında görüĢme: Testi çözenlere soruları çözerken nasıl düĢündükleri sorularak, neden bu yanıtı verdin verirken ne düĢündün gibi sorular yöneltilerek de yapı geçerliği anlaĢılabilir. VIII. Uzman görüĢüne baĢvurma: GÖRÜNÜġ GEÇERLĠĞĠ: “Bundan yıllar yıllar önce, ÖSS’ye hazırlanırken, bir deneme sınavına girmiĢtim. Deneme sınavında geometri kısmındaki soruları çözerken bir çember sorusu ile karĢılaĢtım. Çember konusuna hakim olmama rağmen analitik bilgim olmadığı için o soruyu okumadım bile. Çünkü soruya baktığımda analitik bilgisi ölçüyor gibi görünüyordu ancak soru meğersem çemberde açı bilgisini ölçüyormuĢ” Yukarıda verilen bir anı örneğinden de anlaĢılabileceği gibi görünüĢ geçerliği bir testin gerçekten ne ölçüğü ile ilgili değil, onun ne ölçüyormuĢ gibi göründüğü ile ilgilidir. Matematikle ilgili bir soru hazırlanıyorsa fizik , kimya gibi derslerin kavramları geçmemelidir. Ya da matematikte temel kavramlarla ilgili soru hazırlıyorsak kullandığımız semboller buna uygun olmalıdır. Örneğin matematikte sayı problemleri “a+b= 3 , x.y = z” gibi semboller kullanılır. Bir öğretmen tutar da bu semboller yerine hiç “i + ç = 3 ya da l.u= k” gibi hiç alıĢık olmadığımız semboller kullanırsa görünüĢ geçerliği düĢer. BaĢka bir örnekle ele alalım “ 𝑖 2 +3 𝑖 2 = −1 𝑖𝑠𝑒 2 kaçtır?” Sorusu bir karmaĢık sayı sorusu mu yoksa temel matematik becerisi sorusu mu olduğu belli değildir. 𝑖 Yani sorunun görünüĢ geçerliği düĢüktür. Bu yüzden bazı öğrenciler bu soruyu karmaĢık sayı sorusu algıladığı için yapamamıĢtır. Ben çarpanlara ayırma konusuna oldukça hakim bir öğrenciyim. Ancak polinomlar konusunu bilmiyorum. Girdiğim bir sınavda polinom sorusu gibi görünen ancak aslında çarpanlara ayırmayı ölçtüğünü sonradan öğrendiğin bir soruyu sırf polinom bilgisi ölçüyor gibi göründüğünden yapamamıĢtım. Yukarıda verilen anı örneğinden de anlaĢılabileceği gibi testin bütünü için söz konusu olan görünüĢ geçerliği testteki her bir soru için de söz konusudur. Yani matematik testi yazan bir kitapçıktan matematik sorusu gibi görünen sorular beklenir aynı zamanda o testteki her bir madde neyi ölçmek istiyorsa görünüĢ olarak da öyle olmalıdır. SORU: “Yarılanma süresi 20 yıl olan bir radyoaktif maddenin 200 yıl sonra ne kadarı kalır?” sorusu hangi alanla ilgilidir Ģeklinde bir soru 30 öğrenciye sorulmuĢ. Öğrencilerin 16’sı bu sorunun fizik sorusu olduğunu, 10’u kimya sorusu olduğunu 4’ü de matematik sorusu olduğunu söylemiĢtir. Bu maddenin görünüĢ geçerliği düĢüktür. GÖRÜNÜġ Geçerliği belirleme yollarından biri de yukarıdaki gibi ANKET uygulamaktır. Anket sınava girenlere uygulanabileceği gibi paydaĢlara da ( Aile – öğretmen vb ) uygulanabilir. SORU: “Dün gece Mersin‟de iki taksici gasp edildi” cümlesindeki anlatım bozukluğunun nedeni nedir? Sorusu hangi alanla ilgilidir? --------------Türkçe dediğinizi duyar gibiyim o halde bu testin görünüĢ geçerliği yüksektir. ( Bu arada hadi bakalım buradaki anlatım bozukluğunun nedenini de bulun) ÇOK ÖNEMLĠ UYARI: Bir baĢarı ( Türkçe – Tarih – Coğrafya – Matematik – Fizik vs) testini piyasaya kabul ettirmek istiyorsak GÖRÜNÜġ GEÇERLĠĞĠNĠ ARTIRMAK ZORUNDAYIZ. Ancak bir psikolojik testi ( Tutum ölçeği – KiĢilik Testi) piyasaya kabul ettirmek istiyorsak GÖRÜNÜġ GEÇERLĠĞĠNĠ DÜġÜRMEK ZORUNDAYIZ. Çünkü psikolojik testlerde görünüĢ geçerliği yüksek olursa testi çözen kiĢi gerçekçi yanıt vermez ( Sosyal kabul hatası ) . Bir örnekle ele alalım: Bir kiĢilik testinde Ģöyle bir soru sorulsa: “Paraya mala mülke değer verir misin?” Bu sorunun görünüĢ geçerliği oldukça yüksektir ve bu soruyu yönelttiğimiz kiĢi muhtemelen “Değer vermem ” diyecektir.Ancak bu sorunun görünüĢünü gizlemek ( görünüĢ geçerliğini düĢürmek) gerekir. DüĢürelim bakalım ne olacak Bir gün otobanda kendi araban ile giderken yolda bir adamın yaralı yattığını gördün. Adamın baĢında bir doktor ve önceden beri hayranlık duyduğun bir kız var. Arabanda yalnızca bir kiĢilik yer var, yaralıyı alırsan kızı kaçıracaksın, kızı alırsan yaralıya yardım edemeyeceksin ne yaparsın? Bu soruya genelde kiĢilerin yaralıyı alırdım dediği gözlenmiĢtir. Ancak birçok kiĢi arabamı doktora veririm hem yaralı hastaneye gider hem de sevdiğim kızla zaman geçirir – tanıĢırım dememiĢtir. Yani malları onlar için kıymetli ĠĢte bu yüzden psikolojik testlerin görünüĢ geçerliği düĢürülmelidir. !!! Sınıflama ve Sıralamaya Dayalı KARAR GEÇERLĠĞĠ: Eğitimde ve psikolojide, ölçme araçlarından elde edilen sonuçlara dayanarak bireyler hakkında karara varılır. Yapılan ölçmelerin iki temel problemi; 1. 2. Testin ölçmek istediği değiĢkeni ya da özelliği ne derece ölçebildiği Testin doğru kararlar verebilmek için ne derecede kullanılabilir olduğu yani testi kullanarak ne derece doğru kararlar verilebileceğinin belirlenmesidir. Testlerin sonucuna göre verilen kararların doğruluğu eğitim ve psikoloji açısından çok önemlidir. Testlerin sonucuna göre verilecek kararların doğruluğu testlerin geçerliliği ile doğrudan iliĢkilidir. Karar vericiler açısından bakıldığında, geçersiz bir testin sonunda verilen kararların etkisiz olacağı, bireyler açısından bakıldığında ise geçersiz bir testin sonucunda verilen kararların adil olmayacağı ileri sürülebilir. Eğitimde bireyler hakkında verilen kararların çoğu; geçti – kaldı veya baĢarılı – baĢarısız gibi sınıflama düzeyindedir. Ölçme sonuçları hangi ölçek düzeyinde olursa olsun, bir ölçüte dayanarak veriler sınıflama düzeyine indirgenebilir. Bu aĢama değerlendirme aĢamasını oluĢturur ve asıl amaç da bu nihai karara ulaĢmaktır. Ölçme sonuçları ikili düzeye indirgendiği için aslında geçecek birey için kaldı, kalacak birey için de geçti demek gibi, ölçütün altında veya üstünde kalan bireylerin hatalı sınıflanma olasılığı da vardır. Bazen eğitimde, kullanılan ölçme aracına dayalı ölçülen özellik açısından bireyler sıralanabilir. Ölçme aracı ne kadar güvenilir olursa olsun bireyleri ölçülen özellik açısından doğru ya da yeterli sınıflamıyor ya da sıralamıyor olabilir. Ölçme aracının bu özelliği ölçülen özellik açısından bireylere dönük alınacak kararlar üzerinde son derece etkilidir. Bu durumda ölçme aracının belli ölçüt ya da ölçüt takımlarına göre ölçülen özellik açısından bireyleri doğru sınıflayıp sınıflamadığı ya da sıralayıp sıralamadığı araĢtırılmalıdır. KULLANIġLILIK: Geçerlik ve güvenirlik gibi teknik özelliklerin yanında bir ölçme aracında bulunması gereken bir diğer özellik de kullanıĢlıktır. KullanıĢlık özelliğini, ölçme aracını kullanmasını gerektirecek durumlara iliĢkin gereksinimleri tatmin edici bir Ģekilde hizmet etme derecesi olarak tanımlamıĢtır. Bir testin kullanıĢlığı; onun geliĢtirilmesi, çoğaltılması, uygulanması ve puanlanmasının kolay ve ekonomik olması Ģeklinde tanımlanır. Ekonomiklik, uygulanabilirlik ve puanlanabilirlik açısından ele alınmalıdır. Ekonomiklik: Ölçme aracının zaman, Uygulanabilirlik: Bir ölçme aracı ya Puanlanabilirlik: Ölçme aracının puanlanabilirlik para, emek açısından ekonomik olması da testin uygulanabilirlik özelliğine özelliğine sahip olabilmesi için ölçme aracı veya yanıt demektir. Ölçme aracı hazırlayan sahip olabilmesi için ölçme aracının ya kağıdı ( formu) öğrenci yanıtlarını uygun biçimde almak kiĢiye ve diğer okul personeline çok da testin yönergesi ve test ile ilgili için öğrencinin kolayca anlayabileceği ve algılayabile-ceği fazla mali yük getirmemelidir. açıklamalar açık seçik ve öğrencinin biçimde düzenlenmeli. Yanıt anahtarı dikkatli ve özenle Ekonomiklik ne ucuz test ve anlayabileceği Ģekilde olmalı, ölçme doğru hazırlanmalı, kullanımı kolay, anlaĢılır ve pratik yöntemleri geliĢi güzel kullanmayla aracının ya da testin biçimsel olmalı, güvenilir bir puanlamaya olanak sağlamalı sağlanabilir ne de pahalı araçları ya da özellikleri ( formatı) uygun ve anlaĢılır yöntemleri tercih doğrudur. olmalı , eğer ölçme aracı ya da test Puanlayıcı ölçme aracına iliĢkin puanları kolay doğru Ekonomiklik ölçme aracının geçerlik çeĢitli materyalleri veya parçaları ve hızlı elde edebilmelidir. Bir testin puanlamasını ve güvenirlik gibi teknik özelliklerinin içeriyorsa bu parça veya materyaller kolaylaĢtırabilmek için bir çok yöntem vardır. ÇeĢitli göz önünde tutularak olabildiğince kolayca ve anlamlı bir biçimde test tipleri ve uygun puanlama yöntemleri üzerinde ucuza mal edilmesidir. birleĢtirilebilir ve kullanılabilir ileriki bölümde durulacaktır. olmalıdır. Testi uygulayan kiĢi ya da kiĢiler gereksiz çaba sarf etmeden testi Ekonomiklik ucuzculuk olarak kullanabilmeli ya da düĢünülmesin geçerlik ve güvenirlik açısından iyi bir testi uygulayabilmelidir. en uygun maliyete mal etmektir. Yazılı yoklamalar hazırlanıĢ açısından ekonomik iken çoktan seçmeli testler hazırlanıĢ açsından maliyetli olabilir. Testin sayfa düzeni, yazı düzeni, satır aralıkları yazı stili ve puntosu gibi genel biçimsel özelliklerine dikkat edilmeli, öğrencilerin test maddelerini kolayca algılayacağı biçimde düzenlenmelidir. Özetle kullanıĢlık bir testin hazırlanıĢ, uygulanıĢ ve puanlanıĢ aĢamalarında öğretmen ve öğrencilerin iĢini en az maliyet , zaman ve emekle görmelerine dönük bir kavramdır. Bazen kullanıĢlığın artırılması geçerliği ve güvenirliği düĢürebilir ya da geçerlik ve güvenirliğin artırılması kullanıĢlığı düĢürebilir.
© Copyright 2024 Paperzz