Ölçme Aracında Bulunması İstenen Nitelikler

Egitim kategorisine 12 Temmuz, 2007 tarihinde eklendi, 13 defa okundu

ÖLÇME ARACINDA BULUNMASI İSTENEN NİTELİKLER

GEÇERLİK ve GÜVENİRLİK

Bilimsel çalışmaların niteliklerini belirleyen en önemli durumlardan biri bu çalışmalarda kullanılan ölçme araçlarının geçerlik ve güvenirlik dereceleridir. Bir bilimsel araştırmada diğer şartlar ne kadar uygun olursa olsun kullanılan ölçme aracı ya da araçlarının geçerlik ve güvenirlik düzeyleri kabul edilebilir oranda değilse elde edilen sonuçlara güvenilemeyecektir. Bu nedenle bilimsel araştırmalarda kullanılan ölçme araçlarının geçerlik ve güvenirlik düzeyleri araştırma sonuçlarının kullanışlılığı açısından kabul edilebilir olmalıdır. Böyle olmadığı durumlarda yapılan araştırmalardan elde edilen sonuçlara güvenilemeyecektir. Dolaysıyla boşuna zaman ve enerji harcanmış olacaktır. Bu tür sonuçlara dayanarak yapılan yordamalar da düzeltilmesi mümkün olmayan hatalar yapılacaktır.

Bu çalışmada geçerlik ve güvenirlik kavramlarının önemi, tanımları ve çeşitleri üzerinde durulmuştur.

GEÇERLİK (VALIDITY)

Geçerlik kavramı çeşitli yazarlar tarafından farklı biçimlerde tanımlanmıştır. Örneğin; Özgüven(1994. s,97), “bir ölçme aracının ölçmek üzere hazırlandığı amacını ölçme derecesi”, Tekin(1993. s,42), bir ölçme aracının ölçmeyi amaçladığı özelliği başka herhangibir özellikle karıştırmadan doğru olarak ölçebilme derecesi”, Hakan ve diğerleri(1991. s,267) “bir ölçme aracının ölçtüğü niteliklerde bir değişme olmadığı sürece birbirine yakın ölçüler verme özelliği”, Karasar(1986. s,158), “ölçmek istenen şeyin ölçülebilmiş olma derecesi, ölçülmek istenenin başka şeylerle karıştırılmadan ölçülebilmesi” Demirel ve Ün(1987. s,68), “bir ölçme aracının ölçmek istenen niteliği ölçme derecesi”, ve Yıldırım(1983. s,134), “ölçeğin kullanış amacına uygunluk niteliği”, şeklinde tanımlamaktadır. Bu tanımlar incelendiğinde; ölçme aracının ölçmek istediği şeyleri tam ve doğru olarak, başka şeylerle karıştırmadan ölçmesine o aracın geçerliği olarak değerlendirildiği anlaşılmaktadır.

Bir testin geçerliği ile güvenirliği arasında yakın bir ilişki vardır. Geçerlikte güvenirlik ön koşuldur. Yani bir test geçerli olmak için güvenilir olmak zorundadır.

Geçerlik bir derece sorunudur. Ya hep ya hiç sorunu değildir. Bir test hepten geçerli veya hepten geçersiz olmaktan ziyade, daha çok veya daha az geçerli olabilir. Bu nedenle özel bir amaç dışında bir testin geçerliğini, “yüksek”, “orta” veya “düşük” olarak nitelememek gerekir. Çünkü geçerlik, daima belli bir amaç için geçerliktir. Ayrıca geçerlikte bir de “ölçüt ölçüsü” sorunu vardır. Bir test için ölçüt ölçüsü ne olmalıdır? Ölçüt ölçüsü testin kullanılış amacına göre farklılık göstermektedir. Bilindiği gibi geçerlik, bir ölçme aracının kullanıldığı amaca hizmet derecesidir.

Bir testin geçerliği, o testten elde edilen puanlarla belli bir ölçüt ya da ölçütler takımı arasındaki ilişki bakımından açıklanır. Bu geçerliğin istastistiksel açıdan belirlenmesidir. Bu işlemde ölçüt ya da ölçütler takımı olarak neyin alınmış olduğu ya da alınması gerektiği, testin kullanılış amacına bağlıdır. Test puanlarıyla ölçüt ya da ölçütler takımı arasındaki ilişki katsayısına geçerlik katsayısı adı verilir. Bu sayı (-1,00) ile (+1,00) arasında değişir (Tekin,1993. s,41-42 ).

Karasar(1984. s,159), geçerliği; içerik, uygulama (deneysel) ve yapı geçerliği olmak üzere üç türde incelerken Tekin(1993. s,43) ise kapsam, yordama, yapı ve görünüş geçerliği olmak üzere dört türde incelemektedir. Burada Tekin’in yaklaşımı esas alınmıştır.

Kapsam Geçerliği

Kapsam geçerliği, bir bütün olarak testin ve testteki herbir maddenin amaca ne derece hizmet ettiğidir. Bir testin kapsam geçerliği; o testteki toplam maddelerin ölçülecek davranışı ve konu içeriğini örnekleme derecesine ve testteki herbir maddenin ölçmek istediği davranışı ne derece iyi ölçtüğüne bağlıdır. Bir testtin kapsam geçerliğine sahip olabilmesi için, ölçme konusu evreni yeteri derecede örneklemesi ve kapsaması ayrıca testteki herbir madde ölçmek istediği davranışı gerçekten ölçmesi gerekir.

Bir testtin kapsam geçerliği mantıksal ya da rasyonel ve istatistiksel yaklaşımla belirlenebilir. Mantıksal yaklaşımla testteki bütün maddelerin ölçmek istenen konuyu kapsayıp kapsamadığına bakılır. Bunun için konuların önem derecesini belirleyen belirtke tablosundan yararlanılır. İstatistiksel yaklaşımla ise;

a. Ölçme yapılan alanda daha önce geliştirilmiş olan ve o alanın geçerli ölçüsü olarak kabul edilen bir test seçilir. Aynı alanda sonradan geliştirilen yeni test kapsamı geçerli olarak kabul edilen testle aynı gruba uygulanarak elde edilen sonuçlar arasındaki korelasyon hesaplanır. Hesaplanan korelasyon katsayısı ne denli büyükse yeni testin kapsam geçerliği o denli yüksektir.

b. Geliştirilmiş olan bir test, testin geliştirildiği konuda başarılı ve başarısız diye seçilen iki gruba aynı anda uygulanır. Başarılı gruptaki öğrencilerin aldıkları puanların ortalaması başarısız gruptaki öğrencilerin aldıkları puanların ortalamasından anlamlı ölçüde büyükse bu test geçerlidir denilebilir.

Yordama Geçerliği

Bir testin yordama geçerliği, o testen elde edilen puanlarla testin yordamak için düzenlendiği değişkenin doğrudan ölçüsü olan ve daha sonra elde edilen ölçüt arasındaki korelasyondur. Bu biçimde hesaplanan korelasyon katsayısı yordama geçerliği katsayısı olarak adlandırılır. Korelasyon katsayısın büyüklüğü yüksek yordama geçerliğine işarettir. Kısaca yordama geçerliğinde önceden elde edilen test puanlarıyla sonradan elde edilen ölçüt ölçüleri arasındaki korelasyon katsayısının hesaplanması gerekir. Örneğin; üniversiteler arası seçme sınavında alınmış olan puanlarla seçme sınavı sonuçlarına göre üniversitelere girmiş olan öğrencilerin üniversitelerde almış oldukları notlar arasındaki korelasyon katsayısı, üniversiteler arası seçme sınavının yordama geçerliği katsayısıdır. Genel bir kural olarak test puanlarının elde edilmesiyle ölçüt ölçüsü elde edilmesi arasında geçen zaman arttıkça korelasyon düşer.

Yapı Geçerliği

Yapı geçerliği genelde zeka, ilgi, kişilik vb. niteliklerin ölçülmesiyle ilgilidir. Bu tür nitelikler ölçülürken önce ilgili niteliğin yapısı tanımlanır. Sonra bu niteliğin göstergesi olabilecek davranışları ölçecek araçlar geliştirilir. Bu tür araçların geçerliği; davranışların saptanmasından, araçlardaki maddelere verilen cevapların yorumlanmasına kadar pek çok işlemin geçerli olmasına bağlıdır.

Görünüş Geçerliği

Görünüş geçerliği, bir testin gerçekten ne ölçdüğü ile değil onun ne ölçüyor göründüğü ile ilgilidir. Bir testin görünüş geçerliği o testin ölçmek istediği şeyi ölçüyor görünmesidir. Görünüş geçerliği olan bir test kapağında ne yazıyorsa onu ölçüyor görünür. Örneğin kapağında “Fizik Testi” yazılı olan bir testin içinde fizikle ilgili sorular varsa sözkonusu testin görünüş geçerliği vardır denilir. Yani üzerinde “matematik testi” yazılı olan bir testin içinde kimya soruları bulunmamalıdır. Test görünüş olarak ölçmek istenilen konuda olmalıdır.

GÜVENİRLİK (RELIABILITY)

Bir ölçme aracında bulunması gereken en önemli niteliklerden birisi de güvenirliktir. Güvenirlikten uzak bir ölçme aracını bilimsel çalışmalarda kullanmak son derece sakıncalı olmaktadır. Güvenirlik nedir? Karasar’a(1984. s,155) göre güvenirlik; “aynı şeyin bağımsız ölçümleri arasındaki kararlılık, ölçmek istenen şeyin sürekli olarak aynı sembolleri alması, aynı süreçlerin izlenmesi ve aynı ölçütlerin kullanılması ile aynı sonuçların alınması” şeklinde tanımlanmaktadır. Tekin(1993. s,41) ve Özgüven(1994. s,83) ise güvenirliği “bir ölçme aracının ölçtüğü şeyi tutarlı, kararlı bir şekilde ölçmesi” biçiminde tanımlamaktadırlar. Tanımlamalardan anlaşıldığına göre bir ölçme aracının güvenilir olması için o ölçme aracını aynı koşullar altında tekrar tekrar uyguladığımızda aynı ya da en azından benzer sonuçları vermesi gerekmektedir.

Uygulamada bir nesne ya da özellik değişik zamanlarda ölçüldüğünde, ölçmelerin hepsinde aynı sonuçları elde etmek mümkün değildir. Çünkü çeşitli nedenlerle tam anlamıyla hatadan arınık bir ölçme yapılamaz. Ölçme sonuçlarına karışan hatalar ölçmenin güvenirliğini etkilemektedir. Bu hatalar, ölçmeciden, ölçme aracı ve ölçme yönteminden, ölçmenin yapıldığı ortamdan, ölçülen bireylerin sözü edilen bu etkenlerle etkileşiminden ileri gelebilir. istatistiksel özellikleri bakımından ölçme hataları sabit, sistemli ve rasgele hatalar olarak incelenebilir.

Sabit hatalar herbir ölçme için miktarı değişmeyen hatalardır. Örneğin; öğretmenin okuduğu her cevap kağıtına beş puan fazla verdiğini düşünelim, burada öğretmenin yaptığı hataya sabit hata denir. Hata miktarı her öğrenci için geçerlidir.

Puanlayıcı yanlılıklarını yansıtan tüm hatalara sistemli hatalar denir. Örneğin; öğrencilerin yazılı kağıtlarını okuyan bir öğretmenin sadece kız öğrencilerine veya uzun boylu olanlara beş puan fazla verdiğini düşünelim burada öğretmenin yaptığı hataya sistemli hata denir.

Kaynakları iyi bilinmeyen ve ölçme sonuçlarına gelişigüzel karışan hatalara rastgele hatalar denir. Örneğin sınav günü öğrencinin hastalığı ya da bütün öğrenciler için eşit olmayan şans başarısı gibi hatalar rastgele hatalardırlar.

Güvenirlik Katsayısı

Güvenirlik katsayısı, gerçek ölçümlerin varyansının gözlenen puanların varyansına oranıdır. Gerçek ölçümlerin bilinmemesi, ölçmecileri dolaylı yoldan güvenirlik katsayısı hesaplamak için bazı yöntemler bulmaya zorlamıştır.

Güvenirlik Katsayısının Hesaplanması

Güvenirlik katsayısının hesaplanmasını Anastasi(1988. s,116-125) ve Tekin(1993. s,57-67) dört şekilde açıklamışlardır. Bunlar; test tekrar test yöntemi, birbirini takip eden ya da paralel testler yöntemi, bir testin iki yarıya bölünmesi yöntemi ve kuder-richardson 20 ve 21 formülleridir. Burada bu yöntemlerin ne oldukları kısaca açıklanmıştır.

Test Tekrar Test Yöntemi

Bu yöntemle test güvenliğini belirlemek için bir test aynı gruba belli bir zaman aralığı ile iki kez uygulanır. İlk uygulamadan elde edilen puanlar ile ikinci uygulamadan elde edilen puanlar arasındaki korelasyona bakılır. Korelasyon katsayısı yüksek ise testin güvenirliği yüksek demekdir. Bu yolla güvenirlik katsayısı hesaplamada iki test uygulaması arasında geçen süre testin güvenirliğini olumsuz olarak etkilemektedir.

Paralel Testler Yöntemi

Bu yöntemle güvenlik tahmini için bir testin en az iki eşdeğer formunun geliştirilmesi lazımdır. Paralel iki testin eşdeğer olabilmesi için her iki test içindeki maddelerin sayısı, niteliği ve ölçtükleri davranışlar bakımından birbirine denk olmaları lazımdır. Bu yöntemle güvenirlik tahmininde, testin her iki formu aynı anda aynı gruba uygulanır ve her iki paralel formdan alınan puanlar arasındaki korelasyon hesaplanır.

Bir Testi İki Yarıya Bölme Yöntemi

Bu yöntemde test bir gruba uygulandıktan sonra iki yarıya bölünür. Deneklerin testin iki yarısından aldıkları puanlar arasındaki korelasyon hesaplanır. Hesaplanan korelasyon katsayısı testin yarısının güvenirliğini gösterir. Daha sonra “Sperman-Brown” formülüylede testin tümünün güvenirliği bulunur.

Kuder-Richardson 20 ve 21 Formülleri

Bu yöntem ancak bir testin içindeki herbir maddenin güçlük derecesi biliniyorsa uygulanabilir. Kuder-Richardson formülleri, testteki herbir maddenin aynı değişkeni ölçtüğü, yani testin ölçtüğü şeyin homojen olduğu varsayımına dayanır.

K A Y N A K L A R

Anastasi, Anne. Psychological Testing. Fordham University,1988.

Demirel, Ö. ve Ün, K. Eğitim Terimleri. Ankara,1987.

Hakan, A. ve Arkadaşları. Eğitim Bilimlerinde Çağdaş Gelişmeler. A.Ü., Açiköğretim Fakültesi Yayınları No:203, Eskişehir, 1991.

Karasar, Niyazi. Bilimsel Araştırma Yöntemleri. Hacettepe Taş Kitapçılık ltd.Şti., Ankara,1984.

Özgüven, İ. Ethem. Pisikolojik Testler. Yeni Doğuş Matbaası, Ankara, 1994.

Tekin, Halil. Eğitimde Ölçme ve Değerlendirme. Yargı Kitap ve Yayınevi, Ankara, 1993.

Yıldırım, Cemal. Eğitimde Ölçme ve Değerlendirme. ÖSYM Eğitim Yayınları No:7, Ankara, 1983.

*+*+*+

Yunus AVANOĞLU

Ev: 0412.232 59 84

GSM: 0533.445 55 95

icq: 70738258 dophin

e-mektup:(yunusavanoglu@hotmail.com)

Yorum Yaz

Yorum Yazabilmek İçin Lütfen Giriş Yapın.