Skip to main content

Ölçme Araçlarında Güvenirlik ve Geçerlilik

Özet
Bilimsel çalışmalarda somut ve soyut özelliklerin ölçülmesi için ölçme araçlarına ihtiyaç vardır. Ölçme araçlarının standardize olabilmesi için vazgeçilmez iki temel özelliğin olması gerekmektedir. Bu özellikler geçerlilik ve güvenirliktir. Bu çalışmada geçerlilik ve güvenirliğin tanımı, çeşitleri ve arasındaki ilişki ve farkları bulunmaktadır.
Anahtar Kelime
Güvenirlilik, Geçerlilik, Ölçek

Giriş
Ölçme, bir özelliğe sahip oluş derecesini belirtmek için, belirli kurallara uyularak sembolik değerler verme işlemidir. Bir başka anlamda bir değişkenin sembolle ve özellikle sayı ile eşleştirilmesidir. Bilimsel araştırmalarda ölçmenin temel amacı bir konu üzerinde değerlendirme yapmak ve karar vermektir. Değerlendirme sonucunun ve dolayısıyla da kararların doğruluğu ve uygunluğu değerlendirme sonuçlarına dolayısıyla da ölçeğin uygun olmasına bağlıdır. Bunu sağlamak için ölçeğin standardize olması gerekir. Standardize olan ölçekler nesneldir. Ölçme araçlarının standardize olabilmesi için vazgeçilmez iki temel özelliğin olması gerekmektedir. Bu özellikler geçerlilik ve güvenirliliktir (Ercan & Kan, 2004).

Her ölçeğin öncelikle ölçülecek özelliği tam ve doğru olarak başka bir özelikle karıştırmadan ölçmelidir. Bu özelliğe geçerlilik denir. Bir ölçeğin kullanış amacına uygunluğunun derecesini geçerlilik belirler. Ayrıca, bir ölçme aracı ölçmek istediği özelliği tutarlı olarak ölçebilmelidir. Ölçeme işlemi aynı şartlar altında aynı ölçekle tekrarlandığında aynı sonuçları verebilmelidir. Bu özelliği güvenirlik olarak adlandırılır (Ergin, 1995).

Güvenirlik
Ölçeğin taşıması gereken özelliklerden birisi olan güvenirlik, bir ölçme aracıyla aynı koşullarda farklı zamanlarda tekrarlanan ölçümlerde elde edilen ölçüm değerleri arasındaki tutarlılığına o aracın güvenirliliği denir. Güvenirlik sadece ölçme aracına ait bir özellik değildir, aracın sonuçlarına ilişkin bir özelliktir. (Öncü, 1994).

Ölçekle toplanan bilgilerin tutarlı özellik taşıdığına bir başa değişle hatasız olduğuna ve aynı hedefle yapılacak başka bir ölçmede aynı sonuçların elde edileceğine güven duyulması gerekir. Güven duyulmayan bir ölçek kullanışsızdır. Örnek olarak, bir elmayı defalarca tarttığımızda hep aynı değeri buluyorsak veya insanlara farklı zamanlarda sorduğumuz aynı sorularda aynı cevapları alıyorsak ölçme aracımızın güvenilir olduğunu söyleyebilir (Ercan & Kan, 2004).

Güvenirlik üç öğeden oluşur; 1. Değişmezlik: Değişmezlik bir ölçümün ne derece kararlı olduğunu, zaman içinde ne derece değişmeden kaldığını ifade eder (Bryman, 2004) 2. İç güvenirlik: İç güvenirlik, ölçeği oluşturan değişkenlerin tutarlı olmasını, yani cevaplayıcıların bir değişkene verdikleri cevabın, diğer değişkenlere verdikleri cevaplarla ilişkili olmamasını ifade eder (Bryman, 2004) 3. Gözlemciler arası tutarlılık: Bu kavram da çeşitli gözlemcilerin gözlemlerini kaydetme ya da verileri kategorilere çevirme konusundaki kararlarını ifade eder. Gözlemciler bu konularda önceden alınmış kararlara bağlı kalmalı, özellikle veriler birden fazla kişi tarafından toplanıyor ve kaydediliyorsa farklı gözlemcilerin kayıtlarının tutarlı olması sağlanmalıdır (Bryman, 2004).

Bir ölçeğin güvenirliliğinin yüksek olması o ölçeğin ölçmede izlenen süreçler ile kullanılan ölçütlerin detaylı olarak belirlenmesine bağlıdır. Bilimsel çalışmalarda güvenirliği artmak için madde ve soru sayısı artırılarak çok sayıda ölçüt kullanılır. Böylece hataların birbirini dengelemesiyle güvenirliği yüksek sonuçlar alınabilir. Birbiri ardına yapılan ölçmelerde bireyin grup içinde tutarlılığı aranır. Bu yaklaşımla aynı nesneler ile iki ölçüm arası korelasyon hesaplanır. Bulunan bu korelasyon değerine, güvenirlik kat sayısı denir. Güvenirlik katsayısı, gerçek ölçümlerin puanın, gözlenen (ölçülen) puanlara oranıdır (Ergin, 1995)

Güvenilirliğin tespiti geçerliliğe göre daha somut işlemlere dayanır ve net sayısal verilerle ifade edilebilir. Güvenirliliği tespit etmek için kullanılan bazı yöntemler aşağıda listelenmektedir.
Test-Tekrar Test Yolu: Ölçüm aracının aynı örnekleme benzer koşullar altında aralıklarla iki kere uygulanması ve elde edilen sonuçların karşılaştırılmasıdır. Sonuçlar arasındaki ilişkinin katsayısı, güvenirlik katsayısıdır. Uygulanacak iki ölçüm arasındaki zaman aralığı, cevaplayıcıların önceki uygulamada verdikleri cevapları hatırlamayacakları kadar uzun, ancak ölçülmek istenen özellikte değişiklik meydana gelmesine izin vermeyecek kadar da kısa olmalıdır. (Sencer & Sencer, 1978)
Eşdeğer Biçimler Yolu: Ölçüm aracı aynı amaca yönelik olan iki farklı biçimde hazırlanır, örneğin cevap kategorilerinin ya da soruların yerleri değiştirilir ve aynı örnekleme ardı ardına uygulanır. Elde edilen sonuçlar karşılaştırılır ve güvenirlik düzeyi belirlenir (Sencer & Sencer, 1978).
Yarıya Bölme Yolu: Bu yolda ölçme tamamlandıktan sonra elde edilen veriler tesadüfî yollarla ikiye ayrılır. Bu iki veri grubu ayrı ayrı ele alınarak birbirleriyle karşılaştırılır ve aralarındaki tutarlılık ölçülerek güvenirlik düzeyi belirlenir. Soruların kötü ifade edilmesi, cevapları kodlayan araştırmacıların bireylerin verdikleri açık uçlu soruları farklı kodlarla kodlamaları ya da soruların ilgisiz ya da konuyla ilgili çok az bilgisi olan kişilere sorulması (örneklemin yanlış seçilmesi) gibi faktörler, güvenirlik düzeyinin düşmesine neden olur (Sencer & Sencer, 1978).
İç tutarlılık metodu: Araştırma belli bir kavramı ölçmek için aynı ölçüm düzeyinde birbirinden farklı sorulardan aynı form içerisinde yaralanıyorsa iç tutarlılık metodu uygulanmaktadır. Bu yöntemde araştırmacı testin güvenilirliği açısından cevaplayıcının birbirine benzer sorularda benzer cevaplar vermesini yani cevaplayıcının, cevapları arasında tutarlı olmasını bekler dolayısıyla benzer sorulardan benzer cevapların alınması testin güvenilirliği açısından delil olarak kabul edilir (Ergin, 1995)
Gözlemciler arası güvenilirlik: Araştırmanın uygulanmasında denekler değil de gözlemciler ön planda ise araştırmacı aynı kişi, olay veya yeri değerlendirmek üzere farklı gözlemciler ile çalışır ve elde edilen sonuçların birbiri ile uyumu araştırmanın güvenilirlik derecesini verir. Özellikle araştırmanın değişkenlerinin nitel olması veya daha az nicel olması bu yöntemin tercihinde etkili olmaktadır (Ercan & Kan, 2004).
Geçerlilik
Bir ölçme aracının güvenilir olması doğru bilgi elde edebilmek için yeterli değildir. Her ölçeğin öncelikle ölçülecek özelliği tam ve doğru olarak başka bir özelikle karıştırmadan ölçmelidir. Bu özelliğe geçerlilik denir (Ercan & Kan, 2004). Bir başka deyişle geçerlik, bir ölçme aracının ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle karıştırmadan, doğru ölçebilme derecesidir (Ergin, 1995).

Bir ölçeğin geçerliliği; kapsamlılık, kolay uygulanabilirlik, nesnelliği, maddeleri ayırt etme gücü, puanlana bilirlikten etkilenir. Bunlar güvenirlilik değil bir geçerlilik sorunudur. Güvenirlik ve geçerlik birbirinden tamamen ayrı iki kavramlardır. Bulunan istatistik değerleri arasında da hiçbir ilişki yoktur. Bir ölçme aracının mutlaka hem geçerli hem güvenilir olması anlamında birbirlerini tamamlarlar. Bir ölçmenin geçerli sayılabilmesinin ilk koşulu onun güvenilir olmasıdır. Fakat birbirinin ön koşulu değildir. Bir ölçek standardize olabilmesi için her ikisinin de birlikte olması gerekir. Bir ölçeğin güvenilir olması o ölçeğin geçerli olduğu anlamına gelmez (Ercan & Kan, 2004).

Bir bilimsel araştırmadan elde edilen sonuçların geçerliği üç açıdan değerlendirilir. Bunlardan ilki ölçüt geçerliği, ikincisi iç geçerlik ve üçüncüsü de dış geçerliktir.

Ölçüt Geçerliliği Bir ölçme aracının ölçmeyi hedeflediğini ölçmesidir. Örnek olarak uzunluk ölçme aracı ile ağırlık ölçemeye çalışılırsa bu geçerli bir ölçüm değildir. İç geçerlik, ölçüm aracının ölçmeyi amaçladığı özelliği, bir başka özellikle karıştırmadan doğru bir şekilde ölçebilme derecesidir. Başka bir deyişle bağımlı değişkendeki farklılaşmanın, bağımsız değişkenlerle açıklanma derecesidir (Sencer & Sencer, 1978).

İç Geçerlilik Neden sonuç ilişkisinde bulunan sonuca, ölçülmekte olan özellik değil de çalışmanın kendisi, çalışma yolu ya da tekniği neden olursa çalışma iç geçerlik açısından geçersizdir. Örnek olarak, ders çalışma sıklığının final notları üzerindeki etkisinin incelendiği bir araştırmada, ders çalışma sıklığı ve not ortalaması arasındaki ilişkinin iç geçerliliği, notlardaki değişikliklerin gerçekten de ders çalışma sıklığından kaynaklanması olasılığıdır. Eğer notlar araştırmacının kontrolü dışındaki başka etkenler tarafından da etkileniyorsa iç geçerlik düşüktür. Araştırma sürecinde iç geçerliği yükseltmek için dış faktörler kontrol altında tutulmaya çalışılır, bu nedenle iç geçerliğin en yüksek olduğu araştırmalar laboratuvar ortamında yürütülen araştırmalardır (Sencer & Sencer, 1978).

İç geçerliği tespit etmek için yüzeysel geçerliğin sınanması ve içerik geçerliğinin sınanması gerekir. Yüzeysel geçerleme, bir aracın ölçülmek istenen konuyu ölçer görünmesidir. Örneğin bir muhafazakârlık tanımı yapılarak buna göre geliştirilen bir ölçek, mantıksal olarak siyasal sistem, mülkiyet, aile gibi konularda gelenekçi tutum ve davranışları ölçmek için geçerlidir. Ancak yüzeysel geçerleme sadece mantıksal düzeyde kaldığı için ölçme aracının gerçekte neyi ölçtüğü konusuna açıklık getirmez. İçerik geçerliği ise, bir ölçme aracının ölçülen kavramla ilgili mantıksal içerimleri yeterince temsil etmesidir. Yani, ölçeği oluşturan soruların ya da maddeler, ölçülen konuya ilişkin çeşitli özellikleri iyi temsil etmelidir. Bir önceki örnek üzerinden düşünmek gerekirse, geliştirilen muhafazakârlık ölçeği içindeki soru ya da maddelerin muhafazakârlığı ölçebiliyor olması ve ölçekte ilgili konuyu ölçebilecek kadar çok sayıda soru ya da madde olması gerekir. İç geçerliği etkileyen faktörlerden başlıcaları örneklemin yanlış seçilmesi ve zaman faktörüdür. Zaman faktörü, bağımsız değişken dışında kalan önemli bazı değişkenlerin bağımlı değişken üzerinde yarattığı etkinin zamanla artması ve bağımlı değişkende meydana gelen değişikliğin asıl nedenini bulmayı zorlaştırmasıdır. (Ergin, 1995).
Dış Geçerlilik Bilimsel araştırmanın örneklem hakkında elde edilen bulguların ne dereceye kadar genelleyebileceği, araştırmanın dış geçerliğini oluşturur Örneğin; bir deneyde, grubun iş motivasyonunu artıran bir etkenin, gerçek işyerlerindeki çalışanların da iş motivasyonunu benzer düzeyde artırma olasılığı, bu etkenin dış geçerliğini ifade eder. Buna ek olarak, dış geçerlik, genelleme geçerliği olarak da adlandırılır Başka bir şekilde tanımlayacak olursak bir örneklemden elde ettiğimiz bilgilerin evren hakkında, ya da bir ortamdan elde ettiğimiz bilgilerin başka ortamlar hakkında ne derece bilgi verdiği, dış geçerlik olarak ifade edilir. Örneklemdeki dağılımın ait olduğu evrendeki dağılımı yansıtma derecesi evren geçerliği olarak adlandırılır. Bir ortamda yürütülen bilimsel araştırma sonuçlarının diğer ortamlara genellenebilirlik derecesi ise ekolojik geçerlik olarak adlandırılır. Yapay sosyal ortamlarda ya da laboratuarlarda yürütülen araştırmaların dış geçerliği, özellikle de ekolojik geçerliği genellikle düşüktür. Dış geçerliği etkileyen başlıca faktörler insanların denek olduklarını bildikleri zaman normalden farklı davranma eğilimi göstermeleri, yanlış örneklem seçimi, kavramların yeterince iyi tanımlanmaması ve kavramları yeterince iyi ölçmeyen değişkenler oluşturulmasıdır (Ercan & Kan, 2004)

Kaynakça
Bryman, A. (2004). Social Research Methods (2nd edition). Oxford: Oxford University Press.
Ercan, İ., & Kan, İ. (2004). Ölçeklerde Güvenirlilik ve Geçerlilik. Uludağ Üniversitesi Tıp Fakültesi
Dergisi, 30(3), 211-216.
Ergin, D. Y. (1995). Ölçeklerde Güvenirlilik ve Geçerlik. M.Ü.Atatürk Eğitim Fakültesi Eğitim Bilimleri
Dergisi(7), 125-48.
Öncü, H. (1994). Eğitimde Ölçme ve Değerlendirme. Ankara: Matser Basım San. Ve Tic. Ltd. Şti.
Sencer, M., & Sencer, Y. (1978). Toplumsal Araştırmalarda Yöntembiiim. Ankara: TODAİ.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir