S. Demirel Üniversitesi - Çevirmen
Dünyanın önde gelen istatistikçileri konuştu ve araştırmacılara, öğrencilere ve bilim iletişimcilerine verdikleri mesaj açıktı: Tek başına p değerlerini ve istatistiksel anlamı kullanarak, kuramları sınamayı ve sonuçların önemli olup olmadığına karar vermeyi bırakma zamanı.
Eğer bunların hiçbiri size bir anlam ifade etmiyorsa, ELI5'i anlatalım: Bilim insanları yaptıkları araştırmalarda her zaman bağıntılar bulurlar ve bunların yerinde mi yoksa sadece tesadüf mü olduğunu anlamak için, p değeri adı verilen bir test kullanırlar. P değeri ne kadar küçük olursa, sonuçların gerçek olma ihtimali o kadar yüksek olur ve p değerinin 0.05'ten düşük olması, bir şeyin yayınlanmaya değer ('istatistiksel olarak anlamlı') olup olmadığını belirler. En azından şu an öyle yapıyoruz, fakat Amerikan İstatistik Birliği (ASA) tarafından yayınlanan bir açıklamaya göre, bunu tamamen yanlış yapıyoruz.
ASA yönetici müdürü Ron Wasserstein, "P değeri hiçbir zaman bilimsel tümevarım yerine kullanılmak için tasarlanmamıştı," diyor. "İyi gerekçelendirilmiş istatistiksel iddialar, bir sayı değerinden ve bu sayının keyfî bir eşiği aşıp aşmadığından çok daha fazlasını içerirler. ASA açıklaması, araştırmaları "P<0,05 dönemi sonrası"na yönlendirmeyi amaçlıyor."
Tartışmaya neden olacak bu sözler bir istatistikçiden geliyor. Ayrıca ASA, 177 yıllık tarihinde ilk defa, testin nasıl kullanılması gerektiğini açıkça detaylandıran bir bildiri yayınlamış oldu. Karar, kurumun, bilimsel cemiyetin p değerlerine güvenmesinin, yeniden oluşturulamayacak olan bulguların yayınlanmasına katkıda bulunduğuna dair giderek artan bir şekilde endişelenmesinden sonra geldi. Yani eğer geçmiş çalışmalara dayanılarak bir şey yapılamazsa, bu epey bir büyük bir sorun olacak.
ASA başkanı Jessica Utts, şöyle konuşuyor: "Zamanla, p değerinin, en azından bazı alanlarda, yapılan çalışmanın yayınlanabilir olup olmadığı konusunda bir belirleyici olduğu ortaya çıktı. Bu bariz editörsel önyargılar, 'dosya dolabı etkisine' yol açıyor, yani istatistiksel olarak kayda değer sonuçlara sahip araştırmaların yayınlanması çok daha olasıyken, bilimsel olarak en az onlar kadar önemli olabilen diğer çalışmalar hiç yayınlanmıyor."
Bu aynı zamanda, araştırmacıların çok ihtiyaç duyulan p<0,05 değerini elde etmek amacıyla verilerini değiştirmelerine ve veriyi hesaplamak için kullanılan bütün istatistiksel test ve hükümler hakkında şeffaf olmak yerine, sadece bülten makalelerinde bulunan bu testlere odaklanmalarına sebep olabiliyor.
Peki eğer p değerlerini tamamen yanlış kullanıyorsak, o halde doğru olan ne? ASA, konuya ilişkin şu altı ilkeyi yayınladı:
P değerlerinin ilk eleştirilişi bu değil (geçen sene bir bülten, bunları hepten yasaklayacak kadar ileri gitmişti) ve çoğu bilim insanı, cesur açıklamayı alkışlıyor. Boston'da Dana Farber Kanser Kurumu'nda bir biyoistatikçi olan ve ASA'da görev yapmayan Giovanni Parmigiani, Nature bültenine şöyle söylüyor: "Eğer bu durum 20 yıl önce olsaydı, biyomedikal araştırmalar şu an kesinlikle daha iyi bir yerde olurdu."
Fakat diğerleri bunun asıl meseleyi çözmediği konusunda uyarıyor: P değerlerinin ötesinde, toplumun bilimden gerçekdışı beklentileri. Columbia Üniversitesi'nden istatistikçi Andrew Gelman şöyle aktarıyor: "İnsanlar, aslında elde edemeyecekleri bir şey istiyorlar. Kesinlik istiyorlar."
Bu durum, bilim insanları ile halk arasında, sonuçlardan anlam çıkarmak ve bununla ilgili incelikli yorumlar yapmak konusunda çok daha açık bir iletişim gerektirecek. Bu kolay olmayacak; fakat amaç bilimsel yöntemi daha iyi hale getirmek olduğunda, her zaman buna değer.
Kaynak: Science Alert, "Guys, it's time to stop using 'statistical significance' as the mark of important research"
<http://www.sciencealert.com/guys-it-s-time-to-stop-using-statistical-significance-as-the-mark-of-important-research>
Eğer bunların hiçbiri size bir anlam ifade etmiyorsa, ELI5'i anlatalım: Bilim insanları yaptıkları araştırmalarda her zaman bağıntılar bulurlar ve bunların yerinde mi yoksa sadece tesadüf mü olduğunu anlamak için, p değeri adı verilen bir test kullanırlar. P değeri ne kadar küçük olursa, sonuçların gerçek olma ihtimali o kadar yüksek olur ve p değerinin 0.05'ten düşük olması, bir şeyin yayınlanmaya değer ('istatistiksel olarak anlamlı') olup olmadığını belirler. En azından şu an öyle yapıyoruz, fakat Amerikan İstatistik Birliği (ASA) tarafından yayınlanan bir açıklamaya göre, bunu tamamen yanlış yapıyoruz.
P Değeri Testi Amacını Aştı mı?
ASA yönetici müdürü Ron Wasserstein, "P değeri hiçbir zaman bilimsel tümevarım yerine kullanılmak için tasarlanmamıştı," diyor. "İyi gerekçelendirilmiş istatistiksel iddialar, bir sayı değerinden ve bu sayının keyfî bir eşiği aşıp aşmadığından çok daha fazlasını içerirler. ASA açıklaması, araştırmaları "P<0,05 dönemi sonrası"na yönlendirmeyi amaçlıyor."
Tartışmaya neden olacak bu sözler bir istatistikçiden geliyor. Ayrıca ASA, 177 yıllık tarihinde ilk defa, testin nasıl kullanılması gerektiğini açıkça detaylandıran bir bildiri yayınlamış oldu. Karar, kurumun, bilimsel cemiyetin p değerlerine güvenmesinin, yeniden oluşturulamayacak olan bulguların yayınlanmasına katkıda bulunduğuna dair giderek artan bir şekilde endişelenmesinden sonra geldi. Yani eğer geçmiş çalışmalara dayanılarak bir şey yapılamazsa, bu epey bir büyük bir sorun olacak.
ASA başkanı Jessica Utts, şöyle konuşuyor: "Zamanla, p değerinin, en azından bazı alanlarda, yapılan çalışmanın yayınlanabilir olup olmadığı konusunda bir belirleyici olduğu ortaya çıktı. Bu bariz editörsel önyargılar, 'dosya dolabı etkisine' yol açıyor, yani istatistiksel olarak kayda değer sonuçlara sahip araştırmaların yayınlanması çok daha olasıyken, bilimsel olarak en az onlar kadar önemli olabilen diğer çalışmalar hiç yayınlanmıyor."
Bu aynı zamanda, araştırmacıların çok ihtiyaç duyulan p<0,05 değerini elde etmek amacıyla verilerini değiştirmelerine ve veriyi hesaplamak için kullanılan bütün istatistiksel test ve hükümler hakkında şeffaf olmak yerine, sadece bülten makalelerinde bulunan bu testlere odaklanmalarına sebep olabiliyor.
P Değeri Neye Yarar & Neye Yaramaz?
Peki eğer p değerlerini tamamen yanlış kullanıyorsak, o halde doğru olan ne? ASA, konuya ilişkin şu altı ilkeyi yayınladı:
- P değerleri, verilerin belirlenmiş bir istatistiksel model ile ne kadar uyumsuz olduğunu belirtebilir.
- P değerleri, üzerinde çalışılmış olan varsayımın doğru olma olasılığını veya yalnızca rastgele şans eseri ortaya çıkmış olma olasılığını ölçmez.
- Sadece p değerinin belirli bir eşiği geçip geçmemesine dayalı olarak bilimsel sonuçlara varılmamalı ve ticarî veya siyasî kararlar alınmamalıdır.
- Uygun sonuç çıkarma işlemi, eksiksiz raporlama ve şeffaflık gerektirir.
- Bir p değeri yani istatiksel önem, bir etkinin büyüklüğünü veya bir sonucun önemini ölçmez.
- Bir p değeri tek başına, bir model veya varsayım ile ilgili iyi bir delil ölçütü sağlamaz.
P değerlerinin ilk eleştirilişi bu değil (geçen sene bir bülten, bunları hepten yasaklayacak kadar ileri gitmişti) ve çoğu bilim insanı, cesur açıklamayı alkışlıyor. Boston'da Dana Farber Kanser Kurumu'nda bir biyoistatikçi olan ve ASA'da görev yapmayan Giovanni Parmigiani, Nature bültenine şöyle söylüyor: "Eğer bu durum 20 yıl önce olsaydı, biyomedikal araştırmalar şu an kesinlikle daha iyi bir yerde olurdu."
Fakat diğerleri bunun asıl meseleyi çözmediği konusunda uyarıyor: P değerlerinin ötesinde, toplumun bilimden gerçekdışı beklentileri. Columbia Üniversitesi'nden istatistikçi Andrew Gelman şöyle aktarıyor: "İnsanlar, aslında elde edemeyecekleri bir şey istiyorlar. Kesinlik istiyorlar."
Bu durum, bilim insanları ile halk arasında, sonuçlardan anlam çıkarmak ve bununla ilgili incelikli yorumlar yapmak konusunda çok daha açık bir iletişim gerektirecek. Bu kolay olmayacak; fakat amaç bilimsel yöntemi daha iyi hale getirmek olduğunda, her zaman buna değer.
Kaynak: Science Alert, "Guys, it's time to stop using 'statistical significance' as the mark of important research"
<http://www.sciencealert.com/guys-it-s-time-to-stop-using-statistical-significance-as-the-mark-of-important-research>
Bu içerik BilimFili.com yazarı tarafından oluşturulmuştur. BilimFili.com`un belirtmiş olduğu "Kullanım İzinleri"ne bağlı kalmak kaydıyla kullanabilirsiniz.
Kaynak ve İleri Okuma
Etiket
Projelerimizde bize destek olmak ister misiniz?
Dilediğiniz miktarda aylık veya tek seferlik bağış yapabilirsiniz.
Destek Ol
Yorum Yap (0)
Bunlar da İlginizi Çekebilir
08 Ağustos 2018
Mantıksal Safsatalar-2: İlişkilendirme Safsataları
04 Eylül 2015
Deneylerde Neden Fare Kullanılır?
26 Mart 2019
Kütleçekim Bir Yasa mıdır, Yoksa Bir Kuram mıdır?
26 Ağustos 2018
Mantıksal Safsatalar-3: Zırva Uydurma Safsataları