İstatistiksel hipotezleri test etmek için kriterler ve yöntemler, örnekler

İçindekiler:

İstatistiksel hipotezleri test etmek için kriterler ve yöntemler, örnekler
İstatistiksel hipotezleri test etmek için kriterler ve yöntemler, örnekler
Anonim

Hipotez testi istatistikte gerekli bir prosedürdür. Bir hipotez testi, hangi ifadenin örnek veriler tarafından en iyi şekilde desteklendiğini belirlemek için birbirini dışlayan iki ifadeyi değerlendirir. Bir bulgunun istatistiksel olarak anlamlı olduğu söylendiğinde, bu bir hipotez testinden kaynaklanmaktadır.

Doğrulama yöntemleri

İstatistiksel hipotezleri test etme yöntemleri, istatistiksel analiz yöntemleridir. Tipik olarak, iki istatistik seti karşılaştırılır veya örneklenmiş bir veri seti, idealleştirilmiş bir modelden sentetik bir veri seti ile karşılaştırılır. Veriler, yeni anlamlar ekleyecek şekilde yorumlanmalıdır. Nihai sonucun belirli bir yapısını varsayarak ve varsayımı doğrulamak veya reddetmek için istatistiksel yöntemler kullanarak bunları yorumlayabilirsiniz. Varsayım, hipotez olarak adlandırılır ve bu amaçla kullanılan istatistiksel testler, istatistiksel hipotezler olarak adlandırılır.

H0 ve H1 hipotezleri

İki anahipotezlerin istatistiksel testi kavramları - sözde "ana veya boş hipotez" ve " alternatif hipotez". Bunlara Neyman-Pearson hipotezleri de denir. İstatistiksel test varsayımına boş hipotez, ana hipotez veya kısaca H0 denir. Genellikle varsayılan varsayım veya hiçbir şeyin değişmediği varsayımı olarak adlandırılır. Bir test varsayım ihlaline genellikle ilk hipotez, alternatif hipotez veya H1 denir. H1 başka bir hipotezin kıs altmasıdır, çünkü onun hakkında bildiğimiz tek şey H0 verilerinin atılabileceğidir.

sıfır hipotez testi
sıfır hipotez testi

Boş hipotezi reddetmeden veya reddetmeden önce, test sonucu yorumlanmalıdır. Veri kümeleri arasındaki ilişkinin, eşik olasılığına - anlamlılık düzeyine göre boş hipotezin uygulanması olasılığı düşükse, karşılaştırma istatistiksel olarak anlamlı kabul edilir. İstatistiksel hipotez testi için uyum iyiliği kriterleri de vardır. Bu, bilinmeyen dağılımın varsayılan yasası ile ilişkili olan hipotez testi kriterinin adıdır. Bu, ampirik ve teorik dağılımlar arasındaki tutarsızlığın sayısal bir ölçüsüdür.

İstatistiksel hipotezleri test etmek için prosedür ve kriterler

En yaygın hipotez seçim yöntemleri ya Akaike bilgi kriterine ya da Bayes katsayısına dayanır. İstatistiksel hipotez testi, iki türün dikkate değer farklılıkları olmasına rağmen, hem çıkarım hem de Bayes çıkarımı için önemli bir tekniktir. İstatistiksel Hipotez TestleriYanlış bir temerrüt veya boş hipoteze hatalı olarak karar verme olasılığını kontrol eden bir prosedür tanımlayın. Prosedür, ne kadar işe yarayacağına bağlıdır. Bu yanlış bir karar verme olasılığı, sıfır hipotezinin doğru olmasının ve belirli bir alternatif hipotezin olmamasının imkansızlığıdır. Test doğru mu yanlış mı olduğunu gösteremez.

İstatistiksel hipotezleri test etme yöntemleri
İstatistiksel hipotezleri test etme yöntemleri

Alternatif karar teorisi yöntemleri

Boş ve ilk hipotezlerin daha eşit bir temelde ele alındığı alternatif karar teorisi yöntemleri vardır. Bayes teorisi gibi diğer karar verme yaklaşımları, tek bir boş hipoteze odaklanmak yerine tüm olasılıklar arasında kötü kararların sonuçlarını dengelemeye çalışır. Hangi hipotezin doğru olduğuna karar vermek için bir dizi başka yaklaşım, hangilerinin istenen özelliklere sahip olduğu verilere dayanmaktadır. Ancak hipotez testi, bilimin birçok alanında veri analizine yönelik baskın yaklaşımdır.

İstatistiksel hipotezi test etme

Bir sonuç kümesi diğerinden farklı olduğunda, istatistiksel hipotez testlerine veya istatistiksel hipotez testlerine güvenilmelidir. Yorumlamaları, p değerlerinin ve kritik değerlerin doğru bir şekilde anlaşılmasını gerektirir. Önem düzeyi ne olursa olsun, testlerin yine de hatalar içerebileceğini anlamak da önemlidir. Bu nedenle, sonuç doğru olmayabilir.

Test süreci şunlardan oluşur:birden fazla adım:

  1. Araştırma için bir başlangıç hipotezi oluşturuluyor.
  2. İlgili boş ve alternatif hipotezler belirtilir.
  3. Testteki örnekle ilgili istatistiksel varsayımları açıklar.
  4. Hangi testin uygun olduğunu belirleme.
  5. Altında boş hipotezin reddedileceği anlamlılık düzeyini ve olasılık eşiğini seçin.
  6. Boş hipotez testi istatistiğinin dağılımı, boş hipotezin reddedildiği olası değerleri gösterir.
  7. Hesaplama devam ediyor.
  8. Bir alternatif lehine boş hipotezi reddetmek veya kabul etmek için bir karar verilir.

p değeri kullanan bir alternatif var.

İstatistiksel hipotezleri test etme örnekleri
İstatistiksel hipotezleri test etme örnekleri

Önem testleri

Saf veriler, yorumlanmadan pratik olarak kullanılamaz. İstatistikte, verilerle ilgili sorular sorulması ve sonuçların yorumlanması söz konusu olduğunda, cevapların doğruluğunu veya olasılığını sağlamak için istatistiksel yöntemler kullanılır. İstatistiksel hipotezleri test ederken, bu yöntem sınıfına istatistiksel test veya anlamlılık testleri denir. “Hipotez” terimi, hipotezlerin ve teorilerin araştırıldığı bilimsel yöntemleri hatırlatır. İstatistikte, bir hipotez testi, belirli bir varsayım verilen bir miktarla sonuçlanır. Bir varsayımın doğru olup olmadığını veya bir ihlalin yapılıp yapılmadığını yorumlamanıza olanak tanır.

Testlerin istatistiksel yorumu

Hipotez testlerihangi araştırma sonuçlarının önceden belirlenmiş bir önem düzeyi için sıfır hipotezinin reddedilmesine yol açacağını belirlemek için kullanılır. İstatistiksel bir hipotez testinin sonuçları, üzerinde çalışmanın devam edebilmesi için yorumlanmalıdır. İstatistiksel hipotez test kriterlerinin iki yaygın biçimi vardır. Bunlar p değeri ve kritik değerlerdir. Seçilen kritere bağlı olarak elde edilen sonuçlar farklı yorumlanmalıdır.

p-değeri nedir

Çıktı, p değeri yorumlanırken istatistiksel olarak anlamlı olarak tanımlanır. Aslında bu gösterge, sıfır hipotezi reddedilirse hata olasılığı anlamına gelir. Başka bir deyişle, bir test sonucunu yorumlamak veya ölçmek için kullanılabilecek bir değeri adlandırmak ve sıfır hipotezini reddetmede hata olasılığını belirlemek için kullanılabilir. Örneğin, bir veri örneğinde normallik testi yapabilir ve çok az aykırı değer şansı olduğunu görebilirsiniz. Ancak, sıfır hipotezi reddedilmek zorunda değildir. İstatistiksel bir hipotez testi, bir p değeri döndürebilir. Bu, p değerini anlamlılık düzeyi adı verilen önceden belirlenmiş bir eşik değeriyle karşılaştırarak yapılır.

Boş hipotezlerin istatistiksel testi
Boş hipotezlerin istatistiksel testi

Önem Düzeyi

Önem düzeyi genellikle Yunanca küçük harf "alfa" ile yazılır. Alfa için kullanılan genel değer %5 veya 0,05'tir. Daha küçük bir alfa değeri, boş hipotezin daha güvenilir bir yorumunu önerir. p-değeri ile karşılaştırılırönceden seçilmiş alfa değeri p değeri alfadan küçükse sonuç istatistiksel olarak anlamlıdır. Önem düzeyi, birden çıkarılarak tersine çevrilebilir. Bu, gözlemlenen örnek veriler verilen hipotezin güven düzeyini belirlemek için yapılır. Bu istatistiksel hipotezleri test etme yöntemini kullanırken, P değeri olasılıklıdır. Bu, istatistiksel bir testin sonucunu yorumlama sürecinde kişinin neyin doğru neyin yanlış olduğunu bilmediği anlamına gelir.

İstatistiksel hipotez test teorisi

Boş hipotezin reddedilmesi, olası göründüğüne dair yeterli istatistiksel kanıt olduğu anlamına gelir. Aksi takdirde, reddetmek için yeterli istatistik olmadığı anlamına gelir. İstatistiksel testler, sıfır hipotezini reddetme ve kabul etme ikilemi açısından düşünülebilir. Sıfır hipotezinin istatistiksel olarak test edilmesinin tehlikesi, kabul edildiği takdirde doğru gibi görünebilmesidir. Bunun yerine, onu reddetmek için yeterli istatistiksel kanıt olmadığı için boş hipotezin reddedilmediğini söylemek daha doğru olacaktır.

Uyum kriterlerinin iyiliğini test eden istatistiksel hipotez
Uyum kriterlerinin iyiliğini test eden istatistiksel hipotez

Bu an genellikle acemi ekstraları karıştırır. Böyle bir durumda, kendinize sonucun olasılıklı olduğunu ve sıfır hipotezini kabul etmenin bile hala küçük bir hata şansı olduğunu hatırlatmanız önemlidir.

Doğru veya yanlış boş hipotez

p değerinin yorumlanması, sıfır olduğu anlamına gelmezhipotez doğrudur veya yanlıştır. Bu, deneysel verilere ve seçilen istatistiksel teste dayalı olarak belirli bir istatistiksel anlamlılık düzeyinde boş hipotezi reddetmek veya reddetmemek için bir seçimin yapıldığı anlamına gelir. Bu nedenle, p değeri, istatistiksel testlerde gömülü olarak önceden belirlenmiş bir varsayım altında verilen verilerin olasılığı olarak düşünülebilir. p değeri, sıfır hipotezi doğruysa veri örneğinin ne kadar gözlemleneceğinin bir ölçüsüdür.

Kritik değerlerin yorumlanması

Bazı testler p döndürmez. Bunun yerine, kritik değerlerin bir listesini döndürebilirler. Böyle bir çalışmanın sonuçları benzer şekilde yorumlanır. Tek bir p değerini önceden belirlenmiş bir anlamlılık düzeyiyle karşılaştırmak yerine, test istatistiği kritik bir değerle karşılaştırılır. Daha az olduğu ortaya çıkarsa, sıfır hipotezini reddetmenin mümkün olmadığı anlamına gelir. Büyük veya eşitse, sıfır hipotezi reddedilmelidir. İstatistiksel hipotez test algoritmasının anlamı ve sonucunun yorumlanması p-değerine benzer. Seçilen anlamlılık düzeyi, veri verilen temel test varsayımını reddetme veya reddetmeme olasılığına dayalı bir karardır.

İstatistiksel testlerdeki hatalar

İstatistiksel bir hipotez testinin yorumu olasılıksaldır. İstatistiksel hipotezleri test etmenin görevi, doğru veya yanlış bir ifade bulmak değildir. Test kanıtı hatalı olabilir. Örneğin, alfa %5 ise, bu, çoğunlukla 20'de 1 olduğu anlamına gelir.sıfır hipotezi yanlışlıkla reddedilecektir. Veya veri örneğindeki istatistiksel gürültü nedeniyle olmaz. Bu nokta göz önüne alındığında, sıfır hipotezinin reddedileceği küçük bir p değeri, bunun yanlış olduğu veya bir hata yapıldığı anlamına gelebilir. Bu tür bir hata yapılırsa, sonuca yanlış pozitif denir. Ve böyle bir hata, istatistiksel hipotezleri test ederken birinci türden bir hatadır. Öte yandan, p değeri, sıfır hipotezinin reddedileceği anlamına gelecek kadar büyükse, bunun doğru olduğu anlamına gelebilir. Veya doğru değil ve hatanın yapılmasından dolayı olası olmayan bir olay meydana geldi. Bu tür bir hataya yanlış negatif denir.

Boş hipotezlerin istatistiksel testi
Boş hipotezlerin istatistiksel testi

Hata olasılığı

İstatistiksel hipotezleri test ederken, bu tür hatalardan herhangi birini yapma olasılığı hala vardır. Yanlış veriler veya yanlış sonuçlar oldukça olasıdır. İdeal olarak, bu hatalardan birinin olasılığını en aza indiren bir önem düzeyi seçilmelidir. Örneğin, boş hipotezlerin istatistiksel olarak test edilmesi, çok düşük bir anlamlılık düzeyine sahip olabilir. 0,05 ve 0,01 gibi anlamlılık düzeyleri bilimin birçok alanında yaygın olmakla birlikte en yaygın olarak kullanılan anlamlılık düzeyi 310^-7 veya 0.0000003'tür. Genellikle “5-sigma” olarak anılır. Bu, deneylerin 3.5 milyon bağımsız tekrarında 1 olasılıkla sonucun rastgele olduğu anlamına gelir. İstatistiksel hipotezleri test etme örnekleri genellikle bu tür hatalar taşır. Bu aynı zamanda bağımsız sonuçlara sahip olmanın önemli olmasının nedenidir.doğrulama.

İstatistiksel doğrulama kullanma örnekleri

Uygulamada birkaç yaygın hipotez testi örneği vardır. En popülerlerinden biri “Çay Tadımı” olarak bilinir. Biyometri kurucusu Robert Fisher'ın bir meslektaşı olan Dr. Muriel Bristol, önce bir fincan çaya mı yoksa süte mi eklendiğini kesin olarak söyleyebildiğini iddia etti. Fisher ona sekiz fincan (her çeşitten dördü) rastgele vermeyi teklif etti. Test istatistiği basitti: bir fincan seçimindeki başarıların sayısını saymak. Kritik bölge, muhtemelen olağan olasılık kriterine göre (< %5; 70'te 1 ≈ %1,4) 4'ten tek başarıydı. Fisher, alternatif bir hipotezin gerekli olmadığını savundu. Bayan, istatistiksel olarak anlamlı bir sonuç olarak kabul edilen her bir bardağı doğru bir şekilde tanımladı. Bu deneyim, Fisher'ın Araştırmacılar için İstatistiksel Yöntemler kitabına yol açtı.

Davalı Örnek

İstatistiksel yargılama prosedürü, sanığın suçluluğu kanıtlanana kadar masum sayıldığı bir ceza mahkemesiyle karşılaştırılabilir. Savcı, sanığın suçunu kanıtlamaya çalışır. Sadece bir suçlama için yeterli kanıt olduğunda sanık suçlu bulunabilir. Prosedürün başında iki hipotez vardır: "Sanık suçlu değil" ve "Sanık suçlu." Masumiyet hipotezi, ancak hata olasılığı çok düşük olduğunda reddedilebilir, çünkü kişi masum bir davalıyı mahkum etmek istemez. Böyle bir hataya Tip I hata denir ve oluşumunadiren kontrol edilir. Bu asimetrik davranışın bir sonucu olarak Tip II hata, yani failin beraat etmesi daha yaygındır.

İstatistiksel Doğrulama Örnekleri
İstatistiksel Doğrulama Örnekleri

İstatistikler, büyük miktarda veriyi analiz ederken kullanışlıdır. Bu, hiçbir bilimsel teori olmasa bile sonuçları haklı çıkarabilecek hipotezlerin test edilmesi için de geçerlidir. Çay tadımı örneğinde, sütü çaya dökmekle çayı süte dökmek arasında hiçbir fark olmadığı "açık" idi.

Hipotez testinin gerçek pratik uygulaması şunları içerir:

  • Erkeklerin kadınlardan daha fazla kabus görüp görmediğini test etme;
  • belge ilişkilendirme;
  • Dolunayın davranış üzerindeki etkisinin değerlendirilmesi;
  • bir yarasanın yankı kullanarak bir böceği algılayabileceği aralığı belirleme;
  • sigarayı bırakmak için en iyi yolu seçmek;
  • Tampon çıkartmalarının araç sahibinin davranışını yansıtıp yansıtmadığını kontrol etme.

İstatistiksel hipotez testi, genel olarak istatistikte ve istatistiksel çıkarımda önemli bir rol oynar. Değer testi, bilimsel yöntemin özündeki tahmin edilen değerin ve deneysel sonucun geleneksel karşılaştırmasının yerine kullanılır. Bir teori yalnızca bir ilişkinin işaretini tahmin edebiliyorsa, yönlendirilmiş hipotez testleri, teoriyi yalnızca istatistiksel olarak anlamlı bir sonucun destekleyeceği şekilde yapılandırılabilir. Bu değerlendirme teorisi biçimi en katı olanıdır.hipotez testi kullanımının eleştirisi.

Önerilen: