Matematiksel istatistik, belirsiz koşullar karşısında bilinçli kararlar vermenizi sağlayan bir metodolojidir. Matematiğin bu dalının yaptığı, veri toplama ve sistematize etme yöntemlerinin incelenmesi, deneylerin ve deneylerin kitlesel rastgelelik ile nihai sonuçlarının işlenmesi ve herhangi bir modelin keşfedilmesidir. Matematiksel istatistiklerin temel kavramlarını düşünün.
Olasılık teorisi ile fark
Matematiksel istatistik yöntemleri, olasılık teorisiyle yakından kesişir. Matematiğin her iki dalı, sayısız rastgele fenomenin incelenmesiyle ilgilenir. İki disiplin limit teoremleriyle birbirine bağlıdır. Ancak, bu bilimler arasında büyük bir fark vardır. Olasılık teorisi, gerçek dünyadaki bir sürecin özelliklerini bir matematiksel model temelinde belirlerse, matematiksel istatistik bunun tersini yapar - modelin özelliklerini şu şekilde ayarlar:gözlemlenen bilgilere dayalıdır.
Adımlar
Matematiksel istatistiklerin uygulanması yalnızca rastgele olaylar veya süreçlerle veya daha doğrusu onları gözlemleyerek elde edilen verilerle ilgili olarak gerçekleştirilebilir. Ve bu birkaç aşamada gerçekleşir. İlk olarak, deneylerin ve deneylerin verileri belirli işlemlere tabi tutulur. Netlik ve analiz kolaylığı için sıralanırlar. Ardından, gözlemlenen rastgele sürecin gerekli parametrelerinin tam veya yaklaşık bir tahmini yapılır. Şunlar olabilir:
- Bir olayın olasılığının değerlendirilmesi (olasılığı başlangıçta bilinmiyor);
- belirsiz bir dağıtım fonksiyonunun davranışını incelemek;
- beklenti tahmini;
- varyans tahmini
- vb.
Üçüncü aşama, analizden önce kurulan herhangi bir hipotezin doğrulanması, yani deney sonuçlarının teorik hesaplamalara nasıl karşılık geldiği sorusuna bir cevap alınmasıdır. Aslında, bu matematiksel istatistiklerin ana aşamasıdır. Bir örnek, gözlemlenen rastgele bir sürecin davranışının normal dağılım içinde olup olmadığını düşünmek olabilir.
Nüfus
Matematiksel istatistiklerin temel kavramları, genel ve örnek popülasyonları içerir. Bu disiplin, bazı özelliklere göre bir dizi belirli nesnenin incelenmesi ile ilgilidir. Bir örnek, bir taksi şoförünün işidir. Şu rastgele değişkenleri göz önünde bulundurun:
- Yük veya müşteri sayısı: günde, öğle yemeğinden önce, öğle yemeğinden sonra, …;
- ortalama seyahat süresi;
- gelen başvuru sayısı veya şehir bölgelerine ekleri ve çok daha fazlası.
Ayrıca gözlemlenebilir bir rastgele değişken olacak bir dizi benzer rastgele süreci incelemenin de mümkün olduğunu belirtmekte fayda var.
Yani, matematiksel istatistik yöntemlerinde, belirli bir nesne üzerinde aynı koşullar altında gerçekleştirilen çeşitli gözlemlerin sonuçları veya çalışılan nesneler kümesinin tamamına genel popülasyon denir. Başka bir deyişle, matematiksel olarak daha kesin bir ifadeyle, elementleri bilinen bir olasılığa sahip olan, içinde belirlenmiş bir alt küme sınıfı ile temel olayların uzayında tanımlanan rastgele bir değişkendir.
Örnek popülasyon
Her bir nesneyi incelemek için sürekli bir çalışma yürütmenin herhangi bir nedenle (maliyet, zaman) imkansız veya pratik olmadığı durumlar vardır. Örneğin, kalitesini kontrol etmek için her kapalı reçel kavanozunu açmak şüpheli bir karardır ve her hava molekülünün bir metreküp içindeki yörüngesini tahmin etmeye çalışmak imkansızdır. Bu gibi durumlarda, seçici gözlem yöntemi kullanılır: genel popülasyondan belirli sayıda nesne (genellikle rastgele) seçilir ve bunlar analizlerine tabi tutulur.
Bu kavramlar ilk başta karmaşık görünebilir. Bu nedenle, konuyu tam olarak anlamak için, V. E. Gmurman'ın "Olasılık Teorisi ve Matematiksel İstatistik" ders kitabını incelemeniz gerekir. Bu nedenle, bir örnekleme kümesi veya numune, genel kümeden rastgele seçilen bir dizi nesnedir. Katı matematiksel terimlerle, bu, her biri için dağılımın genel rastgele değişken için belirtilenle çakıştığı bağımsız, düzgün dağılmış rastgele değişkenlerin bir dizisidir.
Temel kavramlar
Matematiksel istatistiklerin diğer bazı temel kavramlarını kısaca ele alalım. Genel popülasyondaki veya örnekteki nesnelerin sayısına hacim denir. Deney sırasında elde edilen numune değerlerine numune gerçekleştirme denir. Bir örneğe dayalı genel nüfus tahmininin güvenilir olması için, temsili veya temsili bir örneklemin olması önemlidir. Bu, örneğin popülasyonu tam olarak temsil etmesi gerektiği anlamına gelir. Bu, yalnızca popülasyonun tüm öğelerinin örneklemde olma olasılığının eşit olması durumunda başarılabilir.
Örnekler, iade ile iade edilmeyen arasında ayrım yapar. İlk durumda, örneğin içeriğinde, tekrarlanan eleman genel kümeye döndürülür, ikinci durumda, değildir. Genellikle pratikte, değiştirme olmadan örnekleme kullanılır. Genel popülasyonun büyüklüğünün her zaman örneklem büyüklüğünü önemli ölçüde aştığı da belirtilmelidir. Mevcutörnekleme işlemi için birçok seçenek:
- basit - öğeler birer birer rastgele seçilir;
- typed - genel popülasyon türlere ayrılır ve her birinden bir seçim yapılır; bir örnek, sakinlere yönelik bir ankettir: erkekler ve kadınlar ayrı ayrı;
- mekanik - örneğin, her 10. öğeden birini seçin;
- seri - seçim bir dizi öğede yapılır.
İstatistiksel dağılım
Gmurman'a göre, olasılık teorisi ve matematiksel istatistik, bilim dünyasında, özellikle pratik kısmında son derece önemli disiplinlerdir. Numunenin istatistiksel dağılımını düşünün.
Matematikte test edilen bir grup öğrencimiz olduğunu varsayalım. Sonuç olarak, bir dizi tahminimiz var: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - bu bizim birincil istatistiksel materyalimiz.
Öncelikle, onu sıralamamız veya bir sıralama işlemi yapmamız gerekiyor: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - ve böylece bir varyasyon serisi elde etmemiz gerekiyor. Her bir değerlendirmenin tekrar sayısına değerlendirme frekansı, bunların örneklem büyüklüğüne oranına ise bağıl frekans denir. Numunenin istatistiksel dağılımının bir tablosunu veya sadece istatistiksel bir dizi yapalım:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
veya
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Üzerinde bir dizi deney yapacağımız rastgele bir değişkenimiz olsun ve bu değişkenin hangi değeri aldığını görelim. Diyelim ki a1 - m1 kez; a2 - m2 kez vb. Bu örneğin boyutu m1 + … + mk=m olacaktır. i'nin 1 ile k arasında değiştiği ai kümesi istatistiksel bir seridir.
Aralık dağılımı
VE Gmurman'ın "Olasılık Teorisi ve Matematiksel İstatistik" adlı kitabında bir aralıklı istatistiksel seri de sunulmaktadır. Derlenmesi, incelenen özelliğin değeri belirli bir aralıkta sürekli olduğunda ve değerlerin sayısı fazla olduğunda mümkündür. Bir grup öğrenciyi veya daha doğrusu boylarını düşünün: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, Toplam 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 öğrenci. Açıkçası, bir kişinin boyu sürekli bir değerdir. Aralık adımını tanımlamamız gerekiyor. Bunun için Sturges formülü kullanılır.
h= | maks - min | = | 190 - 156 | = | 33 | = | 5, 59 |
1+log2m | 1+log230 | 5, 9 |
Dolayısıyla, 6 değeri aralığın boyutu olarak alınabilir.1+log2m değerinin aşağıdaki formül olduğu da söylenmelidir.aralık sayısını belirleme (elbette yuvarlama ile). Böylece, formüllere göre, her biri 6 boyutunda 6 aralık elde edilir ve ilk aralığın ilk değeri, formülle belirlenen sayı olacaktır: min - h / 2=156 - 6/2=153. Aralıkları ve büyümesi belirli bir aralık içine düşen öğrenci sayısını içerecek bir tablo yapalım.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
Elbette hepsi bu kadar değil çünkü matematiksel istatistikte çok daha fazla formül var. Yalnızca bazı temel kavramları düşündük.
Dağıtım programı
Matematiksel istatistiğin temel kavramları, netlikle ayırt edilen dağılımın grafiksel bir temsilini de içerir. İki tür grafik vardır: poligon ve histogram. Birincisi kesikli istatistiksel seriler için kullanılır. Ve sürekli dağıtım için sırasıyla ikincisi.