İstatistiksel model: yöntemin özü, oluşturma ve analiz

İçindekiler:

İstatistiksel model: yöntemin özü, oluşturma ve analiz
İstatistiksel model: yöntemin özü, oluşturma ve analiz
Anonim

İstatistiksel bir model, bazı örnek verilerin oluşturulmasıyla ilgili bir dizi farklı varsayımı içeren matematiksel bir projeksiyondur. Terim genellikle çok ideal bir biçimde sunulur.

İstatistiksel modelde ifade edilen varsayımlar, bir dizi olasılık dağılımını gösterir. Bunların çoğu, belirli bir bilgi setinin çekildiği dağılıma doğru bir şekilde yaklaşmayı amaçlar. Tahmini diğer matematiksel modifikasyonlardan ayıran şey, istatistiksel modellerin doğasında bulunan olasılık dağılımlarıdır.

Genel projeksiyon

istatistiksel süreç modelleri
istatistiksel süreç modelleri

Matematiksel model, belirli kavramları ve dili kullanan sistemin açıklamasıdır. Bunlar doğa bilimleri (fizik, biyoloji, yer bilimi, kimya gibi) ve mühendislik disiplinleri (bilgisayar bilimi, elektrik mühendisliği gibi) ile sosyal bilimler (ekonomi, psikoloji, sosyoloji, siyaset bilimi gibi) için geçerlidir.

Model, sistemi açıklamaya yardımcı olabilir veçeşitli bileşenlerin etkisini inceleyin ve davranış tahminleri yapın.

Matematiksel modeller, dinamik sistemler, istatistiksel projeksiyonlar, diferansiyel denklemler veya oyun teorik parametreleri dahil olmak üzere birçok biçim alabilir. Bunlar ve diğer türler örtüşebilir ve bu model birçok soyut yapı içerir. Genel olarak, matematiksel projeksiyonlar mantıksal bileşenleri de içerebilir. Çoğu durumda, bir bilimsel alanın kalitesi, teorik olarak geliştirilen matematiksel modellerin tekrarlanan deneylerin sonuçlarıyla ne kadar uyumlu olduğuna bağlıdır. Teorik süreçler ve deneysel ölçümler arasındaki anlaşma eksikliği, daha iyi teoriler geliştirildikçe genellikle önemli ilerlemelere yol açar.

Fiziksel bilimlerde, geleneksel matematiksel model aşağıdaki unsurların büyük bir kısmını içerir:

  • Kontrol denklemleri.
  • Ek alt modeller.
  • Denklemleri tanımlayın.
  • Bileşen denklemler.
  • Varsayımlar ve sınırlamalar.
  • Başlangıç ve sınır koşulları.
  • Klasik kısıtlamalar ve kinematik denklemler.

Formül

İstatistiksel bir model, kural olarak, bir veya daha fazla rastgele değişkeni ve muhtemelen diğer doğal olarak oluşan değişkenleri birleştiren matematiksel denklemlerle belirlenir. Benzer şekilde, yansıtma "bir kavramın biçimsel kavramı" olarak kabul edilir.

Tüm istatistiksel hipotez testleri ve istatistiksel değerlendirmeler matematiksel modellerden elde edilir.

Giriş

istatistiksel matematiksel modeller
istatistiksel matematiksel modeller

Gayri resmi olarak, istatistiksel bir model belirli bir özelliğe sahip bir varsayım (veya varsayımlar dizisi) olarak görülebilir: herhangi bir olayın olasılığını hesaplamaya izin verir. Örnek olarak, bir çift sıradan altı yüzlü zar düşünün. Kemikle ilgili iki farklı istatistiksel varsayımın araştırılması gerekiyor.

İlk varsayım:

Zarların her biri için sayılardan (1, 2, 3, 4, 5 ve 6) birinin gelme olasılığı: 1/6.

Bu varsayımdan, her iki zarın da olasılığını hesaplayabiliriz: 1:1/6×1/6=1/36.

Daha genel olarak, herhangi bir olayın olasılığını hesaplayabilirsiniz. Ancak, önemsiz olmayan başka bir olayın olasılığını hesaplamanın imkansız olduğu anlaşılmalıdır.

Yalnızca ilk görüş istatistiksel bir matematiksel model toplar: çünkü yalnızca bir varsayımla her bir eylemin olasılığını belirlemek mümkündür.

İlk izinli yukarıdaki örnekte, bir olayın olasılığını belirlemek kolaydır. Diğer bazı örneklerle, hesaplama zor veya hatta gerçekçi olmayabilir (örneğin, uzun yıllar hesaplamalar gerektirebilir). İstatistiksel bir analiz modeli tasarlayan bir kişi için böyle bir karmaşıklık kabul edilemez olarak kabul edilir: hesaplamaların uygulanması pratik olarak imkansız ve teorik olarak imkansız olmamalıdır.

Resmi tanım

Matematiksel terimlerle, bir sistemin istatistiksel modeli genellikle bir çift (S, P) olarak kabul edilir; burada Solası gözlemler kümesi, yani örnek uzay ve P, S.

üzerindeki olasılık dağılımları kümesidir.

Bu tanımın sezgisi aşağıdaki gibidir. Belirli verileri üreten sürecin neden olduğu "doğru" bir olasılık dağılımı olduğu varsayılır.

Ayarla

Modelin parametrelerini belirleyen odur. Parametreleştirme genellikle farklı dağılımlara neden olmak için farklı değerler gerektirir, yani

Model Sonuç
Model Sonuç

tutmalı (diğer bir deyişle, injektif olmalıdır). Gereksinimi karşılayan bir parametreleştirmenin tanımlanabilir olduğu söylenir.

Örnek

İstatistik Grafiği
İstatistik Grafiği

Farklı yaşlarda birkaç öğrenci olduğunu varsayalım. Çocuğun boyu doğum yılı ile stokastik olarak ilişkili olacaktır: örneğin, bir okul çocuğu 7 yaşındayken, bu büyüme olasılığını etkiler, ancak kişi 3 santimetreden daha uzun olacaktır.

Bu yaklaşımı, örneğin aşağıdaki gibi doğrusal bir regresyon modeline resmileştirebilirsiniz: yükseklik i=b 0 + b 1agei + εi, burada b 0 kesişimdir, b 1 yaşı belirleyen parametredir. yükseklik izleme elde edilirken çarpılır. Bu bir hata terimidir. Yani yüksekliğin yaşa göre belli bir hata ile tahmin edildiğini varsayar.

Geçerli bir form tüm bilgi noktalarıyla eşleşmelidir. Bu nedenle, doğrusal yön (seviye i=b 0 + b 1agei) bir veri modeli için bir denklem olma yeteneğine sahip değildir - eğer kesinlikle tüm noktaları kesinlikle cevaplamıyorsa. yaniistisnasız tüm bilgiler kusursuz bir şekilde hatta yer alır. Formun kesinlikle tüm bilgi öğeleriyle eşleşmesi için εi hata payı denkleme girilmelidir.

İstatistiksel bir çıkarım yapmak için, önce ε i için bazı olasılık dağılımlarını varsaymamız gerekiyor. Örneğin, ε i dağılımlarının sıfır ortalamalı bir Gauss şekline sahip olduğu varsayılabilir. Bu durumda modelin 3 parametresi olacaktır: b 0, b 1 ve Gauss dağılımının varyansı.

Modeli resmi olarak (S, P) olarak belirtebilirsiniz.

Bu örnekte, model S belirtilerek tanımlanır ve bu nedenle P hakkında bazı varsayımlar yapılabilir. İki seçenek vardır:

Bu büyüme, yaşın doğrusal bir fonksiyonu ile tahmin edilebilir;

Yaklaşımdaki hataların bir Gauss içinde olduğu gibi dağıtıldığını.

Genel açıklamalar

Modellerin istatistiksel parametreleri, matematiksel projeksiyonun özel bir sınıfıdır. Bir türü diğerinden farklı kılan nedir? Yani istatistiksel model deterministik değildir. Bu nedenle, matematiksel denklemlerden farklı olarak, belirli değişkenlerin belirli değerleri yoktur, bunun yerine bir olasılık dağılımına sahiptir. Yani, bireysel değişkenler stokastik olarak kabul edilir. Yukarıdaki örnekte, ε stokastik bir değişkendir. Onsuz, projeksiyon belirleyici olurdu.

Maddi sürecin deterministik olduğu düşünülse bile, istatistiksel bir model oluşturmak sıklıkla kullanılır. Örneğin, madeni para atmak, prensipte önceden belirlenmiş bir eylemdir. Ancak, bu hala çoğu durumda stokastik olarak modellenmiştir (Bernoulli süreci aracılığıyla).

Konishi ve Kitagawa'ya göre, istatistiksel bir model için üç hedef vardır:

  • Tahminler.
  • Bilgi madenciliği.
  • Stokastik yapıların açıklaması.

Projeksiyon boyutu

İstatistiksel bir tahmin modeli olduğunu varsayalım, O sonlu bir boyuta sahipse modele parametrik denir. Çözümde şunu yazmalısın

Model farkı
Model farkı

burada k pozitif bir tamsayıdır (R, herhangi bir gerçek sayı anlamına gelir). Burada k, modelin boyutu olarak adlandırılır.

Örnek olarak, tüm verilerin tek değişkenli bir Gauss dağılımından geldiğini varsayabiliriz:

İstatistik Formülü
İstatistik Formülü

Bu örnekte, k'nin boyutu 2'dir.

Ve başka bir örnek olarak, verilerin Gauss artıklarıyla (sıfır ortalamalı) düz bir çizgide dağıldığı varsayılan (x, y) noktalarından oluştuğu varsayılabilir. O zaman istatistiksel ekonomik modelin boyutu 3'e eşittir: doğrunun kesişimi, eğimi ve artıkların dağılımının varyansı. Geometride düz bir çizginin boyutunun 1.

olduğuna dikkat edilmelidir.

Yukarıdaki değer teknik olarak k boyutuna sahip tek parametre olsa da, bazen k farklı değer içerdiği düşünülür. Örneğin, tek boyutlu bir Gauss dağılımıyla, O, 2 boyutundaki tek parametredir, ancak bazen iki tane içerdiği kabul edilir.bireysel parametre - ortalama değer ve standart sapma.

O değerleri kümesi sonsuz boyutluysa, istatistiksel bir süreç modeli parametrik değildir. Ayrıca hem sonlu boyutlu hem de sonsuz boyutlu parametrelere sahipse yarı parametriktir. Resmi olarak, k, O'nun bir boyutu ve n örnek sayısıysa, yarı parametrik ve parametrik olmayan modellerde

vardır.

Model Formülü
Model Formülü

o zaman model yarı parametriktir. Aksi takdirde, projeksiyon parametrik değildir.

Parametrik modeller en sık kullanılan istatistiklerdir. Yarı parametrik ve parametrik olmayan projeksiyonlarla ilgili olarak, Sir David Cox şunları söyledi:

"Genellikle, doku ve dağılım şekli hakkında en az hipotez içerirler, ancak kendi kendine yeterlilik hakkında güçlü teoriler içerirler."

İç içe modeller

Onları çok düzeyli projeksiyonlarla karıştırmayın.

İlki, birincinin parametrelerine kısıtlamalar getirilerek ikinciye dönüştürülebiliyorsa, iki istatistiksel model iç içedir. Örneğin, tüm Gauss dağılımlarının kümesi iç içe bir sıfır ortalama dağılım kümesine sahiptir:

Yani, sıfır ortalamalı dağılımlar elde etmek için tüm Gauss dağılımları kümesindeki ortalamayı sınırlamanız gerekir. İkinci bir örnek olarak, ikinci dereceden model y=b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ 2) gömülü bir doğrusal modele sahiptir y=b 0 + b 1 x + ε, ε ~ N (0,σ 2) - yani, b2 parametresi 0'a eşittir.

Bu örneklerin her ikisinde de birinci model, ikinci modelden daha yüksek bir boyuta sahiptir. Bu genellikle, ancak her zaman böyle değildir. Başka bir örnek, 2.

boyutuna sahip pozitif ortalamalı Gauss dağılımları kümesidir.

Modellerin karşılaştırılması

istatistiksel model
istatistiksel model

Onu oluşturan süreç tarafından indüklenen gözlemlenen verilerin altında yatan "doğru" bir olasılık dağılımı olduğu varsayılır.

Ayrıca modeller, keşfedici analiz veya doğrulayıcı kullanılarak birbirleriyle karşılaştırılabilir. Bir keşif analizinde, farklı modeller formüle edilir ve her birinin verileri ne kadar iyi tanımladığına dair bir değerlendirme yapılır. Doğrulayıcı bir analizde, daha önce formüle edilen hipotez, orijinal olanla karşılaştırılır. Bunun için ortak kriterler arasında P 2, Bayes faktörü ve göreli olasılık bulunur.

Konishi ve Kitagawa'nın Düşüncesi

“İstatistiksel bir matematiksel modeldeki çoğu problem tahmine dayalı sorular olarak düşünülebilir. Genellikle birkaç faktörün karşılaştırması olarak formüle edilirler.”

Ayrıca, Sir David Cox şunları söyledi: "Konudan bir çeviri olarak, istatistiksel modeldeki problem genellikle analizin en önemli kısmıdır."

Önerilen: