İstatistiksel bilgiler: toplama, işleme, analiz

İçindekiler:

İstatistiksel bilgiler: toplama, işleme, analiz
İstatistiksel bilgiler: toplama, işleme, analiz
Anonim

İstatistiğin tarihi boyunca, ölçüm düzeylerinin bir sınıflandırmasını oluşturmak için çeşitli girişimlerde bulunulmuştur. Psikofizikçi Stanley Smith Stevens, nominal, sıralı, aralıklı ve orantılı ölçekleri tanımladı.

Nominal ölçümler, değerler arasında önemli bir sıralama düzenine sahip değildir ve bire bir dönüşüme izin verir.

Normal boyutlar, ardışık değerler arasında tam olmayan farklılıklara sahiptir, ancak bu değerlerin belirli bir sırasına sahiptir ve herhangi bir sırayı koruyan dönüşüme izin verir.

Aralık ölçümleri noktalar arasında anlamlı mesafelere sahiptir, ancak sıfır değeri isteğe bağlıdır (santigrat veya Fahrenheit cinsinden boylam ve sıcaklık ölçümlerinde olduğu gibi) ve herhangi bir doğrusal dönüşüme izin verir.

Oran boyutları hem anlamlı bir sıfır değerine hem de farklı boyutlar arasındaki mesafelere sahiptir ve herhangi bir ölçeklendirme dönüşümüne izin verir.

Image
Image

Değişkenler ve bilgilerin sınıflandırılması

Çünkü değişkenleryalnızca nominal veya sıralı ölçümlere karşılık gelen, sayısal olarak makul bir şekilde ölçülemez ve bazen kategorik değişkenler olarak gruplandırılır. Oran ve aralık ölçümleri, sayısal yapıları nedeniyle kesikli veya sürekli olabilen nicel değişkenler olarak gruplandırılır. İkili kategorik değişkenler boole değerleri, bir integral veri tipinde rastgele tamsayılara sahip politomlu kategorik değişkenler ve kayan nokta hesaplamasını içeren gerçek bileşenlere sahip sürekli değişkenler ile temsil edilebildiğinden, bu tür ayrımlar genellikle bilgisayar bilimindeki veri türü ile gevşek bir şekilde ilişkilidir. Ancak istatistiksel bilgi veri türlerinin görüntülenmesi, hangi sınıflandırmanın uygulandığına bağlıdır.

İşçiler hakkında istatistiksel bilgiler
İşçiler hakkında istatistiksel bilgiler

Diğer sınıflandırmalar

İstatistiksel verilerin (bilgilerin) diğer sınıflandırmaları da oluşturulmuştur. Örneğin, Mosteller ve Tukey dereceler, sıralar, sayılan paylar, sayılar, miktarlar ve bakiyeler arasında ayrım yaptı. Nelder bir keresinde sürekli sayıları, sürekli oranları, sayıların korelasyonunu ve veri iletmenin kategorik yollarını tanımladı. Tüm bu sınıflandırma yöntemleri, istatistiksel bilgilerin toplanmasında kullanılır.

Sorunlar

Farklı ölçüm (toplama) prosedürleriyle elde edilen verilere farklı türde istatistiksel yöntemlerin uygulanmasının uygun olup olmadığı sorusu, değişkenlerin dönüştürülmesi ve soruların kesin yorumlanmasıyla ilgili sorunlar nedeniyle karmaşıktır. Araştırma. “Veriler ile tanımladıkları arasındaki ilişki, basitçe, belirli türdeki istatistiksel ifadelerin belirli dönüşümler altında değişmez olmayan doğruluk değerlerine sahip olabileceği gerçeğini yansıtır. Dönüşümün dikkate değer olup olmadığı, cevaplamaya çalıştığınız soruya bağlıdır.

İstatistiksel bilgilere bir örnek
İstatistiksel bilgilere bir örnek

Veri türü nedir

Veri türü, bir değişkenin anlamsal içeriğinin temel bir bileşenidir ve değişkeni tanımlamak için ne tür olasılık dağılımlarının mantıksal olarak kullanılabileceğini, üzerinde izin verilen işlemleri, onu tahmin etmek için kullanılan regresyon analizinin türünü kontrol eder., vb. Bir veri türü kavramı, ölçüm düzeyi kavramına benzer, ancak daha spesifiktir - örneğin, veri sayıları, negatif olmayan gerçek değerlerden farklı bir dağılım (Poisson veya binom) gerektirir, ancak her ikisi de aynı değere girer ölçüm seviyesi (katsayı ölçeği).

Hakimler hakkında istatistiksel bilgiler
Hakimler hakkında istatistiksel bilgiler

Terazi

İstatistiksel bilgilerin işlenmesi için bir ölçüm seviyeleri sınıflandırması oluşturmak için çeşitli girişimlerde bulunuldu. Psikofizikçi Stanley Smith Stevens, nominal, sıralı, aralıklı ve orantılı ölçekleri tanımladı. Nominal ölçümler, değerler arasında önemli bir sıralamaya sahip değildir ve bire bir dönüşüme izin verir. Sıradan ölçümler, ardışık değerler arasında kesin olmayan farklılıklara sahiptir, ancak bu değerlerin önemli sırasına göre farklılık gösterir veherhangi bir düzeni koruyan dönüşüm. Aralık ölçümleri, ölçümler arasında anlamlı mesafelere sahiptir, ancak sıfır değeri isteğe bağlıdır (santigrat veya Fahrenheit cinsinden boylam ve sıcaklık ölçümlerinde olduğu gibi) ve herhangi bir doğrusal dönüşüme izin verir. Oran boyutları, hem anlamlı bir sıfır değerine hem de farklı tanımlanmış boyutlar arasındaki mesafelere sahiptir ve herhangi bir ölçeklendirme dönüşümüne izin verir.

Diyagram modeli
Diyagram modeli

Tek bir sayı kullanılarak tanımlanamayan veriler, genellikle gerçek rastgele değişkenlerin rastgele vektörlerine dahil edilir, ancak bunları kendiniz işlemek için artan bir eğilim vardır. Bu tür örnekler aşağıda tartışılacaktır.

Rastgele vektörler

Bireysel öğeler ilişkili olabilir veya olmayabilir. İlişkili rastgele vektörleri tanımlamak için kullanılan dağılım örnekleri, çok değişkenli normal dağılım ve çok değişkenli t dağılımıdır. Genel olarak, herhangi bir öğe arasında keyfi korelasyonlar olabilir, ancak bu genellikle belirli bir boyutun üzerinde yönetilemez hale gelir ve ilişkili bileşenler üzerinde ek kısıtlamalar gerektirir.

istatistik özellikleri
istatistik özellikleri

Rastgele matrisler

Rastgele matrisler doğrusal olarak düzenlenebilir ve rastgele vektörler olarak ele alınabilir, ancak bu, farklı öğeler arasındaki korelasyonları temsil etmenin etkili bir yolu olmayabilir. Bazı olasılık dağılımları, normal matris gibi rastgele matrisler için özel olarak tasarlanmıştır.dağıtım ve Wishart dağıtımı.

Rastgele Diziler

Bazen rastgele vektörlerle aynı olarak kabul edilirler, ancak diğer durumlarda bu terim, her bir rastgele değişkenin yalnızca yakındaki değişkenlerle (Markov modelinde olduğu gibi) korelasyon gösterdiği durumlara özel olarak uygulanır. Bu, Bayes ağının özel bir durumudur ve gen zincirleri veya uzun metin belgeleri gibi çok uzun diziler için kullanılır. Gizli Markov dizileri gibi bir dizi model bu tür diziler için özel olarak tasarlanmıştır.

Tipik grafik
Tipik grafik

Rastgele işlemler

Rastgele dizilere benzerler, ancak yalnızca dizinin uzunluğu belirsiz veya sonsuz olduğunda ve dizideki öğeler birer birer işlendiğinde. Bu genellikle zaman serisi olarak tanımlanabilecek veriler için kullanılır. Bu, örneğin ertesi gün hisse senedi fiyatı söz konusu olduğunda geçerlidir.

Sonuç

İstatistiksel bilgilerin analizi, tamamen koleksiyonunun kalitesine bağlıdır. İkincisi, sırayla, sınıflandırma olasılıklarıyla güçlü bir şekilde ilişkilidir. Elbette, okuyucunun bu makaleyi okurken görebileceği birçok istatistiksel bilgi sınıflandırması türü vardır. Bununla birlikte, etkili araçların varlığı ve iyi bir matematik bilgisinin yanı sıra sosyoloji alanındaki bilgi, işlerini yapacak ve hata için önemli düzeltmeler yapmadan herhangi bir anket veya çalışma yapmanıza izin verecektir. Formdaki istatistiksel bilgi kaynaklarıinsanlar, kuruluşlar ve sosyolojinin diğer konuları, neyse ki, bol miktarda temsil edilmektedir. Ve gerçek bir kaşifin önünde hiçbir zorluk duramaz.

Önerilen: