internet pencereler Android

İki veya daha fazla kesrin eşit olduğu hipotezini test etmek için χ2 testinin uygulanması. 2. kriterin logaritmik veriminin bağımsızlığına ilişkin hipotezin test edilmesi

istatistiksel test

R 0 hipotezinin reddedildiği veya kabul edildiği kurala denir. istatistiksel kriter. Kriterin adı, kural olarak, istatistiksel hipotez test algoritmasının (bkz. madde 4.1) 2. maddesinden özel olarak derlenmiş bir özelliği belirten ve kriterde hesaplanan bir harf içerir. Bu algoritmanın koşulları altında, kriter şu şekilde adlandırılacaktır: "v-kriter".

İstatistiksel hipotezleri test ederken, iki tür hata mümkündür:

  • - birinci tür hata(gerçekte doğru olduğunda I 0 hipotezini reddedebilirsiniz);
  • - ikinci tür hata(aslında doğru olmadığında I 0 hipotezini kabul edebilirsiniz).

olasılık a birinci türden bir hata yapmaya denir kriterin önem derecesi.

eğer için r ikinci tür bir hata yapma olasılığını belirtin, o zaman (l - R) - olarak adlandırılan ikinci tür bir hatadan kaçınma olasılığı kriterin gücü.

Uyum iyiliği x 2 Pearson

Birkaç tür istatistiksel hipotez vardır:

  • - dağıtım yasası hakkında;
  • - numunelerin tekdüzeliği;
  • - dağıtım parametrelerinin sayısal değerleri vb.

Pearson'ın x 2 uyum iyiliği testi örneğini kullanarak dağıtım yasasının hipotezini ele alacağız.

rıza kriteri bilinmeyen dağılımın varsayılan yasası hakkında sıfır hipotezini test etmek için istatistiksel kriter olarak adlandırılır.

Pearson'ın uyum iyiliği testi, belirli bir dağılım yasası varsayımı altında hesaplanan deneysel (gözlemlenen) ve teorik gözlem frekanslarının karşılaştırılmasına dayanır. Hipotez # 0 burada şu şekilde formüle edilmiştir: genel popülasyon, incelenen özniteliğe göre normal olarak dağıtılır.

Kriter için istatistiksel hipotez # 0'ı test etmek için algoritma x 1 Pearson:

  • 1) I 0 hipotezini ortaya koyduk - çalışılan özelliğe göre, genel popülasyon normal olarak dağılır;
  • 2) örnek ortalamasını ve örnek standart sapmasını hesaplayın Ö v;

3) mevcut numune hacmine göre NSözel olarak derlenmiş bir özelliği hesaplıyoruz,

nerede: ben, - ampirik frekanslar, - teorik frekanslar,

NS -örnek boyut,

H- aralığın boyutu (iki bitişik seçenek arasındaki fark),

Gözlenen özelliğin normalleştirilmiş değerleri,

- tablo işlevi. Ayrıca teorik frekanslar

formüle göre standart MS Excel işlevi NORMDAĞ kullanılarak hesaplanabilir;

4) numune dağılımına göre, özel olarak derlenmiş bir özelliğin kritik değerini belirleriz xl P

5) 0 numaralı hipotez reddedildiğinde, 0 numaralı hipotez kabul edildiğinde.

Örnek. işareti düşünün x- bir varyasyon serisi şeklinde sunulan bazı psikolojik özellikler için ıslah kolonilerinden birinde hükümlüleri test etme göstergelerinin değeri:

0,05 anlamlılık düzeyinde, genel popülasyonun normal dağılımına ilişkin hipotezi test edin.

1. Ampirik dağılıma dayanarak bir hipotez ortaya koyabilirsiniz. H 0: incelenen "belirli bir psikolojik özellik için test göstergesinin değeri" özelliğine göre genel popülasyon

beklenenler normal dağılır. Alternatif hipotez 1: Genel hükümlü popülasyonu, incelenen “belirli bir psikolojik özellik için test göstergesinin değeri” özelliğine göre normal olarak dağılmamaktadır.

2. Sayısal örnek özelliklerini hesaplayalım:

Aralıklar

x g u

NS) SCH

3. Özel olarak derlenmiş j 2 karakteristiğini hesaplayalım. Bunu yapmak için, önceki tablonun sondan bir önceki sütununda, formüle göre teorik frekansları buluyoruz ve son sütunda

%2 karakteristiğini hesaplayalım. alırız x 2 = 0,185.

Açıklık sağlamak için, teorik frekanslar için ampirik bir dağılım poligonu ve normal bir eğri oluşturacağız (Şekil 6).

Pirinç. 6.

4. Serbestlik derecesi sayısını belirleyin s: k = 5, m = 2, s = 5-2-1 = 2.

Tabloya göre veya 5 = 2 serbestlik derecesi sayısı ve önem düzeyi için standart MS Excel işlevi "HI20BR" kullanılarak bir = 0.05 kriterin kritik değerini bulun xl P.=5,99. Önem düzeyi için a= 0.01 kritik kriter değeri NS %. = 9,2.

5. Ölçütün gözlenen değeri NS= Bulunan tüm değerlerden 0.185 daha az Hk R.-> bu nedenle, I 0 hipotezi her iki anlamlılık düzeyinde de kabul edilir. Ampirik ve teorik frekanslar arasındaki fark önemsizdir. Sonuç olarak, gözlemsel veriler, genel popülasyonun normal dağılımı hipotezi ile tutarlıdır. Bu nedenle, incelenen "belirli bir psikolojik özellik için test göstergesinin değeri" kriterine göre, genel hükümlü popülasyonu normal olarak dağılmıştır.

  • 1. Koryachko A.V., Kulichenko A.G. Psikolojide daha yüksek matematik ve matematiksel yöntemler: Psikoloji Fakültesi öğrencileri için pratik alıştırmalar için bir rehber. Ryazan, 1994.
  • 2. Miras AD Psikolojik araştırmaların matematiksel yöntemleri. Verilerin analizi ve yorumlanması: Ders kitabı, el kitabı. SPb., 2008.
  • 3. Sidorenko E.V. Psikolojide matematiksel işleme yöntemleri. SPb., 2010.
  • 4. Soshnikova L.A. ve ekonomide diğer Çok değişkenli istatistiksel analiz: Ders kitabı, üniversiteler için el kitabı. M., 1999.
  • 5. Sukhodolskiy E.V. Psikolojide matematiksel yöntemler. Harkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. İstatistik teorisi üzerine atölye çalışması: Ders kitabı, el kitabı. M., 2009.
  • Gmurman V.E. Olasılık Teorisi ve Matematiksel İstatistik. s. 465.

Ölçüt atamaları

χ 2 kriteri iki amaç için kullanılır;

1) özelliğin ampirik dağılımını ile karşılaştırmak teorik - tek tip, normal veya başka türlü;

2) karşılaştırma için iki, üç veya daha fazla ampirik aynı özelliğin dağılımları 12.

Kriter açıklaması

Kriter χ 2 Bir özelliğin farklı değerlerinin ampirik ve teorik dağılımlarda aynı frekansta mı yoksa iki veya daha fazla ampirik dağılımda mı oluştuğu sorusunu yanıtlar.

Yöntemin avantajı, isimlendirme ölçeğinden başlayarak herhangi bir ölçekte sunulan özelliklerin dağılımlarının karşılaştırılmasına izin vermesidir (bakınız bölüm 1.2). Alternatif dağılımın en basit durumunda "evet - hayır", "evliliğe izin verildi - evliliğe izin vermedi", "sorunu çözdü - sorunu çözmedi" vb., χ 2 kriterini zaten uygulayabiliriz.

Belirli bir gözlemcinin, A noktasından B noktasına giderken iki simetrik yolun sağını veya solunu seçen yayaların sayısını kaydettiğini varsayalım (bkz. Şekil 4.3).

Diyelim ki 70 gözlem sonucunda bulundu. NS\ insanlar doğru yolu seçti ve sadece 19 kişi solu seçti. χ 2 kriterini kullanma belirli bir seçim dağılımının, her iki yolun da aynı frekansla örnekleneceği tek tip bir dağılımdan farklı olup olmadığını belirleyebiliriz. Bu, alınan karşılaştırmanın bir çeşididir. uhpirik ile dağıtım teorik. Böyle bir görev, örneğin mimaride tasarım, iletişim sistemleri vb. ile ilgili uygulamalı psikolojik araştırmalarda olabilir.

Ancak gözlemcinin tamamen farklı bir sorunu çözdüğünü hayal edelim: iki taraflı düzenleme sorunlarıyla meşgul. Elde edilen dağılımın tekdüze olanla çakışması, verilerinin diğer araştırmacıların verileriyle çakışıp çakışmamasından çok daha az ilgilendirir. Sağ bacağın baskın olduğu kişilerin saat yönünün tersine dönme eğiliminde olduğunu ve sol bacağın baskın olduğu kişilerin saat yönünde dönme eğiliminde olduğunu ve meslektaşları 13 tarafından yapılan bir çalışmada, 26'da sol bacağın baskınlığının bulunduğunu biliyor. 100 kişiden anket yapıldı.

χ 2 yöntemini kullanarak, iki ampirik dağılımı karşılaştırabilir: kendi örneğinde 51:19 oranı ve diğer araştırmacıların bir örneğinde 74:26 oranı.

Bu bir seçenek iki ampirik karşılaştırma en basit alternatif kritere göre dağılımlar (elbette, matematiksel açıdan en basit ve hiçbir şekilde psikolojik olmayan).

Benzer şekilde, üç veya daha fazla alternatif arasından seçim dağılımlarını karşılaştırabiliriz. Örneğin, 50 kişilik bir örneklemde 30 kişi (a) cevabını, 15 kişi - (b) cevabını ve 5 kişi - (c) cevabını seçtiyse, bu dağılımın farklı olup olmadığını kontrol etmek için χ 2 yöntemini kullanabiliriz. tek tip bir dağılımdan veya (a) cevabının 10 kişi tarafından seçildiği başka bir örneklemdeki cevapların dağılımından, cevap (b) -25 kişi, cevap (c) - 15 kişi.

Bir özelliğin nicel olarak ölçüldüğü durumlarda, diyelim ki, v puan, saniye veya milimetre, nitelik değerlerinin tüm bolluğunu birkaç basamakta birleştirmemiz gerekebilir. Örneğin, problemin çözülme süresi 10 ile 300 saniye arasında değişiyorsa, örneklem büyüklüğüne göre 10 veya 5 hane girebiliriz. Örneğin, bunlar deşarj olacaktır: 0-50 saniye; 51-100 saniye; 101-150 saniye vb. Ardından χ 2 yöntemini kullanıyoruz. özelliğin farklı kategorilerinin ortaya çıkma sıklıklarını karşılaştırır, ancak şematik diyagramın geri kalanı değişmez.

Ampirik dağılımı teorik olanla karşılaştırırken, ampirik ve teorik frekanslar arasındaki tutarsızlık derecesini belirleriz.

İki ampirik dağılımı karşılaştırarak, ampirik frekanslar ile bu iki ampirik dağılımın çakışması durumunda gözlemlenecek olan teorik frekanslar arasındaki tutarsızlığın derecesini belirleriz. Teorik frekansları hesaplamak için formüller, her bir karşılaştırma seçeneği için özel olarak verilecektir.

Tutarsızlık ne kadar büyükse iki karşılaştırılabilir dağılım arasında, daha fazla ampirik y'nin değeri).

hipotezler

Görevlere bağlı olarak çeşitli hipotez çeşitleri mümkündür,

kendi önümüze koyduğumuz.

İlk seçenek:

N 0: Özelliğin elde edilen ampirik dağılımı, teorik (örneğin, tek tip) dağılımdan farklı değildir.

H 1: Özelliğin ortaya çıkan ampirik dağılımı, teorik dağılımdan farklıdır.

İkinci seçenek:

H 0: Ampirik dağılım 1, ampirik dağılım 2'den farklı değildir.

H 1: Ampirik dağılım 1, ampirik dağılım 2'den farklıdır.

Üçüncü seçenek:

H 0: Ampirik dağılımlar 1, 2, 3, ... birbirinden farklı değildir.

H 1: Ampirik dağılımlar 1, 2, 3, ... birbirinden farklıdır.

χ 2 kriteri, her üç hipotezin de test edilmesini sağlar.

Kriterin grafiksel gösterimi

A noktasından B noktasına giden yolda sağ veya sol iz seçimi ile bir örnek gösterelim. Şek. 4.4 sol iz seçiminin frekansı sol çubukla temsil edilir ve sağ iz seçiminin frekansı histogramın 14 sağ çubuğu ile temsil edilir. Ordinat ekseninde, göreceli seçim frekansları ölçülür, yani toplam gözlem sayısına atıfta bulunulan belirli bir iz seçiminin frekansları. Sol iz için, frekans olarak da adlandırılan nispi frekans 19/70, yani 0.27 ve sağ iz için 51/70, yani 0.73'tür.

Her iki yol da eşit olasılıkla seçilirse, deneklerin yarısı doğru yolu, yarısı da solu seçecektir. İzlerin her birini seçme olasılığı 0,50 olacaktır.

Ampirik frekansların bu değerden sapmalarının oldukça önemli olduğunu görüyoruz. Belki ampirik ve teorik dağılım arasındaki farklar önemli olacaktır.

İncirde. 4.5 aslında iki histogram sunar, ancak çubuklar, sol şerit tercihinin frekansları, gözlemcimizin (1) seçiminde ve T.A. Dobrokhotova ve N.N. Bragina (2) ve sağda - aynı iki örnekte sağ şerit tercihinin frekansları.

Örnekler arasındaki farklılıkların çok önemsiz olduğunu görüyoruz. Kriter χ2, büyük olasılıkla, iki dağılımın çakışmasını doğrulayacaktır.

Kriter sınırlamaları

1.Örnek boyutu yeterince büyük olmalıdır: NS30. NS NS<30 критерий χ2 çok yaklaşık değerler verir. Kriterin doğruluğu büyük ölçüde artar NS.

2. Tablodaki her hücre için teorik frekans 5'ten az olmamalıdır: F> 5. Bu, basamak sayısı önceden belirlenmişse ve değiştirilemiyorsa, belirli bir minimum gözlem sayısı biriktirmeden χ2 yöntemini uygulayamayacağımız anlamına gelir. Örneğin, Trust telefon hizmetine yapılan aramaların sıklığının haftanın 7 gününe eşit olmayan bir şekilde dağıldığına dair varsayımlarımızı test etmek istiyorsak, 5 * 7 = 35 aramaya ihtiyacımız var. Böylece, eğer basamak sayısı ( k) önceden verilen, bu durumda olduğu gibi, minimum gözlem sayısı ( n dk) şu formülle belirlenir: n min = k*5.

3. Seçilen rakamlar, tüm dağılımı "çıkartmalı", yani özelliklerin tüm değişkenlik aralığını kapsamalıdır. Bu durumda, rakamlara göre gruplandırma, karşılaştırılan tüm dağılımlarda aynı olmalıdır.

4. Sadece 2 değer alan karakteristiklerin dağılımlarını karşılaştırırken bir "süreklilik düzeltmesi" yapmak gerekir. Düzeltme yapıldığında χ 2 değeri azalır (Süreklilik için düzeltmeli örneğe bakın).

5. Deşarjlar örtüşmemelidir: bir kategoriye bir gözlem atanmışsa, artık başka bir kategoriye atanamaz.

Kategoriye göre gözlemlerin toplamı her zaman toplam gözlem sayısına eşit olmalıdır.

Neyin gözlem sayısı olarak kabul edildiği sorusu meşrudur - seçimlerin, tepkilerin, eylemlerin veya bir seçim yapan, tepki gösteren veya eylemleri gerçekleştiren deneklerin sayısı. Denek birkaç reaksiyon gösteriyorsa ve hepsi kayıtlıysa, denek sayısı reaksiyon sayısıyla örtüşmeyecektir. Her konunun tepkilerini, örneğin başarı motivasyonunu incelemek için Heckhausen yönteminde veya S. Rosenzweig Engellenme Tolerans Testinde yapıldığı gibi özetleyebilir ve çeşitli örneklerdeki bireysel tepki toplamlarının dağılımlarını karşılaştırabiliriz.

Bu durumda, gözlem sayısı denek sayısı olacaktır. Numunedeki belirli bir türdeki reaksiyonların sıklığını bir bütün olarak sayarsak, farklı türlerdeki reaksiyonların dağılımını elde ederiz ve bu durumda, gözlem sayısı toplam kayıtlı reaksiyon sayısı olur, değil. konu sayısı.

Matematiksel bir bakış açısından, her iki durumda da bit bağımsızlığı kuralı gözlemlenir: bir gözlem, dağılımın bir ve yalnızca bir bitini ifade eder.

Bir konunun seçimlerinin dağılımını incelediğimiz çalışmanın bir varyantı hayal edilebilir. Örneğin bilişsel-davranışçı terapide, müşteriden, örneğin korku atakları, depresyon, öfke patlamaları, kendini küçümseyen düşünceler, vb. Gibi istenmeyen bir reaksiyonun ortaya çıkış zamanını tam olarak kaydetmesi istenir, ve müşterinin olumsuz reaksiyonların önlenmesi için bireysel bir program oluşturmasına yardımcı olur.

χ2 kriterini kullanmak mümkün mü? Bu bireysel dağılımda bazı saatlerin daha sık, bazılarının daha az sıklıkta olduğunu kanıtlamak için mi? Aynı konuya atıfta bulundukları için tüm gözlemler bağımlıdır; aynı zamanda, tüm deşarjlar örtüşmez, çünkü aynı saldırı bir ve yalnızca bir deşarja atıfta bulunur (bu durumda, öğleden sonra saat bir). Görünüşe göre, bu durumda χ2 yönteminin uygulanması belirli bir basitleştirme olacaktır. Korku, öfke veya depresyon atakları gün boyunca tekrar tekrar meydana gelebilir ve örneğin sabah erkenden, saat 6'da ve akşam geç saatlerde, saat 12'de, atakların genellikle aynı gün içinde birlikte meydana geldiği ortaya çıkabilir. : aynı zamanda, 3 saatlik bir gün saldırısı, önceki saldırıdan bir gün sonra ve bir sonraki saldırıdan en az iki gün önce, vb. Görünür. Görünüşe göre, karmaşık bir matematiksel modelden veya bunun gibi bir şeyden bahsediyoruz . "cebir tarafından inanılır". Yine de, pratik amaçlar için, aynı kişide herhangi bir önemli olayın, seçimin, tercihin vb. başlangıcının sistematik eşitsizliğini ortaya çıkarmak için kriteri kullanmak faydalı olabilir.

Dolayısıyla, aynı gözlem sadece bir kategori için geçerli olmalıdır. Ancak, her bir konunun bir gözlem olarak mı yoksa konunun araştırılan her tepkisi olarak mı ele alınacağı, çözümü çalışmanın amaçlarına bağlı olan bir sorudur (bkz. örneğin, Ganzen V.A., Balin V.D., 1991, s. 10).

Kriterin ana "sınırlaması" χ 2 - çoğu araştırmacı için göz korkutucu derecede zor görünüyor.

Kriterin anlaşılmaz zorluğu efsanesini aşmaya çalışalım. χ 2 . İşleri canlandırmak için mizahi bir edebi örnek düşünün.

h2 Pearson testi

Dağıtım yasasının başarılı veya başarısız bir seçiminin belirlendiği kriterler genellikle anlaşma kriterleri ile gösterilir. C. Pearson'ın 2. kriteri, dağıtım yasası hakkında basit bir hipotezi test etmek için en sık kullanılan kriterdir. Düşme olasılıklarının bilinmeyen gerçek değerlerinin değiştirilmesiyle, bilinmeyen yoğunluk için güven bölgesi oluşturmaya hizmet eden aynı miktarın varsayımsal dağılımından deneysel verilerin sapmasının bir ölçüsü olarak kullanılmasına dayanır. varsayımsal dağılımdan hesaplanan olasılıklarla aralıklara dönüştürülür. Rastgele bir değişkenin olası değer aralığının r aralıklarına bölündüğünü varsayalım (çok boyutlu, yani bir vektör miktarı durumunda dikdörtgenler). n deney sonucunda elde edilen bu aralıklara çarpmanın rastgele frekansları olsun, P1, ..., Pr - varsayımsal dağılımdan hesaplanan aynı aralıklara çarpma olasılıkları.

Genel durumda, bu olasılıklar, aynı deneysel verilerden elde edilen bilinmeyen parametrelerin tahminlerinin fonksiyonlarıdır ve bu nedenle de rastgele niceliklerdir. Varsayımsal bir dağılımın bilinmeyen parametrelerinin tahminlerinin, frekanslarla aynı havuzlanmış örnekten hesaplandığını varsayalım. Daha sonra olasılıklar P1, ..., Pr frekansların bazı fonksiyonları olacaktır ve deneysel verilerin varsayımsal dağılımdan sapmasını değerlendirmek için değeri alınız.

nerede Р1, ..., Pr - frekansların belirli işlevleri.

Neumann ve Pearson, gruplanmış bir örnek üzerinde varsayımsal dağılımın bilinmeyen s-boyutlu parametresinin asimptotik olarak etkili ve asimptotik olarak normal bir tahmininin, P1, ..., Pr olasılıklarını hesaplamak için kullanıldığını, o zaman formülle belirlenen Z değerinin kullanıldığını gösterdi. (1), limitte n ->? r-s-1 serbestlik derecesine sahip bir ch2 dağılımına sahiptir.

Bu teoremi kullanarak, n2 dağılımının tablolarını kullanarak deneysel veriler ile varsayımsal dağılım arasındaki tutarsızlığı tahmin etmek mümkündür. Yeterince küçük bir olasılık p seçiyoruz, böylece böyle bir olasılığa sahip bir olay pratik olarak imkansız olarak kabul edilebilir ve denklemden belirleriz.

Deneyler sonucunda elde edilen Z değerinin gerçekleşmesi = 2, = 2'yi aşar veya buna eşitse, varsayımsal dağılımın deneysel verilerle tutarsız olduğu kabul edilir, çünkü bu dağılımla elde etmek neredeyse imkansızdır. bir örnekle = 2. Çok sayıda deney için böyle bir olayın olasılığı yaklaşık olarak p'ye eşittir, yani. ihmal edilebilir. Bu durumda deneysel verilerde varsayımsal dağılımdan önemli bir sapma olduğu söylenir. = 2 ise, varsayımsal dağılımın deneysel verilerle çelişmediğine, onlarla aynı fikirde olduğuna inanılır.

Değer, örneğin varsayımsal dağılımdan sapmasının yüzde 100p-önem düzeyi olarak adlandırılır. Tipik olarak, görevin doğasına bağlı olarak %5, %1 ve %0,1 önem seviyeleri kullanılır.

Ek olarak, deneysel verilerin varsayımsal dağılımla tutarlılığını kontrol etmek için, belirli bir varsayımsal dağılım için Z'nin değerinin, gerçekleştirilmesine ilişkin deneyler sonucunda elde edilen değerden daha büyük olma olasılığını hesaplamak yararlıdır = 2, P (Z> 2) Bu olasılık ne kadar büyükse, örneklem varsayımsal dağılımla o kadar iyi uyuşursa, örnek ile varsayımsal dağılım arasında elde edilen tutarsızlığın önemi o kadar az olur. Gerçekten de, eğer P (Z> 2) olasılığı yüksekse, o zaman bu deney serisini tekrarlarken, dağılım hakkında seçilen hipotez doğruysa, genellikle elde edilen değerden bile daha büyük olan Z değerleri elde edilecektir. deneyler sonucunda = 2.

Aldığınız gerçeğine dikkat edin = 2< и даже получив высокую вероятность P(Z >2), seçilen dağılım hipotezinin geçerli olduğuna dair kesin bir sonuç çıkarmıyoruz, ancak yalnızca bu hipotezin elde edilen deneysel sonuçlarla çelişmediğini, onlarla aynı fikirde olduğunu ve bunun sonucunda kabul edilebileceğini söylüyoruz. Rastgele değişkenin hipotetik dağılım yasasına gerçekten uyduğuna dair yeterince güçlü bir kanıt elde etmek için, bu deney dizisini yeterince çok sayıda tekrarlamak ve hipotezin deneysel sonuçlarla elde edilen uyuşmasının kararlı olduğundan emin olmak gerekir.

Kolmogorov kriteri

Kolmogorov kriteri - yardımcı kriter

Ana kriterin P-değerinin dağılımının tekdüzeliğini kontrol etmek için yardımcı bir kriter olarak, bu çalışmada Kolmogorov kriterini kullanıyoruz.

Kolmogorov'un kriteri, istatistiksel dağılım fonksiyonu F ^ * (x) ile karşılık gelen teorik dağılım fonksiyonu F (x, yani D = max | F ^ * (x) -F (x) | .

Bir sonraki adım, l = D değerini belirlemektir. İstatistiksel tablolara göre (matcalc ortamında, pvKolm (u) işlevi), tamamen rastgele nedenlerle, F ^ * (x) ve F (x) arasındaki maksimum farkın gerçekte gözlemlenenden daha az olmaması olasılığıdır. . Eğer P(n) olasılığı göreceli olarak yüksekse, o zaman hipotez çok küçükse kabul edilmeli, sonra mantıksız olarak reddedilmelidir.

Uygulamayı düşününHANIMmükemmelbasit hipotezleri test etmek için Pearson ki-kare testi.

Deneysel veriler elde edildikten sonra (yani bazı örneklem), dağıtım kanunu genellikle belirli bir sayı ile temsil edilen rastgele değişkeni en iyi tanımlayan seçilir. örnekleme... Deneysel verilerin seçilen teorik dağılım yasası tarafından ne kadar iyi tanımlandığının kontrol edilmesi, rıza kriterleri. Sıfır hipotezi, genellikle rastgele bir değişkenin dağılımının bazı teorik yasalara eşitliği hakkında bir hipotez vardır.

Önce uygulamayı ele alalım Pearson'ın uyum iyiliği testi X 2 (ki-kare) basit hipotezlerle ilgili olarak (teorik dağılımın parametrelerinin bilindiği varsayılır). Sonra -, sadece dağılımın şekli belirtildiğinde ve bu dağılımın parametreleri ve değer İstatistik 2 aynı temel alınarak tahmin edilir / hesaplanır örnekleme.

Not: İngilizce literatürde başvuru prosedürü Pearson uyum iyiliği testi 2 bir başlığı var Ki-kare uyum iyiliği testi.

Hipotez test prosedürünü hatırlayın:

  • temelli örnekleme değer hesaplanır İstatistik, test edilen hipotezin türüne karşılık gelir. Örneğin, için kullanılır T-İstatistik(bilinmiyorsa);
  • gerçeğe tabi sıfır hipotezi, bunun dağıtımı İstatistik bilinir ve olasılıkları hesaplamak için kullanılabilir (örneğin, T-İstatistik bu );
  • dayalı olarak hesaplanır örnekleme anlam İstatistik verilen değer () için kritik değerle karşılaştırıldığında;
  • sıfır hipotezi değer varsa reddet İstatistik kritikten daha fazla (veya bu değeri alma olasılığı İstatistik() daha küçük önem düzeyi, eşdeğer bir yaklaşımdır).

gerçekleştireceğiz hipotez testi Farklı dağıtımlar için.

ayrı durum

Diyelim ki iki kişi zar oynuyor. Her oyuncunun farklı bir zar seti vardır. Oyuncular sırayla aynı anda 3 zar atarlar. Her tur, bir seferde daha fazla altı atan kişi tarafından kazanılır. Sonuçlar kaydedilir. 100 turdan sonra oyunculardan biri rakibinin zarının asimetrik olduğundan şüphelendi. sık sık kazanır (genellikle altı atar). Bu kadar çok sayıda rakibin sonucunun ne kadar olası olduğunu analiz etmeye karar verdi.

Not: Çünkü zar 3, sonra bir seferde 0 atabilirsiniz; 1; 2 veya 3 altılı, yani. rastgele bir değişken 4 değer alabilir.

Olasılık teorisinden, küpler simetrikse, altı alma olasılığının uyduğunu biliyoruz. Bu nedenle, 100 turdan sonra, altıların frekansları formül kullanılarak hesaplanabilir.
= BİNOM.DAĞ (A7; 3; 1/6; YANLIŞ) * 100

Formül, hücrede olduğunu varsayar. A7 bir turda karşılık gelen düşen altıları içerir.

Not: Hesaplamalar verilmiştir. Ayrık sayfadaki örnek dosya.

Karşılaştırma için gözlemlenen(Gözlemlenen) ve teorik frekanslar(Beklenen) kullanımı uygundur.

Teorik dağılımdan gözlemlenen frekansların önemli bir sapması ile, sıfır hipotezi teorik bir yasaya göre rastgele bir değişkenin dağılımı reddedilmelidir. Yani, rakibin zarı asimetrik ise, o zaman gözlemlenen frekanslar, rakibin zarından "önemli ölçüde farklı" olacaktır. Binom dağılımı.

Bizim durumumuzda, ilk bakışta, frekanslar oldukça yakındır ve hesaplama yapmadan kesin bir sonuç çıkarmak zordur. uygulanabilir Pearson'ın uyum iyiliği testi X 2, böylece karşılaştırmaya dayalı olarak yapılabilecek öznel ifade yerine "önemli ölçüde farklılık gösterir" histogramlar, matematiksel olarak doğru bir ifade kullanın.

nedeniyle olduğu gerçeğini kullanıyoruz büyük sayılar yasası artan hacim ile gözlenen frekans (Gözlenen) örnekleme n, teorik yasaya karşılık gelen olasılığa eğilimlidir (bizim durumumuzda, iki terimli yasa). Bizim durumumuzda, örneklem büyüklüğü n 100'dür.

Tanıtmak Ölçek İstatistik, ki bunu X 2 olarak gösteriyoruz:

O l rasgele değişkenin belirli kabul edilebilir değerleri aldığı olayların gözlemlenen frekansıdır, E l karşılık gelen teorik frekanstır (Beklenen). L, rastgele bir değişkenin alabileceği değer sayısıdır (bizim durumumuzda 4'tür).

Formülden de anlaşılacağı gibi, bu İstatistik gözlemlenen frekansların teorik olanlara yakınlığının bir ölçüsüdür, yani. bu frekanslar arasındaki "mesafeleri" tahmin etmek için kullanılabilir. Bu "mesafelerin" toplamı "çok büyük" ise, bu frekanslar "önemli ölçüde farklıdır". Küpümüz simetrik ise (yani iki terimli yasa), o zaman "mesafelerin" toplamının "çok büyük" olma olasılığı küçük olacaktır. Bu olasılığı hesaplamak için dağılımı bilmemiz gerekir. İstatistik X 2 ( İstatistik X 2, rastgele bir temelde hesaplanır örnekleme, bu nedenle rastgele bir değişkendir ve bu nedenle kendi olasılık dağılımı).

Çok boyutlu bir analogdan Moivre-Laplace integral teoremi n-> ∞ için rasgele değişkenimiz X 2'nin asimptotik olarak L - 1 serbestlik dereceli olduğu bilinmektedir.

Yani hesaplanan değer ise İstatistik X 2 (frekanslar arasındaki "mesafelerin" toplamı) belirli bir sınır değerinden daha büyük olacak, o zaman reddetmek için nedenimiz olacak sıfır hipotezi... Kontrolde olduğu gibi parametrik hipotezler, limit değeri şu şekilde ayarlanır: önem düzeyi... X 2 istatistiğinin hesaplanandan küçük veya ona eşit bir değer alma olasılığı ( P-anlam) daha az olacak önem düzeyi, sonra sıfır hipotezi reddedilebilir.

Bizim durumumuzda istatistik 22.757'dir. X 2 istatistiğinin 22.757'den büyük veya buna eşit bir değer alma olasılığı çok küçüktür (0.000045) ve formüller kullanılarak hesaplanabilir.
= CHI2.DAĞ.RF (22.757; 4-1) veya
= CHI2.TEST (Gözlenen; Beklenen)

Not: CHI2.TEST () işlevi, iki kategorik değişken arasındaki bağlantıyı test etmek için özel olarak tasarlanmıştır (bkz.).

0,000045 olasılığı normalden önemli ölçüde daha azdır önem düzeyi 0.05. Bu nedenle, oyuncunun rakibinin sahtekârlığından şüphelenmek için her türlü nedeni vardır ( sıfır hipotezi dürüstlüğü reddedilir).

başvururken kriter X 2 hacmini sağlamak için gereklidir. örnekleme n yeterince büyüktü, aksi takdirde dağılımın yaklaşımı istatistikler X 2... Genellikle bunun için gözlemlenen frekansların (Gözlemlenen) 5'ten büyük olmasının yeterli olduğu varsayılır. Durum böyle değilse, küçük frekanslar bir frekansta birleştirilir veya diğer frekanslara katılır ve birleşik değere toplam olasılık atanır. ve buna bağlı olarak, serbestlik derecesi sayısı azalır X 2 -dağılımlar.

Uygulama kalitesini artırmak için kriter X 2(), bölüm aralıklarını azaltmak gerekir (L'yi artırın ve buna göre sayıyı artırın özgürlük derecesi), ancak bu, her aralığa düşen gözlem sayısındaki sınırlama tarafından engellenir (b.b.> 5).

Sürekli durum

Pearson uyum iyiliği testi 2 durumda aynı şekilde uygulanabilir.

Belirli bir düşünün örnekleme 200 değerden oluşur. Sıfır hipotezi Devletler örneklem den imal edilmiş .

Not: Rastgele değerler çalışma sayfasındaki örnek dosya Sürekli formül ile oluşturulan = NORM.ST.OBR (RAND ())... Bu nedenle yeni anlamlar örnekleme sayfa her yeniden hesaplandığında oluşturulur.

Mevcut veri setinin yeterli olup olmadığı görsel olarak değerlendirilebilir.

Diyagramdan da anlaşılacağı gibi, örnek değerler düz bir çizgi boyunca oldukça iyi uyuyor. Ancak, olduğu gibi hipotez testi uygulanabilir Pearson'ın uyum iyiliği kriteri X 2.

Bunu yapmak için, rastgele değişkenin varyasyon aralığını 0,5'lik bir adımla aralıklara böleriz. Gözlenen ve teorik frekansları hesaplayalım. Gözlenen frekanslar FREKANS () işlevi kullanılarak ve teorik olanlar - NORM.ST.DAĞ () işlevi kullanılarak hesaplanacaktır.

Not: gelince ayrı durum, bunu sağlamak için gereklidir örneklem yeterince büyüktü ve> 5 değer aralığa düştü.

X 2 istatistiğini hesaplıyoruz ve bunu belirli bir kritik değerle karşılaştırıyoruz. önem düzeyi(0.05). Çünkü rastgele değişkenin varyasyon aralığını 10 aralığa böldük, sonra serbestlik derecesi sayısı 9'dur. Kritik değer formülle hesaplanabilir.
= CHI2.OBR.PH (0,05; 9) veya
= CHI2.OBR (1-0.05; 9)

Yukarıdaki şemada, istatistiğin önemli ölçüde daha yüksek olan 8.19 olduğunu görebilirsiniz. kritiksıfır hipotezi reddedilmez.

Aşağıda gösterilmiştir nerede örneklem olası olmayan bir değer aldı ve kriter Pearson Rızası X 2 boş hipotez reddedildi (rastgele değerler formül kullanılarak oluşturulmuş olsa da) = NORM.ST.OBR (RAND ()) sağlama örnekleme itibaren standart normal dağılım).

Sıfır hipotezi reddedildi, ancak görsel olarak veriler düz bir çizgiye oldukça yakın yerleştirilmiş.

Örnek olarak, ayrıca alın örnekleme U'dan (-3; 3). Bu durumda, grafikten bile açıkça görülüyor ki sıfır hipotezi reddedilmelidir.

kriter Pearson Rızası X 2 ayrıca bunu doğruluyor sıfır hipotezi reddedilmelidir.

Önceki notlarda, sayısal ve kategorik verilerle ilgili hipotezleri test etme prosedürleri açıklanmıştır:, birkaç ve ayrıca, bir veya üzerinde çalışmanıza izin verir. Bu notta, birkaç bağımsız örneğe dayalı olarak genel popülasyonlardaki bir özelliğin payları arasındaki farklar hakkındaki hipotezleri test etme yöntemlerini ele alacağız.

Kullanılan yöntemleri göstermek için, TS Resort Properties'in sahibi olduğu otellerin konuklarının memnuniyet derecesinin kullanıldığı bir senaryo kullanılmıştır. İki tatil adasında bulunan beş otele sahip bir şirketin yöneticisi olduğunuzu hayal edin. Misafirler hizmetten memnun kalırlarsa, gelecek yıl tekrar gelmeleri ve arkadaşlarına otelinizde kalmalarını önerme ihtimalleri vardır. Hizmet kalitesini değerlendirmek için konuklardan bir anket doldurmaları ve konukseverlikten memnun olup olmadıklarını belirtmeleri istenir. Anket verilerini analiz etmeniz, konukların taleplerinden genel memnuniyet düzeyini belirlemeniz, konukların gelecek yıl tekrar gelme olasılığını değerlendirmeniz ve ayrıca bazı müşterilerin olası memnuniyetsizliğinin nedenlerini belirlemeniz gerekir. Örneğin, adalardan birinde şirket, Beachcomber ve Windsurfer otellerinin sahibidir. Bu otellerde hizmet aynı mı? Değilse, bu bilgiler şirketin kalitesini artırmak için nasıl kullanılabilir? Ayrıca, bazı misafirler bir daha size gelmeyeceklerini söyledilerse, diğerlerinden daha sık hangi nedenleri belirtiyorlar? Bu nedenlerin sadece belirli bir otel ile ilgili olduğu ve bir bütün olarak şirketin tamamı için geçerli olmadığı iddia edilebilir mi?

Burada aşağıdaki gösterim kullanılır: x 1 - birinci gruptaki başarı sayısı, x 2 - ikinci gruptaki başarı sayısı, n 1 x 1 - birinci gruptaki başarısızlık sayısı, n 2 x 2 - ikinci gruptaki başarısızlık sayısı, X =x 1 + x 2 - toplam başarı sayısı, nx = (n 1 x 1 ) + (n 2 x 2 ) başarısızlıkların toplam sayısıdır, n 1 - ilk numunenin hacmi, n 2 - ikinci numunenin hacmi, n = n 1 + n 2 - numunelerin toplam hacmi. Gösterilen tablonun iki satırı ve iki sütunu vardır, bu nedenle 2 × 2 faktör tablosu olarak adlandırılır. Her satır ve sütunun kesişmesiyle oluşan hücreler, başarı veya başarısızlık sayısını içerir.

Yukarıda açıklanan senaryo örneğini kullanarak beklenmedik durum tablosunun uygulamasını gösterelim. "Gelecek yıl tekrar gelecek misin?" Sorusunu varsayalım. Beachcomber'daki 227 misafirin 163'ü ve Windsurfer'daki 262 misafirin 154'ü evet dedi. Anlamlılık düzeyi 0,05 ise otel misafir memnuniyeti (misafirlerin gelecek yıl tekrar gelme olasılığını temsil eden) arasında istatistiksel olarak anlamlı bir fark var mıdır?

Pirinç. 2. Konukların hizmet kalitesini değerlendirmek için faktör tablosu 2x2

İlk satır, her otelin gelecek yıl geri dönmek istediğini (başarılı) bildiren misafir sayısını gösterir; ikinci satır, memnuniyetsizliğini (başarısızlığını) ifade eden konuk sayısını içerir. "Toplam" sütununda yer alan hücreler, gelecek yıl otele geri dönmeyi planlayan toplam misafir sayısı ile hizmetten memnun olmayan toplam misafir sayısını içerir. "Toplam" satırındaki hücreler, her otel için anket yapılan toplam konuk sayısını içerir. Geri dönmeyi planlayan misafirlerin oranı, bunu söyleyen misafir sayısının belirli bir otel için anket yapılan toplam misafir sayısına bölünmesiyle hesaplanır. Daha sonra hesaplanan payları karşılaştırmak için χ 2 testi kullanılır.

Boş ve alternatif hipotezleri test etmek için H 0: p 1 = p 2; H 1: p 1 ≠ p 2 test χ 2 -istatistiklerini kullanıyoruz.

İki hisseyi karşılaştırmak için ki-kare testi. Test χ 2 istatistiği, gözlemlenen ve beklenen başarı sayısı arasındaki farkların karelerinin toplamına bölünerek tablonun her hücresindeki beklenen başarı sayısına eşittir:

nerede 0- beklenmedik durum tablosunun belirli bir hücresinde gözlemlenen başarı veya başarısızlık sayısı, f e

χ 2 -istatistik testi, bir serbestlik dereceli χ 2 -dağılımı ile yaklaşık olarak hesaplanır.

Veya beklenmedik durum tablosunun her hücresindeki başarısızlıkların anlamlarını anlamanız gerekir. Boş hipotez doğruysa, yani. iki popülasyondaki başarı oranları eşittir, iki grubun her biri için hesaplanan örnek oranları birbirinden yalnızca rastgele nedenlerle farklılık gösterebilir ve her iki oran da genel popülasyonun genel parametresinin bir tahminidir. r... Bu durumda, her iki paylaşımı tek bir genel (ortalama) parametre tahmininde birleştiren istatistikler r , havuzlanmış gruplardaki toplam başarı oranını temsil eder (yani, toplam başarı sayısının toplam örnek boyutuna bölünmesine eşittir). onun ilavesi, 1 – , birleştirilmiş gruplardaki toplam başarısızlık oranını temsil eder. Anlamı Şekil 1'deki tabloda açıklanan tanımlamaları kullanarak. 1. Parametreyi hesaplamak için formül (2) türetebilirsiniz. :

nerede - özelliğin ortalama payı.

Beklenen başarı sayısını hesaplamak için Fe(yani, beklenmedik durum tablosunun ilk satırının içeriği), örneklem boyutunu parametre ile çarpmak gerekir. ... Beklenen arıza sayısını hesaplamak için f e(yani, beklenmedik durum tablosunun ikinci satırının içeriği), örneklem boyutunu parametre ile çarpmak gerekir. 1 – .

Formül (1) ile hesaplanan test istatistiklerine, bir serbestlik dereceli χ 2 -dağılımı ile yaklaşılır. Belirli bir α anlamlılık düzeyinde, hesaplanan χ 2 -istatistiği, bir serbestlik dereceli χ 2 dağılımının üst kritik değeri olan χ U 2'den büyükse boş hipotez reddedilir. Böylece, karar kuralı aşağıdaki gibidir: hipotez H 0 χ 2> χ U 2 ise reddedilir, aksi takdirde hipotez H 0 sapmaz (Şekil 3).

Pirinç. 3. Kritik alan χ 2 - önem düzeyindeki payları karşılaştırmak için kriter α

Boş hipotez doğruysa, hesaplanan χ 2 istatistiği sıfıra yakındır, çünkü gözlemlenen arasındaki kare farkı F 0 ve beklenen Fe her hücredeki miktarlar çok küçüktür. Öte yandan, eğer boş hipotez H 0 yanlıştır ve genel popülasyondaki başarı oranları arasında önemli bir fark vardır, hesaplanan χ 2 -istatistiklerinin büyük olması gerekir. Bunun nedeni, kare alındığında artan her hücrede gözlemlenen ve beklenen başarı veya başarısızlık sayısı arasındaki farktır. Ancak beklenen ve gözlenen değerler arasındaki farkların genel χ 2 -istatistiklerine katkıları farklı olabilir. arasındaki aynı gerçek fark 0 ve f e hücre, daha fazla sayıda gözleme karşılık gelen farktan daha az sayıda gözlemin sonuçlarını içeriyorsa, χ2 -istatistikleri üzerinde daha büyük bir etkiye sahip olabilir.

İki kesrin eşitliği hipotezini test etmek için χ 2 testini göstermek için, önceki bölümde açıklanan ve sonuçları Şekil 1'de gösterilen senaryoya dönelim. 2. Sıfır hipotezi (H 0: p 1 = p 2), iki oteldeki hizmet kalitesini karşılaştırırken, gelecek yıl geri dönmeyi planlayan misafirlerin oranlarının hemen hemen aynı olduğunu belirtir. Parametreyi tahmin etmek için r, otele geri dönmeyi planlayan misafirlerin oranını temsil eder, eğer boş hipotez doğruysa, değer kullanılır formülü ile hesaplanan

Hizmetten memnun kalmayan misafirlerin payı = 1 - 0,6483 = 0,3517. Bu iki payı, ankete katılan Beachcomber konuk sayısıyla çarparak, gelecek sezon geri dönmeyi planlayan beklenen konuk sayısını ve artık otelde kalmayacak tatilcilerin sayısını elde ediyoruz. Windsurfer otelinin misafirlerinin beklenen payı da benzer şekilde hesaplanır:

Evet - Beachcomber: = 0,6483, n 1 = 227, bu nedenle f e = 147,16.
Evet - Rüzgar Sörfü: = 0,6483, n 2 = 262, bu nedenle f e = 169,84.
Hayır - Beachcomber: 1 - = 0,3517, n 1 = 227, bu nedenle f e = 79,84.
Hayır - Rüzgar Sörfü: 1 - = 0,3517, n 2 = 262, bu nedenle f e = 92,16.

Hesaplamalar Şekil 2'de gösterilmektedir. 4.

Pirinç. 4. χ 2 - oteller için istatistikler: (a) ilk veriler; (b) gözlemlenenleri karşılaştırmak için 2x2 faktöriyel tablo ( F 0 ) ve beklenen ( Fe) hizmetten memnun olan ve olmayan misafir sayısı; (c) hizmetten memnun kalan misafirlerin oranını karşılaştırırken χ 2 -istatistiklerini hesaplamak; (d) testin kritik değerinin hesaplanması χ 2 - istatistik

Testin kritik değerini hesaplamak için χ 2 -istatistik, Excel = CHI2.OBR () işlevi kullanılır. Önem düzeyi α = 0,05 ise (CHI2.OBR işlevinde ikame edilen olasılık 1 –α'dır) ve 2 × 2 faktöriyel tablo için χ 2 -dağılımı bir serbestlik derecesine sahipse, χ 2'nin kritik değeri -istatistik 3.841'dir. 9.053'e (Şekil 4c) eşit olan χ 2 -istatistiklerinin hesaplanan değeri 3.841 sayısını aştığından, boş hipotez reddedilir (Şekil 5).

Pirinç. 5. Testin kritik değerinin belirlenmesi χ 2 - anlamlılık düzeyinde bir serbestlik dereceli istatistikler α = 0.05

olasılık rχ 2 istatistiği 9.053'e (ve bir serbestlik derecesi) eşit olduğunda boş hipotezin doğru olduğu gerçeği, Excel'de = 1 - CHIS 2 işlevi kullanılarak hesaplanır. DIST (9.053; 1; DOĞRU) = 0.0026. r- 0,0026 değeri, Beachcomber ve Windsurfer'daki hizmetten memnun kalan konukların örnek payları arasındaki farkın 0,718'e eşit veya daha büyük olma olasılığıdır - 0,588 = 0,13, eğer aslında her iki popülasyondaki payları aynı ise.. . Bu nedenle, iki otel arasında misafir hizmetinde istatistiksel olarak anlamlı bir fark olduğuna inanmak için iyi nedenler var. Yapılan araştırmalar Beachcomber'daki hizmetten memnun kalan misafir sayısının Windsurfer'da tekrar konaklamayı planlayan misafir sayısından daha fazla olduğunu gösteriyor.

2 × 2 faktör tablosu ile ilgili varsayımların test edilmesi. Tablo 2 × 2'deki verilere dayalı olarak doğru sonuçlar elde etmek için, başarı veya başarısızlık sayısının 5'ten büyük olması gerekir. Bu koşul sağlanmazsa, kesin sayı uygulanmalıdır. Fisher'ın testi.

İki oteldeki hizmet kalitesinden memnun olan müşterilerin yüzdesi karşılaştırıldığında, Z ve χ 2 kriterleri aynı sonuçlara yol açmaktadır. Bu, standartlaştırılmış normal dağılım ile bir serbestlik dereceli χ 2 - dağılımı arasında yakın bir ilişkinin varlığı ile açıklanabilir. Bu durumda, χ 2 istatistiği her zaman Z istatistiğinin karesidir. Örneğin, misafir memnuniyetini ölçerken şunu bulduk: Z-istatistik +3.01 ve χ 2 -istatistik 9.05'tir. Yuvarlama hatalarını ihmal ederek, ikinci değerin birincinin karesi olduğunu doğrulamak kolaydır (yani 3.01 2 = 9.05). Ek olarak, her iki istatistiğin kritik değerlerini α = 0.05 anlamlılık düzeyinde karşılaştırarak, χ 1 2'nin 3.841'e eşit değerinin, +'ya eşit olan Z-istatistikinin üst kritik değerinin karesi olduğunu bulabiliriz. 1,96 (yani, χ 1 2 = Z 2). Dahası, r- her iki kriterin değerleri aynıdır.

Bu nedenle, sıfır ve alternatif hipotezler test edilirken şu söylenebilir. H 0: p 1 = p 2; H 1: p 1 ≠ p 2 Z ve χ 2 kriterleri eşdeğerdir. Ancak sadece farklılıkları bulmak değil, aynı zamanda hangi oranın daha büyük olduğunu (p 1> p 2) belirlemek gerekiyorsa, NS standartlaştırılmış normal dağılımın kuyruğu tarafından sınırlanan bir kritik bölge ile bir Z testi uygulayın. Daha sonra, bir özelliğin birkaç gruptaki paylarını karşılaştırmak için χ 2 kriterinin uygulanması açıklanacaktır. Bu durumda Z kriterinin uygulanamayacağına dikkat edilmelidir.

Birkaç parçanın eşitliği hipotezini test etmek için χ 2 testinin uygulanması

Ki-kare testi daha genel bir duruma genişletilebilir ve bir özelliğin birkaç fraksiyonunun eşit olduğu hipotezini test etmek için kullanılabilir. Harf ile analiz edilen bağımsız genel popülasyonların sayısını gösterelim. ile birlikte... Şimdi beklenmedik durum tablosu iki satırdan oluşuyor ve ile birlikte sütunlar. Boş ve alternatif hipotezleri test etmek için H 0: p 1 = p 2 = … = p 2, H 1: Hepsi değil rJ birbirine eşit (J = 1, 2, …, C), test χ 2 -istatistik kullanılır:

nerede 0- faktör tablosunun belirli bir hücresinde gözlemlenen başarı veya başarısızlık sayısı 2 * ile birlikte, Fe- boş hipotezin doğru olması koşuluyla, beklenmedik durum tablosunun belirli bir hücresindeki teorik veya beklenen başarı veya başarısızlık sayısı.

Olasılık tablosunun her hücresindeki beklenen başarı veya başarısızlık sayısını hesaplamak için aşağıdakileri aklınızda bulundurun. Sıfır hipotezi doğruysa ve tüm popülasyonlardaki başarı oranları eşitse, tüm oranlar bir özelliğin oranının tahminleri olduğundan, karşılık gelen örnek oranları birbirinden yalnızca rastgele nedenlerle farklılık gösterebilir. r genel popülasyonda. Bu durumda, tüm payları tek bir genel (veya ortalama) parametre tahmininde birleştiren istatistikler r, her birinden ayrı ayrı daha fazla bilgi içerir. sembolü ile gösterilen bu istatistikler , havuzlanmış örnekteki toplam (veya ortalama) başarı oranını temsil eder.

Ortalama payın hesaplanması:

Beklenen başarı sayısını hesaplamak için f e beklenmedik durum tablosunun ilk satırında, her örneğin boyutunu bir parametre ile çarpmak gerekir. Beklenen arıza sayısını hesaplamak için f e beklenmedik durum tablosunun ikinci satırında, her örneğin boyutunu parametre ile çarpmak gerekir. 1 – ... Formül (1) ile hesaplanan test istatistiklerine χ 2 -dağılımı ile yaklaşılır. Bu dağılımın serbestlik derecesi sayısı, değere göre verilir. (r - 1) (C – 1) , nerede r- faktör tablosundaki satır sayısı, ile birlikte- tablodaki sütun sayısı. Bir faktör tablosu için 2 * sn serbestlik derecesi sayısı (2 - 1) (s - 1) = s - 1... Belirli bir α anlamlılık düzeyinde, hesaplanan χ 2 -istatistikleri, χ 2 dağılımında bulunan üst kritik değer χ U 2'den büyükse, boş hipotez reddedilir. s - 1özgürlük derecesi. Böylece, karar kuralı aşağıdaki gibidir: hipotez H 0χ 2> χ U 2 (Şekil 6) ise reddedilir, aksi takdirde hipotez reddedilir.

Pirinç. 6. Kritik alan χ 2 - önem düzeyindeki payla karşılaştırma için kriter α

Faktöriyel tablo 2 * c ile ilgili varsayımların kontrol edilmesi. Faktöriyel tablo 2'de verilen verilere göre doğru sonuçlar elde etmek için * ile birlikte, başarı veya başarısızlık sayısının yeterince büyük olması gerekir. Bazı istatistikçiler, beklenen frekansların 0,5'ten büyük olması durumunda testin doğru sonuçlar verdiğine inanmaktadır. Daha muhafazakar araştırmacılar, beklenmedik durum tablosu hücrelerinin %20'sinden fazlasının 5'ten az beklenen değerler içermemesini ve hiçbir hücrenin birden düşük bir beklenen değer içermemesini şart koşar. İkinci koşul bize bu aşırı uçlar arasında makul bir uzlaşma gibi görünüyor. Bu koşulu sağlamak için küçük beklenen değerler içeren kategoriler tek bir kategoride birleştirilmelidir. Bundan sonra, kriter daha kesin hale gelir. Herhangi bir nedenle birden fazla kategoriyi birleştirmek mümkün değilse, alternatif prosedürler izlenmelidir.

Birkaç gruptaki hisselerin eşitliği hipotezini test etmek için χ 2 testini göstermek için bölümün başında açıklanan senaryoya dönüyoruz. TS Resort Resources'a ait üç otelin konuklarının katıldığı benzer bir anketi düşünün (Şekil 7a).

Pirinç. 7. Hizmetten memnun olan ve olmayan misafir sayısını karşılaştırmak için faktör tablosu 2 × 3: (a) gözlemlenen başarı veya başarısızlık sayısı - 0; (b) beklenen başarı veya başarısızlık sayısı - Fe; (c) hizmetten memnun kalan konuk oranlarını karşılaştırırken χ 2 -istatistiklerinin hesaplanması

Sıfır hipotezi, gelecek yıl geri dönmeyi planlayan müşterilerin oranının tüm otellerde hemen hemen aynı olduğunu belirtir. Parametreyi tahmin etmek için r otele geri dönmeyi planlayan misafirlerin oranı olan değer kullanılır. r = NS /n= 513/700 = 0.733. Hizmetten memnun olmayan misafirlerin oranı 1 - 0,733 = 0,267'dir. Her otelde ankete katılan misafir sayısı ile üç payın çarpılması, gelecek sezon geri dönmeyi planlayan beklenen misafir sayısını ve artık o otelde kalmayacak müşteri sayısını verir (Şekil 7b).

Boş ve alternatif hipotezleri test etmek için, formül (1)'e göre beklenen ve gözlenen değerler kullanılarak hesaplanan test χ 2 -istatistikleri kullanılır (Şekil 7c).

Testin kritik değeri χ 2 -istatistik = CHI2.OBR () formülü ile belirlenir. Üç otelin misafirleri ankete katıldığından, χ 2 -istatistikleri (2 - 1) (3 - 1) = 2 serbestlik derecesine sahiptir. α = 0.05 anlamlılık düzeyinde, χ 2 istatistiğinin kritik değeri 5.991'dir (Şekil 7d). 40.236'ya eşit hesaplanan χ 2 -istatistikleri kritik değeri aştığından, boş hipotez reddedilir (Şekil 8). Öte yandan, olasılık r boş hipotezin χ 2 - 40.236'ya (ve iki serbestlik derecesine) eşit istatistikte doğru olduğu gerçeği, Excel'de = 1-CHI2.DIST () = 0.000 işlevi kullanılarak hesaplanır (Şekil 7d). r- değer 0.000'a eşittir ve anlamlılık düzeyinden α = 0.05'ten küçüktür. Dolayısıyla sıfır hipotezi reddedilir.

Pirinç. 8. Üç kesirin 0,05 anlamlılık düzeyinde ve iki serbestlik derecesinde eşitliğine ilişkin hipotezin kabul ve reddedilme alanları

Faktöriyel tablo 2'de belirtilen payları karşılaştırırken boş hipotezi reddetme * ile birlikte, sadece üç otelde hizmetten memnun kalan misafir oranlarının örtüşmediğini söyleyebiliriz. Hangi payların diğerlerinden farklı olduğunu bulmak için Marasquilo prosedürü gibi diğer yöntemlerin uygulanması gerekir.

Marasquilo prosedürü tüm grupları çiftler halinde karşılaştırmanızı sağlar. Prosedürün ilk aşamasında, farklar p s j - p s j '(nerede JJ) arasında s (s - 1) / 2 hisse çiftleri halinde. Karşılık gelen kritik aralıklar aşağıdaki formül kullanılarak hesaplanır:


α genel anlamlılık düzeyinde, değer ki-kare dağılımının üst kritik değerinin kareköküdür. s - 1özgürlük derecesi. Her bir numune fraksiyonu çifti için ayrı bir kritik aralık hesaplamak gerekir. Son aşamada, her biri s (s - 1) / 2 vuruş çiftleri, karşılık gelen kritik aralıkla karşılaştırılır. Belirli bir çifti oluşturan paylar, örnek payların mutlak farkı |p s j - p s j | kritik aralığı aşıyor.

Marasquilo'nun prosedürünü üç otelin misafirleri arasında yapılan bir anket örneğini kullanarak gösterelim (Şekil 9a). Ki-kare testi uygulayarak, farklı otellerin gelecek yıl tekrar gelmeyi düşünen misafirlerin oranları arasında istatistiksel olarak anlamlı bir fark olduğunu doğruladık. Anket üç otelin misafirlerini içerdiğinden, 3 (3 - 1) / 2 = 3 ikili karşılaştırma yapmak ve üç kritik aralığı hesaplamak gerekir. Başlangıç ​​olarak, üç örnek kesir hesaplayalım (Şekil 9b). 0,05 genel anlamlılık düzeyinde, (s - 1) = 2 serbestlik derecesine sahip ki-kare dağılımı için test χ 2 -istatistiğinin üst kritik değeri = CHI2 formülü ile belirlenir.OBR (0.95; 2) = 5,991. Yani, = 2.448 (Şekil 9c). Ardından, üç çift mutlak fark ve bunlara karşılık gelen kritik aralıkları hesaplıyoruz. Mutlak fark kritik aralığından büyükse, karşılık gelen paylar önemli ölçüde farklı kabul edilir (Şekil 9d).

Pirinç. 9. Üç oteldeki memnun misafir oranının eşitliği hakkındaki hipotezi test etmek için Marasquilo prosedürünün sonuçları: (a) anket verileri; (b) numune oranları; (c) testin üst kritik değeri χ 2 - ki-kare dağılımı için istatistikler; (d) üç çift mutlak fark ve karşılık gelen kritik aralıklar

Görüldüğü gibi 0.05 anlamlılık düzeyinde Palm Royal otel misafirlerinin memnuniyet derecesi (p s2 = 0.858), Altın Palmiye (p s1 = 0.593) ve Palm Princess (p s1 = 0.593) misafirlerinden daha yüksektir. s3 = 0.738) oteller. Ayrıca Palm Princess'in memnuniyeti Altın Palmiye'den daha yüksektir. Bu sonuçlar, yönetimin bu farklılıkların nedenlerini analiz etmesine ve Golden Palm otel misafirlerinin memnuniyet oranının diğer otel misafirlerine göre neden önemli ölçüde düşük olduğunu belirlemeye çalışmasına yol açmalıdır.

Yöneticiler için Levin ve diğer İstatistikler kitabının kullanılmış materyalleri. - E.: Williams, 2004 .-- s. 708-730