Internet Windows Android
Kengaytirish

Ikki yoki undan ortiq kasrlar teng degan gipotezani tekshirish uchun ch2 testini qo'llash. 2-mezonning logarifmik rentabelligining mustaqilligi haqidagi gipotezani tekshirish

Statistik test

R 0 gipotezasi rad etiladigan yoki qabul qilinadigan qoida deyiladi statistik mezon. Mezonning nomi, qoida tariqasida, mezon bo'yicha hisoblangan statistik gipotezani tekshirish algoritmining 2-bandidan (4.1-bandga qarang) maxsus tuzilgan xarakteristikani belgilaydigan harfni o'z ichiga oladi. Ushbu algoritm shartlariga ko'ra, mezon chaqiriladi "v- mezon".

Statistik gipotezalarni sinab ko'rishda ikki xil xatolik yuzaga kelishi mumkin:

  • - birinchi turdagi xato(siz I 0 gipotezasini haqiqatda ham rad qilishingiz mumkin);
  • - ikkinchi turdagi xato(aslida to'g'ri bo'lmaganda I 0 gipotezasini qabul qilishingiz mumkin).

Ehtimollik a birinchi turdagi xato qilish deyiladi mezonning ahamiyatlilik darajasi.

Agar uchun R ikkinchi turdagi xato qilish ehtimolini bildiring, keyin (l - R) - deb ataladigan ikkinchi turdagi xatolikdan qochish ehtimoli mezonning kuchi.

Muvofiqligi x 2 Pearson

Statistik gipotezalarning bir necha turlari mavjud:

  • - taqsimot qonuni haqida;
  • - namunalarning bir xilligi;
  • - tarqatish parametrlarining raqamli qiymatlari va boshqalar.

Biz taqsimot qonunining gipotezasini Pearsonning x 2 muvofiqligi testi misolida ko'rib chiqamiz.

Rozilik mezoni noma'lum taqsimotning qabul qilingan qonuni haqidagi nol gipotezani tekshirishning statistik mezoni deb ataladi.

Pirsonning moslik testi ma'lum bir taqsimot qonuni farazi ostida hisoblangan empirik (kuzatilgan) va nazariy kuzatish chastotalarini taqqoslashga asoslangan. Bu erda №0 gipoteza quyidagicha tuzilgan: umumiy aholi odatda o'rganilayotgan atributga ko'ra taqsimlanadi.

Mezon uchun statistik gipotezani tekshirish algoritmi № 0 x 1 Pearson:

  • 1) biz I 0 gipotezasini ilgari surdik - o'rganilayotgan atributga ko'ra, umumiy populyatsiya normal taqsimlangan;
  • 2) namunaviy o'rtacha va namunaviy standart og'ishlarni hisoblang O v;

3) mavjud namuna hajmiga ko'ra NS biz maxsus tuzilgan xarakteristikani hisoblaymiz,

bu yerda: i, - empirik chastotalar, - nazariy chastotalar,

NS - namuna hajmi,

h- intervalning o'lchami (ikki qo'shni variant o'rtasidagi farq),

Kuzatilgan xarakteristikaning normallashtirilgan qiymatlari,

- jadval funktsiyasi. Shuningdek, nazariy chastotalar

formula bo'yicha standart MS Excel NORMDIST funktsiyasi yordamida hisoblash mumkin;

4) namuna taqsimotiga ko'ra, biz maxsus tuzilgan xarakteristikaning kritik qiymatini aniqlaymiz xl P

5) gipoteza № 0 rad etilganda, gipoteza № 0 qabul qilinganda.

Misol. Belgini ko'rib chiqing X- mahkumlarni axloq tuzatish koloniyalaridan birida ba'zi psixologik xususiyatlar bo'yicha sinovdan o'tkazish ko'rsatkichlarining o'zgaruvchan seriya shaklida taqdim etilgan qiymati:

0,05 ahamiyatlilik darajasida umumiy aholining normal taqsimlanishi haqidagi gipotezani sinab ko'ring.

1. Empirik taqsimotga asoslanib, siz gipotezani ilgari surishingiz mumkin H 0: o'rganilgan atributga ko'ra, "ma'lum bir psixologik xususiyat uchun test ko'rsatkichining qiymati" umumiy aholi soni

kutilganlar normal taqsimlanadi. Muqobil gipoteza 1: mahkumlarning umumiy populyatsiyasi o'rganilgan atribut bo'yicha "ma'lum bir psixologik xususiyat uchun test ko'rsatkichining qiymati" bo'yicha odatda taqsimlanmagan.

2. Raqamli namuna xarakteristikalarini hisoblaymiz:

Intervallar

x g u

NS) SCH

3. Maxsus tuzilgan j 2 xarakteristikani hisoblaymiz. Buning uchun oldingi jadvalning oxirgi ustunida nazariy chastotalarni formula bo'yicha va oxirgi ustunda topamiz.

xarakteristikani hisoblaymiz% 2. olamiz x 2 = 0,185.

Aniqlik uchun biz empirik taqsimot poligonini va nazariy chastotalar uchun normal egri chiziqni quramiz (6-rasm).

Guruch. 6.

4. Erkinlik darajalari sonini aniqlang s: k = 5, m = 2, s = 5-2-1 = 2.

Jadvalga ko'ra yoki standart MS Excel funktsiyasidan foydalangan holda "HI20BR" erkinlik darajalari soni 5 = 2 va ahamiyatlilik darajasi a = 0,05 mezonning kritik qiymatini toping xl P.=5,99. Muhimlik darajasi uchun a= 0,01 kritik mezon qiymati NS%. = 9,2.

5. Mezonning kuzatilgan qiymati NS= barcha topilgan qiymatlardan 0,185 kam Hk R.-> shuning uchun I 0 gipotezasi ikkala ahamiyatlilik darajasida ham qabul qilinadi. Empirik va nazariy chastotalar o'rtasidagi tafovut ahamiyatsiz. Binobarin, kuzatuv ma'lumotlari umumiy aholining normal taqsimlanishi haqidagi gipotezaga mos keladi. Shunday qilib, o'rganilgan mezon bo'yicha "ma'lum bir psixologik xususiyat uchun test ko'rsatkichining qiymati" mahkumlarning umumiy populyatsiyasi normal taqsimlanadi.

  • 1. Koryachko A.V., Kulichenko A.G. Psixologiyada oliy matematika va matematik usullar: Psixologiya fakulteti talabalari uchun amaliy mashg'ulotlar uchun qo'llanma. Ryazan, 1994 yil.
  • 2. Miloddan avvalgi meros Psixologik tadqiqotning matematik usullari. Ma'lumotlarni tahlil qilish va sharhlash: Darslik, o'quv qo'llanma. SPb., 2008 yil.
  • 3. Sidorenko E.V. Psixologiyada matematik ishlov berish usullari. SPb., 2010 yil.
  • 4. Soshnikova L.A. va boshqa Iqtisodiyotda ko'p o'lchovli statistik tahlil: Darslik, universitetlar uchun qo'llanma. M., 1999 yil.
  • 5. Suxodolskiy E.V. Psixologiyada matematik usullar. Xarkov, 2004 yil.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Statistika nazariyasi bo'yicha amaliy mashg'ulot: Darslik, o'quv qo'llanma. M., 2009 yil.
  • Gmurman V.E. Ehtimollar nazariyasi va matematik statistika. 465-bet.

Mezon bo'yicha topshiriqlar

ch 2 mezoni ikki maqsadda qo'llaniladi;

1) bilan belgining empirik taqsimlanishini solishtirish nazariy - bir xil, oddiy yoki boshqacha;

2) taqqoslash uchun ikki, uch yoki undan ortiq empirik bir xil xususiyatni taqsimlash 12.

Kriteriya tavsifi

Mezon ch 2 Xususiyatning turli qiymatlari empirik va nazariy taqsimotlarda bir xil chastotada yoki ikki yoki undan ortiq empirik taqsimotlarda yuzaga keladimi degan savolga javob beradi.

Usulning afzalligi shundaki, u nomlash shkalasidan boshlab har qanday shkalada taqdim etilgan xususiyatlarning taqsimlanishini solishtirish imkonini beradi (1.2-bo'limga qarang). Muqobil taqsimotning eng oddiy holatida "ha - yo'q", "ruxsat etilgan nikoh - nikohga ruxsat bermadi", "muammoni hal qildi - muammoni hal qilmadi" va hokazo, biz allaqachon ch 2 mezonini qo'llashimiz mumkin.

Aytaylik, ma'lum bir kuzatuvchi A nuqtadan B nuqtagacha bo'lgan yo'lda ikkita simmetrik yo'lning o'ng yoki chap tomonini tanlagan piyodalar sonini qayd etadi (4.3-rasmga qarang).

Aytaylik, 70 ta kuzatuv natijasida shundayligi aniqlandi NS\ odamlar to'g'ri yo'lni tanladi va faqat 19 chapni tanladi. ch 2 mezonidan foydalanish biz tanlovlarning berilgan taqsimoti ikkala trek bir xil chastotada namuna olinadigan yagona taqsimotdan farq qilishini aniqlashimiz mumkin. Bu olinganlarni taqqoslashning bir variantidir uhpirik bilan tarqatish nazariy. Bunday vazifa, masalan, arxitektura, aloqa tizimlari va boshqalarda dizayn bilan bog'liq amaliy psixologik tadqiqotlar bo'lishi mumkin.

Ammo tasavvur qilaylik, kuzatuvchi butunlay boshqacha muammoni hal qiladi: u ikki tomonlama tartibga solish muammolari bilan band. Olingan taqsimotning bir xil taqsimot bilan mos kelishi uning ma'lumotlarining boshqa tadqiqotchilarning ma'lumotlari bilan mos kelishi yoki mos kelmasligidan ko'ra uni kamroq qiziqtiradi. U biladiki, o'ng oyog'i ustun bo'lgan odamlar soat miliga teskari, chap oyog'i ustun bo'lgan odamlar esa soat yo'nalishi bo'yicha aylanishadi va 13 hamkasblar tomonidan o'tkazilgan tadqiqotda chap oyoqning ustunligi 26 oyda aniqlangan. so'rovda qatnashgan 100 kishi.

ch 2 usulidan foydalanib, u ikkita empirik taqsimotni solishtirishi mumkin: o'z namunasida 51:19 nisbat va boshqa tadqiqotchilarning namunasida 74:26 nisbat.

Bu variant ikki empirik taqqoslash eng oddiy muqobil mezon bo'yicha taqsimlash (albatta, matematik nuqtai nazardan eng oddiy va hech qanday psixologik emas).

Xuddi shunday, biz uchta yoki undan ko'p muqobil variantlardan tanlov taqsimotini solishtirishimiz mumkin. Misol uchun, agar 50 kishidan iborat tanlovda 30 kishi (a) javobni, 15 kishi - (b) javobni va 5 kishi - javobni (c) tanlagan bo'lsa, biz ushbu taqsimotning farqlanishini tekshirish uchun ch 2 usulidan foydalanishimiz mumkin. yagona taqsimotdan yoki javoblarni boshqa namunadagi taqsimlashdan, bunda (a) javob 10 kishi tomonidan tanlangan, (b) javob -25 kishi, (c) javob - 15 kishi.

Xususiyat miqdoriy jihatdan o'lchanadigan hollarda, aytaylik: v nuqtalar, soniyalar yoki millimetrlar, biz atribut qiymatlarining barcha ko'pligini bir nechta raqamlarda birlashtirishimiz kerak bo'lishi mumkin. Masalan, masalani yechish vaqti 10 dan 300 sekundgacha o'zgarsa, namuna hajmiga qarab 10 yoki 5 ta raqamni kiritishimiz mumkin. Masalan, bu zaryadsizlanishlar bo'ladi: 0-50 soniya; 51-100 soniya; 101-150 soniya va hokazo. Keyin ch 2 usulidan foydalanamiz xususiyatning turli toifalarining paydo bo'lish chastotalarini taqqoslaydi, ammo sxematik diagrammaning qolgan qismi o'zgarmaydi.

Empirik taqsimotni nazariy bilan solishtirganda, biz empirik va nazariy chastotalar o'rtasidagi nomuvofiqlik darajasini aniqlaymiz.

Ikki empirik taqsimotni solishtirib, biz empirik chastotalar va bu ikki empirik taqsimot bir-biriga to‘g‘ri kelganda kuzatiladigan nazariy chastotalar o‘rtasidagi nomuvofiqlik darajasini aniqlaymiz. Nazariy chastotalarni hisoblash uchun formulalar har bir taqqoslash varianti uchun maxsus beriladi.

Qarama-qarshilik qanchalik katta bo'lsa ikki taqqoslanadigan taqsimot o'rtasida, ko'proq empirik y qiymati).

Gipotezalar

Vazifalarga qarab gipotezalarning bir nechta variantlari mumkin:

biz o'z oldimizga qo'yganmiz.

Birinchi variant:

N 0: Belgining olingan empirik taqsimoti nazariy (masalan, bir xil) taqsimotdan farq qilmaydi.

H 1: Xususiyatning natijada empirik taqsimoti nazariy taqsimotdan farq qiladi.

Ikkinchi variant:

H 0: Empirik taqsimot 1 empirik taqsimotdan 2 farq qilmaydi.

H 1: Empirik taqsimot 1 empirik taqsimot 2dan farq qiladi.

Uchinchi variant:

H 0: Empirik taqsimotlar 1, 2, 3, ... bir-biridan farq qilmaydi.

H 1: Empirik taqsimotlar 1, 2, 3, ... bir-biridan farq qiladi.

ch 2 mezoni barcha uchta gipotezani sinab ko'rish imkonini beradi.

Mezonning grafik tasviri

Keling, A nuqtadan B nuqtagacha bo'lgan yo'lda o'ng yoki chap yo'llarni tanlash misolini ko'rsatamiz. 4.4 Chap trekni tanlash chastotasi chap chiziq bilan, o'ng trekni tanlash chastotasi esa gistogramma 14 o'ng satri bilan ifodalanadi. Ordinatlar o'qida tanlashning nisbiy chastotalari o'lchanadi, ya'ni kuzatuvlarning umumiy soniga tegishli bo'lgan ma'lum bir yo'lni tanlash chastotalari. Chap trek uchun chastota deb ham ataladigan nisbiy chastota 19/70, ya'ni 0,27 va o'ng trek uchun 51/70, ya'ni 0,73 ni tashkil qiladi.

Agar ikkala trek ham teng darajada tanlangan bo'lsa, sub'ektlarning yarmi o'ng yo'lni, yarmi esa chapni tanlaydi. Har bir trekni tanlash ehtimoli 0,50 ni tashkil qiladi.

Ko'ramizki, empirik chastotalarning ushbu qiymatdan og'ishi ancha sezilarli. Ehtimol, empirik va nazariy taqsimot o'rtasidagi farqlar sezilarli bo'ladi.

Shaklda. 4.5 aslida ikkita gistogrammani taqdim etadi, lekin barlar shunday guruhlanganki, chap tomonda chap yo'lni afzal ko'rish chastotalari bizning kuzatuvchimiz (1) va T.A. namunasida taqqoslanadi. Dobroxotova va N.N. Bragina (2), va o'ngda - bir xil ikkita namunadagi o'ng chiziqli afzalliklarning chastotalari.

Biz namunalar orasidagi tafovutlar juda ahamiyatsiz ekanligini ko'ramiz. ch2 mezon, katta ehtimol bilan, bu ikki taqsimotning mos kelishini tasdiqlaydi.

Kriteriyaning cheklovlari

1. Namuna hajmi etarlicha katta bo'lishi kerak: NS30. Da NS<30 критерий ch2 juda taxminiy qiymatlarni beradi. Mezonning aniqligi umuman ortadi NS.

2. Jadvaldagi har bir katak uchun nazariy chastota 5 dan kam bo'lmasligi kerak: f> 5. Bu shuni anglatadiki, agar raqamlar soni oldindan belgilab qo'yilgan bo'lsa va uni o'zgartirish mumkin bo'lmasa, u holda biz kuzatishlarning ma'lum bir minimal sonini to'plamasdan ch2 usulini qo'llashimiz mumkin emas. Agar, masalan, biz ishonchli telefon xizmatiga qo'ng'iroqlar chastotasi haftaning 7 kunida notekis taqsimlanganligi haqidagi taxminlarimizni sinab ko'rmoqchi bo'lsak, unda bizga 5 * 7 = 35 qo'ng'iroq kerak bo'ladi. Shunday qilib, agar raqamlar soni ( k) oldindan berilgan, bu holatda bo'lgani kabi, kuzatishlarning minimal soni ( n min) formula bilan aniqlanadi: n min = k*5.

3. Tanlangan raqamlar butun taqsimotni "chiqib olishi", ya'ni xususiyatlarning o'zgaruvchanligining butun doirasini qamrab olishi kerak. Bunday holda, raqamlarga guruhlash barcha solishtirilgan taqsimotlarda bir xil bo'lishi kerak.

4. Faqat 2 ta qiymatni qabul qiluvchi xarakteristikalar taqsimotini solishtirishda “uzluksizlikni tuzatish” qilish kerak. Tuzatish amalga oshirilganda, ch 2 qiymati kamayadi (davomiylik uchun tuzatish misoliga qarang).

5. Raqamlar bir-biriga mos kelmasligi kerak: agar kuzatuv bitta toifaga berilgan bo'lsa, uni boshqa toifaga kiritish mumkin emas.

Kategoriyalar bo'yicha kuzatishlar yig'indisi har doim kuzatuvlarning umumiy soniga teng bo'lishi kerak.

Kuzatishlar soni nima deb hisoblanadi, degan savol qonuniydir - tanlovlar, reaktsiyalar, harakatlar soni yoki tanlovni amalga oshiradigan, reaktsiyalarni ko'rsatadigan yoki harakatlarni amalga oshiradigan sub'ektlar soni. Agar mavzu bir nechta reaktsiyalarni ko'rsatsa va ularning barchasi qayd etilgan bo'lsa, unda sub'ektlar soni reaktsiyalar soniga to'g'ri kelmaydi. Biz har bir sub'ektning reaktsiyalarini umumlashtirishimiz mumkin, masalan, u muvaffaqiyat motivatsiyasini o'rganish uchun Hekxauzen usulida yoki S. Rosenzweig umidsizlikka chidamlilik testida amalga oshiriladi va bir nechta namunalardagi reaktsiyalarning individual summalarining taqsimlanishini solishtiring.

Bunday holda, kuzatishlar soni sub'ektlar soni bo'ladi. Agar biz namunadagi ma'lum turdagi reaktsiyalarning chastotasini bir butun sifatida hisoblasak, unda biz har xil turdagi reaktsiyalarning taqsimlanishini olamiz va bu holda kuzatuvlar soni ro'yxatga olingan reaktsiyalarning umumiy soniga teng bo'ladi. mavzular soni.

Matematik nuqtai nazardan, ikkala holatda ham bit mustaqilligi qoidasi kuzatiladi: bitta kuzatish taqsimotning bir va faqat bitta bitiga tegishli.

Tadqiqotning bir variantini tasavvur qilish mumkin, unda biz bitta mavzu bo'yicha tanlovlarni taqsimlashni o'rganamiz. Kognitiv-xulq-atvor terapiyasida, masalan, mijozdan istalmagan reaktsiyaning aniq vaqtini qayd etish so'raladi, masalan, qo'rquv, tushkunlik, g'azabning portlashi, o'zini kamsituvchi fikrlar va boshqalar tez-tez paydo bo'ladi, va mijozga salbiy reaktsiyalarning oldini olish uchun individual dastur yaratishga yordam beradi.

ch2 mezonidan foydalanish mumkinmi? Bu individual taqsimotda ba'zi soatlar tez-tez, boshqalari esa kamroq ekanligini isbotlash uchun? Barcha kuzatishlar bog'liq, chunki ular bir mavzuga tegishli; shu bilan birga, barcha razryadlar bir-biriga mos kelmaydi, chunki bir xil hujum bitta va faqat bitta razryadni bildiradi (bu holda, tushdan keyin soat birda). Ko'rinib turibdiki, bu holda ch2 usulini qo'llash ma'lum bir soddalashtirish bo'ladi. Qo'rquv, g'azab yoki tushkunlik hujumlari kun davomida qayta-qayta sodir bo'lishi mumkin va ma'lum bo'lishicha, erta tongda, soat 6 da va kechki soat 12 da hujumlar odatda bir kunda birga sodir bo'ladi. : bir vaqtning o'zida, 3 soatlik kunlik hujum avvalgi hujumdan bir kundan keyin va keyingi hujumdan kamida ikki kun oldin paydo bo'ladi va hokazo. Ko'rinishidan, biz murakkab matematik model yoki shunga o'xshash narsa haqida gapiramiz , bu mumkin emas. "algebra tomonidan ishoniladi". Va shunga qaramay, amaliy maqsadlar uchun mezondan bir odamda har qanday muhim voqealar, tanlovlar, afzalliklar va boshqalarning boshlanishining muntazam notekisligini aniqlash uchun foydalanish foydali bo'lishi mumkin.

Shunday qilib, xuddi shunday kuzatish faqat bitta toifaga tegishli bo'lishi kerak. Ammo har bir mavzuni kuzatish yoki sub'ektning har bir tekshirilgan reaktsiyasi sifatida ko'rib chiqish - bu savol, uning echimi tadqiqot maqsadlariga bog'liq (qarang, masalan, Ganzen V.A., Balin V.D., 1991, 10-bet).

Mezonning asosiy "cheklovi" χ 2 - bu ko'pchilik tadqiqotchilar uchun juda qiyin ko'rinadi.

Keling, mezonning tushunarsiz qiyinligi haqidagi afsonani engishga harakat qilaylik χ 2 . Vaziyatni ziravor qilish uchun, kulgili adabiy misolni ko'rib chiqing.

h2 Pearson testi

Tarqatish qonunining muvaffaqiyatli yoki muvaffaqiyatsiz tanlovi aniqlanadigan mezonlar odatda kelishuv mezonlari bilan belgilanadi. C.Pirsonning 2-mezoni taqsimot qonuni haqidagi oddiy gipotezani tekshirish uchun eng ko'p qo'llaniladigan mezondir. U eksperimental ma'lumotlarning noma'lum zichlik uchun ishonch mintaqasini qurishga xizmat qiladigan bir xil miqdorning gipotetik taqsimotidan og'ish o'lchovi sifatida, tushish ehtimolining noma'lum haqiqiy qiymatlarini almashtirishga asoslangan. gipotetik taqsimotdan hisoblangan ehtimollar bo'yicha intervallarga. Tasodifiy o'zgaruvchining mumkin bo'lgan qiymatlari diapazoni r oraliqlariga bo'lingan deylik (ko'p o'lchovli, ya'ni vektor miqdorida to'rtburchaklar). n ta tajriba natijasida olingan bu intervallarni urishning tasodifiy chastotalari bo'lsin, P1, ..., Pr - faraziy taqsimotdan hisoblangan bir xil intervallarni urish ehtimoli.

Umumiy holda, bu ehtimolliklar bir xil eksperimental ma'lumotlardan olingan noma'lum parametrlarni baholash funktsiyalari va shuning uchun ham tasodifiy miqdorlardir. Faraz qilaylik, gipotetik taqsimotning noma'lum parametrlarini baholash chastotalar bilan bir xil yig'ilgan namunadan hisoblangan. Keyin P1, ..., Pr ehtimolliklari chastotalarning ba'zi funktsiyalari bo'ladi va eksperimental ma'lumotlarning gipotetik taqsimotdan chetlanishini baholash uchun qiymatni oling.

Bu erda R1, ..., Pr - chastotalarning ma'lum funktsiyalari.

Neyman va Pirson shuni ko'rsatdiki, agar P1, ..., Pr ehtimolliklarini hisoblash uchun guruhlangan tanlama bo'yicha gipotetik taqsimotning noma'lum s o'lchovli parametrini asimptotik jihatdan samarali va asimptotik normal baholashdan foydalanilsa, u holda formula bilan aniqlangan Z qiymati (1), chegarada n -> sifatida? r-s-1 erkinlik darajalari bilan ch2 - taqsimotga ega.

Ushbu teoremadan foydalanib, n2 taqsimot jadvallari yordamida eksperimental ma'lumotlar va gipotetik taqsimot o'rtasidagi nomuvofiqlikni baholash mumkin. Biz etarlicha kichik p ehtimollikni tanlaymiz, shunda bunday ehtimollikka ega bo'lgan hodisani amalda imkonsiz deb hisoblash mumkin va biz tenglamadan aniqlaymiz.

Agar tajribalar natijasida olingan Z qiymatining realizatsiyasi = 2 dan oshsa yoki teng bo'lsa, = 2, u holda gipotetik taqsimot eksperimental ma'lumotlarga mos kelmaydigan hisoblanadi, chunki bu taqsimot bilan uni olish deyarli mumkin emas. bitta namuna bilan = 2. Ko'p sonli tajribalar uchun bunday hodisaning ehtimoli n taxminan p ga teng, ya'ni. ahamiyatsiz. Bunday holda, eksperimental ma'lumotlarning faraziy taqsimotdan sezilarli og'ishi borligi aytiladi. Agar = 2 bo'lsa, u holda gipotetik taqsimot eksperimental ma'lumotlarga zid emas, ular bilan rozi bo'ladi, deb ishoniladi.

Qiymat namunaning gipotetik taqsimotdan chetlanishining 100p-foizlilik darajasi deb ataladi. Odatda vazifaning xususiyatiga qarab 5%, 1% va 0,1% ahamiyatlilik darajalari qo'llaniladi.

Eksperimental ma'lumotlarning gipotetik taqsimotga muvofiqligini qo'shimcha ravishda tekshirish uchun ma'lum gipotetik taqsimot uchun Z qiymati uni amalga oshirish tajribalari natijasida olingan qiymatdan kattaroq bo'lish ehtimolini hisoblash foydalidir = 2, P (Z> 2).Bu ehtimollik qanchalik katta bo'lsa, tanlanma gipotetik taqsimotga qanchalik yaxshi mos kelsa, tanlanma va faraziy taqsimot o'rtasidagi olingan tafovutning ahamiyati shunchalik kam bo'ladi. Haqiqatan ham, agar P (Z> 2) ehtimolligi yuqori bo'lsa, unda ushbu tajribalar seriyasini takrorlashda, taqsimot haqidagi tanlangan gipoteza to'g'ri bo'lsa, ko'pincha Z ning qiymatlari olingan qiymatdan ham kattaroq bo'ladi. tajribalar natijasida = 2.

Qabul qilganingizdan so'ng = 2 ekanligiga e'tibor bering< и даже получив высокую вероятность P(Z >2), biz tanlangan taqsimot gipotezasi to'g'ri ekanligi haqida aniq xulosa chiqarmaymiz, lekin biz faqat bu gipoteza olingan eksperimental natijalarga zid emasligini, ular bilan mos kelishini, natijada uni qabul qilish mumkinligini aytamiz. Tasodifiy o'zgaruvchining haqiqatan ham gipotetik taqsimot qonuniga bo'ysunishi haqida etarlicha kuchli dalil olish uchun ushbu tajribalar seriyasini etarlicha ko'p marta takrorlash va gipotezaning eksperimental natijalar bilan olingan muvofiqligi barqaror ekanligiga ishonch hosil qilish kerak.

Kolmogorov mezoni

Kolmogorov mezoni - yordamchi mezon

Asosiy mezonning P-qiymati taqsimotining bir xilligini tekshirish uchun yordamchi mezon sifatida bu ishda biz Kolmogorov mezonidan foydalanamiz.

Kolmogorov mezoni statistik taqsimot funksiyasi F ^ * (x) va tegishli nazariy taqsimot funksiyasi F (x, ya'ni D = max | F ^ * (x) -F (x) o'rtasidagi farq modulining maksimal qiymatini ko'rib chiqadi | .

Keyingi qadam l = D qiymatini aniqlashdir. Statistik jadvallarga ko'ra (matcalc muhitida pvKolm (u) funksiyasi) bu tasodifiy sabablarga ko'ra F ^ * (x) va F (x) o'rtasidagi maksimal tafovut haqiqatda kuzatilganidan kam bo'lmasligi ehtimoli. . Agar P (n) ehtimolligi nisbatan yuqori bo'lsa, u holda gipotezani qabul qilish kerak, agar juda kichik bo'lsa, u holda rad etilishi mumkin emas.

Ilovani ko'rib chiqingXONIMEXCELoddiy farazlarni tekshirish uchun Pearson chi-kvadrat testi.

Eksperimental ma'lumotlarni olgandan so'ng (ya'ni, ba'zi namuna), odatda berilgan tomonidan ifodalangan tasodifiy o'zgaruvchini eng yaxshi tavsiflovchi taqsimot qonuni tanlanadi namuna olish... Eksperimental ma'lumotlarning tanlangan nazariy taqsimot qonuni bilan qanchalik to'g'ri tasvirlanganligini tekshirish yordamida amalga oshiriladi rozilik mezonlari. Nol gipoteza, odatda tasodifiy miqdorning taqsimlanishining ba'zi bir nazariy qonunga tengligi haqida gipoteza mavjud.

Avval arizani ko'rib chiqaylik Pearsonning moslik testi X 2 (chi-kvadrat) oddiy gipotezalarga nisbatan (nazariy taqsimotning parametrlari ma'lum deb hisoblanadi). Keyin -, faqat taqsimotning shakli ko'rsatilganda va bu taqsimotning parametrlari va qiymati statistika X 2 Shu asosida baholanadi/hisoblanadi namuna olish.

Eslatma: Ingliz tilidagi adabiyotlarda ariza topshirish tartibi Pearsonning muvofiqlik testi X 2 unvoniga ega Ki-kvadrat mosligi testi.

Gipotezani tekshirish jarayonini eslang:

  • asosida namuna olish qiymati hisoblanadi statistika, bu tekshirilayotgan gipoteza turiga mos keladi. Masalan, for ishlatiladi t-statistika(agar ma'lum bo'lmasa);
  • haqiqatga bo'ysunadi nol gipoteza, buning taqsimlanishi statistika ma'lum va ehtimolliklarni hisoblash uchun ishlatilishi mumkin (masalan, uchun t-statistika bu );
  • asosida hisoblangan namuna olish ma'nosi statistika berilgan qiymat uchun kritik qiymat bilan solishtirganda ();
  • nol gipoteza qiymat bo'lsa, rad eting statistika kritikdan ko'proq (yoki bu qiymatni olish ehtimoli bo'lsa statistika() kichikroq ahamiyat darajasi, bu ekvivalent yondashuv).

Biz amalga oshiramiz gipoteza sinovi turli tarqatishlar uchun.

Diskret holat

Aytaylik, ikki kishi zar o‘ynayapti. Har bir o'yinchi turli xil zarlar to'plamiga ega. O'yinchilar bir vaqtning o'zida 3 ta zarni navbatma-navbat tashlaydilar. Har bir turda bir vaqtning o'zida ko'proq oltitani aylantirgan kishi g'alaba qozonadi. Natijalar qayd qilinadi. 100 raunddan so'ng o'yinchilardan biri raqibining zarlari assimetrik ekanligiga shubha qildi, chunki u tez-tez g'alaba qozonadi (ko'pincha oltitani tashlaydi). U raqibning bunday ko'p sonli natijalari qanchalik ehtimoli borligini tahlil qilishga qaror qildi.

Eslatma: Chunki zar 3, keyin siz bir vaqtning o'zida 0 ni tashlashingiz mumkin; 1; 2 yoki 3 oltita, ya'ni. tasodifiy o'zgaruvchi 4 ta qiymatni qabul qilishi mumkin.

Ehtimollar nazariyasidan bilamizki, agar kublar simmetrik bo'lsa, oltita olish ehtimoli bo'ysunadi. Shuning uchun, 100 turdan so'ng, oltitalarning chastotalarini formuladan foydalanib hisoblash mumkin
= BINOM.DIST (A7; 3; 1/6; FALSE) * 100

Formula hujayrada bo'lishini nazarda tutadi A7 bir turda tushgan oltitaning mos keladigan sonini o'z ichiga oladi.

Eslatma: Hisob-kitoblar keltirilgan Diskret varaqdagi misol fayli.

Taqqoslash uchun kuzatilgan(Kuzatilgan) va nazariy chastotalar(Kutilgan) foydalanish uchun qulay.

Kuzatilgan chastotalarning nazariy taqsimotdan sezilarli og'ishi bilan, nol gipoteza tasodifiy o'zgaruvchini nazariy qonunga muvofiq taqsimlash bo'yicha, rad etilishi kerak. Ya'ni, agar raqibning zarlari assimetrik bo'lsa, u holda kuzatilgan chastotalar "sezilarli darajada farq qiladi". binomial taqsimot.

Bizning holatlarimizda, birinchi qarashda, chastotalar juda yaqin va hisob-kitoblarsiz aniq xulosa chiqarish qiyin. Qo'llanilishi mumkin Pearsonning moslik testi X 2, shunday qilib, sub'ektiv bayonot o'rniga "sezilarli farq qiladi" taqqoslash asosida amalga oshirilishi mumkin gistogrammalar, matematik jihatdan to'g'ri bayonotdan foydalaning.

Biz buni tufayli foydalanamiz katta sonlar qonuni ortib borayotgan hajm bilan kuzatilgan chastota (Kuzatilgan). namuna olish n nazariy qonunga mos keladigan ehtimollikka intiladi (bizning holatda, binom qonuni). Bizning holatda, namuna hajmi n 100 ga teng.

tanishtirish sinov statistika, biz X 2 ni belgilaymiz:

Bu erda O l - tasodifiy o'zgaruvchining ma'lum ruxsat etilgan qiymatlarni olgan hodisalarning kuzatilgan chastotasi, E l - mos keladigan nazariy chastota (Kutilayotgan). L - tasodifiy o'zgaruvchi qabul qilishi mumkin bo'lgan qiymatlar soni (bizning holatlarimizda bu 4).

Formuladan ko'rinib turibdiki, bu statistika kuzatilgan chastotalarning nazariy bo'lganlarga yaqinligining o'lchovidir, ya'ni. bu chastotalar orasidagi "masofalarni" baholash uchun ishlatilishi mumkin. Agar bu "masofalar" yig'indisi "juda katta" bo'lsa, unda bu chastotalar "sezilarli darajada farq qiladi". Bizning kubimiz nosimmetrik bo'lsa (ya'ni, biz amal qilamiz) aniq binom qonuni), u holda "masofalar" yig'indisi "juda katta" bo'lish ehtimoli kichik bo'ladi. Ushbu ehtimollikni hisoblash uchun biz taqsimotni bilishimiz kerak statistika X 2 ( statistika X 2 tasodifiy asosida hisoblanadi namuna olish, shuning uchun u tasodifiy o'zgaruvchidir va shuning uchun o'ziga xosdir ehtimollik taqsimoti).

Ko'p o'lchovli analogdan Moivr-Laplasning integral teoremasi ma'lumki, n-> ∞ uchun tasodifiy o'zgaruvchimiz X 2 asimptotik tarzda L - 1 erkinlik darajasiga ega.

Shunday qilib, hisoblangan qiymat bo'lsa statistika X 2 (chastotalar orasidagi "masofalar" yig'indisi) ma'lum bir chegara qiymatidan kattaroq bo'ladi, keyin biz rad etish uchun sabab bo'ladi. nol gipoteza... Tekshirishda bo'lgani kabi parametrik farazlar, chegara qiymati orqali o'rnatiladi ahamiyat darajasi... Agar X 2 statistikasi hisoblangan qiymatdan kichik yoki teng qiymatni olish ehtimoli ( p-ma'nosi) kamroq bo'ladi ahamiyat darajasi, keyin nol gipoteza rad etish mumkin.

Bizning holatda, statistika 22,757 ni tashkil qiladi. X 2 statistikasining 22,757 dan katta yoki unga teng qiymat olishi ehtimoli juda kichik (0,000045) va uni formulalar yordamida hisoblash mumkin.
= CHI2.DIST.RF (22.757; 4-1) yoki
= CHI2.TEST (kuzatilgan; kutilgan)

Eslatma: CHI2.TEST () funktsiyasi ikkita toifali o'zgaruvchilar orasidagi bog'lanishni tekshirish uchun maxsus ishlab chiqilgan (qarang).

0,000045 ehtimoli odatdagidan sezilarli darajada kamroq ahamiyat darajasi 0,05. Demak, o'yinchi raqibini insofsizlikda gumon qilish uchun barcha asoslarga ega ( nol gipoteza uning halolligi rad etiladi).

Murojaat qilganda mezon X 2 hajmini ta'minlash zarur namuna olish n etarlicha katta edi, aks holda taqsimotning yaqinlashishi statistika X 2... Odatda, buning uchun kuzatilgan chastotalar (Kuzatilgan) 5 dan katta bo'lishi kifoya deb taxmin qilinadi. Agar bunday bo'lmasa, kichik chastotalar birlashtiriladi yoki boshqa chastotalarga qo'shiladi va birlashtirilgan qiymat umumiy ehtimollik bilan belgilanadi. va shunga mos ravishda erkinlik darajalari soni kamayadi X 2 - taqsimotlar.

Qo'llash sifatini oshirish uchun mezon X 2(), bo'linish oraliqlarini kamaytirish kerak (L ni oshirish va shunga mos ravishda sonni oshirish). erkinlik darajalari), ammo bunga har bir intervalga (b.b.> 5) to'g'ri keladigan kuzatuvlar sonining cheklanishi to'sqinlik qiladi.

Davomiy holat

Pearsonning muvofiqlik testi X 2 hollarda xuddi shunday qo'llanilishi mumkin.

Muayyan narsani ko'rib chiqing namuna olish 200 ta qiymatdan iborat. Nol gipoteza Buni bildiradi namuna dan yasalgan.

Eslatma: Tasodifiy qiymatlar Ish varag'idagi misol fayli Continuous formula bilan hosil qilingan = NORM.ST.OBR (RAND ())... Shuning uchun yangi ma'nolar namuna olish varaq har safar qayta hisoblanganda hosil bo'ladi.

Mavjud ma'lumotlar to'plamining etarli yoki yo'qligini vizual baholash mumkin.

Diagrammadan ko'rinib turibdiki, namunaviy qiymatlar to'g'ri chiziq bo'ylab juda mos keladi. Biroq, uchun bo'lgani kabi gipoteza sinovi amal qiladi Pearsonning moslik mezoni X 2.

Buning uchun tasodifiy miqdorning o'zgarish diapazonini 0,5 qadamli intervallarga ajratamiz. Kuzatilgan va nazariy chastotalarni hisoblab chiqamiz. Kuzatilgan chastotalar FREQUENCY () funksiyasi, nazariylari esa NORM.ST.DIST () funksiyasi yordamida hisoblab chiqiladi.

Eslatma: kelsak diskret holat, buni ta'minlash zarur namuna etarlicha katta edi va > 5 qiymat intervalga tushdi.

Biz X 2 statistikasini hisoblaymiz va uni berilgan uchun kritik qiymat bilan solishtiramiz ahamiyat darajasi(0,05). Chunki biz tasodifiy o'zgaruvchining o'zgarish diapazonini 10 oraliqga ajratdik, keyin erkinlik darajalari soni 9. Kritik qiymat formula bo'yicha hisoblanishi mumkin.
= CHI2.OBR.PH (0,05; 9) yoki
= CHI2.OBR (1-0,05; 9)

Yuqoridagi diagrammada siz statistika 8,19 ni tashkil etganini ko'rishingiz mumkin, bu sezilarli darajada yuqori tanqidiynol gipoteza rad etilmaydi.

Quyida qaerda ko'rsatilgan namuna mumkin bo'lmagan qiymatni qabul qildi va asoslangan mezon Pearson roziligi X 2 nol gipoteza rad etildi (garchi tasodifiy qiymatlar formuladan foydalangan holda yaratilgan bo'lsa ham). = NORM.ST.OBR (RAND ()) ta'minlash namuna olish dan standart normal taqsimot).

Nol gipoteza Vizual ravishda ma'lumotlar to'g'ri chiziqqa juda yaqin joylashgan bo'lsa-da, rad etilgan.

Misol tariqasida ham oling namuna olish U dan (-3; 3). Bunday holda, hatto grafikdan ham bu aniq nol gipoteza rad etilishi kerak.

Mezon Pearson roziligi X 2 ham buni tasdiqlaydi nol gipoteza rad etilishi kerak.

Oldingi eslatmalarda raqamli va toifali ma'lumotlar haqidagi gipotezalarni sinab ko'rish tartiblari tavsiflangan: bir nechta, shuningdek, bitta yoki bittasini o'rganishga imkon beradi. Ushbu eslatmada biz bir nechta mustaqil namunalar asosida umumiy populyatsiyalardagi xususiyat ulushlari o'rtasidagi farqlar haqidagi farazlarni tekshirish usullarini ko'rib chiqamiz.

Amaldagi usullarni ko'rsatish uchun TS Resort Properties kompaniyasiga tegishli mehmonxonalar mehmonlarining qoniqish darajasi qo'llaniladigan stsenariy qo'llaniladi. Tasavvur qiling-a, siz ikkita kurort orolida joylashgan beshta mehmonxonaga ega bo'lgan kompaniyaning menejerisiz. Agar mehmonlar xizmatdan mamnun bo'lsalar, ehtimol ular keyingi yil qaytib kelishadi va do'stlariga mehmonxonangizda qolishni tavsiya qiladilar. Xizmat ko'rsatish sifatini baholash uchun mehmonlardan so'rovnomani to'ldirishlari va mehmondo'stlikdan qoniqishlarini ko'rsatishlari so'raladi. Siz so'rov ma'lumotlarini tahlil qilishingiz, mehmonlarning so'rovlaridan umumiy qoniqish darajasini aniqlashingiz, mehmonlarning kelgusi yil yana kelishi ehtimolini baholashingiz, shuningdek, ba'zi mijozlarning noroziligi sabablarini aniqlashingiz kerak. Masalan, orollardan birida kompaniya Beachcomber va Windsurfer mehmonxonalariga egalik qiladi. Bu mehmonxonalarda xizmat bir xilmi? Agar yo'q bo'lsa, kompaniya sifatini yaxshilash uchun ushbu ma'lumotlardan qanday foydalanish mumkin? Bundan tashqari, agar ba'zi mehmonlar sizga boshqa kelmasliklarini aytishsa, ular qanday sabablarni boshqalarga qaraganda tez-tez ko'rsatadilar? Ushbu sabablar faqat ma'lum bir mehmonxonaga taalluqli va butun kompaniyaga taalluqli emas, deb bahslashish mumkinmi?

Bu erda quyidagi belgi qo'llaniladi: X 1 - birinchi guruhdagi muvaffaqiyatlar soni, X 2 - ikkinchi guruhdagi muvaffaqiyatlar soni; n 1 X 1 - birinchi guruhdagi muvaffaqiyatsizliklar soni; n 2 X 2 - ikkinchi guruhdagi muvaffaqiyatsizliklar soni; X =X 1 + X 2 - muvaffaqiyatlarning umumiy soni, nX = (n 1 X 1 ) + (n 2 X 2 ) - buzilishlarning umumiy soni, n 1 - birinchi namunaning hajmi, n 2 - ikkinchi namunaning hajmi, n = n 1 + n 2 - namunalarning umumiy hajmi. Ko'rsatilgan jadval ikkita satr va ikkita ustunga ega, shuning uchun u 2 × 2 faktorli jadval deb ataladi. Har bir satr va ustunning kesishmasidan hosil bo'lgan katakchalar muvaffaqiyat yoki muvaffaqiyatsizliklar sonini o'z ichiga oladi.

Keling, yuqorida tavsiflangan stsenariy misolidan foydalanib, favqulodda vaziyatlar jadvalini qo'llashni ko'rsatamiz. Faraz qilaylik, “Keyingi yil qaytib kelasizmi?” degan savol. Beachcomberdagi 227 mehmondan 163 tasi va Windsurferdagi 262 mehmondan 154 tasi "ha" deb javob berdi. Ahamiyat darajasi 0,05 bo'lsa, mehmonxona mehmonlarining qoniqish darajasi o'rtasida statistik jihatdan muhim farq bormi (mehmonlarning keyingi yil qaytishi ehtimolini ifodalaydi)?

Guruch. 2. Mehmonlarga xizmat ko'rsatish sifatini baholash uchun 2x2 faktor jadvali

Birinchi qatorda har bir mehmonxonaning keyingi yil qaytish istagini bildirgan mehmonlar soni ko'rsatilgan (muvaffaqiyat); ikkinchi qatorda norozilik (qobiliyatsizlik) bildirgan mehmonlar soni ko'rsatilgan. “Jami” ustunida joylashgan kataklarda kelasi yil mehmonxonaga qaytishni rejalashtirgan mehmonlarning umumiy soni, shuningdek, xizmatdan norozi bo‘lgan mehmonlarning umumiy soni ko‘rsatilgan. "Jami" qatoridagi katakchalarda har bir mehmonxona uchun so'ralgan mehmonlarning umumiy soni ko'rsatilgan. Qaytishni rejalashtirayotgan mehmonlarning nisbati, buni aytgan mehmonlar sonini ma'lum bir mehmonxona uchun so'ralgan mehmonlarning umumiy soniga bo'lish yo'li bilan hisoblanadi. Keyin hisoblangan aktsiyalarni solishtirish uchun ch 2 testi qo'llaniladi.

Nol va muqobil gipotezalarni sinab ko'rish H 0: p 1 = p 2; H 1: p 1 ≠ p 2 testdan foydalanamiz ch 2 -statistik.

Ikki aktsiyani solishtirish uchun Chi-kvadrat testi. Test ch 2 statistikasi kuzatilgan va kutilgan muvaffaqiyatlar soni o'rtasidagi farqlarning kvadratlari yig'indisi jadvalning har bir katakchasidagi kutilgan muvaffaqiyatlar soniga bo'linadi:

qayerda f 0- favqulodda vaziyatlar jadvalining ma'lum bir katagida kuzatilgan muvaffaqiyatlar yoki muvaffaqiyatsizliklar soni; f e

Test ch 2 -statistika ch 2 -bir daraja erkinlik bilan taqsimlanishi bilan yaqinlashadi.

Yoki favqulodda vaziyatlar jadvalining har bir katakchasidagi muvaffaqiyatsizliklar, ularning ma'nosini tushunishingiz kerak. Agar nol gipoteza to'g'ri bo'lsa, ya'ni. ikki populyatsiyadagi muvaffaqiyat nisbati teng, ikkala guruhning har biri uchun hisoblangan namunaviy nisbatlar faqat tasodifiy sabablarga ko'ra bir-biridan farq qilishi mumkin va ikkala nisbat ham umumiy populyatsiyaning umumiy parametrining taxminidir. R... Bunday holatda, har ikkala ulushni bitta umumiy (o'rtacha) parametr bahosida birlashtirgan statistika R , birlashtirilgan guruhlardagi jami muvaffaqiyat darajasini ifodalaydi (ya'ni, muvaffaqiyatlarning umumiy sonining umumiy namuna hajmiga bo'linganiga teng). Uning qo'shimchasi, 1 – , birlashtirilgan guruhlardagi umumiy nosozlik darajasini ifodalaydi. Ma'nosi rasmdagi jadvalda tasvirlangan belgilar yordamida. 1.Parametrni hisoblash uchun (2) formulani olishingiz mumkin :

qayerda - xususiyatning o'rtacha ulushi.

Kutilayotgan muvaffaqiyatlar sonini hisoblash fe(ya'ni, favqulodda vaziyatlar jadvalining birinchi qatorining mazmuni), namuna hajmini parametr bilan ko'paytirish kerak ... Kutilgan nosozliklar sonini hisoblash uchun f e(ya'ni, favqulodda vaziyatlar jadvalining ikkinchi qatorining mazmuni), tanlov hajmini parametr bilan ko'paytirish kerak 1 – .

Formula (1) bo'yicha hisoblangan test statistik ma'lumotlari bir erkinlik darajasi bilan ch 2 - taqsimoti bilan yaqinlashadi. Berilgan ahamiyatlilik a darajasida, agar hisoblangan ch 2 -statistika ch U 2 dan katta bo'lsa, nol gipoteza rad etiladi, ch 2 - taqsimotning yuqori kritik qiymati bir erkinlik darajasi bilan. Shunday qilib, qaror qoidasi quyidagicha: gipoteza H 0 ch 2> ch U 2 bo'lsa, rad etiladi, aks holda gipoteza H 0 chetga chiqmaydi (3-rasm).

Guruch. 3. Kritik maydon ch 2 -ahamiyat darajasidagi aktsiyalarni solishtirish mezoni

Agar nol gipoteza to'g'ri bo'lsa, hisoblangan ch 2 statistikasi nolga yaqin bo'ladi, chunki kuzatilganlar orasidagi kvadrat farq f 0 va kutilgan fe Har bir hujayradagi miqdorlar juda kichik. Boshqa tomondan, agar nol gipoteza bo'lsa H 0 noto'g'ri va umumiy populyatsiyalarda muvaffaqiyat nisbati o'rtasida sezilarli farq bor, hisoblangan ch 2 -statistika katta bo'lishi kerak. Bu har bir katakdagi muvaffaqiyat yoki muvaffaqiyatsizliklarning kuzatilgan va kutilgan soni o'rtasidagi farq bilan bog'liq bo'lib, kvadratga aylantirilganda ortadi. Biroq, kutilgan va kuzatilgan qiymatlar o'rtasidagi farqlarning umumiy ch 2 -statistikaga qo'shgan hissasi boshqacha bo'lishi mumkin. O'rtasidagi haqiqiy farq bir xil f 0 va f e ch 2 -statistikaga ko'proq ta'sir ko'rsatishi mumkin, agar hujayrada ko'proq kuzatuvlar soniga mos keladigan farqdan ko'ra kam sonli kuzatishlar natijalari mavjud bo'lsa.

Ikki kasrning tengligi gipotezasini sinab ko'rish uchun ch 2 testini ko'rsatish uchun oldingi bo'limda tasvirlangan stsenariyga qaytaylik, natijalari 2-rasmda ko'rsatilgan. 2. Nol gipoteza (H 0: p 1 = p 2) ikkita mehmonxonada xizmat ko'rsatish sifatini solishtirganda, kelgusi yilda qaytishni rejalashtirgan mehmonlar nisbati amalda bir xil ekanligini ta'kidlaydi. Parametrni baholash uchun R, mehmonxonaga qaytishni rejalashtirayotgan mehmonlar ulushini ifodalaydi, agar nol gipoteza to'g'ri bo'lsa, qiymat ishlatiladi , bu formula bo'yicha hisoblanadi

Xizmatdan norozi bo'lgan mehmonlarning ulushi = 1 - 0,6483 = 0,3517. Ushbu ikkita aktsiyani so'rovda qatnashgan Beachcomber mehmonlari soniga ko'paytirsak, biz kelgusi mavsumda qaytishni rejalashtirgan mehmonlarning kutilgan sonini, shuningdek mehmonxonada endi qolmaydigan dam oluvchilar sonini olamiz. Windsurfer mehmonxonasi mehmonlarining kutilayotgan ulushi xuddi shunday tarzda hisoblanadi:

Ha - Beachcomber: = 0,6483, n 1 = 227, shuning uchun f e = 147,16.
Ha - Vindserfer: = 0,6483, n 2 = 262, shuning uchun f e = 169,84.
Yo'q - Beachcomber: 1 - = 0,3517, n 1 = 227, shuning uchun f e = 79,84.
Yo'q - Windsurfer: 1 - = 0,3517, n 2 = 262, shuning uchun f e = 92,16.

Hisob-kitoblar rasmda ko'rsatilgan. 4.

Guruch. 4. ch 2 - mehmonxonalar bo'yicha statistika: (a) dastlabki ma'lumotlar; (b) kuzatilganlarni solishtirish uchun 2x2 faktorial jadval ( f 0 ) va kutilgan ( fe) xizmatdan qoniqarli va qoniqmagan mehmonlar soni; (c) xizmatdan mamnun bo'lgan mehmonlar ulushini taqqoslashda ch 2 -statistik ma'lumotlarni hisoblash; (d) testning kritik qiymatini hisoblash ch 2 -statistika

Testning kritik qiymatini hisoblash uchun ch 2 -statistika, Excel = CHI2.OBR () funktsiyasidan foydalaniladi. Agar muhimlik darajasi a = 0,05 bo'lsa (CHI2.OBR funksiyasiga almashtirilgan ehtimollik 1 –a) va 2 × 2 faktorial jadval uchun ch 2 - taqsimot bir erkinlik darajasiga ega bo'lsa, ch 2 ning kritik qiymati. -statistik ma'lumotlar - 3,841. ch 2 -statistikaning hisoblangan qiymati 9,053 ga teng (4c-rasm) 3,841 raqamidan oshib ketganligi sababli nol gipoteza rad etiladi (5-rasm).

Guruch. 5. Testning kritik qiymatini aniqlash ch 2 -a = 0,05 ahamiyatlilik darajasida bir erkinlik darajasi bilan statistika.

Ehtimollik R ch 2 -statistika 9,053 ga (va bir erkinlik darajasi) teng bo'lganda nol gipotezaning to'g'ri ekanligi Excelda = 1 - CHIS 2 funktsiyasidan foydalangan holda hisoblanadi. DIST (9,053; 1; TRUE) = 0,0026. R- 0,0026 qiymati - Beachcomber va Windsurfer xizmatlaridan mamnun bo'lgan mehmonlarning namunaviy ulushlari o'rtasidagi farq 0,718 ga teng yoki undan katta bo'lish ehtimoli - 0,588 = 0,13, agar aslida ularning ikkala populyatsiyadagi ulushi bir xil bo'lsa .. . Shunday qilib, ikki mehmonxona o'rtasida mehmonlarga xizmat ko'rsatishda statistik jihatdan sezilarli farq borligiga ishonish uchun yaxshi asoslar mavjud. Tadqiqotlar shuni ko'rsatadiki, Beachcomberdagi xizmatdan mamnun bo'lgan mehmonlar soni yana Windsurferda qolishni rejalashtirgan mehmonlar sonidan ko'proq.

2 × 2 faktorlar jadvali haqidagi taxminlarni sinab ko'rish. 2 × 2-jadvaldagi ma'lumotlarga asoslangan aniq natijalarni olish uchun muvaffaqiyat yoki muvaffaqiyatsizliklar soni 5 dan ortiq bo'lishi kerak. Agar bu shart bajarilmasa, unda aniq raqam qo'llanilishi kerak. Fisher testi.

Ikkita mehmonxonada xizmat ko‘rsatish sifatidan mamnun bo‘lgan mijozlar foizini solishtirganda Z va ch 2 mezonlari bir xil natijalarga olib keladi. Buni standartlashtirilgan normal taqsimot va bir darajadagi erkinlik bilan ch 2 - taqsimot o'rtasida yaqin bog'liqlik mavjudligi bilan izohlash mumkin. Bunday holda, ch 2 statistikasi har doim Z statistikasining kvadratidir. Misol uchun, mehmonlarning qoniqishini o'lchashda biz buni aniqladik Z-statistika +3,01, ch 2 -statistika 9,05. Yaxlitlash xatolarini e'tiborsiz qoldirib, ikkinchi qiymat birinchisining kvadrati ekanligini tekshirish oson (ya'ni 3,01 2 = 9,05). Bundan tashqari, ikkala statistikaning kritik qiymatlarini a = 0,05 ahamiyatlilik darajasida taqqoslab, ch 1 2 qiymati 3,841 ga teng Z-statistikaning yuqori kritik qiymatining kvadrati ekanligini aniqlashimiz mumkin + . 1,96 (ya'ni, ch 1 2 = Z 2). Bundan tashqari, R- ikkala mezonning qiymatlari bir xil.

Shunday qilib, nol va muqobil gipotezalarni sinovdan o'tkazishda bahslashish mumkin H 0: p 1 = p 2; H 1: p 1 ≠ p 2 Z va ch 2 mezonlari ekvivalentdir. Biroq, faqat farqlarni topish emas, balki qaysi nisbat katta ekanligini aniqlash kerak bo'lsa (p 1> p 2), kerak standartlashtirilgan normal taqsimotning dumi bilan chegaralangan bitta kritik mintaqa bilan Z-testini qo'llang. Keyinchalik, bir nechta guruhlardagi xususiyat ulushlarini solishtirish uchun ch 2 mezonini qo'llash tavsiflanadi. Shuni ta'kidlash kerakki, bu vaziyatda Z-mezonini qo'llash mumkin emas.

Bir necha qismlarning tengligi gipotezasini tekshirish uchun ch 2 testini qo'llash

Xi-kvadrat testi umumiy holatga kengaytirilishi mumkin va xususiyatning bir nechta kasrlari teng degan gipotezani tekshirish uchun ishlatilishi mumkin. Tahlil qilingan mustaqil umumiy populyatsiyalar sonini harf bilan belgilaymiz bilan... Endi favqulodda vaziyatlar jadvali ikki qatordan iborat va bilan ustunlar. Nol va muqobil gipotezalarni sinab ko'rish H 0: p 1 = p 2 = … = p 2, H 1: hammasi emas Rj bir-biriga teng (j = 1, 2, …, c), test ch 2 -statistikadan foydalaniladi:

qayerda f 0- faktorlar jadvalining ma'lum bir katagida kuzatilgan muvaffaqiyatlar yoki muvaffaqiyatsizliklar soni 2 * bilan, fe- nol gipoteza to'g'ri bo'lishi sharti bilan, kutilmagan holatlar jadvalining ma'lum bir katakchasidagi muvaffaqiyat yoki muvaffaqiyatsizliklarning nazariy yoki kutilgan soni.

Favqulodda vaziyatlar jadvalining har bir katagida kutilgan muvaffaqiyat yoki muvaffaqiyatsizlik sonini hisoblash uchun quyidagilarni yodda tuting. Agar nol gipoteza to'g'ri bo'lsa va barcha populyatsiyalarda muvaffaqiyat nisbati teng bo'lsa, mos keladigan tanlama nisbatlari faqat tasodifiy sabablarga ko'ra bir-biridan farq qilishi mumkin, chunki barcha nisbatlar belgi ulushini baholashdir. R umumiy aholida. Bunday holatda, barcha aktsiyalarni bitta umumiy (yoki o'rtacha) parametr bahosida birlashtirgan statistika R, ularning har biridan alohida ko'proq ma'lumotni o'z ichiga oladi. Ushbu statistik ma'lumotlar belgi bilan belgilanadi , birlashtirilgan namunadagi umumiy (yoki o'rtacha) muvaffaqiyat darajasini ifodalaydi.

O'rtacha ulushni hisoblash:

Kutilayotgan muvaffaqiyatlar sonini hisoblash f e favqulodda vaziyatlar jadvalining birinchi qatorida har bir namunaning o'lchamini parametr bilan ko'paytirish kerak. Kutilgan nosozliklar sonini hisoblash uchun f e favqulodda vaziyatlar jadvalining ikkinchi qatorida har bir namunaning o'lchamini parametrga ko'paytirish kerak 1 – ... Formula (1) bo'yicha hisoblangan test statistikasi ch 2 - taqsimot bo'yicha taxminiy hisoblanadi. Ushbu taqsimotning erkinlik darajalari soni qiymat bilan beriladi (r - 1) (c – 1) , qayerda r- faktorlar jadvalidagi qatorlar soni; bilan- jadvaldagi ustunlar soni. Faktorlar jadvali uchun 2 * s erkinlik darajalari soni (2 - 1) (s - 1) = s - 1... Berilgan a ahamiyatlilik darajasida, agar hisoblangan ch 2 -statistika ch 2 - taqsimotga xos bo'lgan ch U 2 yuqori kritik qiymatdan katta bo'lsa, nol gipoteza rad etiladi. s - 1 erkinlik darajalari. Shunday qilib, qaror qoidasi quyidagicha: gipoteza H 0 ch 2> ch U 2 bo'lsa rad etiladi (6-rasm), aks holda gipoteza rad etiladi.

Guruch. 6. Kritik maydon ch 2 -ahamiyat darajasidagi ulush bilan solishtirish mezoni

Faktorial jadvalga oid taxminlarni tekshirish 2 * c. Faktorial jadvalda keltirilgan ma'lumotlar asosida aniq natijalarni olish uchun 2 * bilan, muvaffaqiyat yoki muvaffaqiyatsizliklar soni etarlicha katta bo'lishi kerak. Ba'zi statistiklar, agar kutilgan chastotalar 0,5 dan katta bo'lsa, test aniq natijalar beradi deb hisoblashadi. Ko'proq konservativ tadqiqotchilar favqulodda vaziyatlar jadvalining xujayralarining 20% ​​dan ko'pi 5 dan kam kutilgan qiymatlarni o'z ichiga olishini talab qiladi va hech bir hujayrada birdan kam kutilgan qiymat bo'lmasligi kerak. Oxirgi shart bizga bu ekstremallar o'rtasida oqilona murosaga o'xshaydi. Ushbu shartni qondirish uchun kichik kutilgan qiymatlarni o'z ichiga olgan toifalarni bittaga birlashtirish kerak. Shundan so'ng, mezon yanada aniqroq bo'ladi. Agar biron sababga ko'ra bir nechta toifalarni birlashtirish imkoni bo'lmasa, muqobil tartiblarga rioya qilish kerak.

Bir nechta guruhlardagi ulushlarning tengligi gipotezasini sinab ko'rish uchun ch 2 testini ko'rsatish uchun biz bobning boshida tasvirlangan stsenariyga qaytamiz. TS Resort Resources kompaniyasiga tegishli uchta mehmonxonaning mehmonlari ishtirok etadigan shunga o'xshash so'rovni ko'rib chiqaylik (7a-rasm).

Guruch. 7. Xizmatdan mamnun va qoniqmagan mehmonlar sonini taqqoslash uchun 2 × 3 faktor jadvali: (a) kuzatilgan muvaffaqiyatlar yoki muvaffaqiyatsizliklar soni - f 0; (b) muvaffaqiyat yoki muvaffaqiyatsizliklarning kutilayotgan soni - fe; (c) xizmatdan mamnun bo'lgan mehmonlarning nisbatlarini taqqoslashda ch 2 - statistikani hisoblash

Nol gipoteza shuni ko'rsatadiki, keyingi yil qaytishni rejalashtirayotgan mijozlar ulushi barcha mehmonxonalarda deyarli bir xil. Parametrni baholash uchun R, bu mehmonxonaga qaytishni rejalashtirgan mehmonlarning nisbati, qiymat ishlatiladi R = NS /n= 513/700 = 0,733. Xizmatdan norozi bo'lgan mehmonlarning ulushi 1 - 0,733 = 0,267. Har bir mehmonxonada so‘rovda qatnashgan mehmonlar soniga uchta aktsiyani ko‘paytirish kelgusi mavsumda qaytishni rejalashtirayotgan mehmonlarning kutilayotgan sonini, shuningdek, ushbu mehmonxonada endi qolmaydigan mijozlar sonini beradi (7b-rasm).

Nol va muqobil gipotezalarni tekshirish uchun test ch 2 -formula (1) bo'yicha kutilgan va kuzatilgan qiymatlar yordamida hisoblangan statistika qo'llaniladi (7c-rasm).

Sinovning kritik qiymati ch 2 -statistika = CHI2.OBR () formulasi bilan aniqlanadi. So'rovda uchta mehmonxonaning mehmonlari qatnashganligi sababli, ch 2 -statistik ma'lumotlar (2 - 1) (3 - 1) = 2 erkinlik darajasiga ega. A = 0,05 ahamiyatlilik darajasida ch 2 -statistikaning kritik qiymati 5,991 ga teng (7d-rasm). 40,236 ga teng hisoblangan ch 2 -statistika kritik qiymatdan oshib ketganligi sababli, nol gipoteza rad etiladi (8-rasm). Boshqa tomondan, ehtimollik R nol gipoteza to'g'ri ekanligi ch 2 -statistika 40,236 ga teng (va ikki erkinlik darajasi) Excelda = 1-CHI2.DIST () = 0,000 funktsiyasi yordamida hisoblanadi (7d-rasm). R- qiymat 0,000 ga teng va ahamiyatlilik darajasidan kichik a = 0,05. Demak, nol gipoteza rad etiladi.

Guruch. 8. 0,05 ahamiyatga ega va ikki erkinlik darajasidagi uchta kasrning tengligi haqidagi gipotezani qabul qilish va rad etish sohalari.

2-jadvalda ko'rsatilgan aktsiyalarni taqqoslashda nol gipotezani rad etish * bilan, faqat uchta mehmonxonadagi xizmatdan mamnun bo'lgan mehmonlar nisbati bir-biriga mos kelmasligini aytishimiz mumkin. Qaysi aktsiyalar boshqalardan farq qilishini bilish uchun boshqa usullarni qo'llash kerak, masalan, Marasquilo protsedurasi.

Marasquilo protsedurasi barcha guruhlarni juftlikda solishtirish imkonini beradi. Jarayonning birinchi bosqichida farqlar p s j - p s j '(qaerda jj) orasida s (s - 1) / 2 juft aktsiyalarda. Tegishli kritik diapazonlar quyidagi formula bo'yicha hisoblanadi:


a ning umumiy ahamiyatlilik darajasida qiymat, chi-kvadrat taqsimotining yuqori kritik qiymatining kvadrat ildizidir. s - 1 erkinlik darajalari. Namuna fraktsiyalarining har bir juftligi uchun alohida kritik diapazonni hisoblash kerak. Oxirgi bosqichda har biri s (s - 1) / 2 urish juftlari mos keladigan kritik diapazon bilan taqqoslanadi. Muayyan juftlikni tashkil etuvchi aktsiyalar statistik jihatdan sezilarli darajada farqlanadi, agar tanlanma aktsiyalarning mutlaq farqi | p s j - p s j | kritik diapazondan oshib ketadi.

Keling, uchta mehmonxona mehmonlari so'rovi misolida Marasquiloning protsedurasini ko'rsatamiz (9a-rasm). Xi-kvadrat testini qo'llash orqali biz kelgusi yilda qaytishni niyat qilgan turli mehmonxonalar mehmonlari nisbati o'rtasida statistik jihatdan sezilarli farq borligini tasdiqladik. So'rovda uchta mehmonxonaning mehmonlari ishtirok etganligi sababli, 3 ta (3 - 1) / 2 = 3 ta juftlik taqqoslashlarini amalga oshirish va uchta muhim diapazonni hisoblash kerak. Boshlash uchun, keling, uchta namunali fraktsiyani hisoblaymiz (9b-rasm). Umumiy ahamiyatlilik darajasi 0,05 bo'lsa, testning yuqori kritik qiymati ch 2 - (s - 1) = 2 erkinlik darajasiga ega bo'lgan chi-kvadrat taqsimoti statistikasi = CHI2 formulasi bilan aniqlanadi.OBR (0,95; 2) = 5,991. Shunday qilib, = 2,448 (9c-rasm). Keyinchalik, biz uch juft mutlaq farqlarni va tegishli kritik diapazonlarni hisoblaymiz. Agar mutlaq farq uning kritik diapazonidan kattaroq bo'lsa, unda tegishli ulushlar sezilarli darajada farqlanadi (9d-rasm).

Guruch. 9. Uchta mehmonxonada qoniqarli mehmonlar nisbati tengligi haqidagi gipotezani sinab ko'rish uchun Marasquilo protsedurasi natijalari: (a) so'rov ma'lumotlari; (b) namuna stavkalari; (c) testning yuqori kritik qiymati ch 2 -ki-kvadrat taqsimoti statistikasi; (d) uch juft mutlaq farqlar va tegishli kritik diapazonlar

Ko'rib turganingizdek, ahamiyatlilik darajasi 0,05 bo'lgan Palm Royal mehmonxonasi mehmonlarining qoniqish darajasi (p s2 = 0,858) Oltin Palma (p s1 = 0,593) va Palm Princess (p) mehmonlariga qaraganda yuqori. s3 = 0,738) mehmonxonalar. Bundan tashqari, Palma malikasining qoniqishi Oltin Palmaga qaraganda yuqori. Ushbu natijalar rahbariyatni ushbu farqlarning sabablarini tahlil qilishga va "Golden Palm" mehmonxonasi mehmonlarining qoniqish darajasi boshqa mehmonxonalar mehmonlariga qaraganda nega sezilarli darajada past ekanligini aniqlashga harakat qilishi kerak.

Menejerlar uchun Levin va boshqa Statistikalar kitobidan foydalanilgan. - M .: Uilyams, 2004 .-- p. 708-730