Internet Windows Android

Aplicarea testului χ2 pentru a testa ipoteza că două sau mai multe fracții sunt egale. Testarea ipotezei despre independența randamentului logaritmic al celui de-al 2-lea criteriu

Test statistic

Se numeste regula dupa care ipoteza R 0 este respinsa sau acceptata criteriu statistic. Numele criteriului, de regulă, conține o literă care denotă o caracteristică special compilată din clauza 2 a algoritmului de testare a ipotezelor statistice (a se vedea clauza 4.1), calculată în criteriu. În condițiile acestui algoritm, criteriul ar fi numit „v-criteriu".

La testarea ipotezelor statistice sunt posibile două tipuri de erori:

  • - eroare de primul fel(puteți respinge ipoteza I 0 când este de fapt adevărată);
  • - eroare de al doilea fel(puteți accepta ipoteza I 0 când de fapt nu este adevărată).

Probabilitate A a face o greseala de primul fel se numeste nivelul de semnificaţie al criteriului.

Dacă pentru R indicați probabilitatea de a face o eroare de al doilea fel, atunci (l - R) - probabilitatea de a evita o eroare de al doilea fel, care se numește puterea criteriului.

Bunătatea potrivirii x 2 Pearson

Există mai multe tipuri de ipoteze statistice:

  • - despre legea distributiei;
  • - uniformitatea probelor;
  • - valorile numerice ale parametrilor de distribuție etc.

Vom lua în considerare ipoteza legii distribuției folosind exemplul testului Pearson x 2 de bunătate a potrivirii.

Criteriul consimțământului se numește criteriul statistic de testare a ipotezei nule despre legea presupusă a distribuției necunoscute.

Testul de bunătate a potrivirii lui Pearson se bazează pe o comparație a frecvențelor de observație empirice (observate) și teoretice calculate sub ipoteza unei anumite legi de distribuție. Ipoteza # 0 este formulată aici astfel: populația generală este distribuită în mod normal în funcție de atributul studiat.

Algoritm pentru testarea ipotezei statistice # 0 pentru criteriu x 1 Pearson:

  • 1) propunem ipoteza I 0 - conform atributului studiat, populaţia generală este distribuită normal;
  • 2) calculați media eșantionului și abaterea standard a eșantionului O v;

3) în funcție de volumul de probă disponibil NS calculăm o caracteristică special compilată,

unde: i, - frecvențe empirice, - frecvente teoretice,

NS - marime de mostra,

h- dimensiunea intervalului (diferența dintre două opțiuni adiacente),

Valori normalizate ale caracteristicii observate,

- funcția de masă. De asemenea, frecvențele teoretice

poate fi calculat folosind funcția standard MS Excel NORMDIST conform formulei;

4) în funcție de distribuția eșantionului, determinăm valoarea critică a unei caracteristici special compilate xl P

5) când ipoteza # 0 este respinsă, când ipoteza # 0 este acceptată.

Exemplu. Luați în considerare semnul X- valoarea indicatorilor de testare a condamnaților într-una din coloniile de corecție pentru unele caracteristici psihologice, prezentați sub forma unei serii de variații:

La un nivel de semnificație de 0,05, testați ipoteza distribuției normale a populației generale.

1. Pe baza distribuției empirice, puteți formula o ipoteză H 0: conform atributului studiat „valoarea indicatorului de test pentru o anumită caracteristică psihologică” populația generală a fost

cele aşteptate sunt distribuite normal. Ipoteza alternativă 1: populația generală de condamnați nu este distribuită în mod normal în funcție de atributul studiat „valoarea indicatorului de test pentru o anumită caracteristică psihologică”.

2. Să calculăm caracteristicile numerice ale eșantionului:

Intervale

x g u

NS) SCH

3. Să calculăm caracteristica special compilată j 2. Pentru a face acest lucru, în penultima coloană a tabelului precedent, găsim frecvențele teoretice prin formula, iar în ultima coloană

să calculăm caracteristica% 2. Primim x 2 = 0,185.

Pentru claritate, vom construi un poligon de distribuție empirică și o curbă normală pentru frecvențele teoretice (Fig. 6).

Orez. 6.

4. Determinați numărul de grade de libertate s: k = 5, m = 2, s = 5-2-1 = 2.

Conform tabelului sau folosind funcția standard MS Excel „HI20BR” pentru numărul de grade de libertate 5 = 2 și nivelul de semnificație a = 0,05 găsiți valoarea critică a criteriului xl P.=5,99. Pentru nivelul de semnificație A= 0,01 valoarea criteriului critic NS%. = 9,2.

5. Valoarea observată a criteriului NS= 0,185 mai puțin decât toate valorile găsite Hk R.-> prin urmare, ipoteza I 0 este acceptată la ambele niveluri de semnificație. Discrepanța dintre frecvențele empirice și cele teoretice este nesemnificativă. În consecință, datele observaționale sunt în concordanță cu ipoteza unei distribuții normale a populației generale. Astfel, conform criteriului studiat „valoarea indicatorului de test pentru o caracteristică psihologică dată”, populația generală de condamnați este distribuită normal.

  • 1. Koryachko A.V., Kulichenko A.G. Matematică superioară și metode matematice în psihologie: un ghid de exerciții practice pentru studenții Facultății de Psihologie. Ryazan, 1994.
  • 2. Patrimoniul AD Metode matematice de cercetare psihologică. Analiza și interpretarea datelor: manual, manual. SPb., 2008.
  • 3. Sidorenko E.V. Metode de prelucrare matematică în psihologie. SPb., 2010.
  • 4. Soshnikova L.A. și alte analize statistice multivariate în economie: manual, manual pentru universități. M., 1999.
  • 5. Suhodolskiy E.V. Metode matematice în psihologie. Harkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Workshop de teoria statisticii: manual, manual. M., 2009.
  • Gmurman V.E. Teoria Probabilității și Statistica Matematică. p. 465.

Atribuții de criterii

Criteriul χ 2 este utilizat în două scopuri;

1) să compare distribuţia empirică a trăsăturii cu teoretic - uniformă, normală sau altfel;

2) pentru comparație două, trei sau mai multe empirice distribuții ale aceleiași caracteristici 12.

Descrierea criteriului

Criteriul χ 2 răspunde la întrebarea dacă valori diferite ale unei caracteristici apar cu aceeași frecvență în distribuțiile empirice și teoretice sau în două sau mai multe distribuții empirice.

Avantajul metodei este că permite compararea distribuțiilor caracteristicilor prezentate la orice scară, pornind de la scara de denumire (vezi secțiunea 1.2). În cel mai simplu caz al distribuției alternative „da – nu”, „a permis căsătoria – nu a permis căsătoria”, „a rezolvat problema – nu a rezolvat problema”, etc., putem aplica deja criteriul χ 2.

Să presupunem că un anumit observator înregistrează numărul de pietoni care au ales dreapta sau stânga a două căi simetrice pe drumul de la punctul A la punctul B (vezi Fig. 4.3).

Să presupunem că, în urma a 70 de observații, s-a constatat că NS\ oamenii au ales drumul cel bun și doar 19 au ales drumul stâng. Folosind criteriul χ 2 putem determina dacă o distribuție dată de opțiuni diferă de o distribuție uniformă în care ambele piste ar fi eșantionate cu aceeași frecvență. Aceasta este o variantă a comparației celor primite uhpiric distributie cu teoretic. O astfel de sarcină poate fi, de exemplu, în cercetarea psihologică aplicată legată de proiectare în arhitectură, sisteme de comunicații etc.

Dar să ne imaginăm că observatorul rezolvă o cu totul altă problemă: el este ocupat cu problemele reglementării bilaterale. Coincidența distribuției obținute cu cea uniformă îl interesează mult mai puțin decât coincidența sau necoincidența datelor sale cu datele altor cercetători. El știe că persoanele cu predominanța piciorului drept tind să se rotească în sens invers acelor de ceasornic, iar persoanele cu o predominanță a piciorului stâng tind să se rotească în sensul acelor de ceasornic și că, într-un studiu realizat de colegii 13, s-a constatat o predominanță a piciorului stâng în 26 de ani. din 100 de persoane chestionate.

Folosind metoda χ2, el poate compara două distribuții empirice: un raport de 51:19 în propriul său eșantion și un raport de 74:26 într-un eșantion de alți cercetători.

Aceasta este o opțiune compararea a două empirice distribuții după cel mai simplu criteriu alternativ (desigur, cel mai simplu din punct de vedere matematic, și deloc psihologic).

În mod similar, putem compara distribuțiile de alegeri din trei sau mai multe alternative. De exemplu, dacă într-un eșantion de 50 de persoane 30 au ales răspunsul (a), 15 persoane - răspunsul (b) și 5 persoane - răspunsul (c), atunci putem folosi metoda χ 2 pentru a verifica dacă această distribuție diferă dintr-o distribuție uniformă sau din repartizarea răspunsurilor într-un alt eșantion, unde răspunsul (a) a fost ales de 10 persoane, răspunsul (b) -25 persoane, răspunsul (c) - 15 persoane.

În cazurile în care o trăsătură este măsurată cantitativ, să zicem, v puncte, secunde sau milimetri, poate fi necesar să combinăm toată abundența valorilor atributelor în mai multe cifre. De exemplu, dacă timpul de rezolvare a problemei variază de la 10 la 300 de secunde, atunci putem introduce 10 sau 5 cifre, în funcție de dimensiunea eșantionului. De exemplu, acestea vor fi descărcări: 0-50 secunde; 51-100 secunde; 101-150 secunde etc. Apoi folosim metoda χ 2 va compara frecvențele de apariție a diferitelor categorii ale caracteristicii, dar restul diagramei schematice nu se modifică.

Când comparăm distribuția empirică cu cea teoretică, determinăm gradul de discrepanță între frecvențele empirice și teoretice.

Prin compararea celor două distribuții empirice, determinăm gradul de discrepanță între frecvențele empirice și frecvențele teoretice care ar fi observate dacă cele două distribuții empirice ar coincide. Formule pentru calcularea frecvențelor teoretice vor fi date special pentru fiecare opțiune de comparație.

Cu cât discrepanța este mai mareîntre două distribuții comparabile, cu atât mai mult empiric valoarea lui y).

Ipoteze

Sunt posibile mai multe variante de ipoteze, în funcție de sarcini,

pe care ni le punem in fata.

Prima varianta:

N 0: Distribuția empirică obținută a trăsăturii nu diferă de distribuția teoretică (de exemplu, uniformă).

H 1: Distribuția empirică rezultată a trăsăturii diferă de distribuția teoretică.

A doua varianta:

H 0: Distribuția empirică 1 nu diferă de distribuția empirică 2.

H 1: Distribuția empirică 1 este diferită de distribuția empirică 2.

A treia varianta:

H 0: Distribuțiile empirice 1, 2, 3, ... nu diferă unele de altele.

H 1: Distribuțiile empirice 1, 2, 3, ... diferă unele de altele.

Criteriul χ 2 permite testarea tuturor celor trei ipoteze.

Reprezentarea grafică a criteriului

Să ilustrăm un exemplu cu alegerea pistelor din dreapta sau din stânga pe traseul de la punctul A la punctul B. În Fig. 4.4 frecvența selecției piesei din stânga este reprezentată de bara din stânga, iar frecvența selecției piesei din dreapta este reprezentată de bara din dreapta a histogramei 14. Pe axa ordonatelor se măsoară frecvențele relative de selecție, adică frecvențele de selecție a unei anumite piese, raportate la numărul total de observații. Pentru pista din stânga, frecvența relativă, numită și frecvență, este 19/70, adică 0,27, iar pentru pista dreaptă, 51/70, adică 0,73.

Dacă ambele piese ar fi alese la fel de probabil, atunci jumătate dintre subiecți ar alege calea dreaptă și jumătate pe cea stângă. Probabilitatea de a selecta fiecare dintre piese ar fi de 0,50.

Vedem că abaterile frecvențelor empirice de la această valoare sunt destul de semnificative. Poate că diferențele dintre distribuția empirică și cea teoretică vor fi semnificative.

În fig. 4.5 prezintă de fapt două histograme, dar barele sunt grupate astfel încât în ​​stânga să fie comparate frecvențele preferinței benzii din stânga în alegerea observatorului nostru (1) și în eșantionul de T.A. Dobrohotova și N.N. Bragina (2), iar în dreapta - frecvențele preferinței benzii din dreapta în aceleași două mostre.

Vedem că discrepanțele dintre eșantioane sunt foarte nesemnificative. Criteriul χ2, cel mai probabil, va confirma coincidența celor două distribuții.

Limitări ale criteriului

1. Dimensiunea eșantionului ar trebui să fie suficient de mare: NS30. La NS<30 критерий χ2 dă valori foarte aproximative. Precizia criteriului crește în general NS.

2. Frecvența teoretică pentru fiecare celulă din tabel nu trebuie să fie mai mică de 5: f> 5. Aceasta înseamnă că dacă numărul de cifre este predeterminat și nu poate fi modificat, atunci nu putem aplica metoda χ2 fără a acumula un anumit număr minim de observații. Dacă, de exemplu, dorim să ne testăm ipotezele că frecvența apelurilor către serviciul telefonic Trust este distribuită inegal pe 7 zile ale săptămânii, atunci avem nevoie de 5 * 7 = 35 de apeluri. Astfel, dacă numărul de cifre ( k) dat în prealabil, ca și în acest caz, numărul minim de observații ( n min) este determinată de formula: n min = k*5.

3. Cifrele selectate ar trebui să „scoate” întreaga distribuție, adică să acopere întreaga gamă de variabilitate a caracteristicilor. În acest caz, gruparea în cifre trebuie să fie aceeași în toate distribuțiile comparate.

4. Este necesar să se facă o „corecție de continuitate” atunci când se compară distribuțiile de caracteristici care iau doar 2 valori. Când se face corecția, valoarea χ 2 scade (vezi Exemplu cu corecție pentru continuitate).

5. Descărcările trebuie să nu se suprapună: dacă o observație este atribuită unei categorii, atunci nu mai poate fi atribuită nici unei alte categorii.

Suma observațiilor pe categorii ar trebui să fie întotdeauna egală cu numărul total de observații.

Întrebarea care este considerată numărul de observații este legitimă - numărul de alegeri, reacții, acțiuni sau numărul de subiecți care fac o alegere, arată reacții sau efectuează acțiuni. Dacă subiectul prezintă mai multe reacții și toate sunt înregistrate, atunci numărul de subiecți nu va coincide cu numărul de reacții. Putem rezuma reacțiile fiecărui subiect, așa cum, de exemplu, se face în metoda Heckhausen pentru studierea motivației de realizare sau în Testul de toleranță la frustrare S. Rosenzweig și compara distribuțiile sumelor individuale de reacții din mai multe eșantioane.

În acest caz, numărul de observații va fi numărul de subiecți. Dacă numărăm frecvența reacțiilor de un anumit tip în eșantion în ansamblu, atunci obținem distribuția reacțiilor de diferite tipuri, iar în acest caz, numărul de observații va fi numărul total de reacții înregistrate, și nu numarul de subiecti.

Din punct de vedere matematic, regula independenței biților este respectată în ambele cazuri: o observație se referă la unul și doar un bit al distribuției.

Ne putem imagina o variantă a studiului în care studiem distribuția alegerilor unui subiect. În terapia cognitiv-comportamentală, de exemplu, clientului i se cere să înregistreze momentul exact al apariției unei reacții nedorite, de exemplu, apar mai des atacuri de frică, depresie, izbucniri de furie, gânduri de autodepreciare etc. și ajută clientul să construiască un program individual de prevenire a reacțiilor adverse.

Este posibil folosind criteriul χ2 pentru a demonstra că unele ceasuri sunt mai frecvente în această distribuție individuală, în timp ce altele sunt mai puțin frecvente? Toate observațiile sunt dependente, deoarece se referă la același subiect; în același timp, toate evacuările nu se suprapun, întrucât același atac se referă la una și o singură descărcare (în acest caz, ora unu după-amiaza). Aparent, aplicarea metodei χ2 în acest caz va fi o anumită simplificare. Atacurile de frică, furie sau depresie pot apărea în mod repetat pe parcursul zilei și se poate dovedi că, să zicem, dimineața devreme, ora 6 și seara târziu, ora 12, atacurile apar de obicei împreună, în aceeași zi. : în același timp, un atac de 3 ore pe zi apare nu mai devreme de o zi după atacul anterior și nu mai puțin de două zile înainte de următorul etc. Aparent, vorbim despre un model matematic complex sau ceva de genul ăsta, care nu poate fi „crezut de algebră”. Și totuși, în scopuri practice, poate fi utilă folosirea criteriului pentru a dezvălui neuniformitatea sistematică a declanșării oricăror evenimente semnificative, alegeri, preferințe etc., la aceeași persoană.

Deci, aceeași observație ar trebui să se aplice doar unei singure categorii. Dar dacă să considerăm fiecare subiect ca o observație sau fiecare reacție investigată a subiectului este o întrebare, a cărei soluție depinde de obiectivele studiului (vezi, de exemplu, Ganzen V.A., Balin V.D., 1991, p. 10).

Principala „limitare” a criteriului χ 2 - că pare descurajator de dificil pentru majoritatea cercetătorilor.

Să încercăm să depășim mitul dificultății de neînțeles a criteriului χ 2 . Pentru a condimenta lucrurile, luați în considerare un exemplu literar plin de umor.

h2 Testul Pearson

Criteriile după care se determină o selecție cu succes sau nereușită a legii de distribuție sunt de obicei notate de criteriile de acord. C. Criteriul 2 al lui Pearson este cel mai frecvent utilizat criteriu pentru testarea unei ipoteze simple despre legea distribuţiei. Se bazează pe utilizarea ca măsură a abaterii datelor experimentale de la distribuția ipotetică a aceleiași cantități care servește la construirea regiunii de încredere pentru densitatea necunoscută, cu înlocuirea valorilor adevărate necunoscute ale probabilităților de scădere. în intervale de probabilităţile calculate din distribuţia ipotetică. Să presupunem că intervalul de valori posibile ale unei variabile aleatoare este împărțit în r intervale (multidimensionale, adică dreptunghiuri, în cazul unei mărimi vectoriale). Fie frecvențele aleatoare de lovire a acestor intervale, obținute ca urmare a n experimente, P1, ..., Pr - probabilitățile de lovire a acelorași intervale, calculate din distribuția ipotetică.

În cazul general, aceste probabilități sunt funcții ale estimărilor parametrilor necunoscuți obținuți din aceleași date experimentale și, prin urmare, sunt și cantități aleatorii. Să presupunem că estimările parametrilor necunoscuți ai unei distribuții ipotetice sunt calculate din același eșantion combinat ca și frecvențele. Atunci probabilitățile P1, ..., Pr vor fi niște funcții ale frecvențelor, iar pentru a evalua abaterea datelor experimentale de la distribuția ipotetică, se ia valoarea

unde Р1, ..., Pr - anumite funcții ale frecvențelor.

Neumann și Pearson au arătat că, dacă o estimare asimptotic eficientă și asimptotic normală a parametrului s-dimensional necunoscut al distribuției ipotetice pe un eșantion grupat este utilizată pentru a calcula probabilitățile P1, ..., Pr, atunci valoarea Z, determinată prin formula (1), în limita ca n ->? are o distribuţie ch2 cu r-s-1 grade de libertate.

Folosind această teoremă, este posibil să se estimeze discrepanța dintre datele experimentale și distribuția ipotetică folosind tabele ale distribuției n2. Alegem o probabilitate p suficient de mică pentru ca un eveniment cu o asemenea probabilitate să poată fi considerat practic imposibil și determinăm din ecuație

Dacă realizarea = 2 a valorii lui Z, obținută în urma experimentelor, depășește sau este egală cu, = 2, atunci distribuția ipotetică este considerată incompatibilă cu datele experimentale, deoarece cu această distribuție este practic imposibil de obținut cu o probă = 2. Probabilitatea unui astfel de eveniment pentru un număr mare de experimente n este aproximativ egală cu p, adică. neglijabil. În acest caz, se spune că există o abatere semnificativă a datelor experimentale de la distribuția ipotetică. Dacă = 2, atunci se crede că distribuția ipotetică nu contrazice datele experimentale, este de acord cu acestea.

Valoarea se numește nivelul de semnificație de 100p la sută al abaterii eșantionului de la distribuția ipotetică. În mod obișnuit, sunt utilizate niveluri de semnificație de 5%, 1% și 0,1%, în funcție de natura sarcinii.

Pentru a verifica suplimentar coerența datelor experimentale cu distribuția ipotetică, este util să se calculeze probabilitatea ca pentru o anumită distribuție ipotetică valoarea lui Z să fie mai mare decât valoarea obținută în urma experimentelor de realizare a acesteia = 2, P (Z> 2) Cu cât această probabilitate este mai mare, cu atât eșantionul este mai bine în acord cu distribuția ipotetică, cu atât este mai mică semnificația discrepanței obținute între eșantion și distribuția ipotetică. Într-adevăr, dacă probabilitatea P (Z> 2) este mare, atunci la repetarea acestei serii de experimente, dacă ipoteza aleasă despre distribuție este corectă, se vor obține adesea valorile lui Z care sunt chiar mai mari decât valoarea obținută. ca rezultat al experimentelor = 2.

Acordați atenție faptului că, după ce a primit = 2< и даже получив высокую вероятность P(Z >2), nu tragem o concluzie certă că ipoteza distribuției alese este valabilă, ci spunem doar că această ipoteză nu contrazice rezultatele experimentale obținute, că este de acord cu acestea, drept care poate fi acceptată. Pentru a obține o dovadă suficient de puternică că variabila aleatoare se supune cu adevărat legii distribuției ipotetice, este necesar să se repete această serie de experimente de un număr suficient de mare de ori și să se asigure că acordul obținut al ipotezei cu rezultatele experimentale este stabil.

criteriul Kolmogorov

Criteriul Kolmogorov - criteriu auxiliar

Ca criteriu auxiliar pentru verificarea uniformității distribuției valorii P a criteriului principal, în această lucrare folosim criteriul Kolmogorov.

Criteriul lui Kolmogorov ia în considerare valoarea maximă a modulului diferenței dintre funcția de distribuție statistică F ^ * (x) și funcția de distribuție teoretică corespunzătoare F (x, adică D = max | F ^ * (x) -F (x) | .

Următorul pas este determinarea valorii lui l = D. Conform tabelelor statistice (în mediul matcalc, funcția pvKolm (u)) este probabilitatea ca, din motive pur aleatorii, discrepanța maximă dintre F ^ * (x) și F (x) să fie nu mai mică decât cea observată efectiv . Dacă probabilitatea P (n) este relativ mare, atunci ipoteza ar trebui acceptată, dacă este foarte mică, apoi respinsă ca neplauzibilă.

Luați în considerare aplicația înDOMNIȘOARĂEXCELAtestul chi-pătrat Pearson pentru testarea ipotezelor simple.

După obținerea datelor experimentale (adică când există unele probă), este de obicei aleasă legea distribuției care descrie cel mai bine variabila aleatoare reprezentată de un dat prelevarea de probe... Verificarea cât de bine sunt descrise datele experimentale de legea de distribuție teoretică aleasă se realizează folosind criteriile de consimțământ. Ipoteza nulă, de obicei există o ipoteză despre egalitatea distribuției unei variabile aleatoare cu o lege teoretică.

Să luăm în considerare mai întâi aplicația Testul de bunăstare a potrivirii lui Pearson X 2 (chi pătrat)în raport cu ipotezele simple (se presupune că parametrii distribuţiei teoretice sunt cunoscuţi). Apoi -, când este specificată doar forma distribuției, și parametrii acestei distribuții și valoarea statistici X 2 sunt estimate/calculate pe baza acelorași prelevarea de probe.

Notă: În literatura de limba engleză, procedura de aplicare Testul de bunăstare a potrivirii lui Pearson X 2 are un titlu Testul de bunătate a potrivirii chi-pătrat.

Amintiți-vă procedura de testare a ipotezelor:

  • bazat prelevarea de probe se calculează valoarea statistici, care corespunde tipului de ipoteză testată. De exemplu, pentru este folosit t-statistici(dacă nu se cunoaște);
  • supus adevărului ipoteza nulă, distribuția acestuia statistici este cunoscut și poate fi folosit pentru a calcula probabilități (de exemplu, pentru t-statistici aceasta este );
  • calculat pe baza prelevarea de probe sens statistici comparat cu valoarea critică pentru valoarea dată ();
  • ipoteza nulă respinge dacă valoarea statistici mai mult decât critic (sau dacă probabilitatea de a obține această valoare statistici() mai mica nivelul de semnificație, care este o abordare echivalentă).

Vom duce la îndeplinire testarea ipotezelor pentru diferite distribuții.

Caz discret

Să presupunem că doi oameni joacă zaruri. Fiecare jucător are un set diferit de zaruri. Jucătorii aruncă pe rând 3 zaruri deodată. Fiecare rundă este câștigată de cel care aruncă mai multe șase la un moment dat. Rezultatele sunt înregistrate. După 100 de runde, unul dintre jucători a bănuit că zarurile adversarului său erau asimetrice, deoarece el câștigă adesea (de multe ori aruncă șase). El a decis să analizeze cât de probabil este un astfel de număr de rezultate ale adversarului.

Notă: Pentru că zarurile 3, apoi puteți arunca 0 la un moment dat; 1; 2 sau 3 șase, adică o variabilă aleatoare poate lua 4 valori.

Din teoria probabilității, știm că dacă cuburile sunt simetrice, atunci probabilitatea de a obține șase se supune. Prin urmare, după 100 de runde, frecvențele de șase pot fi calculate folosind formula
= BINOM.DIST (A7; 3; 1/6; FALSE) * 100

Formula presupune că în celulă A7 conține numărul corespunzător de șase renunțate într-o rundă.

Notă: Calculele sunt date în exemplu de fișier pe foaia Discrete.

Pentru comparație observat(Observat) și frecvențe teoretice(Așteptată) este convenabil de utilizat.

Cu o abatere semnificativă a frecvențelor observate de la distribuția teoretică, ipoteza nulă privind distribuția unei variabile aleatoare conform unei legi teoretice, ar trebui respinsă. Adică, dacă zarurile adversarului sunt asimetrice, atunci frecvențele observate vor fi „semnificativ diferite” de distribuție binomială.

În cazul nostru, la prima vedere, frecvențele sunt destul de apropiate și este dificil să tragem o concluzie fără ambiguitate fără calcule. Aplicabil Testul de bunăstare a potrivirii lui Pearson X 2, astfel încât în ​​locul afirmației subiective „diferă semnificativ”, care se poate face pe baza comparației histogramelor, folosiți o afirmație corectă din punct de vedere matematic.

Folosim faptul că din cauza legea numerelor mari frecvența observată (Observată) cu creșterea volumului prelevarea de probe n tinde către probabilitatea corespunzătoare legii teoretice (în cazul nostru, legea binomială). În cazul nostru, dimensiunea eșantionului n este 100.

Introduce Test statistici, pe care îl notăm X 2:

unde O l este frecvența observată a evenimentelor pe care variabila aleatoare a luat anumite valori admisibile, E l este frecvența teoretică corespunzătoare (Așteptată). L este numărul de valori pe care le poate lua o variabilă aleatoare (în cazul nostru, este 4).

După cum se poate vedea din formulă, aceasta statistici este o măsură a apropierii frecvențelor observate de cele teoretice, adică. poate fi folosit pentru a estima „distanțele” dintre aceste frecvențe. Dacă suma acestor „distanțe” este „prea mare”, atunci aceste frecvențe sunt „semnificativ diferite”. Este clar că dacă cubul nostru este simetric (adică aplicăm legea binomială), atunci probabilitatea ca suma „distanțelor” să fie „prea mare” va fi mică. Pentru a calcula această probabilitate trebuie să cunoaștem distribuția statistici X 2 ( statistici X 2 se calculează pe baza unei aleatorii prelevarea de probe, prin urmare este o variabilă aleatoare și, prin urmare, are propria sa distribuția probabilității).

Dintr-un analog multidimensional teorema integrală a lui Moivre-Laplace se ştie că pentru n-> ∞ variabila noastră aleatoare X 2 asimptotic cu L - 1 grade de libertate.

Deci, dacă valoarea calculată statistici X 2 (suma „distanțelor” dintre frecvențe) va fi mai mare decât o anumită valoare limită, atunci vom avea motive să respingem ipoteza nulă... Ca și în cazul verificării ipoteze parametrice, valoarea limită este setată prin nivelul de semnificație... Dacă probabilitatea ca statistica X 2 să ia o valoare mai mică sau egală cu valoarea calculată ( p-sens) va fi mai puțin nivelul de semnificație, atunci ipoteza nulă poate fi respins.

În cazul nostru, statistica este 22.757. Probabilitatea ca statistica X 2 să ia o valoare mai mare sau egală cu 22,757 este foarte mică (0,000045) și poate fi calculată folosind formulele
= CHI2.DIST.RF (22,757; 4-1) sau
= CHI2.TEST (Observat; Așteptat)

Notă: Funcția CHI2.TEST () este special concepută pentru a testa conexiunea dintre două variabile categoriale (vezi).

Probabilitatea de 0,000045 este semnificativ mai mică decât de obicei nivelul de semnificație 0,05. Deci, jucătorul are toate motivele să-și suspecteze adversarul de necinste ( ipoteza nulă onestitatea lui este respinsă).

La aplicare criteriul X 2 este necesar să se asigure că volumul prelevarea de probe n a fost suficient de mare, altfel aproximarea distribuției statistica X 2... De obicei, se presupune că pentru aceasta este suficient ca frecvențele observate (Observate) să fie mai mari decât 5. Dacă nu este cazul, atunci frecvențele mici sunt combinate într-una sau se unesc cu alte frecvențe, iar valoarea combinată este atribuită totalului probabilitatea și, în consecință, numărul de grade de libertate scade X 2 -distribuţii.

Pentru a îmbunătăți calitatea aplicării criteriul X 2(), este necesar să reduceți intervalele de partiție (creșteți L și, în consecință, creșteți numărul grade de libertate), însă, acest lucru este împiedicat de limitarea numărului de observații care se încadrează în fiecare interval (b.b.> 5).

Caz continuu

Testul de bunăstare a potrivirii lui Pearson X 2 poate fi aplicat în același mod în caz.

Luați în considerare un anumit prelevarea de probe format din 200 de valori. Ipoteza nulă afirmă că probă făcut din .

Notă: Valori aleatorii în exemplu de fișier pe foaia de lucru Continuous generate cu formula = NORM.ST.OBR (RAND ())... Prin urmare, noile sensuri prelevarea de probe generat de fiecare dată când foaia este recalculată.

Dacă setul de date disponibil este adecvat, poate fi evaluat vizual.

După cum se poate vedea din diagramă, valorile eșantionului se potrivesc destul de bine de-a lungul liniei drepte. Cu toate acestea, ca și pentru testarea ipotezelor aplicabil Criteriul de potrivire al lui Pearson X 2.

Pentru a face acest lucru, împărțim intervalul de variație al variabilei aleatoare în intervale cu un pas de 0,5. Să calculăm frecvențele observate și teoretice. Frecvențele observate vor fi calculate folosind funcția FREQUENCY (), iar cele teoretice - folosind funcția NORM.ST.DIST ().

Notă: Cât despre caz discret, este necesar să se asigure că probă a fost suficient de mare și> 5 valori au căzut în interval.

Calculăm statistica X 2 și o comparăm cu valoarea critică pentru un anumit nivelul de semnificație(0,05). pentru că am împărțit intervalul de variație al variabilei aleatoare în 10 intervale, apoi numărul de grade de libertate este 9. Valoarea critică poate fi calculată prin formula
= CHI2.OBR.PH (0,05; 9) sau
= CHI2.OBR (1-0,05; 9)

În diagrama de mai sus, puteți vedea că statistica este 8,19, ceea ce este semnificativ mai mare criticipoteza nulă nu este respins.

Mai jos este afișat unde probă a asumat o valoare improbabilă şi se bazează pe criteriu Consimțământul Pearson X 2 ipoteza nulă a fost respinsă (deși valorile aleatoare au fost generate folosind formula = NORM.ST.OBR (RAND ()) furnizarea prelevarea de probe din distribuție normală standard).

Ipoteza nulă respins, deși vizual datele sunt situate destul de aproape de o linie dreaptă.

Ca exemplu, luați de asemenea prelevarea de probe din U (-3; 3). În acest caz, chiar și din grafic este evident că ipoteza nulă trebuie respins.

Criteriu Consimțământul Pearson X 2 confirmă de asemenea că ipoteza nulă trebuie respins.

În notele anterioare, au fost descrise proceduri de testare a ipotezelor despre date numerice și categoriale:, mai multe și, de asemenea, permițându-vă să studiați una sau. În această notă, vom lua în considerare metode de testare a ipotezelor despre diferențele dintre cotele unei caracteristici în populațiile generale pe baza mai multor eșantioane independente.

Pentru a ilustra metodele folosite, se folosește un scenariu în care se folosește gradul de satisfacție al oaspeților hotelurilor deținute de TS Resort Properties. Imaginează-ți că ești managerul unei companii care deține cinci hoteluri situate pe două insule de stațiune. Dacă oaspeții sunt mulțumiți de serviciu, sunt șanse să revină anul viitor și să le recomande prietenilor să stea la hotelul dumneavoastră. Pentru a evalua calitatea serviciilor, oaspeții sunt rugați să completeze un chestionar și să indice dacă sunt mulțumiți de ospitalitate. Trebuie să analizați datele sondajului, să determinați nivelul general de satisfacție față de cererile oaspeților, să evaluați probabilitatea ca oaspeții să vină din nou anul viitor și, de asemenea, să stabiliți motivele posibilei nemulțumiri a unor clienți. De exemplu, pe una dintre insule, compania deține hotelurile Beachcomber și Windsurfer. Serviciul este același în aceste hoteluri? Dacă nu, cum pot fi folosite aceste informații pentru a îmbunătăți calitatea companiei? Mai mult, dacă unii oaspeți au spus că nu vor mai veni la tine, ce motive indică mai des decât alții? Se poate susține că aceste motive se referă doar la un anumit hotel și nu se aplică întregii companii în ansamblu?

Aici se folosește următoarea notație: X 1 - numărul de succese din prima grupă, X 2 - numărul de succese în grupa a doua, n 1 X 1 - numărul de eșecuri din primul grup, n 2 X 2 - numărul de defecțiuni din a doua grupă, X =X 1 + X 2 - numărul total de succese, nX = (n 1 X 1 ) + (n 2 X 2 ) este numărul total de defecțiuni, n 1 - volumul primei probe, n 2 - volumul celei de-a doua probe, n = n 1 + n 2 - volumul total de probe. Tabelul prezentat are două rânduri și două coloane, așa că se numește tabel cu factori 2 × 2. Celulele formate prin intersecția fiecărui rând și coloană conțin numărul de reușite sau eșecuri.

Să ilustrăm aplicarea tabelului de contingență folosind exemplul scenariului descris mai sus. Să presupunem că întrebarea „Vei reveni anul viitor?” 163 din cei 227 de oaspeți de la Beachcomber și 154 din cei 262 de oaspeți de la Windsurfer au spus da. Există o diferență semnificativă statistic între satisfacția oaspeților hotelului (reprezentând probabilitatea ca oaspeții să se întoarcă anul viitor) dacă nivelul de semnificație este 0,05?

Orez. 2. Tabelul factori 2x2 pentru evaluarea calității serviciilor pentru oaspeți

Prima linie indică numărul de oaspeți ai fiecărui hotel care și-au declarat dorința de a reveni anul viitor (succes); a doua linie conține numărul de invitați care și-au exprimat nemulțumirea (eșecul). Celulele situate în coloana „Total” conțin numărul total de oaspeți care intenționează să se întoarcă la hotel anul viitor, precum și numărul total de oaspeți care au fost nemulțumiți de serviciu. Celulele de pe rândul „Total” conțin numărul total de oaspeți chestionați pentru fiecare hotel. Proporția oaspeților care intenționează să se întoarcă este calculată prin împărțirea numărului de oaspeți care au spus acest lucru la numărul total de oaspeți chestionați pentru un anumit hotel. Testul χ 2 este apoi utilizat pentru a compara cotele calculate.

Pentru a testa ipotezele nule și alternative H 0: p 1 = p 2; H 1: p 1 ≠ p 2 folosim testul χ 2 -statistici.

Testul chi-pătrat pentru compararea a două acțiuni. Statistica testului χ 2 este egală cu suma pătratelor diferențelor dintre numărul de succese observat și așteptat împărțit la numărul așteptat de succese în fiecare celulă a tabelului:

Unde f 0- numărul observat de succese sau eșecuri într-o anumită celulă a tabelului de contingență; f e

Testul χ 2 -statistici este aproximat prin distribuția χ 2 - cu un grad de libertate.

Sau eșecurile în fiecare celulă a tabelului de contingență, trebuie să înțelegeți semnificația lor. Dacă ipoteza nulă este adevărată, i.e. proporțiile de succes în cele două populații sunt egale, proporțiile eșantionului calculate pentru fiecare dintre cele două grupuri pot diferi unele de altele doar din motive aleatorii și ambele proporții sunt o estimare a parametrului general al populației generale R... În această situație, statisticile care combină ambele acțiuni într-o estimare globală (medie) a parametrului R , reprezintă rata totală de succes în grupurile grupate (adică egală cu numărul total de succese împărțit la dimensiunea totală a eșantionului). Adăugarea ei, 1 – , reprezintă rata totală de eșec în grupurile combinate. Folosind denumirile, a căror semnificație este descrisă în tabelul din Fig. 1.Puteți deriva formula (2) pentru a calcula parametrul :

Unde - cota medie a caracteristicii.

Pentru a calcula numărul așteptat de succese fe(adică conținutul primului rând al tabelului de urgență), este necesar să se înmulțească dimensiunea eșantionului cu parametrul ... Pentru a calcula numărul așteptat de eșecuri f e(adică conținutul celui de-al doilea rând al tabelului de urgență), este necesar să se înmulțească dimensiunea eșantionului cu parametrul 1 – .

Statisticile de test calculate prin formula (1) sunt aproximate prin distribuția χ 2 cu un grad de libertate. La un nivel de semnificație dat α, ipoteza nulă este respinsă dacă statistica χ 2 calculată este mai mare decât χ U 2, valoarea critică superioară a distribuției χ 2 cu un grad de libertate. Astfel, regula deciziei este următoarea: ipoteză H 0 se respinge dacă χ 2> χ U 2, în caz contrar ipoteza H 0 nu deviază (fig. 3).

Orez. 3. Aria critică χ 2 -criteriu de comparare a acțiunilor la nivelul de semnificație α

Dacă ipoteza nulă este adevărată, statistica χ 2 calculată este aproape de zero, deoarece diferența pătrată dintre statisticile observate f 0 si asteptat fe cantitățile din fiecare celulă sunt foarte mici. Pe de altă parte, dacă ipoteza nulă H 0 este falsă și există o diferență semnificativă între proporțiile de succes în populația generală, statisticile χ 2 calculate ar trebui să fie mari. Acest lucru se datorează diferenței dintre numărul observat și cel așteptat de succese sau eșecuri în fiecare celulă, care crește la pătrat. Cu toate acestea, contribuțiile diferențelor dintre valorile așteptate și observate la statisticile generale χ 2 pot fi diferite. Aceeași diferență reală între f 0și f e poate avea un impact mai mare asupra statisticilor χ 2 dacă celula conține rezultatele unui număr mic de observații decât diferența corespunzătoare unui număr mai mare de observații.

Pentru a ilustra testul χ 2 pentru testarea ipotezei egalității a două fracții, să revenim la scenariul descris în secțiunea anterioară, ale cărui rezultate sunt prezentate în Fig. 2. Ipoteza nulă (H 0: p 1 = p 2) arată că la compararea calității serviciilor din două hoteluri, proporțiile oaspeților care plănuiesc să revină anul viitor sunt practic aceleași. Pentru a estima parametrul R, reprezentând proporția de oaspeți care intenționează să se întoarcă la hotel, dacă ipoteza nulă este adevărată, se folosește valoarea , care se calculează prin formula

Ponderea oaspeților care au rămas nemulțumiți de serviciu = 1 - 0,6483 = 0,3517. Înmulțind aceste două cote cu numărul de oaspeți Beachcomber chestionați, obținem numărul așteptat de oaspeți care intenționează să revină sezonul viitor, precum și numărul de turiști care nu vor mai sta la hotel. Ponderea așteptată a oaspeților hotelului Windsurfer este calculată într-un mod similar:

Da - Beachcomber: = 0,6483, n 1 = 227, prin urmare f e = 147,16.
Da - Windsurfer: = 0,6483, n 2 = 262, prin urmare f e = 169,84.
Nu - Beachcomber: 1 - = 0,3517, n 1 = 227, prin urmare f e = 79,84.
Nu - Windsurfer: 1 - = 0,3517, n 2 = 262, prin urmare f e = 92,16.

Calculele sunt prezentate în Fig. 4.

Orez. 4. χ 2 - statistici pentru hoteluri: (a) date inițiale; (b) Tabel factorial 2x2 pentru compararea observațiilor ( f 0 ) și așteptat ( fe) numărul de oaspeți care sunt mulțumiți și nemulțumiți de serviciu; (c) calcularea statisticilor χ 2 la compararea proporției de oaspeți mulțumiți de serviciu; (d) calculul valorii critice a testului χ 2 -statistici

Pentru a calcula valoarea critică a testului χ 2 -statistică se folosește funcția Excel = CHI2.OBR (). Dacă nivelul de semnificație este α = 0,05 (probabilitatea substituită în funcția CHI2.OBR este 1 –α), iar distribuția χ 2 pentru tabelul factorial 2 × 2 are un grad de libertate, valoarea critică a χ 2 -statistica este 3.841. Întrucât valoarea calculată a statisticilor χ 2, egală cu 9,053 (Fig. 4c), depășește numărul 3,841, ipoteza nulă este respinsă (Fig. 5).

Orez. 5. Determinarea valorii critice a testului χ 2 -statistici cu un grad de libertate la nivelul de semnificație α = 0,05

Probabilitate R faptul că ipoteza nulă este corectă atunci când χ 2 -statistica este egală cu 9,053 (și un grad de libertate) se calculează în Excel folosind funcția = 1 - CHIS 2. DIST (9,053; 1; TRUE) = 0,0026. R- o valoare de 0,0026 este probabilitatea ca diferența dintre cotele eșantionului de oaspeți mulțumiți de serviciul de la Beachcomber și Windsurfer să fie egală sau mai mare de 0,718 - 0,588 = 0,13, dacă de fapt cotele lor în ambele populații sunt aceleași .. . Astfel, există motive întemeiate să credem că există o diferență semnificativă statistic în ceea ce privește serviciile pentru oaspeți între cele două hoteluri. Cercetările arată că numărul de oaspeți mulțumiți de serviciile de la Beachcomber este mai mare decât numărul de oaspeți care intenționează să rămână din nou la Windsurfer.

Testarea ipotezelor despre tabelul de factori 2 × 2. Pentru a obține rezultate precise pe baza datelor din Tabelul 2 × 2, este necesar ca numărul de succese sau eșecuri să fie mai mare de 5. Dacă această condiție nu este îndeplinită, atunci trebuie aplicat numărul exact. Testul lui Fisher.

La compararea procentului de clienți mulțumiți de calitatea serviciilor din două hoteluri, criteriile Z și χ 2 conduc la aceleași rezultate. Acest lucru poate fi explicat prin existența unei relații strânse între distribuția normală standardizată și distribuția χ 2 cu un grad de libertate. În acest caz, statistica χ 2 este întotdeauna pătratul statisticii Z. De exemplu, atunci când am măsurat satisfacția oaspeților, am constatat că Z-statistics este +3,01, iar χ 2 -statistics este 9,05. Neglijând erorile de rotunjire, este ușor de verificat că a doua valoare este pătratul primei (adică 3,01 2 = 9,05). În plus, comparând valorile critice ale ambelor statistici la un nivel de semnificație de α = 0,05, putem constata că valoarea lui χ 1 2 egală cu 3,841 este pătratul valorii critice superioare a statisticii Z egal cu + 1,96 (adică, χ 1 2 = Z 2). În plus, R- valorile ambelor criterii sunt aceleași.

Astfel, se poate susține că la testarea ipotezelor nule și alternative H 0: p 1 = p 2; H 1: p 1 ≠ p 2 criteriile Z și χ 2 sunt echivalente. Cu toate acestea, dacă este necesar nu numai să se găsească diferențe, ci și să se determine care proporție este mai mare (p 1> p 2), ar trebui să aplicați un test Z cu o regiune critică delimitată de coada distribuției normale standardizate. În continuare, se va descrie aplicarea criteriului χ 2 pentru compararea cotelor unei caracteristici în mai multe grupuri. Trebuie menționat că criteriul Z nu poate fi aplicat în această situație.

Aplicarea testului χ 2 pentru a testa ipoteza egalității mai multor părți

Testul chi-pătrat poate fi extins la un caz mai general și utilizat pentru a testa ipoteza că mai multe fracții ale unei caracteristici sunt egale. Să notăm cu literă numărul de populații generale independente analizate cu... Acum tabelul de urgență este format din două rânduri și cu coloane. Pentru a testa ipotezele nule și alternative H 0: p 1 = p 2 = … = p 2, H 1: Nu tot Rj egale între ele (j = 1, 2, …, c), testul χ 2 -se folosește statistica:

Unde f 0- numărul observat de succese sau eșecuri într-o anumită celulă a tabelului de factori 2 * cu, fe- numărul teoretic sau așteptat de succese sau eșecuri într-o anumită celulă a tabelului de contingență, cu condiția ca ipoteza nulă să fie adevărată.

Pentru a calcula numărul așteptat de succese sau eșecuri în fiecare celulă a tabelului de contingență, țineți cont de următoarele. Dacă ipoteza nulă este adevărată și proporțiile de succes în toate populațiile sunt egale, proporțiile eșantionului corespunzătoare pot diferi unele de altele doar din motive aleatorii, deoarece toate proporțiile sunt estimări ale proporției unei trăsături. R in populatia generala. În această situație, statisticile care combină toate acțiunile într-un singur parametru global (sau mediu). R, conține mai multe informații decât fiecare dintre ele separat. Aceste statistici, notate cu simbolul , reprezintă rata de succes totală (sau medie) în eșantionul grupat.

Calculul cotei medii:

Pentru a calcula numărul așteptat de succese f eîn prima linie a tabelului de contingență, este necesar să se înmulțească dimensiunea fiecărui eșantion cu un parametru. Pentru a calcula numărul așteptat de eșecuri f eîn al doilea rând al tabelului de contingență, este necesar să se înmulțească dimensiunea fiecărui eșantion cu parametrul 1 – ... Statisticile de test calculate prin formula (1) sunt aproximate prin distribuția χ 2. Numărul de grade de libertate ale acestei distribuții este dat de valoare (r - 1) (c – 1) , Unde r- numărul de rânduri din tabelul factorilor, cu- numărul de coloane din tabel. Pentru un tabel de factori 2 * s numărul de grade de libertate este (2 - 1) (s - 1) = s - 1... La un nivel de semnificație dat α, ipoteza nulă este respinsă dacă statistica χ 2 calculată este mai mare decât valoarea critică superioară χ U 2 inerentă distribuției χ 2 cu s - 1 grade de libertate. Astfel, regula deciziei este următoarea: ipoteză H 0 este respinsă dacă χ 2> χ U 2 (Fig. 6), în caz contrar ipoteza este respinsă.

Orez. 6. Aria critică χ 2 -criteriu de comparare cu ponderea la nivelul de semnificație α

Verificarea ipotezelor privind tabelul factorial 2 * c. Pentru a obține rezultate precise pe baza datelor prezentate în tabelul factorial 2 * cu, este necesar ca numărul de reușite sau eșecuri să fie suficient de mare. Unii statisticieni cred că testul oferă rezultate precise dacă frecvențele așteptate sunt mai mari de 0,5. Cercetătorii mai conservatori solicită ca nu mai mult de 20% din celulele tabelului de contingență să conțină valori așteptate mai mici de 5 și nicio celulă să nu conțină o valoare așteptată mai mică de unu. Această din urmă condiție ni se pare a fi un compromis rezonabil între aceste extreme. Pentru a îndeplini această condiție, categoriile care conțin valori mici așteptate ar trebui combinate într-una singură. După aceea, criteriul devine mai precis. Dacă, din anumite motive, nu este posibilă combinarea mai multor categorii, ar trebui urmate proceduri alternative.

Pentru a ilustra testul χ 2 pentru testarea ipotezei egalității acțiunilor în mai multe grupuri, revenim la scenariul descris la începutul capitolului. Luați în considerare un sondaj similar la care participă oaspeții a trei hoteluri deținute de TS Resort Resources (Fig. 7a).

Orez. 7. Tabelul de factori 2 × 3 pentru compararea numărului de oaspeți mulțumiți și nemulțumiți de serviciu: (a) numărul observat de succese sau eșecuri - f 0; (b) numărul așteptat de succese sau eșecuri - fe; (c) calcularea statisticilor χ 2 atunci când se compară proporțiile de oaspeți mulțumiți de serviciu

Ipoteza nulă arată că proporția clienților care plănuiesc să revină anul viitor este aproape aceeași în toate hotelurile. Pentru a estima parametrul R, care este proporția de oaspeți care intenționează să se întoarcă la hotel, se folosește valoarea R = NS /n= 513/700 = 0,733. Ponderea oaspeților care au fost nemulțumiți de serviciu este 1 - 0,733 = 0,267. Înmulțirea a trei cote cu numărul de oaspeți chestionați în fiecare hotel oferă numărul așteptat de oaspeți care intenționează să revină sezonul următor, precum și numărul de clienți care nu vor mai sta la acel hotel (Figura 7b).

Pentru a testa ipotezele nule și alternative, se utilizează testul χ 2 -statistici, calculate folosind valorile așteptate și observate conform formulei (1) (Fig. 7c).

Valoarea critică a testului χ 2 -statistică este determinată de formula = CHI2.OBR (). Deoarece oaspeții a trei hoteluri participă la sondaj, statistica χ 2 are (2 - 1) (3 - 1) = 2 grade de libertate. La nivelul de semnificație α = 0,05, valoarea critică a statisticilor χ 2 este 5,991 (Fig. 7d). Întrucât statistica χ 2 calculată egală cu 40,236 depășește valoarea critică, ipoteza nulă este respinsă (Fig. 8). Pe de altă parte, probabilitatea R faptul că ipoteza nulă este corectă la χ 2 -statistică egală cu 40,236 (și două grade de libertate) se calculează în Excel folosind funcția = 1-CHI2.DIST () = 0,000 (Fig. 7d). R- valoarea este egală cu 0,000 și mai mică decât nivelul de semnificație α = 0,05. Prin urmare, ipoteza nulă este respinsă.

Orez. 8. Arii de acceptare și respingere a ipotezei despre egalitatea a trei fracții la un nivel de semnificație de 0,05 și două grade de libertate

Respingerea ipotezei nule la compararea cotelor indicate în tabelul factorial 2 * cu, putem spune doar că proporțiile oaspeților mulțumiți de serviciul din cele trei hoteluri nu coincid. Pentru a afla care acțiuni diferă de altele, este necesar să se aplice alte metode, de exemplu, procedura Marasquilo.

Procedura Marasquilo vă permite să comparați toate grupurile în perechi. În prima etapă a procedurii, diferențele p s j - p s j ’ (unde jj) între s (s - 1) / 2în perechi de acțiuni. Intervalele critice corespunzătoare sunt calculate folosind formula:


La un nivel de semnificație generală al lui α, valoarea este rădăcina pătrată a valorii critice superioare a distribuției chi-pătrat având s - 1 grade de libertate. Pentru fiecare pereche de fracții de probă, este necesar să se calculeze un interval critic separat. În ultima etapă, fiecare dintre s (s - 1) / 2 perechile de bătăi sunt comparate cu intervalul critic corespunzător. Acțiunile care formează o anumită pereche sunt considerate statistic semnificativ diferite dacă diferența absolută a cotelor eșantionului | p s j - p s j | depășește intervalul critic.

Să ilustrăm procedura lui Marasquilo folosind exemplul unui sondaj de oaspeți din trei hoteluri (Figura 9a). Aplicând testul chi-pătrat, am verificat că există o diferență semnificativă statistic între proporțiile de oaspeți ai diferitelor hoteluri care intenționează să revină anul viitor. Deoarece sondajul implică oaspeții a trei hoteluri, este necesar să se efectueze 3 (3 - 1) / 2 = 3 comparații în perechi și să se calculeze cele trei intervale critice. Pentru început, să calculăm trei fracții eșantion (Fig. 9b). Cu un nivel de semnificație generală de 0,05, valoarea critică superioară a testului χ 2 -statistica pentru distribuția chi pătrat având (s - 1) = 2 grade de libertate este determinată de formula = CHI2. OBR (0,95; 2) = 5,991. Deci, = 2,448 (Fig.9c). Apoi, calculăm trei perechi de diferențe absolute și intervalele critice corespunzătoare. Dacă diferența absolută este mai mare decât intervalul critic, atunci cotele corespunzătoare sunt considerate semnificativ diferite (Fig. 9d).

Orez. 9. Rezultatele procedurii Marasquilo de testare a ipotezei privind egalitatea proporției de oaspeți mulțumiți în trei hoteluri: (a) datele sondajului; (b) ratele de eșantionare; (c) valoarea critică superioară a testului χ 2 -statistici pentru distribuția chi-pătrat; (d) trei perechi de diferențe absolute și intervalele critice corespunzătoare

După cum puteți vedea, cu un nivel de semnificație de 0,05, gradul de satisfacție al oaspeților hotelului Palm Royal (p s2 = 0,858) este mai mare decât cel al oaspeților de la Golden Palm (p s1 = 0,593) și Palm Princess (p s3 = 0,738) hoteluri. În plus, satisfacția Prințesei Palmieri este mai mare decât cea a Palmierului de Aur. Aceste rezultate ar trebui să conducă conducerea să analizeze motivele acestor diferențe și să încerce să determine de ce rata de satisfacție a oaspeților hotelului Golden Palm este semnificativ mai scăzută decât a oaspeților altor hoteluri.

Materiale folosite din cartea Levin și alte statistici pentru manageri. - M .: Williams, 2004 .-- p. 708-730