Internet ablakok Android

A χ2 teszt alkalmazása annak a hipotézisnek a tesztelésére, hogy két vagy több tört egyenlő. A 2. kritérium logaritmikus hozamának függetlenségére vonatkozó hipotézis tesztelése

Statisztikai teszt

Azt a szabályt, amely szerint az R 0 hipotézist elvetjük vagy elfogadjuk, nevezzük statisztikai kritérium. A kritérium neve főszabály szerint egy betűt tartalmaz, amely a statisztikai hipotézisvizsgáló algoritmus 2. pontjából (lásd 4.1. pont) a kritériumban számított, speciálisan összeállított jellemzőt jelöli. Ennek az algoritmusnak a feltételei mellett a kritériumot hívnák "v-kritérium".

A statisztikai hipotézisek tesztelésekor kétféle hiba lehetséges:

  • - első fajta hiba(elutasíthatja az I 0 hipotézist, ha valóban igaz);
  • - a második típusú hiba(Elfogadhatja az I 0 hipotézist, ha valójában nem igaz).

Valószínűség a az első fajta hibát elkövetni az úgynevezett a kritérium jelentőségének szintje.

Ha azért R jelölje a második típusú hiba elkövetésének valószínűségét, akkor (l - R) - a második típusú hiba elkerülésének valószínűsége, amelyet ún a kritérium ereje.

Jó illeszkedés x 2 Pearson

Többféle statisztikai hipotézis létezik:

  • - az elosztás törvényéről;
  • - a minták egységessége;
  • - az eloszlási paraméterek számértékei stb.

Az eloszlási törvény hipotézisét a Pearson-féle x 2 illeszkedési teszt példáján fogjuk megvizsgálni.

A beleegyezés kritériuma az ismeretlen eloszlás feltételezett törvényére vonatkozó nullhipotézis tesztelésének statisztikai kritériuma.

A Pearson-féle illeszkedési teszt az empirikus (megfigyelt) és az elméleti megfigyelési gyakoriságok összehasonlításán alapul, amelyeket egy bizonyos eloszlási törvény feltételezése mellett számítanak ki. A 0. hipotézis itt a következőképpen fogalmazódik meg: az általános populáció normálisan a vizsgált attribútum szerint oszlik meg.

Algoritmus a 0. számú statisztikai hipotézis tesztelésére a kritériumhoz x 1 Pearson:

  • 1) feltesszük az I 0 hipotézist - a vizsgált tulajdonság szerint az általános populáció normális eloszlású;
  • 2) számítsa ki a minta átlagát és a minta szórását O v;

3) a rendelkezésre álló mintamennyiség szerint NS kiszámítunk egy speciálisan összeállított jellemzőt,

ahol: i, - tapasztalati frekvenciák, - elméleti frekvenciák,

NS - minta nagysága,

h- az intervallum mérete (két szomszédos lehetőség közötti különbség),

a megfigyelt jellemző normalizált értékei,

- táblázat funkció. Az elméleti frekvenciák is

a szabványos MS Excel NORMDIST függvény segítségével számítható ki a képlet szerint;

4) a mintaeloszlásnak megfelelően meghatározzuk egy speciálisan összeállított jellemző kritikus értékét xl P

5) ha a 0. hipotézist elutasítják, ha a 0. hipotézist elfogadják.

Példa. Vegye figyelembe a jelet x- az egyik javítótelepen az elítéltek bizonyos pszichológiai jellemzők vizsgálatára vonatkozó mutatóinak értéke, variációs sorozat formájában:

0,05 szignifikanciaszinten tesztelje az általános populáció normális eloszlásának hipotézisét.

1. Az empirikus eloszlás alapján hipotézist állíthat fel H 0: a vizsgált attribútum szerint "egy adott pszichológiai jellemző tesztmutatójának értéke" az általános populáció volt

a vártak normálisan oszlanak el. 1. alternatív hipotézis: az elítéltek általános populációja általában nem a vizsgált attribútum szerint oszlik meg „egy adott pszichológiai jellemző tesztmutatójának értéke”.

2. Számítsuk ki a minta numerikus jellemzőit:

Intervallumok

x g u

NS) SCH

3. Számítsuk ki a speciálisan összeállított j 2 karakterisztikát. Ehhez az előző táblázat utolsó előtti oszlopában a képlet alapján találjuk meg az elméleti gyakoriságokat, az utolsó oszlopban pedig

számítsuk ki a jellemző% 2-t. Kapunk x 2 = 0,185.

Az érthetőség kedvéért megszerkesztünk egy empirikus eloszlási sokszöget és egy normálgörbét az elméleti frekvenciákhoz (6. ábra).

Rizs. 6.

4. Határozza meg a szabadságfokok számát! s: k = 5, m = 2, s = 5-2-1 = 2.

A táblázat szerint vagy a szabványos MS Excel "HI20BR" függvény használatával a szabadsági fokok száma 5 = 2 és a szignifikancia szintje a = 0,05 keresse meg a kritérium kritikus értékét xl P.=5,99. A szignifikanciaszinthez a= 0,01 kritikus kritériumérték NS%. = 9,2.

5. A kritérium megfigyelt értéke NS= 0,185-tel kevesebb, mint az összes talált érték Hk R.-> ezért az I 0 hipotézist mindkét szignifikanciaszinten elfogadjuk. Az empirikus és elméleti gyakoriságok közötti eltérés jelentéktelen. Következésképpen a megfigyelési adatok összhangban vannak az általános populáció normális eloszlására vonatkozó hipotézissel. Így a vizsgált kritérium szerint "egy adott pszichológiai jellemző tesztmutatójának értéke" az elítéltek általános populációja normálisan oszlik el.

  • 1. Koryachko A.V., Kulichenko A.G. Felsőfokú matematika és matematikai módszerek a pszichológiában: gyakorlati gyakorlatok útmutatója a Pszichológiai Kar hallgatóinak. Rjazan, 1994.
  • 2. Örökség Kr. u A pszichológiai kutatás matematikai módszerei. Adatok elemzése, értelmezése: Tankönyv, kézikönyv. SPb., 2008.
  • 3. Sidorenko E.V. A matematikai feldolgozás módszerei a pszichológiában. SPb., 2010.
  • 4. Soshnikova L.A. és egyéb Többváltozós statisztikai elemzés a közgazdaságtanban: Tankönyv, kézikönyv egyetemeknek. M., 1999.
  • 5. Sukhodolskiy E.V. Matematikai módszerek a pszichológiában. Harkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Statisztika elméleti műhely: Tankönyv, kézikönyv. M., 2009.
  • Gmurman V.E. Valószínűségelmélet és matematikai statisztika. 465. o.

Kritériumfeladatok

A χ 2 kritériumot két célra használják;

1) összehasonlítani a tulajdonság empirikus eloszlását a elméleti - egységes, normál vagy egyéb;

2) összehasonlítás céljából kettő, három vagy több empirikus ugyanazon jellemző eloszlásai 12.

A kritérium leírása

χ 2. kritérium választ ad arra a kérdésre, hogy egy jellemző különböző értékei azonos gyakorisággal fordulnak elő empirikus és elméleti eloszlásban, vagy két vagy több empirikus eloszlásban.

A módszer előnye, hogy lehetővé teszi a jellemzők eloszlásának összehasonlítását tetszőleges skálán, az elnevezési skálától kezdve (lásd 1.2. fejezet). Az "igen - nem", "megengedte a házasságot - nem tette lehetővé a házasságot", "megoldotta a problémát - nem oldotta meg a problémát" stb. alternatív eloszlás legegyszerűbb esetben már alkalmazhatjuk a χ 2 kritériumot.

Tegyük fel, hogy egy megfigyelő feljegyzi azoknak a gyalogosoknak a számát, akik két szimmetrikus út közül a jobb vagy bal oldalt választották az A pontból B pontba vezető úton (lásd 4.3. ábra).

Tegyük fel, hogy 70 megfigyelés eredményeként azt találták NS\ az emberek a helyes pályát választották, és csak 19-en választották a bal oldalt. A χ 2 kritériumot használva Meg tudjuk határozni, hogy a választások adott eloszlása ​​eltér-e egy olyan egyenletes eloszlástól, amelyben mindkét sáv ugyanolyan gyakorisággal mintavételezésre kerülne. Ez a kapott összehasonlítás egy változata uhpirikus terjesztéssel elméleti. Ilyen feladat lehet például a tervezéssel kapcsolatos alkalmazott pszichológiai kutatások építészetben, kommunikációs rendszerekben stb.

De képzeljük el, hogy a megfigyelő egészen más problémát old meg: a kétoldalú szabályozás problémáival van elfoglalva. A kapott eloszlás egybeesése az egységesvel sokkal kevésbé érdekli őt, mint adatainak egybeesése vagy nem egyezése más kutatók adataival. Tudja, hogy azok az emberek, akiknél túlsúlyban van a jobb láb, hajlamosak az óramutató járásával ellentétes irányba, a bal lábukkal túlsúlyban lévők pedig az óramutató járásával megegyezően körözni, és hogy a kollégák 13 tanulmányában a bal láb túlsúlyát találták 26-ban. 100 megkérdezett ember közül.

A χ 2 módszerrel két empirikus eloszlást tud összehasonlítani: a saját mintájában az 51:19-es arányt és a többi kutató mintájában a 74:26-os arányt.

Ez egy lehetőség két empirikus összehasonlítása eloszlások a legegyszerűbb alternatív kritérium szerint (természetesen matematikai szempontból a legegyszerűbb, és semmiképpen sem pszichológiai szempontból).

Hasonlóképpen összehasonlíthatjuk három vagy több alternatíva választási eloszlását. Például, ha egy 50 fős mintában 30 fő választotta az (a) választ, 15 fő - a (b) és 5 fő - a (c) választ, akkor a χ 2 módszerrel ellenőrizhetjük, hogy ez az eloszlás eltér-e. egységes megoszlásból vagy más mintában a válaszok megoszlásából, ahol az (a) választ 10 fő választotta, a (b) választ -25 fő, a (c) választ - 15 fő.

Azokban az esetekben, amikor egy tulajdonságot mennyiségileg mérnek, mondjuk v pontok, másodpercek vagy milliméterek, előfordulhat, hogy az attribútumértékek sokaságát több számjegyben kell kombinálnunk. Például, ha a probléma megoldásának ideje 10 és 300 másodperc között változik, akkor a minta méretétől függően 10 vagy 5 számjegyet adhatunk meg. Például ezek kisülések lesznek: 0-50 másodperc; 51-100 másodperc; 101-150 másodperc, stb. Ezután a χ 2 módszert használjuk összehasonlítja a jellemző különböző kategóriáinak előfordulási gyakoriságát, de a sematikus diagram többi része nem változik.

Az empirikus eloszlás elméletivel való összehasonlításakor meghatározzuk az empirikus és az elméleti gyakoriság közötti eltérés mértékét.

A két empirikus eloszlás összehasonlításával meghatározzuk az empirikus gyakoriságok és az elméleti gyakoriságok közötti eltérés mértékét, amely akkor figyelhető meg, ha ez a két empirikus eloszlás egybeesne. Az elméleti frekvenciák kiszámítására szolgáló képleteket minden összehasonlítási lehetőséghez külön megadják.

Minél nagyobb az eltérés két összehasonlítható eloszlás között, a több empirikus y értéke).

Hipotézisek

A hipotéziseknek többféle változata lehetséges, a feladatoktól függően,

amit magunk elé helyezünk.

Első lehetőség:

N 0: A tulajdonság kapott empirikus eloszlása ​​nem tér el az elméleti (például egyenletes) eloszlástól.

H 1: A tulajdonság eredő empirikus eloszlása ​​eltér az elméleti eloszlástól.

Második lehetőség:

H 0: Az 1. tapasztalati eloszlás nem különbözik a 2. tapasztalati eloszlástól.

H 1: Az 1. tapasztalati eloszlás eltér a 2. tapasztalati eloszlástól.

Harmadik lehetőség:

H 0: Az 1, 2, 3, ... empirikus eloszlások nem különböznek egymástól.

H 1: Az 1, 2, 3, ... tapasztalati eloszlások különböznek egymástól.

A χ 2 kritérium lehetővé teszi mindhárom hipotézis tesztelését.

A kritérium grafikus ábrázolása

Szemléltessünk egy példát a jobb vagy bal pálya kiválasztásával az A pontból B pontba vezető úton. 4.4 a bal oldali sáv kiválasztásának gyakoriságát a bal oldali sáv, a jobb oldali sáv kiválasztásának gyakoriságát pedig a 14 hisztogram jobb sávja jelöli. Az ordináta tengelyen a kiválasztás relatív gyakoriságát mérik, vagyis egy adott pálya kiválasztásának gyakoriságát, a megfigyelések összességére vonatkoztatva. A bal oldali sáv relatív gyakorisága, amelyet frekvenciának is neveznek, 19/70, azaz 0,27, a jobb sávnál pedig 51/70, azaz 0,73.

Ha mindkét pályát egyforma valószínűséggel választanák, akkor az alanyok fele a jobb, fele a bal oldalt választaná. Az egyes sávok kiválasztásának valószínűsége 0,50.

Látjuk, hogy az empirikus gyakoriságok eltérései ettől az értéktől meglehetősen jelentősek. Talán jelentősek lesznek a különbségek az empirikus és az elméleti eloszlás között.

ábrán. A 4.5 valójában két hisztogramot mutat be, de az oszlopok úgy vannak csoportosítva, hogy a bal oldalon a bal oldali sáv preferenciájának gyakoriságait hasonlítjuk össze megfigyelőnk választása során (1) és a T.A. mintájában. Dobrokhotova és N.N. Bragina (2), és a jobb oldalon - a jobb oldali sáv preferenciájának gyakorisága ugyanabban a két mintában.

Látjuk, hogy a minták közötti eltérések nagyon jelentéktelenek. χ2 kritérium, nagy valószínűséggel megerősíti a két eloszlás egybeesését.

A kritérium korlátai

1. A minta méretének elég nagynak kell lennie: NS30. Nál nél NS<30 критерий χ2 nagyon közelítő értékeket ad. A kritérium pontossága általában nő NS.

2. A táblázatban szereplő egyes cellák elméleti gyakorisága nem lehet kisebb 5-nél: f> 5. Ez azt jelenti, hogy ha a számjegyek száma előre meghatározott és nem változtatható, akkor nem tudjuk alkalmazni a χ2 módszert bizonyos minimális számú megfigyelés felhalmozása nélkül. Ha például tesztelni akarjuk azon feltételezéseinket, hogy a Trust telefonszolgáltatás hívási gyakorisága egyenetlenül oszlik meg a hét 7 napján, akkor 5 * 7 = 35 hívásra van szükségünk. Így ha a számjegyek száma ( k) előre megadva, mint ebben az esetben is, a megfigyelések minimális száma ( n min) a következő képlettel határozzuk meg: n min = k*5.

3. A kiválasztott számjegyeknek a teljes disztribúciót "ki kell húzniuk", vagyis le kell fedniük a jellemzők variabilitásának teljes skáláját. Ebben az esetben a számjegyek szerinti csoportosításnak minden összehasonlított eloszlásban azonosnak kell lennie.

4. A csak 2 értéket felvevő jellemzők eloszlásának összehasonlításakor "folytonossági korrekciót" kell végezni. A korrekció végrehajtásakor a χ 2 érték csökken (lásd a folytonossági korrekciós példát).

5. A kibocsátások nem lehetnek átfedőek: ha egy megfigyelést egy kategóriába sorolnak, akkor az már nem rendelhető más kategóriába.

A megfigyelések kategóriánkénti összegének mindig egyenlőnek kell lennie a megfigyelések teljes számával.

Jogos az a kérdés, hogy mit tekintünk a megfigyelések számának – a választások, reakciók, cselekvések száma, vagy azon alanyok száma, akik választanak, reagálnak vagy cselekednek. Ha az alany több reakciót mutat, és mindegyik regisztrálva van, akkor az alanyok száma nem esik egybe a reakciók számával. Összegezhetjük az egyes alanyok reakcióit, mint például a Heckhausen-módszer a teljesítménymotiváció vizsgálatánál, vagy az S. Rosenzweig Frusztrációs Tolerancia Teszt, és összehasonlíthatjuk az egyes reakcióösszegek eloszlását több mintán.

Ebben az esetben a megfigyelések száma az alanyok száma lesz. Ha egy adott típusú reakciók gyakoriságát számoljuk a minta egészében, akkor megkapjuk a különböző típusú reakciók eloszlását, és ebben az esetben a megfigyelések száma a regisztrált reakciók összessége lesz, és nem a reakciók száma. tantárgyak száma.

Matematikai szempontból mindkét esetben betartjuk a bitfüggetlenség szabályát: egy megfigyelés az eloszlás egy és csak egy bitjére vonatkozik.

Elképzelhető a vizsgálat egy olyan változata, ahol egy tárgy választási lehetőségeinek megoszlását vizsgáljuk. A kognitív-viselkedési terápiában például arra kérik a klienst, hogy rögzítse a nemkívánatos reakció fellépésének pontos idejét, például gyakrabban jelennek meg félelemrohamok, depresszió, dühkitörések, önbecsapó gondolatok stb. és segít az ügyfélnek egyéni programot felépíteni a mellékhatások megelőzésére.

Lehetséges-e a χ2 kritérium használatával annak bizonyítására, hogy egyes órák gyakoribbak ebben az egyedi eloszlásban, míg mások ritkábban? Minden megfigyelés függő, mivel ugyanarra a témára vonatkozik; ugyanakkor az összes folyás nem fedi egymást, mivel ugyanaz a roham egy és csak egy folyásra vonatkozik (jelen esetben délután egy órára). Nyilvánvalóan a χ2 módszer alkalmazása ebben az esetben némi egyszerűsítést jelent. A félelem, harag vagy depresszió rohamai a nap folyamán ismétlődően előfordulhatnak, és kiderülhet, hogy mondjuk kora reggel 6 órakor és késő este 12 órakor a rohamok általában együtt, ugyanazon a napon jelentkeznek. : ugyanakkor a napi 3 órás roham legkorábban az előző roham után egy nappal, és legalább két nappal a következő előtt jelentkezik, stb. Úgy tűnik, egy összetett matematikai modellről vagy valami hasonlóról beszélünk, ami nem tud "az algebra elhiszi". Mindazonáltal gyakorlati okokból hasznos lehet a kritérium alkalmazása annak érdekében, hogy feltárjuk a szisztematikus egyenetlenségeket, amelyek egyazon személynél jelentkeznek bármely jelentős esemény, választás, preferencia stb.

Tehát ugyanaz a megfigyelés csak egy kategóriára vonatkozik. De hogy az egyes alanyokat megfigyelésnek vagy az alany minden egyes vizsgált reakcióját tekintsük-e, az kérdés, amelynek megoldása a vizsgálat célkitűzéseitől függ (lásd például Ganzen V.A., Balin V.D., 1991, 10. o.).

A kritérium fő "korlátozása". χ 2 -, hogy a legtöbb kutató számára ijesztően nehéznek tűnik.

Próbáljuk meg leküzdeni a kritérium érthetetlen nehézségének mítoszát χ 2 . A dolgok felpörgetése érdekében vegyünk egy humoros irodalmi példát.

h2 Pearson teszt

Az elosztási törvény sikeres vagy sikertelen kiválasztásának kritériumait általában az egyetértési kritériumok jelölik. C. Pearson 2. kritériuma a leggyakrabban használt kritérium az eloszlási törvény egyszerű hipotézisének tesztelésére. Ez azon alapul, hogy a kísérleti adatok eltérésének mértékeként használják fel a kísérleti adatoknak az azonos mennyiség hipotetikus eloszlásától való eltérését, amely az ismeretlen sűrűség megbízhatósági tartományának megalkotására szolgál, a zuhanási valószínűségek ismeretlen valódi értékeinek helyettesítésével. az intervallumokba a hipotetikus eloszlásból számított valószínűségekkel. Tegyük fel, hogy egy valószínűségi változó lehetséges értékeinek tartománya r intervallumra van felosztva (többdimenziós, azaz vektormennyiség esetén téglalapok). Legyen ezeknek az intervallumoknak az n kísérlet eredményeként kapott véletlenszerű ütési gyakorisága, P1, ..., Pr - az azonos intervallumok eltalálásának valószínűsége, a hipotetikus eloszlásból számítva.

Általános esetben ezek a valószínűségek azonos kísérleti adatokból nyert ismeretlen paraméterek becsléseinek függvényei, és ezért véletlenszerű mennyiségek is. Tegyük fel, hogy egy hipotetikus eloszlás ismeretlen paramétereinek becsléseit ugyanabból az összevont mintából számítjuk ki, mint a gyakoriságokat. Ekkor a P1, ..., Pr valószínűségek a gyakoriságok néhány függvényei lesznek, és a kísérleti adatok hipotetikus eloszlástól való eltérésének értékeléséhez vegyük az értéket.

ahol Р1, ..., Pr - a frekvenciák bizonyos funkciói.

Neumann és Pearson kimutatta, hogy ha a hipotetikus eloszlás ismeretlen s-dimenziós paraméterének aszimptotikusan hatékony és aszimptotikusan normális becslését használjuk csoportosított mintán a P1, ..., Pr valószínűségek kiszámításához, akkor a képlettel meghatározott Z értéket. (1), a határértékben n ->? ch2 -eloszlású r-s-1 szabadságfokkal.

Ezzel a tétellel az n2 eloszlás táblázatai segítségével megbecsülhető a kísérleti adatok és a hipotetikus eloszlás közötti eltérés. Elég kicsi p valószínűséget választunk, hogy egy ilyen valószínűségű esemény gyakorlatilag lehetetlennek tekinthető, és az egyenletből meghatározzuk

Ha a kísérletek eredményeként kapott Z érték realizációja = 2 meghaladja vagy egyenlő, = 2, akkor a hipotetikus eloszlást a kísérleti adatokkal összeegyeztethetetlennek tekintjük, mivel ezzel az eloszlással gyakorlatilag lehetetlen megkapni. egy mintával = 2. Egy ilyen esemény valószínűsége nagyszámú n kísérlet esetén megközelítőleg egyenlő p-vel, azaz. elhanyagolható. Ebben az esetben azt mondják, hogy a kísérleti adatok jelentős eltérést mutatnak a hipotetikus eloszlástól. Ha = 2, akkor úgy gondoljuk, hogy a hipotetikus eloszlás nem mond ellent a kísérleti adatoknak, megegyezik velük.

Az értéket a minta hipotetikus eloszlástól való eltérésének 100p-százalékos szignifikanciaszintjének nevezzük. Jellemzően 5%, 1% és 0,1% szignifikanciaszinteket használnak, a feladat jellegétől függően.

A kísérleti adatok és a hipotetikus eloszlás összhangjának további ellenőrzéséhez célszerű kiszámítani annak a valószínűségét, hogy egy adott hipotetikus eloszlás esetén Z értéke nagyobb lesz, mint a megvalósítási kísérletek eredményeként kapott érték = 2, P (Z> 2) Minél nagyobb ez a valószínűség, annál jobban egyezik a minta a hipotetikus eloszlással, annál kisebb a jelentősége a kapott eltérésnek a minta és a hipotetikus eloszlás között. Valóban, ha a P valószínűség magas (Z> 2), akkor ennek a kísérletsorozatnak a megismétlésekor, ha az eloszlásról választott hipotézis helyes, akkor gyakran olyan Z értékeket kapunk, amelyek még a kapott értéknél is nagyobbak. a kísérletek eredményeként = 2.

Ügyeljen arra, hogy miután megkapta = 2< и даже получив высокую вероятность P(Z >2) nem vonunk le határozott következtetést a választott eloszlási hipotézis érvényességére, csak annyit mondunk, hogy ez a hipotézis nem mond ellent a kapott kísérleti eredményeknek, megegyezik azokkal, aminek eredményeként elfogadható. Ahhoz, hogy kellően erős bizonyítékot kapjunk arra vonatkozóan, hogy a valószínűségi változó valóban engedelmeskedik a hipotetikus eloszlási törvénynek, ezt a kísérletsorozatot kellően sokszor meg kell ismételni, és meg kell győződni arról, hogy a hipotézis és a kísérleti eredmények között kapott egyezés stabil.

Kolmogorov-kritérium

Kolmogorov-kritérium - segédkritérium

A főkritérium P-értéke eloszlásának egységességének ellenőrzéséhez segédkritériumként ebben a munkában a Kolmogorov-kritériumot használjuk.

Kolmogorov-kritérium az F ^ * (x) statisztikai eloszlásfüggvény és a megfelelő F (x, azaz D = max | F ^ * (x) -F (x) eloszlásfüggvény közötti különbség modulusának maximális értékét veszi figyelembe | .

A következő lépés az l = D érték meghatározása. A statisztikai táblázatok szerint (matcalc környezetben a pvKolm (u) függvény) annak a valószínűsége, hogy pusztán véletlenszerű okok miatt az F ^ * (x) és F (x) közötti maximális eltérés nem lesz kisebb, mint a ténylegesen megfigyelt . Ha a P (n) valószínűség viszonylag magas, akkor a hipotézist el kell fogadni, ha nagyon kicsi, akkor el kell utasítani, mint valószínűtlen.

Vegye figyelembe az alkalmazástKISASSZONYEXCELa Pearson khi-négyzet teszt egyszerű hipotézisek tesztelésére.

A kísérleti adatok beszerzése után (vagyis amikor van néhány minta), általában azt az eloszlási törvényt választják, amely a legjobban írja le az adott által képviselt valószínűségi változót mintavétel... Annak ellenőrzését, hogy a kísérleti adatokat mennyire írja le jól a választott elméleti eloszlási törvény, a segítségével végezzük beleegyezés kritériumai. Null hipotézist, általában létezik egy hipotézis egy valószínűségi változó eloszlásának egyenlőségéről valamilyen elméleti törvényszerűséggel.

Először nézzük meg az alkalmazást Pearson-féle illeszkedési teszt X 2 (khi-négyzet) egyszerű hipotézisekkel kapcsolatban (az elméleti eloszlás paramétereit ismertnek feltételezzük). Ekkor -, amikor csak az eloszlás alakja van megadva, és ennek az eloszlásnak a paraméterei és az értéke statisztika X 2 ezek alapján becsülik / számítják ki mintavétel.

jegyzet: Az angol nyelvű szakirodalomban a pályázati eljárás Pearson alkalmassági tesztje X 2 címe van Az illeszkedés khi-négyzet jósági tesztje.

Emlékezzünk vissza a hipotézisvizsgálati eljárásra:

  • alapján mintavétel az érték kiszámításra kerül statisztika, amely megfelel a tesztelt hipotézis típusának. Például for használatos t-statisztika(ha nem ismert);
  • alávetve az igazságnak null hipotézist, ennek eloszlása statisztika ismert, és valószínűségek kiszámítására használható (például a t-statisztika ez );
  • alapján számítják ki mintavétel jelentése statisztikaösszehasonlítva az adott érték kritikus értékével ();
  • null hipotézist elutasítja, ha az érték statisztika több mint kritikus (vagy ha ennek az értéknek a valószínűsége statisztika() kisebb szignifikancia szint, ami egyenértékű megközelítés).

végrehajtjuk hipotézisvizsgálat különböző disztribúciókhoz.

Diszkrét eset

Tegyük fel, hogy két ember kockáznak. Minden játékosnak más-más kockája van. A játékosok felváltva dobnak egyszerre 3 kockával. Minden kört az nyer, aki egyszerre több hatost dob. Az eredményeket rögzítjük. 100 kör után az egyik játékos azt gyanította, hogy az ellenfél kockái aszimmetrikusak, mert gyakran nyer (gyakran hatost dob). Úgy döntött, hogy elemzi, mennyire valószínű, hogy ilyen számú ellenfél eredményes lesz.

jegyzet: Mivel kocka 3, akkor egyszerre 0-t dobhatsz; 1; 2 vagy 3 hatos, pl. egy valószínűségi változó 4 értéket vehet fel.

A valószínűségelméletből tudjuk, hogy ha a kockák szimmetrikusak, akkor a hatos szerzés valószínűsége engedelmeskedik. Ezért 100 kör után a képlet segítségével kiszámítható a hatosok gyakorisága
= BINOM.ELOSZTÁS (A7; 3; 1/6; HAMIS) * 100

A képlet feltételezi, hogy a cellában A7 tartalmazza a megfelelő számú kiesett hatost egy körben.

jegyzet: A számítások a következőkben vannak megadva példafájlt a Diszkrét lapon.

Összehasonlításképp megfigyelt(Megfigyelték) és elméleti frekvenciák(Várható) kényelmesen használható.

Ha a megfigyelt gyakoriságok jelentős eltérést mutatnak az elméleti eloszlástól, null hipotézist egy valószínűségi változó elméleti törvény szerinti eloszlásáról, el kell utasítani. Vagyis ha az ellenfél kockái aszimmetrikusak, akkor a megfigyelt frekvenciák „jelentősen eltérnek” a binomiális eloszlás.

Nálunk első ránézésre elég közel állnak a frekvenciák, és számítások nélkül nehéz egyértelmű következtetést levonni. Alkalmazható Pearson-féle illeszkedési teszt X 2, így a szubjektív „jelentősen különbözik” állítás helyett, ami az összehasonlítás alapján tehető hisztogramok, használjon matematikailag helyes állítást.

Használjuk azt a tényt, hogy mivel a nagy számok törvénye megfigyelt gyakoriság (Megfigyelt) növekvő hangerővel mintavétel n az elméleti törvénynek megfelelő valószínűségre hajlik (esetünkben binomiális törvény). Esetünkben az n mintanagyság 100.

Bemutatni teszt statisztika, amelyet X 2-vel jelölünk:

ahol O l azoknak az eseményeknek a megfigyelt gyakorisága, amelyeknél a valószínűségi változó bizonyos megengedhető értékeket vett fel, E l a megfelelő elméleti gyakoriság (várható). L az értékek száma, amelyet egy valószínűségi változó felvehet (a mi esetünkben 4).

Ahogy a képletből is látszik, ez statisztika a megfigyelt frekvenciák elméletihez való közelségének mértéke, azaz. segítségével meg lehet becsülni e frekvenciák közötti "távolságokat". Ha ezeknek a "távolságoknak" az összege "túl nagy", akkor ezek a frekvenciák "jelentősen különböznek". Nyilvánvaló, hogy ha a kockánk szimmetrikus (azaz alkalmazzuk binomiális törvény), akkor kicsi lesz annak a valószínűsége, hogy a „távolságok” összege „túl nagy” lesz. Ennek a valószínűségnek a kiszámításához ismernünk kell az eloszlást statisztika X 2 ( statisztika Az X 2 kiszámítása véletlenszerűen történik mintavétel, ezért ez egy valószínűségi változó, és ezért megvan a sajátja Valószínűségi eloszlás).

Többdimenziós analógból Moivre-Laplace integrál tétele ismert, hogy n-> ∞ esetén az X 2 valószínűségi változónk aszimptotikusan L - 1 szabadságfokkal.

Tehát ha a számított érték statisztika X 2 (a frekvenciák közötti "távolságok" összege) nagyobb lesz, mint egy bizonyos határérték, akkor lesz okunk elutasítani null hipotézist... Mint az ellenőrzésnél parametrikus hipotézisek, a határérték beállítása ezen keresztül történik szignifikancia szint... Ha annak a valószínűsége, hogy az X 2 statisztika kisebb vagy egyenlő értéket vesz fel, mint a számított ( p-jelentése) kevesebb lesz szignifikancia szint, azután null hipotézist elutasítható.

Esetünkben a statisztika 22,757. Annak a valószínűsége, hogy az X 2 statisztika 22,757-nél nagyobb vagy egyenlő értéket vesz fel, nagyon kicsi (0,000045), és a képletekkel kiszámítható
= CHI2.DIST.RF (22,757; 4-1) vagy
= CHI2.TESZT (megfigyelt; várható)

jegyzet: A CHI2.TEST () függvényt kifejezetten két kategorikus változó közötti kapcsolat tesztelésére tervezték (lásd).

A 0,000045 valószínűség lényegesen kisebb a szokásosnál szignifikancia szint 0,05. Tehát a játékosnak minden oka megvan arra, hogy ellenfelét tisztességtelenséggel gyanúsítsa ( null hipotézistőszinteségét elutasítják).

Jelentkezéskor X 2. kritérium biztosítani kell, hogy a hangerő mintavétel n elég nagy volt, egyébként az eloszlás közelítése statisztika X 2... Általában azt feltételezik, hogy ehhez elegendő, ha a megfigyelt gyakoriságok (Megfigyelt) nagyobbak, mint 5. Ha ez nem így van, akkor a kis frekvenciákat egyesítik egy vagy más frekvenciákhoz kapcsolják, és az összesített értékhez hozzárendeljük a teljes valószínűséget. és ennek megfelelően a szabadsági fokok száma csökken X 2 -eloszlások.

Az alkalmazás minőségének javítása érdekében X 2. kritérium(), csökkenteni kell a partíciók intervallumait (növelni kell az L-t, és ennek megfelelően növelni a számot szabadsági fokokat), ezt azonban gátolja az egyes intervallumokba eső megfigyelések számának korlátozása (b.b.> 5).

Folyamatos eset

Pearson alkalmassági tesztje X 2 esetben ugyanúgy alkalmazható.

Fontolja meg egy bizonyos mintavétel 200 értékből áll. Null hipotézist azt állítja minta készült .

jegyzet: Véletlenszerű értékek példafájl a munkalapon Folyamatos képlettel generált = NORM.ST.OBR (RAND ())... Ezért az új jelentések mintavétel minden alkalommal generálódik, amikor a lap újraszámításra kerül.

Vizuálisan értékelhető, hogy a rendelkezésre álló adatkészlet megfelelő-e.

Amint az a diagramból látható, a mintaértékek meglehetősen jól illeszkednek az egyenes mentén. Azonban, mint a hipotézisvizsgálat alkalmazható Pearson-féle alkalmassági kritérium X 2.

Ehhez a valószínűségi változó variációs tartományát 0,5 lépéssel intervallumokra osztjuk. Számítsuk ki a megfigyelt és az elméleti gyakoriságokat! A megfigyelt frekvenciák a FREKVENCIA () függvénnyel, az elméletiek pedig a NORM.ST.DIST () függvény segítségével kerülnek kiszámításra.

jegyzet: Ami azt illeti diszkrét eset, biztosítani kell azt minta elég nagy volt, és > 5 érték esett az intervallumba.

Kiszámoljuk az X 2 statisztikát, és összehasonlítjuk egy adott kritikus értékével szignifikancia szint(0,05). Mivel a valószínűségi változó variációs tartományát 10 intervallumra osztottuk, ekkor a szabadsági fokok száma 9. A kritikus érték a képlettel számítható
= CHI2.OBR.PH (0,05; 9) vagy
= CHI2.OBR (1-0,05; 9)

A fenti diagramon látható, hogy a statisztika 8,19, ami lényegesen magasabb kritikainull hipotézist nincs elutasítva.

Alább látható, hogy hol minta valószínűtlen értéket vett fel és azon alapul kritérium Pearson Consent X 2 a nullhipotézist elutasították (bár a véletlen értékeket a képlet segítségével generáltuk = NORM.ST.OBR (RAND ()) gondoskodás mintavétel tól től szabványos normál eloszlás).

Null hipotézist elutasítva, bár vizuálisan az adatok meglehetősen közel helyezkednek el egy egyeneshez.

Példaként vegyük azt is mintavétel U-tól (-3; 3). Ebben az esetben már a grafikonon is nyilvánvaló, hogy null hipotézist el kell utasítani.

Kritérium Pearson Consent X 2 ezt is megerősíti null hipotézist el kell utasítani.

Az előző jegyzetekben leírták a numerikus és kategorikus adatokkal kapcsolatos hipotézisek tesztelésének eljárásait:, több, valamint lehetővé téve egy vagy egy vagy. Ebben a jegyzetben olyan hipotézisek tesztelésének módszereit vizsgáljuk meg, amelyek egy jellemzőnek az általános sokaságban való részesedése közötti különbségekre vonatkoznak, több független minta alapján.

Az alkalmazott módszerek illusztrálására egy olyan forgatókönyvet használnak, amelyben a TS Resort Properties tulajdonában lévő szállodák vendégeinek elégedettségi fokát használják. Képzelje el, hogy Ön egy olyan cég vezetője, amely öt szállodával rendelkezik két üdülőszigeten. Ha a vendégek elégedettek a szolgáltatással, valószínű, hogy jövőre visszatérnek, és ajánlják barátaiknak, hogy szálljanak meg az Ön szállodájában. A szolgáltatás minőségének felmérése érdekében a vendégeket kérdőív kitöltésével kérjük, jelezzék, hogy elégedettek-e a vendéglátással. Elemeznie kell a felmérés adatait, meg kell határoznia a vendégek kéréseivel kapcsolatos általános elégedettségi szintet, fel kell mérnie annak valószínűségét, hogy jövőre ismét vendég érkezik, és meg kell határoznia egyes ügyfelek esetleges elégedetlenségének okait. Például az egyik szigeten a cég a Beachcomber és a Windsurfer szállodák tulajdonosa. Ugyanaz a szolgáltatás ezekben a szállodákban? Ha nem, hogyan lehet ezeket az információkat felhasználni a vállalat minőségének javítására? Sőt, ha néhány vendég azt mondta, hogy nem jön többé Önhöz, milyen indokokat jelöl meg gyakrabban, mint mások? Lehet-e vitatkozni azzal, hogy ezek az okok csak egy adott szállodára vonatkoznak, és nem vonatkoznak a vállalat egészére?

Itt a következő jelölést használjuk: x 1 - az első csoportban elért sikerek száma, x 2 - a sikerek száma a második csoportban, n 1 x 1 - a hibák száma az első csoportban, n 2 x 2 - a meghibásodások száma a második csoportban, X =x 1 + x 2 - a sikerek teljes száma, nx = (n 1 x 1 ) + (n 2 x 2 ) a hibák teljes száma, n 1 - az első minta térfogata, n 2 - a második minta térfogata, n = n 1 + n 2 - a minták teljes mennyisége. A bemutatott táblázat két sorból és két oszlopból áll, ezért 2 × 2 faktoros táblázatnak nevezzük. Az egyes sorok és oszlopok metszéspontjából képzett cellák a sikeresek vagy kudarcok számát tartalmazzák.

Szemléltessük a kontingenciatábla alkalmazását a fent leírt forgatókönyv példáján keresztül. Tegyük fel a kérdést: "Jövőre visszajössz?" A Beachcomber 227 vendégéből 163, a Windsurfer 262 vendégéből 154 mondott igent. Van-e statisztikailag szignifikáns különbség a szállodai vendégelégedettség között (amely annak valószínűségét jelenti, hogy a vendégek jövőre visszatérnek), ha a szignifikancia szint 0,05?

Rizs. 2. 2x2-es faktortábla a vendégek kiszolgálásának minőségének felmérésére

Az első sor az egyes szállodák azon vendégeinek számát jelzi, akik bejelentették, hogy a következő évben szeretnének visszatérni (siker); a második sor az elégedetlenséget (kudarcot) kifejező vendégek számát tartalmazza. Az „Összesen” oszlopban található cellák a szállodába jövőre visszatérni szándékozók összesített számát, valamint a szolgáltatással elégedetlen vendégek számát tartalmazzák. Az „Összesen” sor cellái az egyes szállodákban megkérdezett vendégek teljes számát tartalmazzák. A visszatérni szándékozó vendégek arányát úgy számítjuk ki, hogy az így nyilatkozó vendégek számát elosztjuk az adott szállodában megkérdezett vendégek számával. Ezután a χ 2 tesztet használják a számított részesedések összehasonlítására.

Null- és alternatív hipotézisek tesztelése H 0: p 1 = p 2; H 1: p 1 ≠ p 2 a teszt χ 2 -statisztikáját használjuk.

Khi-négyzet teszt két részvény összehasonlítására. A χ 2 teszt statisztikája egyenlő a megfigyelt és a várt sikerek száma közötti különbség négyzetének összegével osztva a táblázat egyes celláiban található sikerek várható számával:

ahol f 0- a sikeresek vagy kudarcok megfigyelt száma a kontingenciatábla egy adott cellájában, f e

A teszt χ 2 -statisztikáját a χ 2 -eloszlás egy szabadságfokkal közelíti.

Vagy a kontingenciatábla egyes celláiban előforduló hibákat meg kell értened a jelentésükkel. Ha a nullhipotézis igaz, pl. a sikeresség aránya a két populációban egyenlő, a két csoportra számított mintaarányok csak véletlenszerű okokból térhetnek el egymástól, és mindkét arány az általános sokaság átfogó paraméterének becslése R... Ebben a helyzetben a statisztika mindkét részesedést egy általános (átlagos) paraméterbecslésben egyesíti R , a teljes sikerarányt jelenti az összevont csoportokban (azaz egyenlő a sikerek teljes számával osztva a teljes mintamérettel). Az ő kiegészítése, 1 – , a teljes meghibásodási arányt jelenti a kombinált csoportokban. A jelöléseket használva, amelyek jelentését az ábra táblázata írja le. 1. A (2) képletből származtathatja a paramétert :

ahol - a jellemző átlagos részesedése.

A sikerek várható számának kiszámításához fe(vagyis a kontingenciatábla első sorának tartalma), szükséges a minta méretét megszorozni a paraméterrel ... A meghibásodások várható számának kiszámításához f e(vagyis a kontingencia tábla második sorának tartalma), szükséges a minta méretét megszorozni a paraméterrel 1 – .

Az (1) képlettel számított tesztstatisztikát a χ 2 -eloszlás közelíti egy szabadságfokkal. Adott α szignifikanciaszinten a nullhipotézist elvetjük, ha a számított χ 2 -statisztika nagyobb, mint χ U 2, a χ 2 -eloszlás felső kritikus értéke egy szabadságfokkal. Így a döntési szabály a következő: hipotézis H 0 elvetjük, ha χ 2> χ U 2, ellenkező esetben a hipotézis H 0 nem tér el (3. ábra).

Rizs. 3. Kritikus terület χ 2 -kritérium az α szignifikancia szinten lévő részesedések összehasonlításához

Ha a nullhipotézis igaz, akkor a számított χ 2 statisztika közel nulla, mivel a megfigyelt értékek közötti négyzetes különbség f 0 és várható fe mennyisége minden sejtben nagyon kicsi. Másrészt, ha a nullhipotézis H 0 hamis és szignifikáns különbség van az általános populációk sikerességi arányai között, a számított χ 2 -statisztikának nagynak kell lennie. Ennek oka az egyes cellákban megfigyelt és várt sikerek vagy kudarcok száma közötti különbség, amely négyzetre vetve nő. Azonban a várt és megfigyelt értékek közötti különbségek hozzájárulása a teljes χ 2 -statisztikához eltérő lehet. Ugyanaz a tényleges különbség között f 0és f e nagyobb hatással lehet a χ 2 -statisztikára, ha a cella kis számú megfigyelés eredményét tartalmazza, mint a nagyobb számú megfigyelésnek megfelelő különbség.

A két tört egyenlőségének hipotézisének tesztelésére szolgáló χ 2 teszt szemléltetéséhez térjünk vissza az előző részben ismertetett forgatókönyvhöz, melynek eredményeit az 1. ábra mutatja. 2. A nullhipotézis (H 0: p 1 = p 2) azt állítja, hogy két szálloda szolgáltatási minőségét összehasonlítva gyakorlatilag megegyezik a jövőre visszatérni tervező vendégek aránya. A paraméter becsléséhez R, amely a szállodába visszatérni tervező vendégek arányát jelenti, ha a nullhipotézis igaz, akkor az értéket használjuk , amelyet a képlet számít ki

A szolgáltatással továbbra is elégedetlen vendégek aránya = 1 - 0,6483 = 0,3517. Ezt a két részt megszorozva a Beachcomber megkérdezett vendégeinek számával, megkapjuk a következő szezonban visszatérni tervező vendégek várható számát, valamint azon nyaralók számát, akik már nem szállnak meg a szállodában. A Windsurfer hotel vendégeinek várható arányát hasonló módon számítják ki:

Igen – Beachcomber: = 0,6483, n 1 = 227 tehát f e = 147,16.
Igen - Windsurfer: = 0,6483, n 2 = 262 tehát f e = 169,84.
Nem - Beachcomber: 1 - = 0,3517, n 1 = 227 tehát f e = 79,84.
Nem - Szörfös: 1 - = 0,3517, n 2 = 262 tehát f e = 92,16.

A számításokat a ábra mutatja. 4.

Rizs. 4. χ 2 – szállodákra vonatkozó statisztikák: a) kezdeti adatok; (b) 2x2 faktoriális táblázat a megfigyelt ( f 0 ) és várható ( fe) a szolgáltatással elégedett és nem elégedett vendégek száma; (c) a χ 2 -statisztika kiszámítása a szolgáltatással elégedett vendégek arányának összehasonlításakor; (d) a teszt χ 2 -statisztika kritikus értékének kiszámítása

A teszt χ 2 -statisztika kritikus értékének kiszámításához az Excel = CHI2.OBR () függvényt használjuk. Ha a szignifikancia szint α = 0,05 (a CHI2.OBR függvénybe behelyettesített valószínűség 1 –α), és a 2 × 2 faktoriális táblázat χ 2 -eloszlása ​​egy szabadságfokú, akkor a χ 2 kritikus értéke -a statisztika 3,841. Mivel a χ 2 -statisztika számított értéke, amely 9,053 (4c. ábra), meghaladja a 3,841-et, a nullhipotézist elvetjük (5. ábra).

Rizs. 5. A teszt χ 2 -statisztika kritikus értékének meghatározása egy szabadságfokkal α = 0,05 szignifikancia szinten

Valószínűség R azt a tényt, hogy a nullhipotézis helyes, ha a χ 2 -statisztika egyenlő 9,053-mal (és egy szabadságfokkal), az Excelben a = 1 - CHIS 2 függvény segítségével számítjuk ki. DIST (9,053; 1; IGAZ) = 0,0026. R- a 0,0026 érték annak a valószínűsége, hogy a Beachcomber és a Windsurfer szolgáltatásaival elégedett vendégek mintaaránya közötti különbség egyenlő vagy nagyobb, mint 0,718 - 0,588 = 0,13, ha a részesedésük mindkét populációban azonos. . Így alapos okkal feltételezhető, hogy statisztikailag szignifikáns különbség van a két szálloda vendégellátásában. A kutatások azt mutatják, hogy a Beachcomber szolgáltatásaival elégedett vendégek száma magasabb, mint azoknak a száma, akik ismét a Windsurferben szeretnének megszállni.

A 2 × 2 faktoros táblázattal kapcsolatos feltételezések tesztelése. Ahhoz, hogy a 2 × 2. táblázat adatai alapján pontos eredményeket kapjunk, szükséges, hogy a sikerek vagy kudarcok száma 5-nél nagyobb legyen. Ha ez a feltétel nem teljesül, akkor a pontos számot kell alkalmazni. Fisher tesztje.

Ha összehasonlítjuk a két szálloda szolgáltatási minőségével elégedett ügyfelek százalékos arányát, a Z és a χ 2 kritériumok azonos eredményre vezetnek. Ez azzal magyarázható, hogy szoros kapcsolat van a standardizált normális eloszlás és a χ 2 -eloszlás között egy szabadságfokkal. Ebben az esetben a χ 2 statisztika mindig a Z statisztika négyzete. Például a vendégelégedettség mérésénél azt tapasztaltuk Z-statisztika +3,01, a χ 2 -statisztika pedig 9,05. A kerekítési hibák figyelmen kívül hagyásával könnyen ellenőrizhető, hogy a második érték az első négyzete (azaz 3,01 2 = 9,05). Ezenkívül mindkét statisztika kritikus értékét α = 0,05 szignifikancia szinten összehasonlítva azt találjuk, hogy a χ 1 2 értéke 3,841 a Z-statisztika felső kritikus értékének négyzete, amely egyenlő + 1,96 (azaz χ 1 2 = Z 2). Ráadásul, R- mindkét kritérium értéke megegyezik.

Így a null- és alternatív hipotézisek tesztelésekor vitatható H 0: p 1 = p 2; H 1: p 1 ≠ p 2 a Z és χ 2 kritériumok egyenértékűek. Ha azonban nem csak az eltéréseket kell megtalálni, hanem azt is, hogy melyik arány nagyobb (p 1> p 2), kellene alkalmazzon Z-próbát egy kritikus régióval, amelyet a standardizált normális eloszlás vége határol. Ezután a χ 2 kritérium alkalmazását írjuk le egy jellemző részesedésének több csoportban való összehasonlítására. Megjegyzendő, hogy a Z-kritérium ebben a helyzetben nem alkalmazható.

A χ 2 teszt alkalmazása több rész egyenlőségének hipotézisének tesztelésére

A khi-négyzet teszt kiterjeszthető egy általánosabb esetre, és felhasználható annak a hipotézisnek a tesztelésére, hogy egy jellemző több törtrésze egyenlő. Jelöljük betűvel az elemzett független általános sokaságok számát val vel... Most a kontingencia táblázat két sorból és val vel oszlopok. Null- és alternatív hipotézisek tesztelése H 0: p 1 = p 2 = … = 2. o, H 1: Nem mind Rj egyenlő egymással (j = 1, 2, …, c), teszt χ 2 -statisztikát használunk:

ahol f 0- a sikerek vagy kudarcok megfigyelt száma a 2. faktortábla egy adott cellájában * val vel, fe- a sikerek vagy kudarcok elméleti vagy várható száma a kontingenciatábla egy adott cellájában, feltéve, hogy a nullhipotézis igaz.

A kontingenciatábla egyes celláiban várható sikerek vagy kudarcok számának kiszámításához tartsa szem előtt a következőket. Ha a nullhipotézis igaz, és a sikeresség aránya minden populációban egyenlő, akkor a megfelelő mintaarányok csak véletlenszerű okokból térhetnek el egymástól, mivel minden arány egy tulajdonság arányának becslése. R az általános lakosságban. Ebben a helyzetben az összes részesedést egyetlen általános (vagy átlagos) paraméterbecslésben egyesítő statisztikák R, több információt tartalmaz, mint mindegyik külön-külön. Ezeket a statisztikákat a szimbólum jelöli , a teljes (vagy átlagos) sikerességi arányt jelenti az egyesített mintában.

Az átlagos részesedés kiszámítása:

A sikerek várható számának kiszámításához f e a kontingencia táblázat első sorában minden minta méretét meg kell szorozni egy paraméterrel. A meghibásodások várható számának kiszámításához f e a kontingenciatábla második sorában minden minta méretét meg kell szorozni a paraméterrel 1 – ... Az (1) képlettel számított tesztstatisztikát a χ 2 -eloszlás közelíti. Ennek az eloszlásnak a szabadságfokainak számát az érték adja meg (r - 1) (c – 1) , ahol r- a sorok száma a faktortáblázatban, val vel- a táblázat oszlopainak száma. Tényezőtáblázathoz 2 * s a szabadsági fokok száma az (2 - 1) (s - 1) = s - 1... Adott α szignifikanciaszinten a nullhipotézist elvetjük, ha a számított χ 2 -statisztika nagyobb, mint a χ 2 -eloszlásban rejlő χ U 2 felső kritikus érték. s - 1 szabadsági fokokat. Így a döntési szabály a következő: hipotézis H 0 elvetjük, ha χ 2> χ U 2 (6. ábra), ellenkező esetben a hipotézist elvetjük.

Rizs. 6. Kritikus terület χ 2 -kritérium az α szignifikanciaszintű részesedéssel való összehasonlításhoz

A faktortáblázatra vonatkozó feltételezések ellenőrzése 2 * c. Pontos eredmények elérése a faktortáblázatban megadott adatok alapján 2 * val vel, szükséges, hogy a sikerek vagy kudarcok száma elég nagy legyen. Egyes statisztikusok úgy vélik, hogy a teszt pontos eredményt ad, ha a várható gyakoriság nagyobb, mint 0,5. Konzervatívabb kutatók megkövetelik, hogy a kontingencia táblázat celláinak legfeljebb 20%-a tartalmazzon 5-nél kisebb várható értéket, és egyetlen cella sem tartalmazhat egynél kisebb várható értéket. Ez utóbbi feltétel ésszerű kompromisszumnak tűnik számunkra e szélsőségek között. Ennek a feltételnek a teljesítéséhez a kis várható értékeket tartalmazó kategóriákat egybe kell vonni. Ezt követően a kritérium pontosabbá válik. Ha valamilyen okból nem lehetséges több kategória kombinálása, alternatív eljárásokat kell követni.

A részarányok egyenlõségének hipotézisének több csoportban való tesztelésére szolgáló χ 2 teszt illusztrálása érdekében visszatérünk a fejezet elején ismertetett forgatókönyvhöz. Vegyünk egy hasonló felmérést, amelyben három, a TS Resort Resources tulajdonában lévő szálloda vendégei vesznek részt (7a. ábra).

Rizs. 7. 2 × 3 faktortábla a szolgáltatással elégedett és nem elégedett vendégek számának összehasonlítására: (a) a megfigyelt sikerek vagy kudarcok száma - f 0; (b) a sikerek vagy kudarcok várható száma, fe; (c) a χ 2 -statisztika kiszámítása a szolgáltatással elégedett vendégek arányának összehasonlításakor

A nullhipotézis szerint minden szállodában közel azonos a jövő évi visszatérést tervező ügyfelek aránya. A paraméter becsléséhez R, amely a szállodába visszatérni tervező vendégek aránya, az érték kerül felhasználásra R = NS /n= 513/700 = 0,733. A szolgáltatással elégedetlen vendégek aránya 1 - 0,733 = 0,267. Három részesedést megszorozva az egyes szállodákban megkérdezett vendégek számával, megkapjuk a következő szezonban visszatérni tervező vendégek várható számát, valamint azon ügyfelek számát, akik már nem fognak megszállni az adott szállodában (7b. ábra).

A null- és alternatív hipotézisek teszteléséhez χ 2 teszt -statisztikát használunk, amelyet az (1) képlet szerint a várt és megfigyelt értékekből számítunk ki (7c. ábra).

A teszt χ 2 -statisztika kritikus értékét a = CHI2.OBR () képlet határozza meg. Mivel három szálloda vendégei vesznek részt a felmérésben, a χ 2 -statisztika (2 - 1) (3 - 1) = 2 szabadságfok. α = 0,05 szignifikancia szinten a χ 2 -statisztika kritikus értéke 5,991 (7d. ábra). Mivel a számított χ 2 -statisztika 40,236-tal meghaladja a kritikus értéket, a nullhipotézist elvetjük (8. ábra). Másrészt a valószínűség R azt a tényt, hogy a nullhipotézis helyes χ 2 -statisztika esetén, amely egyenlő 40,236-tal (és két szabadságfokkal), az Excelben a = 1-CHI2.DIST () = 0,000 függvény segítségével számítjuk ki (7d. ábra). R- az érték 0,000 és kisebb, mint az α = 0,05 szignifikanciaszint. Ezért a nullhipotézist elvetik.

Rizs. 8. A három tört egyenlőségére vonatkozó hipotézis elfogadásának és elutasításának területei 0,05 szignifikanciaszinten és két szabadsági fokon

A nullhipotézis elvetése a faktoriális táblázatban feltüntetett részesedések összehasonlításakor 2 * val vel, csak annyit mondhatunk, hogy a három szállodában nem esik egybe a szolgáltatással elégedett vendégek aránya. Annak megállapításához, hogy mely részvények különböznek a többitől, más módszereket kell alkalmazni, például a Marasquilo eljárást.

Marasquilo eljárás lehetővé teszi az összes csoport páros összehasonlítását. Az eljárás első szakaszában a különbségek p s j - p s j ’(ahol jj) között s (s - 1) / 2 részvénypárokban. A megfelelő kritikus tartományokat a következő képlet segítségével számítjuk ki:


α általános szignifikanciaszintjén az érték a khi-négyzet eloszlás felső kritikus értékének négyzetgyöke. s - 1 szabadsági fokokat. Minden egyes mintafrakciópárhoz külön kritikus tartományt kell kiszámítani. Az utolsó szakaszban mindegyik s (s - 1) / 2 az ütempárokat összehasonlítjuk a megfelelő kritikus tartománnyal. Az adott párt alkotó részarányokat statisztikailag szignifikánsan eltérőnek tekintjük, ha a minta részesedéseinek abszolút különbsége |p s j - p s j | meghaladja a kritikus tartományt.

Szemléltessük Marasquilo eljárását három szálloda vendégeinek felmérésének példáján (9a. ábra). A khi-négyzet teszt alkalmazásával igazoltuk, hogy statisztikailag szignifikáns különbség van a különböző szállodák következő évben visszatérni szándékozó vendégeinek aránya között. Mivel a felmérésben három szálloda vendégei vesznek részt, 3 (3 - 1) / 2 = 3 páronkénti összehasonlítást kell végezni, és ki kell számítani a három kritikus tartományt. Kezdésként számítsunk ki három mintafrakciót (9b. ábra). 0,05 általános szignifikanciaszint mellett az (s - 1) = 2 szabadságfokú khi-négyzet eloszlás χ 2 -statisztikájának felső kritikus értékét a = CHI2 képlet határozza meg. OBR (0,95; 2) = 5,991. Tehát = 2,448 (9c. ábra). Ezután kiszámítjuk három abszolút különbségpárt és a megfelelő kritikus tartományokat. Ha az abszolút különbség nagyobb, mint a kritikus tartománya, akkor a megfelelő részarányokat szignifikánsan eltérőnek tekintjük (9d. ábra).

Rizs. 9. A Marasquilo-eljárás eredményei az elégedett vendégek arányának egyenlőségére vonatkozó hipotézis tesztelésére három szállodában: (a) felmérési adatok; b) mintavételi arányok; (c) a khi-négyzet eloszlásra vonatkozó χ 2 teszt -statisztika felső kritikus értéke; d) három abszolút különbségpár és a megfelelő kritikus tartományok

Mint látható, 0,05-ös szignifikanciaszint mellett a Palm Royal szállóvendégeinek elégedettségi foka (p s2 = 0,858) magasabb, mint az Arany Pálma (p s1 = 0,593) és Palm Princess (p) vendégeinek elégedettsége. s3 = 0,738) szállodák. Ráadásul a Palm Princess elégedettsége magasabb, mint az Arany Pálma. Ezek az eredmények arra késztetik a vezetést, hogy elemezze a különbségek okait, és megpróbálja meghatározni, hogy az Arany Pálma hotel vendégeinek elégedettsége miért alacsonyabb a többi szállodához képest.

A Levin és egyéb Statisztika vezetők számára című könyv felhasznált anyagai. - M .: Williams, 2004 .-- p. 708-730