Test: Chi-ruut jaotus ja selle rakendamine. Pearsoni sobivuse test χ2 (Chi-ruut)

Pearsoni hii-ruut test on mitteparameetriline meetod, mis võimaldab hinnata igasse kategooriasse kuuluvate valimi tegelike (uuringu tulemusena selgunud) tulemuste arvu või kvalitatiivsete tunnuste ja teoreetiliste näitajate erinevuste olulisust. arv, mida võib eeldada uuritud rühmades, kui nullhüpotees on tõene. Lihtsamalt öeldes võimaldab meetod hinnata kahe või enama suhtelise näitaja (sagedused, osakaalud) erinevuste statistilist olulisust.

1. χ 2 kriteeriumi kujunemise ajalugu

Hii-ruut-testi situatsioonitabelite analüüsimiseks töötas välja ja pakkus välja 1900. aastal inglise matemaatik, statistik, bioloog ja filosoof, 1900. aastal. matemaatiline statistika ja üks biomeetria rajajatest Karl Pearson(1857-1936).

2. Milleks kasutatakse Pearsoni χ 2 kriteeriumi?

Analüüsis saab rakendada hii-ruut testi situatsioonitabelid mis sisaldab teavet tulemuste sageduse kohta sõltuvalt riskiteguri olemasolust. Näiteks, neljaväljaga situatsioonitabel järgnevalt:

Exodus on (1) Väljapääsu pole (0) Kokku
On olemas riskitegur (1) A B A+B
Riskifaktor puudub (0) C D C+D
Kokku A+C B+D A+B+C+D

Kuidas sellist situatsioonitabelit täita? Vaatleme väikest näidet.

Käimas on uuring suitsetamise mõju kohta arteriaalse hüpertensiooni tekkeriskile. Selleks valiti välja kaks katsealuste gruppi – esimesse kuulus 70 inimest, kes suitsetavad päevas vähemalt 1 paki sigarette, teises – 80 samavanust mittesuitsetajat. Esimeses rühmas oli kõrge vererõhk 40 inimesel. Teises - arteriaalset hüpertensiooni täheldati 32 inimesel. Seega oli normaalne vererõhk suitsetajate rühmas 30 inimesel (70–40 = 30) ja mittesuitsetajate rühmas 48 (80–32 = 48).

Täidame neljaväljalise situatsioonitabeli algandmetega:

Saadud situatsioonitabelis vastab iga rida kindlale subjektide rühmale. Veerud – näitavad arteriaalse hüpertensiooniga või normaalse vererõhuga inimeste arvu.

Uurija väljakutseks on: kas suitsetajate ja mittesuitsetajate seas on vererõhuhaigete esinemissageduses statistiliselt olulisi erinevusi? Sellele küsimusele saate vastata, kui arvutate Pearsoni hii-ruut testi ja võrdlete saadud väärtust kriitilise väärtusega.

3. Pearsoni hii-ruuttesti kasutamise tingimused ja piirangud

  1. Mõõta tuleks võrreldavates näitajates nominaalne skaala(näiteks patsiendi sugu – mees või naine) või sisse järguline(näiteks arteriaalse hüpertensiooni aste, võttes väärtused vahemikus 0 kuni 3).
  2. See meetod võimaldab analüüsida mitte ainult neljaväljalisi tabeleid, kui nii tegur kui ka tulemus on binaarsed muutujad, st neil on ainult kaks võimalikku väärtust (näiteks mees või naine, teatud haiguse olemasolu või puudumine ajaloos ...). Pearsoni hii-ruut testi saab kasutada ka mitme väljaga tabelite analüüsi puhul, kui tegur ja (või) tulemus võtavad kolm või enam väärtust.
  3. Sobitatud rühmad peaksid olema sõltumatud, st hii-ruudu testi ei tohiks kasutada enne-pärast vaatluste võrdlemisel. McNemari test(kahe seotud populatsiooni võrdlemisel) või arvutatud Q-test Cochran(kolme või enama rühma võrdlemisel).
  4. Neljavälja tabelite analüüsimisel eeldatavad väärtused igas lahtris peab olema vähemalt 10. Juhul, kui vähemalt ühes lahtris on oodatava nähtuse väärtus vahemikus 5 kuni 9, tuleb arvutada hii-ruut test Yatesi parandusega. Kui vähemalt ühes lahtris on oodatav nähtus alla 5, tuleks analüüsi kasutada Fisheri täpne test.
  5. Mitmeväljaga tabelite analüüsi puhul ei tohiks oodatav vaatluste arv olla väiksem kui 5 rohkem kui 20% lahtritest.

4. Kuidas arvutada Pearsoni hii-ruut testi?

Hii-ruuttesti arvutamiseks peate:

See algoritm on rakendatav nii nelja- kui ka mitmeväljaliste tabelite jaoks.

5. Kuidas tõlgendada Pearsoni hii-ruut testi väärtust?

Juhul, kui kriteeriumi χ 2 saadud väärtus on suurem kui kriitiline, järeldame, et uuritud riskiteguri ja tulemuse vahel on statistiline seos sobival olulisuse tasemel.

6. Pearsoni hii-ruuttesti arvutamise näide

Teeme kindlaks suitsetamisteguri mõju statistilise olulisuse arteriaalse hüpertensiooni esinemissagedusele ülaltoodud tabeli järgi:

  1. Arvutame iga lahtri eeldatavad väärtused:
  2. Leia Pearsoni hii-ruuttesti väärtus:

    χ 2 \u003d (40-33,6) 2 / 33,6 + (30-36,4) 2 / 36,4 + (32-38,4) 2 / 38,4 + (48-41,6) 2 / 41,6 \u003d 4,396.

  3. Vabadusastmete arv f = (2-1)*(2-1) = 1. Tabelist leiame Pearsoni hii-ruuttesti kriitilise väärtuse, mis olulisuse tasemel p=0,05 ja vabadusastmete arv 1, on 3,841.
  4. Võrdleme saadud hii-ruut-testi väärtust kriitilisega: 4,396 > 3,841, seega on arteriaalse hüpertensiooni esinemissageduse sõltuvus suitsetamise esinemisest statistiliselt oluline. Selle seose olulisuse tase vastab p<0.05.

See postitus ei vasta põhimõtteliselt sellele, kuidas Chi ruudu kriteeriumi arvutada, selle eesmärk on näidata, kuidas saate automatiseerida chi ruudu arvutamine Excelis, millised funktsioonid Chi ruudu kriteeriumi arvutamiseks on olemas. SPSS-i või R-i jaoks pole programm alati käepärast.
Mõnes mõttes on see meeldetuletus ja vihje Analytics for HR seminaril osalejatele, loodan, et kasutate neid meetodeid oma töös, sellest postitusest saab järjekordne vihje.
Ma ei anna failile allalaadimislinki, kuid võite lihtsalt kopeerida minu esitatud näidistabelid ja käivitada minu esitatud andmed ja valemid

sissejuhatav

Näiteks tahame kontrollida ettevõtte uuringu tulemuste jaotuse sõltumatust (juhuslikkus / mittejuhuslikkus), kus ridadel on vastused küsimustiku mis tahes küsimusele ja veergudes - jaotus pikkuse järgi. teenusest.

Khi-ruuduarvutuse sisestate pivot-tabeli kaudu, kui teie andmed on kokku võetud konjugatsioonitabelis, näiteks sellel kujul
Tabel 1

vähem kui 1 aasta

Summa ridade kaupa

Veergude summa

Chi ruudu arvutamiseks Excelis on järgmised valemid

HI2.TEST

Valem CHI2.TEST arvutab jaotuse sõltumatuse (juhuslikkuse / mittejuhuslikkuse) tõenäosuse

Süntaks on

CHI2.TEST(tegelik_intervall, eeldatav_intervall)

Meie puhul on tegelik intervall tabeli sisu, st.

Need. olles saanud kaks tabelit - empiirilised ja eeldatavad (või teoreetilised sagedused) - vabastame end tegelikult nii erinevuse, ruutude ja muude arvutuste kui ka kriitiliste väärtuste tabeliga vastavusse viimise tööst.

Meie puhul CH2.DIST.RT = 0,000466219908895455, nagu näites CH2.TEST

Märge

See hii-ruudu arvutamise valem Excelis sobib 2X2 tabelite arvutamiseks, kuna te ise peate hii ruutu empiiriliseks ja saate arvutustesse järjepidevuse parandusi teha

Märkus 2

Samuti on olemas valem HI2.DIS (seda näete paratamatult excelis) - see arvutab vasakpoolse tõenäosuse (kui see on lihtne, siis vasakpoolset peetakse 1-ks - parempoolne, st me lihtsalt pöörame ümber valem, nii et ma ei anna seda arvutustes Chi ruudus, meie näites CHI2.DIST = 0,999533780091105.
CH2.DIST + CH2.DIST.RT kokku = 1.

chi2.ex.ph

Tagastab hii-ruutjaotuse parempoolse tõenäosuse pöördarvu (või lihtsalt hii-ruudu väärtuse antud tõenäosustaseme ja vabadusastmete arvu jaoks)

Sünaksis

XI2.INV.RT(tõenäosus, vabadusastmed)

Järeldus

Ausalt öeldes ma ei tea täpselt, kuidas tulemused saavutati chi ruudu arvutused Excelis erinevad Chi-ruudu arvutamise tulemustest SPSS-is. ma saan täpselt aru. mis on erinevad, kasvõi sellepärast, et kui Chi on sõltumatult arvutatud, ümardatakse ruudus olevad väärtused ja teatud arv kümnendkohti kaob. Aga ma ei arva, et see on kriitiline. Soovitan olla kindlustatud ainult juhul, kui hii-ruutjaotuse tõenäosus on läve (p-väärtus) 0,05 lähedal.

Pole just tore, et järjepidevuse korrektsiooni ei võeta arvesse – me arvutame palju 2X2 tabelites. Seetõttu me peaaegu ei saavuta optimeerimist 2X2 tabelite arvutamisel

No sellegipoolest arvan, et ülaltoodud teadmistest piisab, et Chi ruudu arvutamine excelis veidi kiirem oleks, et säästa aega tähtsamate asjade peale.

). Testitava hüpoteesi konkreetne sõnastus on igal üksikjuhul erinev.

Selles postituses kirjeldan immunoloogia (hüpoteetilise) näite abil, kuidas \(\chi^2\) test töötab. Kujutage ette, et oleme teinud katse, et teha kindlaks mikroobse haiguse arengu mahasurumise efektiivsus, kui kehasse viiakse vastavad antikehad. Kokku osales katses 111 hiirt, kelle jagasime kahte rühma, sealhulgas vastavalt 57 ja 54 looma. Esimesele hiirte rühmale süstiti patogeenseid baktereid, millele järgnes nende bakterite vastaseid antikehi sisaldava vereseerum. Teise rühma loomad olid kontrollid - nad said ainult bakterite süsti. Pärast mõnda aega kestnud inkubatsiooni selgus, et 38 hiirt suri ja 73 jäi ellu. Hukkunutest kuulus esimesse gruppi 13 ja teise (kontroll) 25 inimest. Selles katses testitud nullhüpoteesi saab sõnastada järgmiselt: seerumi manustamine koos antikehadega ei mõjuta hiirte ellujäämist. Teisisõnu väidame, et täheldatud erinevused hiirte ellujäämises (77,2% esimeses rühmas versus 53,7% teises rühmas) on täiesti juhuslikud ega ole seotud antikehade toimega.

Katse käigus saadud andmed saab esitada tabeli kujul:

Kokku

Bakterid + seerum

Ainult bakterid

Kokku

Selliseid tabeleid nimetatakse situatsioonitabeliteks. Selles näites on tabeli mõõtmed 2x2: on kaks objektide klassi ("Bakterid + seerum" ja "Ainult bakterid"), mida uuritakse kahe kriteeriumi järgi ("Surnud" ja "Ellujäänud"). See on juhuslikkuse tabeli kõige lihtsam juhtum: loomulikult võib nii uuritavate klasside kui ka tunnuste arv olla suurem.

Eespool sõnastatud nullhüpoteesi testimiseks peame teadma, milline oleks olukord, kui antikehad tõesti ei mõjutaks hiirte ellujäämist. Teisisõnu, peate arvutama eeldatavad sagedused situatsioonitabeli vastavate lahtrite jaoks. Kuidas seda teha? Kokku suri katses 38 hiirt, mis moodustab 34,2% kaasatud loomade koguarvust. Kui antikehade sissetoomine hiirte ellujäämist ei mõjuta, tuleks mõlemas katserühmas täheldada samasugust suremuse protsenti, nimelt 34,2%. Arvutades, kui palju on 34,2% 57-st ja 54-st, saame 19,5 ja 18,5. Need on meie katserühmade eeldatavad suremusnäitajad. Eeldatavad elulemusnäitajad arvutatakse sarnaselt: kuna kokku jäi ellu 73 hiirt ehk 65,8% nende koguarvust, on eeldatav elulemus 37,5 ja 35,5. Teeme uue situatsioonitabeli, nüüd eeldatavate sagedustega:

surnud

Ellujäänud

Kokku

Bakterid + seerum

Ainult bakterid

Kokku

Nagu näha, on oodatavad sagedused vaadeldatutest üsna erinevad, s.t. antikehade manustamine näib avaldavat mõju patogeeniga nakatunud hiirte ellujäämisele. Selle mulje saame kvantifitseerida Pearsoni sobivuse testi abil \(\chi^2\):

\[\chi^2 = \sum_()\frac((f_o - f_e)^2)(f_e),\]


kus \(f_o\) ja \(f_e\) on vastavalt vaadeldavad ja eeldatavad sagedused. Summeerimine toimub kõigi tabeli lahtrite üle. Vaadeldava näite puhul on meil nii

\[\chi^2 = (13–19,5)^2/19,5 + (44–37,5)^2/37,5 + (25–18,5)^2/18,5 + (29–35,5)^2/35,5 = \]

Kas \(\chi^2\) on nullhüpoteesi tagasilükkamiseks piisavalt suur? Sellele küsimusele vastamiseks on vaja leida kriteeriumile vastav kriitiline väärtus. \(\chi^2\) vabadusastmete arv arvutatakse järgmiselt: \(df = (R - 1)(C - 1)\), kus \(R\) ja \(C\) on arv ridadest ja veergudest tabeli konjugaadis. Meie puhul \(df = (2 -1)(2 - 1) = 1\). Teades vabadusastmete arvu, saame nüüd hõlpsasti teada kriitilise väärtuse \(\chi^2\), kasutades standardset R-funktsiooni qchisq() :


Seega ületab ühe vabadusastme puhul kriteeriumi \(\chi^2\) väärtus 3,841 vaid 5% juhtudest. Saadud väärtus 6, 79 ületab oluliselt seda kriitilist väärtust, mis annab meile õiguse lükata tagasi nullhüpotees antikehade manustamise ja nakatunud hiirte ellujäämise vahelise seose puudumise kohta. Selle hüpoteesi ümberlükkamisel riskime eksimisega vähem kui 5% tõenäosusega.

Tuleb märkida, et ülaltoodud kriteeriumi valem \(\chi^2\) annab 2x2 suuruse situatsioonitabelitega töötamisel mõnevõrra ülehinnatud väärtused. Põhjus on selles, et \(\chi^2\) kriteeriumi enda jaotus on pidev, samas kui binaarsete tunnuste ("surnud" / "ellu jäänud") sagedused on definitsiooni järgi diskreetsed. Sellega seoses on kriteeriumi arvutamisel tavaks juurutada nn. järjepidevuse korrigeerimine, või Yatesi muudatusettepanek :

\[\chi^2_Y = \sum_()\frac((|f_o - f_e| - 0,5)^2)(f_e).\]

"s Chi-ruut test Yatesiga" järjepidevuse korrigeerimise andmed: hiirte X-ruut = 5,7923, df = 1, p-väärtus = 0,0161


Nagu näete, rakendab R automaatselt Yatesi parandus järjepidevuse ( Pearsoni hii-ruut test Yatesi järjepidevuse korrektsiooniga). Programmi arvutatud väärtus \(\chi^2\) oli 5,79213. Võime tagasi lükata nullhüpoteesi, et antikehade mõju puudub, kui on oht eksida, kui tõenäosus on veidi üle 1% (p-väärtus = 0,0161).

Sõltumatuse hii-ruuttesti kasutatakse kahe kategoorilise muutuja vahelise seose määramiseks. Kategooriliste muutujate paaride näited on järgmised: Perekonnaseis vs. vastaja tööhõive tase; Koeratõug vs. Võõrustaja elukutse, palgatase vs. Inseneri spetsialiseerumine jne Sõltumatuse kriteeriumi arvutamisel kontrollitakse hüpoteesi, et muutujate vahel pole seost. Arvutused teostame MS EXCEL 2010 XI2.TEST () funktsiooni ja tavaliste valemite abil.

Oletame, et meil on näidis andmed, mis esindavad 500 inimest hõlmanud küsitluse tulemust. Inimestele esitati 2 küsimust: nende perekonnaseisu (abielus, tsiviilabielu, mitte suhtes) ja tööhõive (täistööaeg, osalise tööajaga, ajutiselt töötu, leibkond, pensionil, õppimine) kohta. Kõik vastused pandi tabelisse:

Seda tabelit nimetatakse märkide situatsioonitabel(või faktoritabel, ingliskeelne Contingency table). Tabeli ridade ja veergude ristumiskohas olevad elemendid tähistavad tavaliselt O ij (inglise keelest. Observed, s.o vaadeldakse, tegelikud sagedused).

Meid huvitab küsimus “Kas perekonnaseis mõjutab töötamist?”, st. kas kahe klassifitseerimismeetodi vahel on seos proovid?

Kell hüpoteesi testimine seda tüüpi, tavaliselt eeldatakse, et nullhüpotees märgib, et klassifitseerimismeetodid ei sõltu.

Vaatleme piirjuhtumeid. Kahe kategoorilise muutuja täieliku sõltuvuse näide on järgmine uuringutulemus:

Sel juhul määrab perekonnaseis ühemõtteliselt tööhõive (vt. näidisfaili leht Selgitus). Ja vastupidi, teine ​​uuringutulemus on näide täielikust sõltumatusest:

Pange tähele, et töötamise protsent ei sõltu antud juhul perekonnaseisust (sama abielus ja vallalisel). See on täpselt sama, mis sõnastus nullhüpotees. Kui a nullhüpotees vastab tõele, siis oleks pidanud küsitluse tulemused tabelis jaotama nii, et töötajate protsent oleks sõltumata perekonnaseisust sama. Seda kasutades arvutame välja vastavad küsitlustulemused nullhüpotees(cm. näidisfailileht Näide).

Esiteks arvutame selle elemendi tõenäosushinnangu proovid tal on teatud töökoht (vt veergu u i):

kus Koos- veergude (veergude) arv, mis võrdub muutuja "Perekonnaseis" tasemete arvuga.

Seejärel arvutame selle elemendi tõenäosushinnangu proovid on teatud perekonnaseis (vt rida v j).

kus r– ridade (ridade) arv, mis võrdub muutuja "Tööhõive" tasemete arvuga.

Iga lahtri E ij teoreetiline sagedus sõltumatute muutujate korral arvutatakse valemiga:
E ij =n* u i * v j

On teada, et statistikal X 2 0 suure n kohta on ligikaudu (r-1) (c-1) vabadusastmed (df - vabadusastmed):

Kui arvutada selle põhjal proovid selle statistika väärtus on "liiga suur" (läviväärtusest suurem), siis nullhüpotees tagasi lükatud. Läviväärtus arvutatakse näiteks valemi =XI2.INV.RT(0,05; df) abil.

Märge: Olulisuse tase tavaliselt võetakse 0,1; 0,05; 0,01.

Kell hüpoteesi testimine Samuti on mugav arvutada , millega me võrdleme olulisuse tase. lk- tähendus arvutatakse kasutades c (r-1)*(c-1)=df vabadusastmeid.

Kui tõenäosus, et juhuslik väärtus millel on (r-1) (c-1) vabadusastmed saab suurema väärtuse kui arvutatud statistika X 2 0, s.o. P(X2(r-1)*(c-1) >X20), vähem olulisuse tase, siis nullhüpotees lükatakse tagasi.

MS EXCELIS p-väärtus saab arvutada valemi abil =XI2.DIST.PX(X 2 0 ;df), muidugi, olles arvutanud X 2 0 statistika väärtuse vahetult enne (seda tehakse näidisfailis). Kõige mugavam on aga kasutada funktsiooni XI2.TEST(). Selle funktsiooni argumentidena on täpsustatud viited vahemikele, mis sisaldavad tegelikke (vaadatud) ja arvutatud teoreetilisi sagedusi (oodatud).

Kui a olulisuse tase > lk-väärtused, siis see on tegelik ja teoreetiline sagedus, mis on arvutatud õigluse eeldusest nullhüpotees, on tõsiselt erinevad. Sellepärast, nullhüpotees tuleb tagasi lükata.

Funktsiooni CH2.TEST() kasutamine võimaldab protseduuri kiirendada hüpoteesi testimine, sest väärtust pole vaja arvutada statistika. Nüüd piisab, kui võrrelda funktsiooni XI2.TEST () tulemust etteantuga olulisuse tase.

Märge: Funktsioon CH2.TEST() , Ingliskeelne nimi CHISQ.TEST ilmus MS EXCEL 2010-s. Selle varasemal versioonil CHISQ.TEST() , mis on saadaval MS EXCEL 2007-s, on samad funktsioonid. Kuid nagu CHI2.TEST() puhul, tuleb teoreetilised sagedused arvutada iseseisvalt.

Mõelge hii-ruutjaotusele. MS EXCELi funktsiooni kasutamineCHI2.DIST() koostame jaotusfunktsiooni ja tõenäosustiheduse graafikud, selgitame selle jaotuse rakendamist matemaatilise statistika jaoks.

Chi-ruut jaotus (X 2, XI2, IngliseChi- ruudulinelevitamine) sisse rakendatud erinevaid meetodeid matemaatiline statistika:

  • ehitamisel;
  • kell ;
  • juures (kas empiirilised andmed on kooskõlas meie eeldusega teoreetilise jaotusfunktsiooni kohta või mitte, eng. Goodness-of-fit)
  • at (kasutatakse kahe kategoorilise muutuja vahelise seose määramiseks, ing. hii-ruut test).

Definitsioon: Kui x 1 , x 2 , …, x n on sõltumatud juhuslikud suurused, mis on jaotatud üle N(0;1), siis on juhusliku suuruse Y=x 1 2 + x 2 2 +…+ x n 2 jaotus levitamine X 2 n vabadusastmega.

Levitamine X 2 sõltub ühest parameetrist, mida nimetatakse vabaduse aste (df, kraadidkohtavabadust). Näiteks ehitamisel vabadusastmete arv on võrdne df=n-1, kus n on suurus proovid.

Jaotustihedus X 2 väljendatakse valemiga:

Funktsioonigraafikud

Levitamine X 2 on asümmeetrilise kujuga, võrdne n-ga, võrdne 2n-ga.

AT näidisfail lehel Graafik antud jaotustiheduse graafikud tõenäosused ja integraalne jaotusfunktsioon.

Kasulik vara chi2 distributsioonid

Olgu x 1 , x 2 , …, x n sõltumatud juhuslikud muutujad, mis on jaotatud tavaline seadus samade parameetritega μ ja σ ning X vrd on aritmeetiline keskmine need väärtused x.
Siis juhuslik suurus y võrdne

Sellel on X 2 - levitamine n-1 vabadusastmega. Definitsiooni kasutades saab ülaltoodud avaldise ümber kirjutada järgmiselt:

Järelikult valimi jaotus statistika y, koos proovide võtmine alates normaaljaotus, Sellel on X 2 - levitamine n-1 vabadusastmega.

Meil on seda kinnisvara vaja . Sest dispersioon saab olla ainult positiivne arv ja X 2 - levitamine kasutatakse selle hindamiseks y d.b. >0, nagu on öeldud definitsioonis.

HI2 jaotus MS EXCELIS

MS EXCELIS, alates versioonist 2010, jaoks X 2 -jaotused on olemas spetsiaalne funktsioon CHISQ.DIST() , ingliskeelne nimi on CHISQ.DIST(), mis võimaldab arvutada tõenäosustihedus(vt ülaltoodud valemit) ja (tõenäosus, et juhuslikul suurusel X on XI2-levitamine, võtab väärtuse, mis on väiksem või võrdne x, P(X<= x}).

Märge: Sest chi2 jaotus on erijuhtum, siis valem =GAMMA.DIST(x,n/2,2,TRUE) positiivse täisarvu n korral tagastab valemiga sama tulemuse =XI2.DIST(x, n, TÕENE) või =1-XI2.DIST.X(x;n) . Ja valem =GAMMA.DIST(x,n/2,2,FALSE) tagastab valemiga sama tulemuse =XI2.DIST(x, n, VÄÄR), st. tõenäosustihedus XI2 distributsioonid.

Funktsioon CH2.DIST.RT() tagastab jaotusfunktsioon, täpsemalt paremakäe tõenäosus, s.o. P(X > x). On ilmne, et võrdsus
=CHI2.DIST.X(x;n)+ CHI2.DIST(x;n;TRUE)=1
sest esimene liige arvutab tõenäosuse P(X > x) ja teine ​​P(X<= x}.

Enne MS EXCEL 2010 oli EXCELis ainult funktsioon HI2DIST(), mis võimaldab arvutada parempoolse tõenäosuse, s.t. P(X > x). Uute MS EXCEL 2010 funktsioonide CHI2.DIST() ja CHI2.DIST.RT() võimalused kattuvad selle funktsiooni võimalustega. Funktsioon HI2DIST() jäeti MS EXCEL 2010-sse ühilduvuse tagamiseks.

CHI2.DIST() on ainus funktsioon, mis tagastab chi2 jaotuse tõenäosustihedus(kolmas argument peab olema FALSE). Ülejäänud funktsioonid naasevad integraalne jaotusfunktsioon, st. tõenäosus, et juhuslik muutuja võtab väärtuse määratud vahemikust: P(X<= x}.

Ülaltoodud MS EXCELi funktsioonid on toodud.

Näited

Leidke tõenäosus, et juhuslik suurus X saab väärtuse, mis on väiksem või võrdne antud x: P(X<= x}. Это можно сделать несколькими функциями:

CHI2.DIST(x, n, TRUE)
=1-CHI2.DIST.RP(x; n)
=1-CHI2DIST(x; n)

Funktsioon XI2.DIST.X() tagastab tõenäosuse P(X > x), nn paremakäelise tõenäosuse, nii et P(X)<= x}, необходимо вычесть ее результат от 1.

Leiame tõenäosuse, et juhuslik suurus X saab antud väärtusest suurema väärtuse x: P(X > x). Seda saab teha mitme funktsiooniga:

1-CHI2.DIST(x, n, TRUE)
=XI2.DIST.RP(x; n)
=CHI2DIST(x, n)

Chi2 pöördjaotusfunktsioon

Arvutamiseks kasutatakse pöördfunktsiooni alfa- , st. väärtuste arvutamiseks x etteantud tõenäosuse jaoks alfa ja X peab vastama avaldisele P(X<= x}=alfa.

Arvutamiseks kasutatakse funktsiooni CH2.INV(). normaaljaotuse dispersiooni usaldusvahemikud.

Funktsiooni XI2.INV.RT() kasutatakse arvutamiseks, st. kui funktsiooni argumendiks on määratud olulisustase, näiteks 0,05, siis funktsioon tagastab sellise juhusliku suuruse x väärtuse, mille puhul P(X>x)=0,05. Võrdluseks: funktsioon XI2.INV() tagastab sellise juhusliku suuruse x väärtuse, mille puhul P(X<=x}=0,05.

MS EXCEL 2007 ja varasemates versioonides kasutati XI2.OBR.RT() asemel funktsiooni XI2OBR().

Ülaltoodud funktsioone saab omavahel vahetada, nagu järgmised valemid annavad sama tulemuse:
=CHI.OBR(alfa,n)
=XI2.INV.RT(1-alpha;n)
\u003d XI2OBR (1-alfa; n)

Mõned arvutusnäited on toodud Näidisfail funktsioonide lehel.

MS EXCEL töötab chi2 jaotuse abil

Allpool on kirjavahetus vene ja inglise funktsioonide nimede vahel:
HI2.DIST.PH() - eng. nimi CHISQ.DIST.RT, st. CHI-ruutjaotus parempoolne saba, parempoolne hii-ruut(d) jaotus
XI2.OBR () - inglise keel. nimi CHISQ.INV, st. CHI-ruudu jaotus INVerse
HI2.PH.OBR() – inglise keel. nimi CHISQ.INV.RT, s.o. CHI-ruudu jaotus INVerse Right Tail
HI2DIST() - eng. nimi CHIDIST, funktsioon, mis on samaväärne funktsiooniga CHISQ.DIST.RT
HI2OBR() - eng. nimetus CHIINV, s.o. CHI-ruudu jaotus INVerse

Jaotusparameetrite hindamine

Sest tavaliselt chi2 jaotus kasutatakse matemaatilise statistika jaoks (arvutus usaldusvahemikud, hüpoteesi testimine jne) ja reaalväärtuste mudelite konstrueerimiseks peaaegu mitte kunagi, siis selle jaotuse puhul jaotusparameetrite hindamise arutelu siin läbi ei viida.

XI2 jaotuse lähendamine normaaljaotusega

Vabadusastmete arvuga n>30 jaotus X 2 hästi ligikaudne normaaljaotus co keskmineμ=n ja dispersioon σ=2*n (vt näidisfailileht Lähendamine).