Kasutage sirge leidmiseks vähimruutude meetodit. Kus kasutatakse vähimruutude meetodit?

  • Õpetus

Sissejuhatus

Olen matemaatik ja programmeerija. Suurim hüpe, mille ma oma karjääri jooksul tegin, oli see, kui õppisin ütlema: "Ma ei saa millestki aru!" Nüüd ma ei häbene öelda teaduse valgustajale, et ta peab mulle loengut, et ma ei saa aru, mida tema, valgusti, mulle räägib. Ja see on väga raske. Jah, oma teadmatuse tunnistamine on raske ja piinlik. Kellele meeldib tunnistada, et ta ei tea millegi põhitõdesid? Oma ametist tulenevalt pean kohal käima suured hulgad ettekanded ja loengud, kus, tunnistan, tahan enamikul juhtudel magada, sest ma ei saa millestki aru. Aga ma ei saa aru, sest teaduse praeguse olukorra suur probleem seisneb matemaatikas. See eeldab, et kõik kuulajad tunnevad absoluutselt kõiki matemaatika valdkondi (mis on absurdne). Tunnistada, et te ei tea, mis on tuletis (mis see on, räägime sellest veidi hiljem), on häbiväärne.

Aga ma olen õppinud ütlema, et ma ei tea, mis on korrutamine. Jah, ma ei tea, mis on alamgebra üle Lie algebra. Jah, ma ei tea, miks neid elus vaja on ruutvõrrandid. Muide, kui olete kindel, et teate, siis on meil millestki rääkida! Matemaatika on trikkide jada. Matemaatikud püüavad avalikkust segadusse ajada ja hirmutada; kus pole segadust, pole ka mainet ega autoriteeti. Jah, prestiižne on rääkida võimalikult abstraktses keeles, mis on täielik jama.

Kas sa tead, mis on tuletis? Tõenäoliselt räägite mulle erinevuse suhte piirist. Peterburi Riikliku Ülikooli matemaatika ja mehaanika esimesel kursusel rääkis mulle Viktor Petrovitš Khavin kindlaks määratud tuletis kui funktsiooni Taylori seeria esimese liikme koefitsient punktis (see oli eraldi võimlemine Taylori seeria määramiseks ilma tuletisi). Naersin selle määratluse üle kaua, kuni lõpuks sain aru, millega tegu. Tuletis pole midagi muud kui lihtne mõõt selle kohta, kui sarnane on eristatav funktsioon funktsiooniga y=x, y=x^2, y=x^3.

Nüüd on mul au pidada loenguid üliõpilastele, kes kardan matemaatika. Kui kardad matemaatikat, siis oleme samal teel. Niipea, kui proovite mõnda teksti lugeda ja teile tundub, et see on liiga keeruline, teadke, et see on halvasti kirjutatud. Ma väidan, et pole ühtegi matemaatika valdkonda, mida ei saaks arutada "näpuga" ilma täpsust kaotamata.

Lähituleviku ülesanne: andsin oma õpilastele ülesandeks mõista, mis on lineaarne ruutregulaator. Ärge olge häbelik, kulutage kolm minutit oma elust ja järgige linki. Kui te millestki aru ei saa, siis oleme samal teel. Ka mina (professionaalne matemaatik-programmeerija) ei saanud millestki aru. Ja ma kinnitan teile, et saate selle "näpuga" välja mõelda. Peal Sel hetkel Ma ei tea, mis see on, aga ma kinnitan teile, et saame selle välja mõelda.

Niisiis, esimene loeng, mille ma oma õpilastele pean pärast seda, kui nad õudusega minu juurde jooksevad ja ütlevad, et lineaar-ruutregulaator on kohutav asi, mida te kunagi oma elus ei valda. meetodid vähimruudud . Kas saate otsustada lineaarvõrrandid? Kui sa seda teksti loed, siis suure tõenäosusega mitte.

Seega, kui on antud kaks punkti (x0, y0), (x1, y1), näiteks (1,1) ja (3,2), on ülesandeks leida neid kahte punkti läbiva sirge võrrand:

illustratsioon

Sellel real peaks olema järgmine võrrand:

Siin on alfa ja beeta meile tundmatud, kuid selle joone kaks punkti on teada:

Selle võrrandi saame kirjutada maatriksi kujul:

Siin tuleks teha lüüriline kõrvalepõik: mis on maatriks? Maatriks pole midagi muud kui kahemõõtmeline massiiv. See on andmete salvestamise viis, millele ei tohiks lisada täiendavaid tähendusi. See, kuidas teatud maatriksit täpselt tõlgendada, sõltub meist endist. Perioodiliselt tõlgendan seda lineaarse kaardistusena, perioodiliselt kui ruutvorm ja mõnikord lihtsalt vektorite kogumina. Seda kõike selgitatakse kontekstis.

Asendame betoonmaatriksid nende sümboolse esitusega:

Siis (alfa, beeta) saab hõlpsasti leida:

Täpsemalt meie varasemate andmete kohta:

Mis annab punkte (1,1) ja (3,2) läbiva sirge järgmise võrrandi:

Olgu, siin on kõik selge. Leiame läbiva sirge võrrandi kolm punktid: (x0,y0), (x1,y1) ja (x2,y2):

Oi-oi-oi, aga kahe tundmatu jaoks on meil kolm võrrandit! Tavaline matemaatik ütleb, et lahendust pole. Mida programmeerija ütleb? Ja kõigepealt kirjutab ta eelmise võrrandisüsteemi ümber järgmisel kujul:

Meie puhul vektorid i,j,b on kolmemõõtmelised, mistõttu (üldjuhul) sellele süsteemile lahendust ei ole. Iga vektor (alfa\*i + beeta\*j) asub vektorite (i, j) poolt katval tasapinnal. Kui b ei kuulu sellele tasapinnale, siis pole lahendust (võrrandis ei saa võrdsust saavutada). Mida teha? Otsime kompromissi. Tähistagem e (alfa, beeta) täpselt, kui kaugele me pole võrdsust saavutanud:

Ja me püüame seda viga minimeerida:

Miks ruut?

Me ei otsi lihtsalt normi miinimumi, vaid normi ruudu miinimumi. Miks? Miinimumpunkt ise langeb kokku ja ruut annab sujuva funktsiooni (argumentide ruutfunktsioon (alfa, beeta)), samas kui lihtsalt pikkus annab koonusekujulise funktsiooni, mis ei ole miinimumpunktis eristatav. Brr. Ruut on mugavam.

Ilmselt on viga minimeeritud, kui vektor e vektorite poolt hõlmatud tasapinnaga risti i Ja j.

Illustratsioon

Teisisõnu: otsime sirgjoont, mille kõigi punktide ja selle sirge kauguste ruudu pikkuste summa on minimaalne:

VÄRSKENDUS: Mul on siin probleem, kaugust sirgest tuleks mõõta vertikaalselt, mitte ortogonaalprojektsiooniga. Sellel kommentaatoril on õigus.

Illustratsioon

Täiesti erinevate sõnadega (hoolsalt, halvasti vormistatud, kuid see peaks olema selge): võtame kõik võimalikud jooned kõigi punktipaaride vahel ja otsime kõigi vahelt keskmist joont:

Illustratsioon

Veel üks selgitus sõrmede kohta: kinnitame vedru kõigi andmepunktide (siin on kolm) ja otsitava sirge ja sirge vahele tasakaaluseisund seal on täpselt see, mida otsime.

Minimaalne ruutvorm

Niisiis, arvestades seda vektorit b ja maatriksi veeruvektoritega hõlmatud tasapind A(antud juhul (x0,x1,x2) ja (1,1,1)), otsime vektorit e minimaalse ruudu pikkusega. Ilmselgelt on miinimum saavutatav ainult vektori puhul e, risti maatriksi veeruvektoritega kaetud tasapinnaga A:

Teisisõnu otsime vektorit x=(alfa, beeta), et:

Lubage mul teile meelde tuletada, et see vektor x=(alfa, beeta) on minimaalne ruutfunktsioon||e(alfa, beeta)||^2:

Siinkohal oleks kasulik meeles pidada, et maatriksit saab tõlgendada ka ruutvormina, näiteks identiteedimaatriksit ((1,0),(0,1)) saab tõlgendada funktsioonina x^2 + y^ 2:

ruutvorm

Kogu see võimlemine on tuntud lineaarse regressiooni nime all.

Laplace'i võrrand Dirichlet' piirtingimusega

Nüüd kõige lihtsam tegelik ülesanne: on olemas teatud kolmnurkne pind, seda on vaja siluda. Näiteks laadime minu näo mudeli:

Algne kohustus on saadaval. Väliste sõltuvuste minimeerimiseks võtsin oma tarkvara renderdaja koodi, juba Habré peal. Lahenduste jaoks lineaarne süsteem Kasutan OpenNL-i, see on suurepärane lahendaja, mida on aga väga raske paigaldada: pead kopeerima kaks faili (.h+.c) oma projektiga kausta. Kogu silumine toimub järgmise koodiga:

For (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = näod[i]; jaoks (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y ja Z koordinaadid on eraldatavad, silun eraldi. See tähendab, et lahendan kolm lineaarvõrrandisüsteemi, millest igaühel on minu mudeli tippude arvuga võrdne muutujate arv. Maatriksi A esimesel n real on ainult üks 1 rea kohta ja vektori b esimesel n real on mudeli algsed koordinaadid. See tähendab, et seon tipu uue asukoha ja tipu vana asendi vahele vedru - uued ei tohiks vanadest liiga kaugele liikuda.

Kõigil järgnevatel maatriksi A ridadel (faces.size()*3 = kõigi võrgusilma kolmnurkade servade arv) on üks esinemine 1 ja üks esinemine -1, kusjuures vektoril b on nullkomponente. See tähendab, et panen meie kolmnurkse võrgu igale servale vedru: kõik servad püüavad saada sama tipu algus- ja lõpp-punktiga.

Veel kord: kõik tipud on muutujad ja nad ei saa oma algsest asukohast kaugele liikuda, kuid samal ajal püüavad nad muutuda üksteisega sarnaseks.

Siin on tulemus:

Kõik oleks hästi, mudel on tõesti silutud, kuid see on oma esialgsest servast eemaldunud. Muudame veidi koodi:

For (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

Meie maatriksis A serval olevate tippude jaoks ei lisa ma rida kategooriast v_i = verts[i][d], vaid 1000*v_i = 1000*verts[i][d]. Mida see muudab? Ja see muudab meie vea ruutlikku vormi. Nüüd maksab üks kõrvalekalle ülemisest servast mitte ühe ühiku, nagu varem, vaid 1000*1000 ühikut. See tähendab, et äärmiste tippude külge riputasime tugevama vedru, lahendus eelistab teisi tugevamalt venitada. Siin on tulemus:

Kahekordistame tippude vahelist vedru tugevust:
nlKoefitsient(nägu[ j ], 2); nlKoefitsient(nägu[(j+1)%3], -2);

On loogiline, et pind on muutunud siledamaks:

Ja nüüd isegi sada korda tugevam:

Mis see on? Kujutage ette, et oleme kastnud traatrõnga seebivette. Selle tulemusena püüab saadud seebikile olla võimalikult väike kumerus, puudutades piiri - meie traatrõngast. Täpselt selle saimegi, kui kinnitasime piirde ja palusime seest sileda pinna. Õnnitleme, lahendasime just Laplace'i võrrandi Dirichlet' piirtingimustega. Kõlab lahedalt? Kuid tegelikult peate lihtsalt lahendama ühe lineaarvõrrandisüsteemi.

Poissoni võrrand

Meenutagem veel üht lahedat nime.

Oletame, et mul on selline pilt:

Tundub kõigile hea, aga mulle see tool ei meeldi.

Ma lõikan pildi pooleks:



Ja ma valin oma kätega tooli:

Seejärel tõmban kõik, mis maskis on valge, pildi vasakusse serva ja samal ajal kogu pildi ulatuses ütlen, et kahe naaberpiksli vahe peaks olema võrdne kahe parema naaberpiksli vahega. pilt:

For (int i=0; i

Siin on tulemus:

Kood ja pildid olemas

Seda kasutatakse ökonomeetrias laialdaselt selle parameetrite selge majandusliku tõlgendamise vormis.

Lineaarne regressioon taandub vormi võrrandi leidmisele

või

Vormi võrrand võimaldab kindlaksmääratud parameetri väärtuste alusel X neil on saadud karakteristiku teoreetilised väärtused, asendades sellega teguri tegelikud väärtused X.

Ehitus lineaarne regressioon taandub selle parameetrite hindamisele - A Ja V. Lineaarse regressiooni parameetrite hinnanguid saab leida erinevate meetodite abil.

Klassikaline lähenemine lineaarse regressiooni parameetrite hindamisel põhineb vähimruutude meetod(MNC).

Vähimruutude meetod võimaldab meil saada selliseid parameetrite hinnanguid A Ja V, mille juures saadud karakteristiku tegelike väärtuste hälvete ruudu summa (y) arvutatud (teoreetilisest) miinimum:

Funktsiooni miinimumi leidmiseks peate arvutama iga parameetri osatuletised A Ja b ja seadke need võrdseks nulliga.

Tähistame läbi S, siis:

Valemit teisendades saame parameetrite hindamiseks järgmise normaalvõrrandi süsteemi A Ja V:

Lahendades normaalvõrrandisüsteemi (3.5) kas muutujate järjestikuse elimineerimise meetodil või determinantide meetodil, leiame parameetrite nõutavad hinnangud A Ja V.

Parameeter V nimetatakse regressioonikoefitsiendiks. Selle väärtus näitab tulemuse keskmist muutust teguri muutusega ühe ühiku võrra.

Regressioonivõrrandile lisandub alati seose tiheduse näitaja. Lineaarse regressiooni kasutamisel on selliseks näitajaks lineaarne korrelatsioonikordaja. Lineaarse korrelatsioonikordaja valemil on erinevaid modifikatsioone. Mõned neist on toodud allpool:

Nagu teada, on lineaarne korrelatsioonikordaja piirides: -1 1.

Lineaarfunktsiooni valiku kvaliteedi hindamiseks arvutatakse ruut

Nimetatud lineaarne korrelatsioonikordaja määramiskoefitsient. Determinatsioonikordaja iseloomustab saadud tunnuse dispersiooni osakaalu y, seletatav regressiooniga saadud tunnuse koguvariatsioonis:

Vastavalt sellele iseloomustab väärtus 1 dispersiooni osakaalu y, põhjustatud muude tegurite mõjust, mida mudelis arvesse ei võeta.

Küsimused enesekontrolliks

1. Vähimruutude meetodi olemus?

2. Mitu muutujat annab paaripõhine regressioon?

3. Milline koefitsient määrab muutustevahelise seose tiheduse?

4. Millistes piirides määratakse determinatsioonikoefitsient?

5. Parameetri b hindamine korrelatsioon-regressioonanalüüsis?

1. Christopher Dougherty. Sissejuhatus ökonomeetriasse. - M.: INFRA - M, 2001 - 402 lk.

2. S.A. Boroditš. Ökonomeetria. Minsk LLC “Uued teadmised” 2001.


3. R.U. Rakhmetova Ökonomeetria lühikursus. Õpetus. Almatõ. 2004. -78lk.

4. I.I. Eliseeva, ökonomeetria. - M.: "Finants ja statistika", 2002

5. Igakuine info- ja analüütiline ajakiri.

Mittelineaarsed majandusmudelid. Mittelineaarsed regressioonimudelid. Muutujate teisendus.

Mittelineaarsed majandusmudelid..

Muutujate teisendus.

Elastsustegur.

Kui majandusnähtuste vahel on mittelineaarsed seosed, siis väljendatakse neid vastavate mittelineaarsete funktsioonide abil: näiteks võrdkülgne hüperbool. , teise astme paraboolid ja jne.

Mittelineaarseid regressioone on kahte klassi:

1. Regressioonid, mis on analüüsis sisalduvate selgitavate muutujate suhtes mittelineaarsed, kuid hinnanguliste parameetrite suhtes lineaarsed, näiteks:

Erineva astme polünoomid - , ;

Võrdkülgne hüperbool - ;

Poollogaritmiline funktsioon - .

2. Hinnatavates parameetrites mittelineaarsed regressioonid, näiteks:

Võimsus - ;

Demonstratiivne - ;

Eksponentsiaalne - .

Saadud karakteristiku üksikute väärtuste kõrvalekallete ruudu summa juures keskmisest väärtusest on põhjustatud paljude põhjuste mõjust. Jagame tinglikult kogu põhjuste komplekti kahte rühma: uuritav tegur x Ja muud tegurid.

Kui tegur tulemust ei mõjuta, on graafikul olev regressioonisirge teljega paralleelne Oh Ja

Siis tuleneb kogu saadud karakteristiku dispersioon muude tegurite mõjust ja hälvete ruudu summa langeb kokku jääkväärtusega. Kui muud tegurid tulemust ei mõjuta, siis y seotud Koos X funktsionaalselt ja ruutude jääksumma on null. Sel juhul on regressiooniga seletatav ruutude hälvete summa võrdne ruutude kogusummaga.

Kuna kõik korrelatsioonivälja punktid ei asu regressioonisirgel, tekib nende hajumine alati teguri mõju tulemusena. X, st regressioon juures Kõrval X, ja põhjustatud muudest põhjustest (seletamatu variatsioon). Regressioonijoone sobivus prognoosimiseks sõltub sellest, milline osa tunnuse koguvariatsioonist juures seletatud variatsiooni

Ilmselgelt, kui regressioonist tingitud hälvete ruudu summa on suurem kui ruutude jääksumma, siis on regressioonivõrrand statistiliselt oluline ja tegur X mõjutab oluliselt tulemust u.

, st tunnuse sõltumatu varieerumise vabaduse arvuga. Vabadusastmete arv on seotud üldkogumi n ühikute arvu ja sellest määratud konstantide arvuga. Seoses uuritava probleemiga peaks vabadusastmete arv näitama, kui paljudest sõltumatutest kõrvalekalletest P

Regressioonivõrrandi kui terviku olulisuse hinnang antakse kasutades F- Fisheri kriteerium. Sel juhul esitatakse nullhüpotees, et regressioonikordaja on võrdne nulliga, s.t. b = 0 ja seega tegur X tulemust ei mõjuta u.

F-testi kohesele arvutamisele eelneb dispersioonanalüüs. Keskse koha selles hõivab muutuja hälvete ruutude kogusumma lagunemine juures keskmisest väärtusest juures kaheks osaks - "seletatud" ja "seletamatu":

- hälvete ruudu summa;

- regressiooniga seletatavate hälvete ruudu summa;

- hälvete ruudu jääksumma.

Igasugune hälvete ruudu summa on seotud vabadusastmete arvuga , st tunnuse sõltumatu varieerumise vabaduse arvuga. Vabadusastmete arv on seotud rahvastikuühikute arvuga n ja sellest määratud konstantide arvuga. Seoses uuritava probleemiga peaks vabadusastmete arv näitama, kui paljudest sõltumatutest kõrvalekalletest P võimalik etteantud ruutude summa moodustamiseks.

Dispersioon vabadusastme kohtaD.

F-suhted (F-test):

Kui nullhüpotees on tõene, siis tegur ja jääkvariatsioonid ei erine üksteisest. H 0 puhul on ümberlükkamine vajalik selleks, et teguri dispersioon ületaks mitu korda jääkdispersiooni. Inglise statistik Snedekor töötas välja kriitiliste väärtuste tabelid F-suhted nullhüpoteesi erinevatel olulisuse tasanditel ja erinevatel vabadusastmete arvudel. Tabeli väärtus F-kriteerium on dispersioonide suhte maksimaalne väärtus, mis võib tekkida juhusliku lahknemise korral nullhüpoteesi esinemise tõenäosuse antud tasemel. Arvutatud väärtus F-suhteid peetakse usaldusväärseks, kui o on tabelist suurem.

Sel juhul lükatakse tagasi nullhüpotees märkidevahelise seose puudumise kohta ja tehakse järeldus selle seose olulisuse kohta: F fakt > F tabel H 0 lükatakse tagasi.

Kui väärtus on tabelis esitatud väärtusest väiksem F fakt ‹, F tabel, siis on nullhüpoteesi tõenäosus suurem kui määratud tase ja seda ei saa tagasi lükata ilma tõsise riskita teha vale järelduse seose olemasolu kohta. Sel juhul peetakse regressioonivõrrandit statistiliselt ebaoluliseks. Kuid ta ei kaldu kõrvale.

Regressioonikordaja standardviga

Regressioonikordaja olulisuse hindamiseks võrreldakse selle väärtust standardveaga, st määratakse tegelik väärtus t- õpilase test: mida seejärel võrreldakse tabeli väärtusega teatud olulisuse tasemel ja vabadusastmete arvul ( n- 2).

Standardparameetri viga A:

Lineaarse korrelatsioonikordaja olulisust kontrollitakse vea suuruse alusel korrelatsioonikordaja t r:

Kogu tunnuse dispersioon X:

Mitmekordne lineaarne regressioon

Mudeli ehitamine

Mitmekordne regressioon tähistab efektiivse tunnuse regressiooni kahe või enama teguriga, st vormi mudelit

Regressioon võib anda modelleerimisel häid tulemusi, kui jätta tähelepanuta teiste uuritavat objekti mõjutavate tegurite mõju. Üksikute majandusmuutujate käitumist ei saa kontrollida, st ühe uuritava teguri mõju hindamisel ei ole võimalik tagada kõigi teiste tingimuste võrdsust. Sel juhul peaksite proovima tuvastada teiste tegurite mõju, lisades need mudelisse, st koostama mitmekordse regressiooni võrrandi: y = a+b 1 x 1 +b 2 +…+b p x p + .

Mitmekordse regressiooni põhieesmärk on koostada mudel suure hulga teguritega, määrates seejuures igaühe mõju eraldi, aga ka nende koosmõju modelleeritavale näitajale. Mudeli spetsifikatsioon sisaldab kahte probleemivahemikku: tegurite valik ja regressioonivõrrandi tüübi valik

Vähimruutude meetod (OLS) võimaldab hinnata erinevaid suurusi, kasutades paljude juhuslikke vigu sisaldavate mõõtmiste tulemusi.

Hargmaiste ettevõtete omadused

Selle meetodi põhiidee seisneb selles, et ruudu vigade summat peetakse probleemi lahendamise täpsuse kriteeriumiks, mida nad püüavad minimeerida. Selle meetodi kasutamisel saab kasutada nii numbrilist kui ka analüütilist lähenemist.

Eelkõige hõlmab vähimruutude meetod numbrilise teostusena võimalikult paljude tundmatu juhusliku suuruse mõõtmist. Veelgi enam, mida rohkem arvutusi, seda täpsem on lahendus. Selle arvutuste komplekti (algandmete) põhjal saadakse veel üks hinnanguliste lahenduste komplekt, millest seejärel valitakse välja parim. Kui lahenduste kogum on parameetriline, taandatakse vähimruutude meetod parameetrite optimaalse väärtuse leidmiseks.

Analüütilise lähenemisena LSM-i rakendamisele lähteandmete (mõõtmiste) ja eeldatava lahenduste kogumi puhul määratakse kindel (funktsionaalne), mida saab väljendada valemiga, mis saadakse kindla hüpoteesina, mis nõuab kinnitust. Sel juhul taandub vähimruutude meetod selle funktsionaalsuse miinimumi leidmisele algandmete ruuduvigade hulgast.

Pange tähele, et see ei ole vead ise, vaid vigade ruudud. Miks? Fakt on see, et sageli on mõõtmiste kõrvalekalded täpsest väärtusest nii positiivsed kui ka negatiivsed. Keskmise määramisel võib lihtne liitmine viia hinnangu kvaliteedi kohta vale järelduseni, kuna positiivsete ja negatiivsete väärtuste tühistamine vähendab mitme mõõtmise proovivõtu võimsust. Ja sellest tulenevalt ka hinnangu täpsus.

Et seda ei juhtuks, summeeritakse kõrvalekalded ruudus. Veelgi enam, mõõdetud väärtuse ja lõpliku hinnangu mõõtmete võrdsustamiseks eraldatakse vigade ruudu summa.

Mõned MNC rakendused

MNC-d kasutatakse laialdaselt erinevates valdkondades. Näiteks tõenäosusteoorias ja matemaatilises statistikas kasutatakse seda meetodit juhusliku suuruse sellise tunnuse määramiseks nagu standardhälve, mis määrab juhusliku suuruse väärtusvahemiku laiuse.

Lähendame funktsiooni 2. astme polünoomiga. Selleks arvutame normaalse võrrandisüsteemi koefitsiendid:

, ,

Loome tavalise vähimruutude süsteemi, mille vorm on:

Süsteemi lahendust on lihtne leida:, , .

Seega leitakse 2. astme polünoom: .

Teoreetiline teave

Tagasi lehele<Введение в вычислительную математику. Примеры>

Näide 2. Polünoomi optimaalse astme leidmine.

Tagasi lehele<Введение в вычислительную математику. Примеры>

Näide 3. Normaalse võrrandisüsteemi tuletamine empiirilise sõltuvuse parameetrite leidmiseks.

Tuletame koefitsientide ja funktsioonide määramiseks võrrandisüsteemi , mis teostab antud funktsiooni punktide kaupa ruutkeskmise lähenduse. Koostame funktsiooni ja kirjutage üles selle jaoks vajalik äärmuslik tingimus:

Siis on tavaline süsteem järgmine:

Saime tundmatute parameetrite jaoks lineaarse võrrandisüsteemi, mida on lihtne lahendada.

Teoreetiline teave

Tagasi lehele<Введение в вычислительную математику. Примеры>

Näide.

Eksperimentaalsed andmed muutujate väärtuste kohta X Ja juures on toodud tabelis.

Nende joondamise tulemusena saadakse funktsioon

Kasutades vähima ruudu meetod, lähendage neid andmeid lineaarse sõltuvusega y=kirves+b(leidke parameetrid A Ja b). Uurige, kumb kahest reast paremini (vähimruutude meetodi mõttes) joondab katseandmeid. Tee joonistus.

Vähimruutude meetodi (LSM) olemus.

Ülesandeks on leida lineaarsed sõltuvuskoefitsiendid, mille juures kahe muutuja funktsioon A Ja bvõtab väikseima väärtuse. See tähendab, et antud A Ja b katseandmete ruuduhälbete summa leitud sirgest on väikseim. See on kogu vähimruutude meetodi mõte.

Seega taandub näite lahendamine kahe muutuja funktsiooni ekstreemumi leidmisele.

Valemite tuletamine koefitsientide leidmiseks.

Koostatakse ja lahendatakse kahest võrrandist koosnev süsteem kahe tundmatuga. Funktsiooni osatuletiste leidmine muutujate järgi A Ja b, võrdsustame need tuletised nulliga.

Lahendame saadud võrrandisüsteemi mis tahes meetodiga (näiteks asendusmeetodil või Crameri meetod) ja saada valemid koefitsientide leidmiseks vähimruutude meetodi (LSM) abil.

Antud A Ja b funktsiooni võtab väikseima väärtuse. Selle fakti tõestus on toodud allpool lehe lõpus olevas tekstis.

See on kogu vähimruutude meetod. Valem parameetri leidmiseks a sisaldab summasid , , , ja parameetrit n— katseandmete hulk. Soovitame nende summade väärtused eraldi välja arvutada.

Koefitsient b leitud pärast arvutamist a.

On aeg meenutada algset näidet.

Lahendus.

Meie näites n = 5. Nõutavate koefitsientide valemites sisalduvate summade arvutamise mugavuse huvides täidame tabeli.

Tabeli neljanda rea ​​väärtused saadakse, korrutades iga numbri 2. rea väärtused 3. rea väärtustega i.

Tabeli viienda rea ​​väärtused saadakse iga numbri 2. rea väärtuste ruudustamisel i.

Tabeli viimases veerus olevad väärtused on ridade väärtuste summad.

Koefitsientide leidmiseks kasutame vähimruutude meetodi valemeid A Ja b. Asendame neisse vastavad väärtused tabeli viimasest veerust:

Seega y = 0,165x+2,184— soovitud ligikaudne sirgjoon.

Jääb välja selgitada, milline ridadest y = 0,165x+2,184 või lähendab paremini algandmeid, st teeb hinnangu vähimruutude meetodil.

Vähimruutude meetodi vea hindamine.

Selleks peate arvutama nendest ridadest saadud algandmete ruuduhälbete summa Ja , vastab väiksem väärtus joonele, mis lähendab paremini algandmeid vähimruutude meetodi tähenduses.

Alates , siis otse y = 0,165x+2,184 lähendab paremini algandmeid.

Vähimruutude (LS) meetodi graafiline illustratsioon.

Graafikutelt on kõik selgelt näha. Punane joon on leitud sirgjoon y = 0,165x+2,184, sinine joon on , roosad täpid on algandmed.

Miks seda vaja on, milleks kõik need ligikaudsed hinnangud?

Mina isiklikult kasutan seda andmete silumise, interpoleerimise ja ekstrapoleerimise probleemide lahendamiseks (algses näites võidakse neil paluda leida vaadeldava väärtuse väärtus y juures x=3 või millal x=6 kasutades vähimruutude meetodit). Kuid me räägime sellest hiljem saidi teises jaotises.

Lehe ülaosa

Tõestus.

Nii et kui leitakse A Ja b funktsioon võtab väikseima väärtuse, siis on vajalik, et selles punktis funktsiooni teist järku diferentsiaali ruutkuju maatriks oli positiivne kindel. Näitame seda.

Teist järku diferentsiaalil on vorm:

See on

Seetõttu on ruutvormi maatriksil vorm

ja elementide väärtused ei sõltu A Ja b.

Näitame, et maatriks on positiivne kindel. Selleks peavad nurgelised alaealised olema positiivsed.

I järgu nurgeline moll . Ebavõrdsus on range, sest punktid ei lange kokku. Järgnevalt viitame sellele.

Teist järku nurgeline moll

Tõestame seda matemaatilise induktsiooni meetodil.

Järeldus: leitud väärtused A Ja b vastavad funktsiooni väikseimale väärtusele Seetõttu on vähimruutude meetodi nõutavad parameetrid.

Pole aega seda välja mõelda?
Telli lahendus

Lehe ülaosa

Prognoosi koostamine vähimruutude meetodil. Näide probleemi lahendamisest

Ekstrapoleerimine on teaduslik uurimismeetod, mis põhineb mineviku ja oleviku suundumuste, mustrite ja seoste levitamisel prognoositava objekti tulevase arenguga. Ekstrapoleerimismeetodid hõlmavad liikuva keskmise meetod, eksponentsiaalse silumise meetod, vähimruutude meetod.

Essents vähimruutude meetod seisneb vaadeldud ja arvutatud väärtuste vaheliste ruutude hälvete summa minimeerimises. Arvutatud väärtused leitakse valitud võrrandi - regressioonivõrrandi abil. Mida väiksem on vahemaa tegelike väärtuste ja arvutatud väärtuste vahel, seda täpsem on regressioonivõrrandil põhinev prognoos.

Kõvera valiku aluseks on uuritava nähtuse olemuse teoreetiline analüüs, mille muutust peegeldab aegrida. Mõnikord võetakse arvesse kaalutlusi seeria tasemete tõusu olemuse kohta. Seega, kui toodangu kasvu oodatakse aritmeetilises progressioonis, siis silumine toimub sirgjooneliselt. Kui selgub, et kasv on geomeetrilises progressioonis, siis tuleb silumine teha eksponentsiaalfunktsiooni abil.

Vähimruutude meetodi töövalem : Y t+1 = a*X + b, kus t + 1 – prognoosiperiood; Уt+1 – prognoositav näitaja; a ja b on koefitsiendid; X on aja sümbol.

Koefitsientide a ja b arvutamine toimub järgmiste valemite abil:

kus Uf – dünaamika seeria tegelikud väärtused; n – aegridade tasemete arv;

Aegridade tasandamine vähimruutude meetodil kajastab uuritava nähtuse arengumustrit. Trendi analüütilises väljenduses käsitletakse aega sõltumatu muutujana ja seeria tasemed toimivad selle sõltumatu muutuja funktsioonina.

Nähtuse areng ei sõltu sellest, mitu aastat on alguspunktist möödunud, vaid sellest, millised tegurid, mis suunas ja millise intensiivsusega selle arengut mõjutasid. Siit on selge, et nähtuse areng aja jooksul on nende tegurite toime tulemus.

Kõvera tüübi õige määramine, analüütilise sõltuvuse tüüp ajast on ennustava analüüsi üks keerulisemaid ülesandeid .

Trendi kirjeldava funktsiooni tüübi valimine, mille parameetrid määratakse vähimruutude meetodil, toimub enamikul juhtudel empiiriliselt, konstrueerides mitmeid funktsioone ja võrreldes neid üksteisega vastavalt funktsiooni väärtusele. keskmine ruutviga, arvutatakse järgmise valemiga:

kus UV on dünaamika seeria tegelikud väärtused; Ur – dünaamika seeria arvutatud (silutud) väärtused; n – aegridade tasemete arv; p – trendi (arengutrendi) kirjeldavates valemites määratletud parameetrite arv.

Vähimruutude meetodi puudused :

  • kui püütakse kirjeldada uuritavat majandusnähtust matemaatilise võrrandi abil, on prognoos lühikest aega täpne ja regressioonivõrrand tuleks uue teabe ilmnemisel ümber arvutada;
  • standardsete arvutiprogrammide abil lahendatava regressioonivõrrandi valimise keerukus.

Näide vähimruutude meetodi kasutamisest prognoosi koostamiseks

Ülesanne . Piirkonnas on tööpuudust iseloomustavad andmed, %

  • Koostage piirkonna töötuse määra prognoos novembriks, detsembriks, jaanuariks järgmiste meetoditega: liikuv keskmine, eksponentsiaalne silumine, vähimruutud.
  • Arvutage saadud prognooside vead iga meetodi abil.
  • Võrrelge tulemusi ja tehke järeldused.

Vähimruutude lahendus

Selle lahendamiseks koostame tabeli, milles teeme vajalikud arvutused:

ε = 28,63/10 = 2,86% prognoosi täpsus kõrge.

Järeldus : Arvutuste tulemusel saadud tulemuste võrdlemine liikuva keskmise meetod , eksponentsiaalne silumismeetod ja vähimruutude meetodit, võime öelda, et keskmine suhteline viga eksponentsiaalse silumise meetodil arvutamisel jääb vahemikku 20-50%. See tähendab, et sel juhul on prognoosi täpsus vaid rahuldav.

Esimesel ja kolmandal juhul on prognoosi täpsus kõrge, kuna keskmine suhteline viga on alla 10%. Kuid libiseva keskmise meetod võimaldas saada usaldusväärsemaid tulemusi (novembri prognoos - 1,52%, prognoos detsembriks - 1,53%, prognoos jaanuariks - 1,49%), kuna keskmine suhteline viga selle meetodi kasutamisel on väikseim - 1 ,13%.

Vähima ruudu meetod

Teised artiklid sellel teemal:

Kasutatud allikate loetelu

  1. Teaduslikud ja metoodilised soovitused sotsiaalsete riskide diagnoosimiseks ning väljakutsete, ohtude ja sotsiaalsete tagajärgede prognoosimiseks. Venemaa Riiklik Sotsiaalülikool. Moskva. 2010;
  2. Vladimirova L.P. Prognoosimine ja planeerimine turutingimustes: Õpik. toetust. M.: kirjastus "Dashkov ja Co", 2001;
  3. Novikova N.V., Pozdeeva O.G. Rahvamajanduse prognoosimine: Haridus- ja metoodiline käsiraamat. Jekaterinburg: Uurali kirjastus. olek ökon. Ülikool, 2007;
  4. Slutskin L.N. MBA kursus äriprognoosidest. M.: Alpina Business Books, 2006.

MNC programm

Sisesta andmed

Andmed ja lähendamine y = a + b x

i- katsepunktide arv;
x i- fikseeritud parameetri väärtus punktis i;
y i- mõõdetud parameetri väärtus punktis i;
ωi- mõõta kaalu ühes punktis i;
y i, arvut.- erinevus mõõdetud ja regressiooniga arvutatud väärtuse vahel y punktis i;
S x i (x i)- veahinnang x i mõõtmisel y punktis i.

Andmed ja lähendamine y = k x

i x i y i ωi y i, arvut. Δy i S x i (x i)

Klõpsake diagrammil

MNC võrguprogrammi kasutusjuhend.

Sisestage andmeväljale igale eraldi reale x ja y väärtused ühes katsepunktis. Väärtused tuleb eraldada tühikuga (tühik või tabeldusmärk).

Kolmas väärtus võib olla punkti w kaal. Kui punkti kaal pole määratud, on see võrdne ühega. Valdav enamus juhtudel on katsepunktide kaalud teadmata või arvutamata, s.t. kõiki katseandmeid peetakse samaväärseteks. Mõnikord ei ole kaalud uuritud väärtuste vahemikus absoluutselt samaväärsed ja neid saab isegi teoreetiliselt arvutada. Näiteks spektrofotomeetrias saab kaalusid arvutada lihtsate valemite abil, kuigi see on tööjõukulude vähendamiseks enamasti tähelepanuta jäetud.

Andmeid saab lõikepuhvri kaudu kleepida kontorikomplekti, näiteks Microsoft Office'i Exceli või Open Office'i Calci arvutustabelist. Selleks valige arvutustabelis kopeeritavate andmete vahemik, kopeerige lõikepuhvrisse ja kleepige andmed selle lehe andmeväljale.

Vähimruutude meetodi abil arvutamiseks on vaja vähemalt kahte punkti, et määrata kaks koefitsienti "b" - joone kaldenurga puutuja ja "a" - väärtus, mille joon lõikab y-teljel.

Arvutatud regressioonikoefitsientide vea hindamiseks peate määrama katsepunktide arvuks rohkem kui kaks.

Vähimruutude meetod (LSM).

Mida suurem on katsepunktide arv, seda täpsem on koefitsientide statistiline hinnang (Student-i koefitsiendi vähenemise tõttu) ja seda lähemal on hinnang üldvalimi hinnangule.

Väärtuste saamine igas katsepunktis on sageli seotud märkimisväärsete tööjõukuludega, seetõttu tehakse sageli kompromissiline arv katseid, mis annavad juhitava hinnangu ja ei too kaasa liigseid tööjõukulusid. Reeglina valitakse kahe koefitsiendiga lineaarse vähimruutude sõltuvuse katsepunktide arv vahemikus 5-7 punkti.

Lineaarsete suhete vähimate ruutude lühiteooria

Oletame, et meil on eksperimentaalsete andmete kogum väärtuspaaride kujul ["y_i", "x_i"], kus i on ühe katselise mõõtmise arv vahemikus 1 kuni n; "y_i" – mõõdetud suuruse väärtus punktis "i"; „x_i” – parameetri väärtus, mille me määrame punktis „i”.

Vaatleme näiteks Ohmi seaduse toimimist. Muutes pinget (potentsiaalide erinevust) elektriahela sektsioonide vahel, mõõdame seda sektsiooni läbiva voolu suurust. Füüsika annab meile eksperimentaalselt leitud sõltuvuse:

"I = U/R",
kus "I" on voolutugevus; `R` - takistus; "U" - pinge.

Sel juhul on "y_i" mõõdetav vooluväärtus ja "x_i" on pinge väärtus.

Teise näitena vaadeldakse valguse neeldumist aine lahuses. Keemia annab meile valemi:

"A = ε l C",
kus "A" on lahuse optiline tihedus; `ε` - lahustunud aine läbilaskvus; `l` - tee pikkus, kui valgus läbib lahusega küveti; "C" on lahustunud aine kontsentratsioon.

Sel juhul on „y_i” optilise tiheduse „A” mõõdetud väärtus ja „x_i” on meie poolt määratud aine kontsentratsiooni väärtus.

Vaatleme juhtumit, kui suhteline viga määramises "x_i" on oluliselt väiksem kui mõõtmise suhteline viga "y_i". Samuti eeldame, et kõik mõõdetud väärtused "y_i" on juhuslikud ja normaalse jaotusega, st. järgige normaaljaotuse seadust.

Kui "y" on lineaarne sõltuvusest "x", võime kirjutada teoreetilise sõltuvuse:
y = a + b x.

Geomeetrilisest vaatenurgast tähistab koefitsient "b" sirge kaldenurga puutujat x-telje suhtes ja koefitsient "a" - y väärtust joone lõikepunktis. joon y-teljega (x = 0).

Regressioonijoone parameetrite leidmine.

Katses ei saa 'y_i' mõõdetud väärtused olla täpselt teoreetilisel sirgel mõõtmisvigade tõttu, mis on reaalses elus alati omased. Seetõttu tuleb lineaarvõrrandit esitada võrrandisüsteemiga:
"y_i = a + b x_i + ε_i" (1),
kus ε_i on y tundmatu mõõtmisviga i-ndas katses.

Sõltuvust (1) nimetatakse ka regressioon, st. kahe suuruse sõltuvus üksteisest statistilise olulisusega.

Sõltuvuse taastamise ülesanne on leida katsepunktidest [`y_i`, `x_i`] koefitsiendid `a` ja `b`.

Tavaliselt kasutatakse seda koefitsientide "a" ja "b" leidmiseks vähima ruudu meetod(MNC). See on maksimaalse tõenäosuse põhimõtte erijuhtum.

Kirjutame (1) ümber kujul `ε_i = y_i - a - b x_i`.

Siis on vigade ruudu summa
"Φ = summa_(i=1)^(n) ε_i^2 = summa_(i=1)^(n) (y_i - a - b x_i)^2". (2)

Vähimruutude (vähimruutude) põhimõte on minimeerida summa (2) parameetrite "a" ja "b" suhtes.

Miinimum saavutatakse, kui summa (2) osatuletised koefitsientide "a" ja "b" suhtes on võrdsed nulliga:
`frac(osaline Φ)(osaline a) = murd(osaline summa_(i=1)^(n) (y_i - a - b x_i)^2)(osaline a) = 0
`murd(osaline Φ)(osaline b) = murd(osasumma_(i=1)^(n) (y_i - a - b x_i)^2)(osaline b) = 0

Laiendades tuletisi, saame kahe tundmatuga võrrandisüsteemi:
`summa_(i=1)^(n) (2a + 2bx_i — 2y_i) = summa_(i=1)^(n) (a + bx_i — y_i) = 0
`summa_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = summa_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0`

Avame sulud ja kanname nõutavatest koefitsientidest sõltumatud summad teisele poolele, saame lineaarvõrrandisüsteemi:
`summa_(i=1)^(n) y_i = a n + b summa_(i=1)^(n) bx_i
`summa_(i=1)^(n) x_iy_i = a summa_(i=1)^(n) x_i + b summa_(i=1)^(n) x_i^2

Lahendades saadud süsteemi, leiame koefitsientide "a" ja "b" valemid:

`a = frac(summa_(i=1)^(n) y_i summa_(i=1)^(n) x_i^2 — summa_(i=1)^(n) x_i summa_(i=1)^(n ) x_iy_i) (n summa_(i=1)^(n) x_i^2 — (summa_(i=1)^(n) x_i)^2)" (3.1)

`b = frac(n summa_(i=1)^(n) x_iy_i — summa_(i=1)^(n) x_i summa_(i=1)^(n) y_i) (n summa_(i=1)^ (n) x_i^2 — (summa_(i=1)^(n) x_i)^2)" (3.2)

Nendel valemitel on lahendused, kui `n > 1` (joone saab konstrueerida vähemalt 2 punkti abil) ja kui determinant `D = n summa_(i=1)^(n) x_i^2 - (summa_(i= 1) )^(n) x_i)^2 != 0`, st. kui katse x_i punktid on erinevad (st kui joon ei ole vertikaalne).

Regressioonisirgekoefitsientide vigade hindamine

Koefitsientide "a" ja "b" arvutamise vea täpsemaks hindamiseks on soovitav kasutada palju katsepunkte. Kui `n = 2`, on koefitsientide viga võimatu hinnata, sest ligikaudne joon läbib üheselt kahte punkti.

Määratakse juhusliku suuruse `V` viga vigade kogunemise seadus
`S_V^2 = summa_(i=1)^p (frac(osaline f)(osaline z_i))^2 S_(z_i)^2,
kus "p" on veaga "S_(z_i)" parameetrite "z_i" arv, mis mõjutavad viga "S_V";
"f" on funktsioon "V" sõltuvusest väärtusest "z_i".

Paneme kirja koefitsientide `a` ja `b` vea jaoks vigade kogunemise seaduse
`S_a^2 = summa_(i=1)^(n)(murd(osaline a)(osaline y_i))^2 S_(y_i)^2 + summa_(i=1)^(n)(frac(osaline a) )(osaline x_i))^2 S_(x_i)^2 = S_y^2 summa_(i=1)^(n)(frac(osaline a)(osaline y_i))^2 `,
`S_b^2 = summa_(i=1)^(n)(murd(osaline b)(osaline y_i))^2 S_(y_i)^2 + summa_(i=1)^(n)(murd(osaline b) )(osaline x_i))^2 S_(x_i)^2 = S_y^2 summa_(i=1)^(n)(frac(osaline b)(osaline y_i))^2 `,
sest "S_(x_i)^2 = 0" (varem tegime reservatsiooni, et viga "x" on tühine).

S_y^2 = S_(y_i)^2 – viga (dispersioon, ruudus standardhälve) y mõõtmisel, eeldades, et viga on kõigi y väärtuste puhul ühtlane.

Asendades saadud avaldistes valemid "a" ja "b" arvutamiseks

`S_a^2 = S_y^2 frac(summa_(i=1)^(n) (summa_(i=1)^(n) x_i^2 — x_i summa_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n summa_(i=1)^(n) x_i^2 — (summa_(i=1)^(n) x_i)^2) summa_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(summa_(i=1)^(n) x_i^2) (D)" (4.1)

`S_b^2 = S_y^2 frac(summa_(i=1)^(n) (n x_i — summa_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n summa_(i=1)^(n) x_i^2 — (summa_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) (4.2)

Enamikus reaalsetes katsetes ei mõõdeta "Sy" väärtust. Selleks on vaja ühes või mitmes plaani punktis läbi viia mitu paralleelset mõõtmist (katset), mis suurendab katse aega (ja võib-olla ka maksumust). Seetõttu eeldatakse tavaliselt, et "y" kõrvalekallet regressioonisirgest võib pidada juhuslikuks. Dispersiooni y hinnang arvutatakse sel juhul valemi abil.

`S_y^2 = S_(y, ülejäänud)^2 = frac(summa_(i=1)^n (y_i - a - b x_i)^2) (n-2)".

"n-2" jagaja ilmub, kuna meie vabadusastmete arv on vähenenud kahe koefitsiendi arvutamise tõttu, kasutades sama katseandmete valimit.

Seda hinnangut nimetatakse ka regressioonijoone S_(y, rest)^2 suhtes jääkvariatsiooniks.

Koefitsientide olulisust hinnatakse Studenti t-testi abil

"t_a = frac(|a|) (S_a)", "t_b = frac(|b|) (S_b)"

Kui arvutatud kriteeriumid `t_a`, `t_b` on väiksemad kui tabelikriteeriumid `t(P, n-2)`, siis arvestatakse, et vastav koefitsient ei erine antud tõenäosusega `P` oluliselt nullist.

Lineaarse seose kirjelduse kvaliteedi hindamiseks saate Fisheri kriteeriumi abil võrrelda väärtusi "S_(y, rest)^2" ja "S_(bar y)" keskmisega.

`S_(bar y) = murd(summa_(i=1)^n (y_i — riba y)^2) (n-1) = frac(summa_(i=1)^n (y_i — (summa_(i=) 1)^n y_i) /n)^2) (n-1) – dispersiooni y valimi hinnang keskmise suhtes.

Regressioonivõrrandi efektiivsuse hindamiseks sõltuvuse kirjeldamiseks arvutatakse Fisheri koefitsient
"F = S_(bar y) / S_(y, ülejäänud)^2",
mida võrreldakse tabeli Fisheri koefitsiendiga "F(p, n-1, n-2)".

Kui "F > F(P, n-1, n-2)", peetakse erinevust regressioonivõrrandit kasutava seose y = f(x) kirjelduse ja keskmist kasutava kirjelduse vahel tõenäoliselt statistiliselt oluliseks. "P". Need. regressioon kirjeldab sõltuvust paremini kui y levik keskmise ümber.

Klõpsake diagrammil
tabelisse väärtuste lisamiseks

Vähima ruudu meetod. Vähimruutude meetod tähendab tundmatute parameetrite a, b, c, aktsepteeritud funktsionaalse sõltuvuse määramist

Vähimruutude meetod viitab tundmatute parameetrite määramisele a, b, c,… aktsepteeritud funktsionaalne sõltuvus

y = f(x,a,b,c,…),

mis annaks vea keskmise ruudu (dispersiooni) miinimumi

, (24)

kus x i, y i on katsest saadud arvupaaride hulk.

Kuna mitme muutuja funktsiooni ekstreemumi tingimuseks on tingimus, et selle osatuletised on võrdsed nulliga, siis parameetrid a, b, c,… määratakse võrrandisüsteemist:

; ; ; … (25)

Tuleb meeles pidada, et parameetrite valimiseks funktsiooni tüübi järel kasutatakse vähimruutude meetodit y = f(x) määratletud

Kui teoreetilistest kaalutlustest lähtudes ei saa teha järeldusi selle kohta, milline peaks olema empiiriline valem, siis tuleb lähtuda visuaalsetest esitustest, eelkõige vaadeldavate andmete graafilistest esitustest.

Praktikas piirduvad need enamasti järgmist tüüpi funktsioonidega:

1) lineaarne ;

2) ruutkeskne a.

Näide.

Eksperimentaalsed andmed muutujate väärtuste kohta X Ja juures on toodud tabelis.

Nende joondamise tulemusena saadakse funktsioon

Kasutades vähima ruudu meetod, lähendage neid andmeid lineaarse sõltuvusega y=kirves+b(leidke parameetrid A Ja b). Uurige, kumb kahest reast paremini (vähimruutude meetodi mõttes) joondab katseandmeid. Tee joonistus.

Vähimruutude meetodi (LSM) olemus.

Ülesandeks on leida lineaarsed sõltuvuskoefitsiendid, mille juures kahe muutuja funktsioon A Ja b võtab väikseima väärtuse. See tähendab, et antud A Ja b katseandmete ruuduhälbete summa leitud sirgest on väikseim. See on kogu vähimruutude meetodi mõte.

Seega taandub näite lahendamine kahe muutuja funktsiooni ekstreemumi leidmisele.

Valemite tuletamine koefitsientide leidmiseks.

Koostatakse ja lahendatakse kahest võrrandist koosnev süsteem kahe tundmatuga. Funktsiooni osatuletiste leidmine muutujate järgi A Ja b, võrdsustame need tuletised nulliga.

Lahendame saadud võrrandisüsteemi mis tahes meetodiga (näiteks asendusmeetodil või Crameri meetod) ja saada valemid koefitsientide leidmiseks vähimruutude meetodi (LSM) abil.

Antud A Ja b funktsiooni võtab väikseima väärtuse. Selle fakti tõestus on esitatud allpool lehe lõpus olevas tekstis.

See on kogu vähimruutude meetod. Valem parameetri leidmiseks a sisaldab summasid ,, ja parameetrit n- katseandmete hulk. Soovitame nende summade väärtused eraldi välja arvutada. Koefitsient b leitud pärast arvutamist a.

On aeg meenutada algset näidet.

Lahendus.

Meie näites n = 5. Nõutavate koefitsientide valemites sisalduvate summade arvutamise mugavuse huvides täidame tabeli.

Tabeli neljanda rea ​​väärtused saadakse, korrutades iga numbri 2. rea väärtused 3. rea väärtustega i.

Tabeli viienda rea ​​väärtused saadakse iga numbri 2. rea väärtuste ruudustamisel i.

Tabeli viimases veerus olevad väärtused on ridade väärtuste summad.

Koefitsientide leidmiseks kasutame vähimruutude meetodi valemeid A Ja b. Asendame neisse vastavad väärtused tabeli viimasest veerust:

Seega y = 0,165x+2,184- soovitud ligikaudne sirgjoon.

Jääb välja selgitada, milline ridadest y = 0,165x+2,184 või lähendab paremini algandmeid, st teeb hinnangu vähimruutude meetodil.

Vähimruutude meetodi vea hindamine.

Selleks peate arvutama nendest ridadest saadud algandmete ruuduhälbete summa Ja , vastab väiksem väärtus joonele, mis lähendab paremini algandmeid vähimruutude meetodi tähenduses.

Alates , siis otse y = 0,165x+2,184 lähendab paremini algandmeid.

Vähimruutude (LS) meetodi graafiline illustratsioon.

Graafikutelt on kõik selgelt näha. Punane joon on leitud sirgjoon y = 0,165x+2,184, sinine joon on , roosad täpid on algandmed.

Praktikas kasutatakse mitmesuguste protsesside - eriti majanduslike, füüsiliste, tehniliste, sotsiaalsete - modelleerimisel laialdaselt üht või teist meetodit funktsioonide ligikaudsete väärtuste arvutamiseks nende teadaolevatest väärtustest teatud kindlates punktides.

Seda tüüpi funktsioonide lähendamise probleem tekib sageli:

    ligikaudsete valemite koostamisel uuritava protsessi iseloomulike suuruste väärtuste arvutamiseks, kasutades katse tulemusena saadud tabeliandmeid;

    arvulises integreerimises, diferentseerimises, diferentsiaalvõrrandite lahendamises jne;

    vajadusel arvutage funktsioonide väärtused vaadeldava intervalli vahepunktides;

    protsessi iseloomulike suuruste väärtuste määramisel väljaspool vaadeldavat intervalli, eriti prognoosimisel.

Kui teatud tabeliga määratud protsessi modelleerimiseks konstrueerime funktsiooni, mis seda protsessi ligikaudselt kirjeldab vähimruutude meetodil, nimetatakse seda lähendavaks funktsiooniks (regressiooniks) ja lähendavate funktsioonide enda konstrueerimise ülesannet. ligikaudne probleem.

Selles artiklis käsitletakse MS Exceli paketi võimalusi seda tüüpi probleemide lahendamiseks, lisaks pakutakse meetodeid ja võtteid tabelifunktsioonide regressioonide koostamiseks (loomiseks) (mis on regressioonanalüüsi aluseks).

Excelil on regressioonide koostamiseks kaks võimalust.

    Valitud regressioonide (trendijoonte) lisamine uuritava protsessi karakteristiku andmetabeli alusel koostatud diagrammile (saadaval ainult siis, kui diagramm on konstrueeritud);

    Exceli töölehe sisseehitatud statistiliste funktsioonide kasutamine, mis võimaldab teil saada regressioone (trendijooni) otse lähteandmete tabelist.

Trendijoonte lisamine diagrammile

Protsessi kirjeldava andmetabeli jaoks, mis on kujutatud diagrammina, on Excelil tõhus regressioonianalüüsi tööriist, mis võimaldab teil:

    ehitada vähimruutude meetodi alusel ja lisada diagrammile viis tüüpi regressioone, mis modelleerivad uuritavat protsessi erineva täpsusega;

    lisada diagrammile konstrueeritud regressioonivõrrand;

    määrata valitud regressiooni vastavuse aste diagrammil kuvatavatele andmetele.

Diagrammi andmete põhjal võimaldab Excel saada lineaarseid, polünoomilisi, logaritmilisi, võimsuse, eksponentsiaalseid regressioone, mis on määratud võrrandiga:

y = y(x)

kus x on sõltumatu muutuja, mis võtab sageli naturaalarvude jada (1; 2; 3; ...) väärtused ja loob näiteks uuritava protsessi aja loenduse (karakteristikud).

1 . Lineaarne regressioon on hea selliste karakteristikute modelleerimiseks, mille väärtused suurenevad või vähenevad konstantse kiirusega. See on uuritava protsessi jaoks kõige lihtsam mudel. See on ehitatud vastavalt võrrandile:

y = mx + b

kus m on lineaarse regressiooni tõusu puutuja x-teljega; b - lineaarse regressiooni ja ordinaattelje lõikepunkti koordinaat.

2 . Polünoomiline trendijoon on kasulik selliste omaduste kirjeldamiseks, millel on mitu erinevat äärmust (maksimumid ja miinimumid). Polünoomi astme valiku määrab uuritava tunnuse ekstreemumite arv. Seega saab teise astme polünoom hästi kirjeldada protsessi, millel on ainult üks maksimum või miinimum; kolmanda astme polünoom - mitte rohkem kui kaks äärmust; neljanda astme polünoom - mitte rohkem kui kolm ekstreemi jne.

Sel juhul koostatakse trendijoon vastavalt võrrandile:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

kus koefitsiendid c0, c1, c2,...c6 on konstandid, mille väärtused määratakse ehituse käigus.

3 . Logaritmilist trendijoont kasutatakse edukalt karakteristikute modelleerimisel, mille väärtused muutuvad alguses kiiresti ja seejärel järk-järgult stabiliseeruvad.

y = c ln(x) + b

4 . Võimuseaduse trendijoon annab häid tulemusi, kui uuritava suhte väärtusi iseloomustab pidev kasvutempo muutus. Sellise sõltuvuse näiteks on auto ühtlaselt kiirendatud liikumise graafik. Kui andmetes on null või negatiivsed väärtused, ei saa te võimsustrendi joont kasutada.

Ehitatud vastavalt võrrandile:

y = c xb

kus koefitsiendid b, c on konstandid.

5 . Eksponentsiaalset trendijoont tuleks kasutada siis, kui andmete muutumise kiirus pidevalt kasvab. Null- või negatiivseid väärtusi sisaldavate andmete puhul ei ole seda tüüpi lähendus samuti kohaldatav.

Ehitatud vastavalt võrrandile:

y = c ebx

kus koefitsiendid b, c on konstandid.

Trendijoone valimisel arvutab Excel automaatselt välja R2 väärtuse, mis iseloomustab lähenduse usaldusväärsust: mida lähemal on R2 väärtus ühtsusele, seda usaldusväärsemalt läheneb trendijoon uuritavale protsessile. Vajadusel saab R2 väärtuse alati diagrammil kuvada.

Määratakse valemiga:

Andmeseeriale trendijoone lisamiseks tehke järgmist.

    aktiveerige diagramm andmete seeria põhjal, st klõpsake diagrammialal. Diagrammi element ilmub peamenüüsse;

    pärast sellel üksusel klõpsamist ilmub ekraanile menüü, kus peaksite valima käsu Lisa trendijoon.

Samu toiminguid saab hõlpsasti teostada, kui liigutada hiirekursorit ühele andmeseeriale vastava graafiku kohale ja teha paremklõps; Ilmuvas kontekstimenüüs valige käsk Lisa trendijoon. Ekraanile ilmub dialoogiboks Trendline, kus on avatud vahekaart Tüüp (joonis 1).

Pärast seda vajate:

Valige vahekaardil Tüüp soovitud trendijoone tüüp (vaikimisi on valitud Lineaarne tüüp). Polünoomi tüübi jaoks määrake väljal Degree valitud polünoomi aste.

1 . Väljal Built on seeria on loetletud kõik kõnealuse diagrammi andmesarjad. Konkreetsele andmeseeriale trendijoone lisamiseks valige väljal Built on seeria selle nimi.

Vajadusel saate vahekaardile Parameetrid minnes (joonis 2) määrata trendijoonele järgmised parameetrid:

    muutke väljal Lähendava (silutud) kõvera nimi trendijoone nime.

    määrata väljale Prognoos prognoosi perioodide arv (edasi või tagasi);

    kuvage diagrammialal trendijoone võrrand, mille jaoks peaksite lubama märkeruudu näitamise võrrandit diagrammil;

    kuva skeemialal ligikaudse usaldusväärsuse väärtus R2, mille puhul tuleks lubada märkeruut Aseta lähenduse usaldusväärsuse väärtus diagrammile (R^2);

    määrake trendijoone lõikepunkt Y-teljega, mille jaoks peaksite märkima kõvera ristumiskoha Y-teljega punktis;

    Dialoogiboksi sulgemiseks klõpsake nuppu OK.

Juba joonistatud trendijoone redigeerimise alustamiseks on kolm võimalust:

    kasuta menüüst Vorming käsku Valitud trendijoon, olles eelnevalt valinud trendijoone;

    vali kontekstimenüüst käsk Vorminda trendijoont, mis avatakse trendijoonel paremklõpsuga;

    topeltklõps trendijoonel.

Ekraanile ilmub dialoogiboks Trend Line Format (joonis 3), mis sisaldab kolme vahekaarti: Vaade, Tüüp, Parameetrid ning kahe viimase sisu kattub täielikult samalaadsete vahekaartidega Trend Line dialoogiboksis (joonis 1). -2). Vahekaardil Vaade saate määrata joone tüübi, värvi ja paksuse.

Juba joonistatud trendijoone kustutamiseks valige kustutatav trendijoon ja vajutage klahvi Kustuta.

Vaadeldava regressioonanalüüsi tööriista eelised on järgmised:

    trendijoone konstrueerimise suhteline lihtsus diagrammidel ilma selle jaoks andmetabelit loomata;

    üsna lai nimekiri pakutud trendijoonte tüüpidest ja see loend sisaldab kõige sagedamini kasutatavaid regressioonitüüpe;

    võime ennustada uuritava protsessi käitumist suvalise (terve mõistuse piires) sammude arvuga edasi ja ka tagasi;

    trendijoone võrrandi analüütilise vormi saamise oskus;

    vajaduse korral võimalus saada hinnang lähenduse usaldusväärsuse kohta.

Puuduste hulka kuuluvad järgmised:

    trendijoone konstrueerimine toimub ainult siis, kui on olemas andmeseeriale üles ehitatud diagramm;

    uuritava karakteristiku andmeseeriate genereerimise protsess selle jaoks saadud trendijoone võrrandite põhjal on mõnevõrra segane: nõutavaid regressioonivõrrandeid uuendatakse iga algse andmerea väärtuste muutusega, kuid ainult diagrammi ala piires. , samas kui vana joonvõrrandi trendi alusel moodustatud andmeread jäävad muutumatuks;

    PivotChart-liigenddiagrammi aruannetes ei säilita diagrammi või sellega seotud PivotTable-liigendtabeli aruande vaate muutmine olemasolevaid trendijooni, mis tähendab, et enne trendijoonte joonistamist või muul viisil PivotChart-liigenddiagrammi aruande vormindamist peaksite veenduma, et aruande paigutus vastab nõutavatele nõuetele.

Trendijooni saab kasutada andmeseeriate täiendamiseks diagrammidel, nagu graafik, histogramm, lamedad standardeerimata aladiagrammid, tulpdiagrammid, hajuvusdiagrammid, mulldiagrammid ja aktsiadiagrammid.

3D-, normaliseeritud, radari-, sektor- ja sõõrdiagrammides ei saa andmeseeriatele lisada trendijooni.

Exceli sisseehitatud funktsioonide kasutamine

Excelis on ka regressioonianalüüsi tööriist trendijoonte joonistamiseks väljaspool diagrammi ala. Sel eesmärgil saate kasutada mitmeid statistilisi töölehe funktsioone, kuid kõik need võimaldavad teil koostada ainult lineaarseid või eksponentsiaalseid regressioone.

Excelil on lineaarse regressiooni koostamiseks mitu funktsiooni, eelkõige:

    TREND;

  • KALVAD ja LÕIKAD.

Lisaks mitmed funktsioonid eksponentsiaalse trendijoone koostamiseks, eriti:

    LGRFPRIBL.

Tuleb märkida, et TREND ja GROWTH funktsioonide abil regressioonide koostamise tehnikad on peaaegu samad. Sama võib öelda ka funktsioonipaari LINEST ja LGRFPRIBL kohta. Nende nelja funktsiooni jaoks kasutab väärtustabeli loomine Exceli funktsioone, näiteks massiivi valemeid, mis segab regressioonide koostamise protsessi mõnevõrra. Pangem ka tähele, et lineaarse regressiooni konstrueerimine on meie arvates kõige lihtsamini teostatav funktsioonide SLOPE ja INTERCEPT abil, kus esimene neist määrab lineaarse regressiooni kalde ja teine ​​määrab lõigu, mille katkestab regressioon y-telg.

Regressioonanalüüsi sisseehitatud funktsioonide tööriista eelised on järgmised:

    üsna lihtne ja ühtne protsess uuritava tunnuse andmeseeriate genereerimiseks kõigi sisseehitatud statistiliste funktsioonide jaoks, mis määratlevad trendijooned;

    standardmetoodika trendijoonte koostamiseks genereeritud andmeseeriate põhjal;

    võime ennustada uuritava protsessi käitumist vajaliku arvu sammudega edasi või tagasi.

Puudusteks on asjaolu, et Excelis puuduvad sisseehitatud funktsioonid muud tüüpi (välja arvatud lineaarsed ja eksponentsiaalsed) trendijoonte loomiseks. See asjaolu ei võimalda sageli valida uuritava protsessi kohta piisavalt täpset mudelit, samuti saada tegelikkusele lähedasi prognoose. Lisaks ei ole funktsioonide TREND ja GROWTH kasutamisel teada trendijoonte võrrandid.

Tuleb märkida, et autorid ei soovinud regressioonanalüüsi kulgu mingilgi määral täielikult esitada. Selle põhiülesanne on konkreetsete näidete abil näidata Exceli paketi võimalusi lähendusülesannete lahendamisel; demonstreerida, millised tõhusad tööriistad on Excelil regressioonide koostamiseks ja prognoosimiseks; illustreerige, kuidas selliseid probleeme saab suhteliselt lihtsalt lahendada isegi kasutaja, kellel pole laialdasi teadmisi regressioonanalüüsist.

Näited konkreetsete probleemide lahendamisest

Vaatame konkreetsete probleemide lahendamist loetletud Exceli tööriistade abil.

Probleem 1

Tabeliga autotranspordiettevõtte kasumi kohta aastatel 1995-2002. peate tegema järgmist:

    Koostage diagramm.

    Lisage diagrammile lineaarsed ja polünoomilised (ruut- ja kuup-) trendijooned.

    Trendijoone võrrandite abil hankige tabeliandmed ettevõtte kasumi kohta iga trendijoone kohta aastatel 1995–2004.

    Tehke ettevõtte 2003. ja 2004. aasta kasumiprognoos.

Probleemi lahendus

    Sisestage Exceli töölehe lahtrite vahemikku A4:C11 joonisel fig. 4.

    Olles valinud lahtrite vahemiku B4:C11, koostame diagrammi.

    Aktiveerime koostatud diagrammi ja vastavalt ülalkirjeldatud meetodile, peale trendijoone tüübi valimist Trend Line dialoogiaknas (vt joon. 1), lisame diagrammile vaheldumisi lineaarsed, ruut- ja kuuptrendijooned. Samas dialoogiboksis avage vahekaart Parameetrid (vt joonis 2), väljale Name of the lähendava (silutud) kõvera nimi sisestage lisatava trendi nimi ja väljale Forecast forward for: periods määrake väärtus 2, kuna plaanis on teha kasumiprognoos kaheks aastaks ette. Regressioonivõrrandi ja lähenduse usaldusväärsuse väärtuse R2 kuvamiseks diagrammialal lubage võrrandi kuvamine ekraanil märkeruudud ja asetage diagrammile lähenduse usaldusväärsusväärtus (R^2). Parema visuaalse tajumise huvides muudame konstrueeritud trendijoonte tüüpi, värvi ja paksust, mille jaoks kasutame dialoogiboksi Trend Line Format vahekaarti Vaade (vt joonis 3). Saadud diagramm koos lisatud trendijoontega on näidatud joonisel fig. 5.

    Tabeliandmete saamiseks ettevõtete kasumite kohta iga trendijoone kohta aastatel 1995–2004. Kasutame joonisel fig. 5. Selleks sisestage vahemiku D3:F3 lahtritesse tekstiinfo valitud trendijoone tüübi kohta: Lineaarne trend, Ruuttrend, Kuubitrend. Järgmisena sisestage lahtrisse D4 lineaarse regressiooni valem ja kopeerige see valem täitemarkeri abil suhteliste viidetega lahtrivahemikule D5:D13. Tuleb märkida, et igas lahtris, millel on lineaarse regressioonivalem lahtrite vahemikust D4:D13, on argumendiks vastav lahter vahemikust A4:A13. Samamoodi täitke ruutregressiooni jaoks lahtrite vahemik E4:E13 ja kuupregressiooni jaoks lahtrite vahemik F4:F13. Seega on koostatud ettevõtte 2003. ja 2004. aasta kasumiprognoos. kasutades kolme suundumust. Saadud väärtuste tabel on näidatud joonisel fig. 6.

Probleem 2

    Koostage diagramm.

    Lisage diagrammile logaritmilised, võimsus- ja eksponentsiaalsed trendijooned.

    Tuletage saadud trendijoonte võrrandid ja nende kõigi jaoks lähenduse R2 usaldusväärsusväärtused.

    Kasutage trendijoone võrrandeid, hankige tabeliandmed ettevõtte kasumi kohta iga trendijoone kohta aastatel 1995–2002.

    Tehke nende trendijoonte abil ettevõtte 2003. ja 2004. aasta kasumiprognoos.

Probleemi lahendus

Järgides ülesande 1 lahendamisel antud metoodikat, saame diagrammi, millele on lisatud logaritmi-, võimsus- ja eksponentsiaalsed trendijooned (joonis 7). Järgmisena täidame saadud trendijoone võrrandite abil ettevõtte kasumi väärtuste tabeli, mis sisaldab 2003. ja 2004. aasta prognoositud väärtusi. (joonis 8).

Joonisel fig. 5 ja fig. on näha, et logaritmilise trendiga mudel vastab lähenduse usaldusväärsuse madalaimale väärtusele

R2 = 0,8659

R2 suurimad väärtused vastavad polünoomilise trendiga mudelitele: ruut (R2 = 0,9263) ja kuup (R2 = 0,933).

Probleem 3

Ülesandes 1 toodud autotranspordiettevõtte 1995-2002 kasumi andmete tabeliga peate tegema järgmised sammud.

    Hankige lineaarsete ja eksponentsiaalsete trendijoonte andmeseeriad, kasutades funktsioone TREND ja GROW.

    Tehke TREND ja GROWTH funktsioonide abil ettevõtte 2003. ja 2004. aasta kasumiprognoos.

    Koostage algandmete ja saadud andmeseeriate diagramm.

Probleemi lahendus

Kasutame ülesande 1 töölehte (vt joonis 4). Alustame funktsiooniga TREND:

    valige lahtrite vahemik D4:D11, mis tuleks täita funktsiooni TREND väärtustega, mis vastavad ettevõtte kasumi teadaolevatele andmetele;

    Kutsuge menüüst Lisa käsk Funktsioon. Valige kuvatavas dialoogiboksis Funktsiooniviisard jaotisest Statistika funktsioon TREND ja seejärel klõpsake nuppu OK. Sama toimingu saab teha, klõpsates standardsel tööriistaribal nuppu (Sisesta funktsioon).

    Ilmuvas dialoogiboksis Funktsiooni argumendid sisestage väljale Known_values_y lahtrite vahemik C4:C11; väljal Known_values_x - lahtrite vahemik B4:B11;

    Sisestatud valemi massiivivalemiks muutmiseks kasutage klahvikombinatsiooni + + .

Valemiribale sisestatud valem näeb välja selline: =(TREND(C4:C11,B4:B11)).

Selle tulemusena täidetakse lahtrite vahemik D4:D11 funktsiooni TREND vastavate väärtustega (joonis 9).

Teha ettevõtte 2003. ja 2004. aasta kasumiprognoos. vajalik:

    valige lahtrite vahemik D12:D13, kuhu sisestatakse funktsiooni TREND ennustatud väärtused.

    kutsuge välja funktsioon TREND ja ilmuvas dialoogiboksis Funktsiooni argumendid sisestage väljale Known_values_y - lahtrite vahemik C4:C11; väljal Known_values_x - lahtrite vahemik B4:B11; ja väljal New_values_x - lahtrite vahemik B12:B13.

    muutke see valem massiivivalemiks, kasutades klahvikombinatsiooni Ctrl + Shift + Enter.

    Sisestatud valem näeb välja selline: =(TREND(C4:C11;B4:B11;B12:B13)) ja lahtrite vahemik D12:D13 täidetakse funktsiooni TREND prognoositud väärtustega (vt joonis 1). 9).

Andmeread täidetakse sarnaselt funktsiooniga GROWTH, mida kasutatakse mittelineaarsete sõltuvuste analüüsimisel ja mis töötab täpselt samamoodi nagu selle lineaarne vaste TREND.

Joonis 10 näitab tabelit valemi kuvamise režiimis.

Algandmete ja saadud andmeseeriate jaoks on joonisel fig. üksteist.

Probleem 4

Mootorveoettevõtte dispetšerteenistuse teenusetaotluste vastuvõtmise andmete tabeliga jooksva kuu 1. kuni 11. kuupäevani peate tegema järgmised toimingud.

    Hankige andmeseeriad lineaarse regressiooni jaoks: funktsioonide SLOPE ja INTERCEPT abil; kasutades funktsiooni LINEST.

    Hankige eksponentsiaalse regressiooni jaoks andmete seeria, kasutades funktsiooni LGRFPRIBL.

    Kasutades ülaltoodud funktsioone, koosta prognoos taotluste laekumise kohta dispetšerteenistusse jooksva kuu 12.-14.

    Looge algse ja vastuvõetud andmeseeria diagramm.

Probleemi lahendus

Pange tähele, et erinevalt funktsioonidest TREND ja GROWTH ei ole ükski ülaltoodud funktsioonidest (SLOPE, INTERCEPT, LINEST, LGRFPRIB) regressioon. Need funktsioonid mängivad ainult toetavat rolli, määrates kindlaks vajalikud regressiooniparameetrid.

Funktsioonide SLOPE, INTERCEPT, LINEST, LGRFPRIB abil koostatud lineaarsete ja eksponentsiaalsete regressioonide puhul on nende võrrandite välimus alati teada, erinevalt funktsioonidele TREND ja GROWTH vastavatest lineaarsetest ja eksponentsiaalsetest regressioonidest.

1 . Koostame lineaarse regressiooni võrrandiga:

y = mx+b

kasutades funktsioone SLOPE ja INTERCEPT, kusjuures regressioonikalde m määrab SLOPE funktsioon ja vaba liige b funktsiooni INTERCEPT abil.

Selleks viime läbi järgmised toimingud:

    sisestage algne tabel lahtrivahemikku A4:B14;

    parameetri m väärtus määratakse lahtris C19. Valige kategooriast Statistical funktsioon Slope; sisestage lahtrite vahemik B4:B14 väljale teadaolevad_väärtused_y ja lahtrite vahemik A4:A14 väljale teadaolevad_väärtused_x. Valem sisestatakse lahtrisse C19: =SLOPE(B4:B14,A4:A14);

    Sarnast tehnikat kasutades määratakse parameetri b väärtus lahtris D19. Ja selle sisu näeb välja selline: =SEGMENT(B4:B14,A4:A14). Seega salvestatakse lineaarse regressiooni koostamiseks vajalike parameetrite m ja b väärtused vastavalt lahtritesse C19, D19;

    Järgmisena sisestage lahtrisse C4 lineaarse regressiooni valem kujul: =$C*A4+$D. Selles valemis kirjutatakse lahtrid C19 ja D19 absoluutsete viidetega (lahtri aadress ei tohiks võimaliku kopeerimise käigus muutuda). Absoluutse viitemärgi $ saab sisestada kas klaviatuurilt või kasutades klahvi F4, pärast kursori asetamist lahtri aadressile. Täitepideme abil kopeerige see valem lahtrite vahemikku C4:C17. Saame vajalikud andmeread (joon. 12). Kuna päringute arv on täisarv, peaksite akna Lahtrivorming vahekaardil Number määrama arvuvorminguks komakohtade arvuga 0.

2 . Nüüd koostame võrrandiga antud lineaarse regressiooni:

y = mx+b

kasutades funktsiooni LINEST.

Selle jaoks:

    Sisestage funktsioon LINEST massiivivalemina lahtrivahemikus C20:D20: =(LINEST(B4:B14,A4:A14)). Selle tulemusena saame parameetri m väärtuse lahtris C20 ja parameetri b väärtuse lahtris D20;

    sisesta lahtrisse D4 valem: =$C*A4+$D;

    kopeerige see valem täitemarkeri abil lahtrivahemikku D4:D17 ja hankige soovitud andmeseeria.

3 . Koostame eksponentsiaalse regressiooni võrrandiga:

LGRFPRIBL funktsiooni kasutades teostatakse seda sarnaselt:

    Lahtrivahemikus C21:D21 sisestame massiivivalemina funktsiooni LGRFPRIBL: =( LGRFPRIBL (B4:B14,A4:A14)). Sel juhul määratakse parameetri m väärtus lahtris C21 ja parameetri b väärtus lahtris D21;

    valem sisestatakse lahtrisse E4: =$D*$C^A4;

    täitemarkerit kasutades kopeeritakse see valem lahtrite vahemikku E4:E17, kus paiknevad eksponentsiaalse regressiooni andmeread (vt joonis 12).

Joonisel fig. Joonisel 13 on näha tabel, kus on näha funktsioonid, mida me nõutud lahtrivahemikega kasutame, ja ka valemid.

Suurusjärk R 2 helistas määramiskoefitsient.

Regressioonisõltuvuse konstrueerimise ülesanne on leida mudeli (1) koefitsientide m vektor, mille juures koefitsient R saab maksimaalse väärtuse.

R-i olulisuse hindamiseks kasutatakse Fisheri F-testi, mis arvutatakse valemiga

Kus n- valimi suurus (katsete arv);

k on mudeli koefitsientide arv.

Kui F ületab mõne andmete kriitilise väärtuse n Ja k ja aktsepteeritud usaldustõenäosus, siis loetakse R väärtus oluliseks. F kriitiliste väärtuste tabelid on toodud matemaatilise statistika teatmeteostes.

Seega määrab R olulisuse mitte ainult selle väärtus, vaid ka katsete arvu ja mudeli koefitsientide (parameetrite) arvu suhe. Tõepoolest, n=2 korrelatsioonisuhe lihtsa lineaarse mudeli korral on võrdne 1-ga (ühe sirge saab alati tõmmata läbi 2 punkti tasapinnal). Kui aga katseandmed on juhuslikud muutujad, tuleks sellist R väärtust usaldada väga ettevaatlikult. Tavaliselt püüavad nad märkimisväärse R ja usaldusväärse regressiooni saamiseks tagada, et katsete arv ületaks oluliselt mudeli koefitsientide arvu (n> k).

Lineaarse regressioonimudeli koostamiseks vajate:

1) koostage katseandmeid sisaldav n rea ja m veeru loend (väljundväärtust sisaldav veerg Y peab olema loendis esimene või viimane); Näiteks võtame eelmise ülesande andmed, lisades veeru nimega "Perioodi nr", nummerdage perioodi numbrid vahemikus 1 kuni 12. (need on väärtused X)

2) mine menüüsse Data/Data Analysis/Regression

Kui menüüst "Tööriistad" on puudu "Andmete analüüs", siis tuleks minna samas menüüs punkti "Lisandmoodulid" ja märkida linnuke "Analüüsipakett".

3) määrake dialoogiboksis "Regression":

· sisestusintervall Y;

· sisestusintervall X;

· väljundintervall - intervalli ülemine vasak lahter, kuhu arvutustulemused paigutatakse (soovitav on paigutada need uuele töölehel);

4) klõpsake "Ok" ja analüüsige tulemusi.