Pienimmän neliösumman menetelmä lineaaristen funktioiden esimerkeille. Missä pienimmän neliösumman menetelmää käytetään?

  • Opetusohjelma

Johdanto

Olen matemaatikko ja ohjelmoija. Suurin harppaus urallani oli, kun opin sanomaan: "En ymmärrä mitään!" Nyt en häpeä kertoa tieteen valoisalle, että hän pitää minulle luennon, etten ymmärrä, mitä hän, valokeikari, sanoo minulle. Ja se on erittäin vaikeaa. Kyllä, tietämättömyytesi myöntäminen on vaikeaa ja kiusallista. Kuka haluaa myöntää, ettei hän tiedä jonkin asian perusteita? Ammattini vuoksi minun on osallistuttava suuria määriä esityksiä ja luentoja, joissa, myönnän, suurimmassa osassa tapauksista haluan nukkua, koska en ymmärrä mitään. Mutta en ymmärrä, koska tieteen nykytilanteen valtava ongelma on matematiikassa. Se olettaa, että kaikki kuulijat tuntevat ehdottomasti kaikki matematiikan osa-alueet (mikä on absurdia). On häpeällistä myöntää, että et tiedä mitä johdannainen on (puhumme siitä vähän myöhemmin).

Mutta olen oppinut sanomaan, etten tiedä mitä kertolasku on. Kyllä, en tiedä mikä alialgebra lie-algebran yläpuolella on. Kyllä, en tiedä miksi niitä tarvitaan elämässä toisen asteen yhtälöt. Muuten, jos olet varma, että tiedät, meillä on jotain puhuttavaa! Matematiikka on sarja temppuja. Matemaatikot yrittävät hämmentää ja pelotella yleisöä; missä ei ole sekaannusta, ei ole mainetta, ei auktoriteettia. Kyllä, on arvovaltaa puhua mahdollisimman abstraktia kieltä, mikä on täyttä hölynpölyä.

Tiedätkö mikä on johdannainen? Todennäköisesti kerrot minulle erosuhteen rajasta. Ensimmäisenä vuonna matematiikan ja mekaniikan Pietarin valtionyliopistossa Viktor Petrovitš Khavin kertoi minulle päättänyt derivaatta funktion Taylor-sarjan ensimmäisen termin kertoimena pisteessä (tämä oli erillinen voimistelu Taylor-sarjan määrittämiseksi ilman derivaattoja). Nauroin tälle määritelmälle pitkään, kunnes vihdoin ymmärsin, mistä siinä oli kyse. Derivaata ei ole muuta kuin yksinkertainen mitta siitä, kuinka samanlainen erottamamme funktio on funktion y=x, y=x^2, y=x^3 kanssa.

Minulla on nyt kunnia luennoi opiskelijoille, jotka peloissaan matematiikka. Jos pelkäät matematiikkaa, olemme samalla tiellä. Heti kun yrität lukea tekstiä ja sinusta tuntuu, että se on liian monimutkaista, tiedä, että se on huonosti kirjoitettu. Väitän, ettei ole olemassa yhtä matematiikan aluetta, josta ei voida keskustella "sormilla" menettämättä tarkkuutta.

Tehtävä lähitulevaisuudessa: Annoin oppilailleni ymmärtää, mitä lineaarinen neliönsäätäjä on. Älä ole ujo, käytä kolme minuuttia elämästäsi ja seuraa linkkiä. Jos et ymmärrä mitään, olemme samalla tiellä. Minäkään (ammattimainen matemaatikko-ohjelmoija) en ymmärtänyt mitään. Ja voin vakuuttaa teille, että voit selvittää tämän "sormillasi". Päällä Tämä hetki En tiedä mikä se on, mutta voin vakuuttaa, että voimme selvittää sen.

Joten ensimmäinen luento, jonka aion pitää opiskelijoilleni sen jälkeen, kun he juoksevat luokseni kauhuissaan ja sanovat, että lineaarinen neliöllinen säädin on kauhea asia, jota et koskaan hallitse elämässäsi. menetelmiä pienimmän neliösumman . Voitko päättää lineaariset yhtälöt? Jos luet tätä tekstiä, luultavasti et.

Joten kun on annettu kaksi pistettä (x0, y0), (x1, y1), esimerkiksi (1,1) ja (3,2), tehtävänä on löytää näiden kahden pisteen kautta kulkevan suoran yhtälö:

kuva

Tällä rivillä pitäisi olla seuraavanlainen yhtälö:

Tässä alfa ja beta ovat meille tuntemattomia, mutta kaksi pistettä tästä viivasta tunnetaan:

Voimme kirjoittaa tämän yhtälön matriisimuodossa:

Tässä meidän pitäisi tehdä lyyrinen poikkeama: mikä on matriisi? Matriisi ei ole mitään muuta kuin kaksiulotteinen matriisi. Tämä on tapa tallentaa tietoja, eikä siihen saa liittää muita merkityksiä. Se riippuu meistä tarkalleen kuinka tulkita tietty matriisi. Ajoittain tulkitsen sen lineaariseksi kartoitukseksi, ajoittain kuten neliöllinen muoto, ja joskus vain vektoreiden joukkona. Tämä kaikki selvitetään kontekstissa.

Korvataan konkreettiset matriisit niiden symbolisella esityksellä:

Sitten (alfa, beta) löytyy helposti:

Tarkemmin aiemmista tiedoistamme:

Mikä johtaa pisteiden (1,1) ja (3,2) kautta kulkevan suoran seuraavaan yhtälöön:

Okei, kaikki on selvää täällä. Etsitään läpi kulkevan suoran yhtälö kolme pisteet: (x0,y0), (x1,y1) ja (x2,y2):

Voi-o-oi, mutta meillä on kolme yhtälöä kahdelle tuntemattomalle! Tavallinen matemaatikko sanoo, ettei ratkaisua ole. Mitä ohjelmoija sanoo? Ja hän kirjoittaa ensin uudelleen edellisen yhtälöjärjestelmän seuraavassa muodossa:

Meidän tapauksessamme vektorit i,j,b ovat kolmiulotteisia, joten (yleisessä tapauksessa) tähän järjestelmään ei ole ratkaisua. Mikä tahansa vektori (alfa\*i + beta\*j) on vektorien (i, j) kattamassa tasossa. Jos b ei kuulu tähän tasoon, ratkaisua ei ole (yhtälössä ei voida saavuttaa yhtäläisyyttä). Mitä tehdä? Etsitään kompromissia. Merkitään e (alfa, beta) kuinka pitkälle emme ole saavuttaneet tasa-arvoa:

Ja yritämme minimoida tämän virheen:

Miksi neliö?

Emme etsi vain normin minimiä, vaan normin neliön minimiä. Miksi? Itse minimipiste osuu yhteen, ja neliö antaa tasaisen funktion (argumenttien (alfa, beta) neliöfunktio), kun taas yksinkertaisesti pituus antaa kartion muotoisen funktion, joka ei erotu minimipisteessä. Brr. Neliö on kätevämpi.

Ilmeisesti virhe on minimoitu, kun vektori e kohtisuorassa vektorien kattamaa tasoa vastaan i Ja j.

Kuva

Toisin sanoen: etsimme sellaista suoraa, että kaikkien pisteiden ja tämän suoran välisten etäisyyksien neliöityjen pituuksien summa on minimaalinen:

PÄIVITYS: Minulla on ongelma tässä, etäisyys suoraan tulee mitata pystysuorassa, ei ortogonaalisella projektiolla. Tämä kommentoija on oikeassa.

Kuva

Täysin eri sanoin (huolellisesti, huonosti muotoiltu, mutta sen pitäisi olla selkeä): otamme kaikki mahdolliset viivat kaikkien pisteparien välillä ja etsimme keskimääräistä viivaa kaikkien välillä:

Kuva

Toinen selitys sormille: kiinnitämme jousen kaikkien datapisteiden (tässä niitä on kolme) ja etsimämme suoran ja suoran väliin tasapainotila siellä on juuri sitä mitä etsimme.

Minimi neliömuoto

Joten tämän vektorin perusteella b ja taso, joka ulottuu matriisin sarakevektorien kanssa A(tässä tapauksessa (x0,x1,x2) ja (1,1,1)), etsimme vektoria e jonka pituus on vähintään neliö. Ilmeisesti minimi on saavutettavissa vain vektorille e, kohtisuorassa matriisin sarakevektorien kattamaa tasoa vastaan A:

Toisin sanoen etsimme vektoria x=(alfa, beta), joka on:

Haluan muistuttaa, että tämä vektori x=(alfa, beta) on minimi neliöfunktio||e(alfa, beta)||^2:

Tässä olisi hyvä muistaa, että matriisi voidaan tulkita myös neliömuotoiseksi, esimerkiksi identiteettimatriisi ((1,0),(0,1)) voidaan tulkita funktiona x^2 + y^ 2:

neliömuoto

Kaikki tämä voimistelu tunnetaan nimellä lineaarinen regressio.

Laplacen yhtälö Dirichlet-rajaehdon kanssa

Nyt yksinkertaisin todellinen tehtävä: siellä on tietty kolmiomainen pinta, se on tasoitettava. Ladataan esimerkiksi malli kasvoistani:

Alkuperäinen sitoumus on saatavilla. Ulkoisten riippuvuuksien minimoimiseksi otin ohjelmiston renderöijani koodin jo Habreen. Ratkaisuja varten lineaarinen järjestelmä Käytän OpenNL:ää, se on erinomainen ratkaisu, joka on kuitenkin erittäin vaikea asentaa: sinun on kopioitava kaksi tiedostoa (.h+.c) projektisi kansioon. Kaikki tasoitus tehdään seuraavalla koodilla:

For (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = kasvot[i]; for (int j = 0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X-, Y- ja Z-koordinaatit ovat erotettavissa, tasoitan ne erikseen. Eli ratkaisen kolme lineaariyhtälöjärjestelmää, joissa kussakin on mallissani olevien pisteiden lukumäärää vastaava määrä muuttujia. Matriisin A ensimmäisellä n rivillä on vain yksi 1 riviä kohden, ja vektorin b ensimmäisillä n rivillä on alkuperäiset mallikoordinaatit. Eli sidon jousen kärjen uuden sijainnin ja kärjen vanhan sijainnin väliin - uudet eivät saa siirtyä liian kauas vanhoista.

Kaikilla matriisin A myöhemmillä riveillä (faces.size()*3 = kaikkien verkon kolmioiden reunojen lukumäärä) on yksi esiintymä 1 ja yksi esiintyminen -1, vektorin b ollessa nollakomponentteja vastakkain. Tämä tarkoittaa, että laitan jousen kolmioverkkomme jokaiseen reunaan: kaikki reunat yrittävät saada saman kärjen kuin aloitus- ja loppupisteensä.

Jälleen kerran: kaikki kärjet ovat muuttujia, eivätkä ne voi liikkua kauas alkuperäisestä sijainnistaan, mutta samalla ne yrittävät tulla samanlaisiksi toistensa kanssa.

Tässä tulos:

Kaikki olisi hyvin, malli on todella tasoitettu, mutta se on siirtynyt pois alkuperäisestä reunastaan. Muutetaan koodia hieman:

For (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

Matriisissamme A reunassa oleville pisteille en lisää riviä luokasta v_i = verts[i][d], vaan 1000*v_i = 1000*verts[i][d]. Mitä se muuttaa? Ja tämä muuttaa neliöllisen virhemuotomme. Nyt yksittäinen poikkeama ylhäältä reunassa ei maksa yhtä yksikköä, kuten ennen, vaan 1000*1000 yksikköä. Eli ripustimme vahvemman jousen ääripisteisiin, ratkaisu mieluummin venyttää muita voimakkaammin. Tässä tulos:

Kaksinkertaistetaan jousen vahvuus pisteiden välillä:
nlKerroin(face[ j ], 2); nlKerroin(kasvo[(j+1)%3], -2);

On loogista, että pinnasta on tullut tasaisempi:

Ja nyt jopa sata kertaa vahvempi:

Mikä tämä on? Kuvittele, että olemme kastaneet lankarenkaan saippuaveteen. Tämän seurauksena tuloksena oleva saippuakalvo yrittää saada mahdollisimman vähän kaarevuutta koskettaen reunaa - lankarengaamme. Juuri tämän saimme kiinnittämällä reunuksen ja pyytämällä sileää pintaa sisälle. Onnittelut, olemme juuri ratkaisseet Laplacen yhtälön Dirichlet-rajaehdoilla. Kuulostaa siistiltä? Mutta todellisuudessa sinun tarvitsee vain ratkaista yksi lineaarinen yhtälöjärjestelmä.

Poissonin yhtälö

Muistakaamme toinen hieno nimi.

Oletetaan, että minulla on tällainen kuva:

Näyttää hyvältä kaikille, mutta en pidä tuolista.

Leikkaan kuvan puoliksi:



Ja valitsen tuolin käsilläni:

Sitten vedän kuvan vasemmalle puolelle kaiken, mikä on maskissa valkoista, ja samalla sanon koko kuvassa, että kahden vierekkäisen pikselin eron tulee olla yhtä suuri kuin oikean kahden vierekkäisen pikselin ero. kuva:

For (int i=0; i

Tässä tulos:

Koodi ja kuvat saatavilla

Pienimmän neliön menetelmä

Aiheen viimeisellä oppitunnilla tutustumme kuuluisimpaan sovellukseen FNP, joka löytää laajimman sovelluksen eri tieteenaloilla ja käytännön toiminnassa. Tämä voi olla fysiikka, kemia, biologia, taloustiede, sosiologia, psykologia ja niin edelleen ja niin edelleen. Kohtalon tahdosta joudun usein käsittelemään taloutta, ja siksi järjestän tänään sinulle matkan hämmästyttävään maahan ns. Ekonometria=) ...Miten et halua sitä?! Siellä on erittäin hyvä – sinun tarvitsee vain tehdä päätös! ...Mutta mitä varmasti haluat, on oppia ratkaisemaan ongelmia pienimmän neliösumman menetelmä. Ja erityisen ahkerat lukijat oppivat ratkaisemaan ne paitsi tarkasti, myös ERITTÄIN NOPEASTI ;-) Mutta ensin yleiskuvaus ongelmasta+ oheinen esimerkki:

Tutkitaanpa tietyn aihealueen indikaattoreita, joilla on määrällinen ilmaisu. Samalla on täysi syy uskoa, että indikaattori riippuu indikaattorista. Tämä oletus voi olla joko tieteellinen hypoteesi tai perustua maalaisjärkeen. Jätetään kuitenkin tiede sivuun ja tutkitaan herkullisempia alueita - nimittäin ruokakauppoja. Merkitään:

– ruokakaupan vähittäiskauppatila, neliömetri,
– päivittäistavarakaupan vuosiliikevaihto, miljoonaa ruplaa.

On täysin selvää, että mitä suurempi myymäläpinta-ala, sitä suurempi on useimmissa tapauksissa sen liikevaihto.

Oletetaan, että tamburiinilla tehtyjen havaintojen/kokeilujen/laskelmien/tanssien jälkeen meillä on käytössämme numeerista tietoa:

Ruokakaupoissa mielestäni kaikki on selvää: - tämä on 1. myymälän pinta-ala, - sen vuosiliikevaihto, - 2. myymälän pinta-ala, - sen vuosiliikevaihto jne. Muuten, turvaluokiteltuihin aineistoihin pääsy ei ole ollenkaan välttämätöntä - melko tarkka arvio kaupan liikevaihdosta voidaan saada matemaattiset tilastot. Älkäämme kuitenkaan hämmentykö, kaupallinen vakoilukurssi on jo maksettu =)

Taulukkotiedot voidaan kirjoittaa myös pisteiden muodossa ja kuvata tutussa muodossa Karteesinen järjestelmä .

Vastataanpa tärkeään kysymykseen: Kuinka monta pistettä laadulliseen tutkimukseen tarvitaan?

Mitä isompi sen parempi. Pienin hyväksyttävä sarja koostuu 5-6 pisteestä. Lisäksi, kun dataa on vähän, "poikkeavia" tuloksia ei voida sisällyttää otokseen. Joten esimerkiksi pieni eliittikauppa voi ansaita suuruusluokkaa enemmän kuin "kollegansa", mikä vääristää yleistä mallia, joka sinun on löydettävä!



Hyvin yksinkertaisesti sanottuna meidän on valittava toiminto, ajoittaa joka kulkee mahdollisimman läheltä pisteitä . Tätä toimintoa kutsutaan likimääräinen (likiarvo - likiarvo) tai teoreettinen toiminto . Yleisesti ottaen tässä ilmestyy heti ilmeinen "kilpailija" - korkean asteen polynomi, jonka kuvaaja kulkee KAIKKI pisteet. Mutta tämä vaihtoehto on monimutkainen ja usein yksinkertaisesti väärä. (koska kaavio "kiertelee" koko ajan ja heijastaa huonosti päätrendiä).

Siten haetun funktion on oltava melko yksinkertainen ja samalla heijastettava riittävästi riippuvuutta. Kuten arvata saattaa, yksi tällaisten funktioiden löytämismenetelmistä on nimeltään pienimmän neliösumman menetelmä. Katsotaanpa ensin sen olemusta yleisellä tasolla. Olkoon jonkin funktion likimääräinen kokeellinen data:


Kuinka arvioida tämän likiarvon tarkkuus? Lasketaan myös erot (poikkeamat) kokeellisten ja toiminnallisten arvojen välillä (tutkimme piirustusta). Ensimmäinen ajatus joka tulee mieleen on arvioida kuinka suuri summa on, mutta ongelmana on, että erot voivat olla negatiivisia (Esimerkiksi, ) ja tällaisesta summauksesta johtuvat poikkeamat kumoavat toisensa. Siksi arviona likiarvon tarkkuudesta on otettava summa moduulit poikkeamat:

tai romahtanut: (jos joku ei tiedä: on summakuvake ja - apu "laskuri" muuttuja, joka ottaa arvot 1: stä ) .

Approksimoimalla koepisteitä eri funktioilla saamme erilaisia ​​arvoja, ja on selvää, jos tämä summa on pienempi, se funktio on tarkempi.

Tällainen menetelmä on olemassa ja sitä kutsutaan pienimmän moduulin menetelmä. Käytännössä se on kuitenkin yleistynyt huomattavasti pienimmän neliösumman menetelmä, jossa mahdollisia negatiivisia arvoja ei eliminoi moduuli vaan neliöimällä poikkeamat:



, jonka jälkeen pyritään valitsemaan funktio, joka on neliöityjen poikkeamien summa oli mahdollisimman pieni. Itse asiassa tästä menetelmän nimi tulee.

Ja nyt palaamme toiseen tärkeään kohtaan: kuten yllä todettiin, valitun toiminnon tulisi olla melko yksinkertainen - mutta myös sellaisia ​​​​toimintoja on monia: lineaarinen , hyperbolinen , eksponentiaalinen , logaritminen , neliöllinen jne. Ja tietysti tässä haluaisin heti "vähentää toimintakenttää". Mikä toimintoluokka minun pitäisi valita tutkimukseen? Alkukantainen mutta tehokas tekniikka:

– Helpoin tapa on kuvata pisteitä piirustukseen ja analysoida niiden sijaintia. Jos niillä on tapana kulkea suorassa linjassa, sinun tulee etsiä suoran yhtälö optimaalisilla arvoilla ja . Toisin sanoen tehtävänä on löytää SELLISIÄ kertoimia niin, että neliöpoikkeamien summa on pienin.

Jos pisteet sijaitsevat esimerkiksi pitkin hyperbolia, silloin on selvää, että lineaarinen funktio antaa huonon approksimaation. Tässä tapauksessa etsimme "suotuisimpia" kertoimia hyperboliyhtälölle – ne, jotka antavat pienimmän neliösumman .

Huomaa nyt, että molemmissa tapauksissa puhumme kahden muuttujan funktioita, jonka argumentit ovat haettiin riippuvuusparametreja:

Ja pohjimmiltaan meidän on ratkaistava standardiongelma - löytää kahden muuttujan minimifunktio.

Muistakaamme esimerkkimme: oletetaan, että "myymälä"-pisteet sijaitsevat yleensä suorassa linjassa ja on täysi syy uskoa, että lineaarinen riippuvuus liikevaihto liiketiloista. Etsitään SELLAISIA kertoimia “a” ja “olla” sellaisina, että poikkeamien neliösumma oli pienin. Kaikki on tavalliseen tapaan - ensin Ensimmäisen asteen osajohdannaiset. Mukaan lineaarisuussääntö Voit tehdä eron suoraan summakuvakkeen alla:

Jos haluat käyttää näitä tietoja esseessä tai lopputyössä, olen erittäin kiitollinen linkistä lähdeluettelossa; tällaisia ​​yksityiskohtaisia ​​laskelmia löytyy muutamasta paikasta:

Luodaan vakiojärjestelmä:

Vähennämme kutakin yhtälöä "kahdella" ja lisäksi "hajotamme" summat:

Huomautus : analysoi itsenäisesti, miksi "a" ja "be" voidaan poistaa summakuvakkeen jälkeen. Muuten, muodollisesti tämä voidaan tehdä summalla

Kirjoitetaan järjestelmä uudelleen "soveltuun" muotoon:

jonka jälkeen algoritmi ongelmamme ratkaisemiseksi alkaa syntyä:

Tiedämmekö pisteiden koordinaatit? Me tiedämme. Summat voimmeko löytää sen? Helposti. Tehdään yksinkertaisin kahden lineaarisen yhtälön järjestelmä kahdessa tuntemattomassa("a" ja "olla"). Ratkaisemme järjestelmän mm. Cramerin menetelmä, jonka seurauksena saamme stationaarisen pisteen. Tarkistetaan riittävä kunto ääripäälle, voimme varmistaa, että tässä vaiheessa funktio saavuttaa täsmälleen minimi. Tarkastukseen liittyy lisälaskelmia, joten jätämme sen kulissien taakse (tarvittaessa puuttuvaa kehystä voi katsoaTässä ) . Teemme lopullisen johtopäätöksen:

Toiminto paras tapa (ainakin verrattuna muihin lineaarisiin funktioihin) tuo koepisteitä lähemmäksi . Karkeasti ottaen sen kaavio kulkee mahdollisimman läheltä näitä pisteitä. Perinteessä ekonometria kutsutaan myös tuloksena olevaa approksimointifunktiota pari yhtälö lineaarinen regressio .

Käsiteltävänä olevalla ongelmalla on suuri käytännön merkitys. Esimerkkitilanteessamme Eq. voit ennustaa kaupan liikevaihtoa ("Igrek") myymälällä on jokin myyntialueen arvo (X:n yksi tai toinen merkitys). Kyllä, tuloksena oleva ennuste on vain ennuste, mutta monissa tapauksissa se osoittautuu melko tarkkaksi.

Analysoin vain yhden ongelman "oikeilla" numeroilla, koska siinä ei ole vaikeuksia - kaikki laskelmat ovat 7-8-luokan koulun opetussuunnitelman tasolla. 95 prosentissa tapauksista sinua pyydetään löytämään vain lineaarinen funktio, mutta aivan artikkelin lopussa näytän, että optimaalisen hyperbolin, eksponentiaalisen ja joidenkin muiden funktioiden yhtälöiden löytäminen ei ole sen vaikeampaa.

Itse asiassa jäljellä on vain jakaa luvatut herkut - jotta voit oppia ratkaisemaan tällaiset esimerkit paitsi tarkasti, myös nopeasti. Tutkimme standardia huolellisesti:

Tehtävä

Kahden indikaattorin välisen suhteen tutkimisen tuloksena saatiin seuraavat numeroparit:

Etsi pienimmän neliösumman menetelmällä lineaarinen funktio, joka parhaiten approksimoi empiiristä (kokenut) tiedot. Tee piirros, jolle voit rakentaa kokeellisia pisteitä, ja kuvaaja approksimoivasta funktiosta suorakulmaisessa koordinaattijärjestelmässä . Laske empiiristen ja teoreettisten arvojen neliöityjen poikkeamien summa. Ota selvää, olisiko ominaisuus parempi (pienimpien neliöiden menetelmän näkökulmasta) tuo koepisteitä lähemmäksi.

Huomaa, että "x" merkitykset ovat luonnollisia, ja tällä on tyypillinen merkityksellinen merkitys, josta puhun hieman myöhemmin; mutta ne voivat tietysti olla myös murto-osia. Lisäksi tietyn tehtävän sisällöstä riippuen sekä "X"- että "peli"-arvot voivat olla täysin tai osittain negatiivisia. No, meille on annettu "kasvoton" tehtävä, ja aloitamme sen ratkaisu:

Löydämme optimaalisen funktion kertoimet ratkaisuksi järjestelmään:

Kompaktimman tallennuksen vuoksi "laskuri"-muuttuja voidaan jättää pois, koska on jo selvää, että summaus suoritetaan 1 - .

Tarvittavat määrät on helpompi laskea taulukkomuodossa:


Laskelmat voidaan suorittaa mikrolaskimella, mutta on paljon parempi käyttää Exceliä - sekä nopeammin että ilman virheitä; katso lyhyt video:

Siten saamme seuraavan järjestelmä:

Täällä voit kertoa toisen yhtälön 3:lla ja vähennä 2. 1. yhtälöstä termi kerrallaan. Mutta tämä on onnea - käytännössä järjestelmät eivät usein ole lahja, ja sellaisissa tapauksissa se säästää Cramerin menetelmä:
, mikä tarkoittaa, että järjestelmässä on ainutlaatuinen ratkaisu.

Tarkistetaan. Ymmärrän, että et halua, mutta miksi ohittaa virheet, joissa niitä ei todellakaan voi jättää huomiotta? Korvataan löydetty ratkaisu järjestelmän kunkin yhtälön vasempaan puoleen:

Vastaavien yhtälöiden oikeat puolet saadaan, mikä tarkoittaa, että järjestelmä on ratkaistu oikein.

Siten haluttu approksimoiva funktio: – alkaen kaikki lineaarifunktiot Hän arvioi parhaiten kokeelliset tiedot.

Toisin kuin suoraan myymälän liikevaihdon riippuvuus sen pinta-alasta, todettu riippuvuus on käänteinen (periaate "mitä enemmän, sitä vähemmän"), ja tämä tosiasia paljastuu välittömästi negatiivisesti kaltevuus. Toiminto kertoo meille, että kun tiettyä indikaattoria lisätään 1 yksiköllä, riippuvan indikaattorin arvo pienenee keskiverto 0,65 yksiköllä. Kuten sanotaan, mitä korkeampi tattari maksaa, sitä vähemmän sitä myydään.

Approksimoivan funktion kaavion piirtämiseksi löydämme sen kaksi arvoa:

ja suorita piirustus:

Muodostettua suoraa kutsutaan trendiviiva (eli lineaarinen trendiviiva, eli yleisessä tapauksessa trendi ei välttämättä ole suora). Kaikille on tuttu ilmaus "olla trendissä", eikä tämä termi mielestäni kaipaa lisäkommentteja.

Lasketaan poikkeamien neliösumma empiiristen ja teoreettisten arvojen välillä. Geometrisesti tämä on "vadelma" -osien pituuksien neliöiden summa (joista kaksi on niin pieniä, että niitä ei edes näy).

Tehdään laskelmat yhteenvetona taulukkoon:


Jälleen ne voidaan tehdä manuaalisesti; varmuuden vuoksi annan esimerkin ensimmäisestä kohdasta:

mutta on paljon tehokkaampaa tehdä se jo tunnetulla tavalla:

Toistamme vielä kerran: Mikä on saadun tuloksen merkitys? From kaikki lineaarifunktiot y-toiminto indikaattori on pienin, eli perheessään se on paras likiarvo. Ja tässä, muuten, ongelman viimeinen kysymys ei ole sattuma: entä jos ehdotettu eksponentiaalinen funktio olisiko parempi tuoda koepisteitä lähemmäksi?

Etsitään vastaava neliöityjen poikkeamien summa - erottamiseksi, merkitsen ne kirjaimella "epsilon". Tekniikka on täsmälleen sama:


Ja vielä, varmuuden vuoksi, laskelmat 1. pisteestä:

Excelissä käytämme vakiofunktiota EXP (syntaksi löytyy Excelin ohjeesta).

Johtopäätös: , mikä tarkoittaa, että eksponentiaalinen funktio approkimoi koepisteitä huonommin kuin suora .

Mutta tässä on huomattava, että "huonompi" on ei tarkoita vielä, mikä hätänä. Nyt olen rakentanut kuvaajan tästä eksponentiaalisesta funktiosta - ja se myös kulkee lähellä pisteitä - niin paljon, että ilman analyyttistä tutkimusta on vaikea sanoa, kumpi funktio on tarkempi.

Tämä päättää ratkaisun, ja palaan kysymykseen väitteen luonnollisista arvoista. Useissa tutkimuksissa, yleensä taloudellisissa tai sosiologisissa tutkimuksissa, luonnollisia X:itä käytetään numeroimaan kuukausia, vuosia tai muita vastaavia aikavälejä. Harkitse esimerkiksi seuraavaa ongelmaa:

Myymälän ensimmäisen vuosipuoliskon vähittäiskaupan liikevaihdosta on saatavilla seuraavat tiedot:

Määritä heinäkuun liikevaihdon volyymi analyyttisen suoraviivauksen avulla.

Kyllä, ei hätää: numeroimme kuukaudet 1, 2, 3, 4, 5, 6 ja käytämme tavallista algoritmia, jonka seurauksena saamme yhtälön - ainoa asia on, että kun on kyse ajasta, he yleensä käyttävät kirjain "te" (vaikka tämä ei ole kriittinen). Tuloksena oleva yhtälö osoittaa, että vuoden ensimmäisellä puoliskolla kaupan liikevaihto kasvoi keskimäärin 27,74 yksikköä. kuukaudessa. Otetaan ennuste heinäkuulle (kuukausi nro 7): d.e.

Ja tällaisia ​​tehtäviä on lukemattomia. Halukkaat voivat käyttää lisäpalvelua, nimittäin minun Excelin laskin (demoversio), mikä ratkaisee analysoidun ongelman lähes välittömästi! Ohjelman toimiva versio on saatavilla vaihdossa tai varten symbolinen maksu.

Oppitunnin lopussa lyhyt informaatio joidenkin muuntyyppisten riippuvuuksien löytämisestä. Itse asiassa ei ole paljon kerrottavaa, koska perustavanlaatuinen lähestymistapa ja ratkaisualgoritmi pysyvät samoina.

Oletetaan, että koepisteiden järjestely muistuttaa hyperbolia. Sitten parhaan hyperbelin kertoimien löytämiseksi sinun on löydettävä funktion minimi - kuka tahansa voi suorittaa yksityiskohtaisia ​​laskelmia ja päästä samanlaiseen järjestelmään:

Muodollisesti tekniseltä kannalta se saadaan "lineaarisesta" järjestelmästä (merkitään se tähdellä) korvataan "x":llä. No entä summat? laskea, jonka jälkeen optimaalisiin kertoimiin "a" ja "be" käden ulottuvilla.

Jos on täysi syy uskoa, että pistettä sijaitsevat logaritmisella käyrällä, niin optimaalisten arvojen löytämiseksi löydämme funktion minimin . Muodollisesti järjestelmässä (*) on korvattava seuraavalla:

Kun suoritat laskelmia Excelissä, käytä toimintoa LN. Myönnän, että minun ei olisi erityisen vaikeaa luoda laskureita jokaiseen tarkasteltavaan tapaukseen, mutta silti olisi parempi, jos "ohjelmoisit" laskelmat itse. Oppituntivideot avuksi.

Eksponentiaalisella riippuvuudella tilanne on hieman monimutkaisempi. Supistaaksemme asian lineaariseen tapaukseen otamme funktion logaritmi ja käytämme logaritmin ominaisuudet:

Vertaamalla nyt saatua funktiota lineaariseen funktioon, tulemme siihen tulokseen, että järjestelmässä (*) on korvattava merkillä , ja – . Merkitään mukavuuden vuoksi:

Huomaa, että järjestelmä on ratkaistu suhteessa ja siksi juurien löytämisen jälkeen sinun ei pidä unohtaa löytää itse kerroin.

Tuo kokeelliset kohdat lähemmäksi optimaalinen paraabeli , pitäisi löytyä kolmen muuttujan vähimmäisfunktio . Vakiotoimintojen suorittamisen jälkeen saamme seuraavan "toimivan" järjestelmä:

Kyllä, tietysti täällä on enemmän summia, mutta suosikkisovelluksesi käytössä ei ole vaikeuksia. Ja lopuksi kerron sinulle kuinka nopeasti suorittaa tarkistus Excelillä ja rakentaa haluttu trendiviiva: luo sirontakaavio, valitse mikä tahansa pisteistä hiirellä ja valitse vaihtoehto hiiren oikealla painikkeella "Lisää trendiviiva". Valitse seuraavaksi kaavion tyyppi ja välilehdeltä "Vaihtoehdot" aktivoi vaihtoehto "Näytä yhtälö kaaviossa". OK

Kuten aina, haluan lopettaa artikkelin kauniilla lauseella, ja melkein kirjoitin "Ole trendissä!" Mutta hän muutti ajatuksensa. Eikä siksi, että se olisi stereotyyppinen. En tiedä miten se sopii kenellekään, mutta en todellakaan halua seurata edistettyä amerikkalaista ja varsinkaan eurooppalaista trendiä =) Siksi toivon, että jokainen teistä pysyy omassa linjassaan!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Pienimmän neliösumman menetelmä on yksi yleisimmistä ja kehittyneimmistä sen ansiosta lineaaristen ekonometristen mallien parametrien estimointimenetelmien yksinkertaisuus ja tehokkuus. Samanaikaisesti sitä käytettäessä tulee noudattaa tiettyä varovaisuutta, sillä sen avulla rakennetut mallit eivät välttämättä täytä useita parametrien laatuvaatimuksia eivätkä sen seurauksena heijasta prosessikehityksen malleja "hyvin". tarpeeksi.

Tarkastellaan yksityiskohtaisemmin menettelyä lineaarisen ekonometrisen mallin parametrien estimoimiseksi pienimmän neliösumman menetelmällä. Tällainen malli voidaan yleensä esittää yhtälöllä (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

Alkutiedot parametreja a 0, a 1,..., a n arvioitaessa on riippuvan muuttujan arvojen vektori y= (y 1 , y 2 , ... , y T)" ja riippumattomien muuttujien arvojen matriisi

jossa ensimmäinen sarake, joka koostuu ykkösistä, vastaa mallikerrointa.

Pienimmän neliösumman menetelmä sai nimensä sillä perusperiaatteella, että sen perusteella saatujen parametriestimaattien tulee täyttää: mallivirheen neliösumman tulee olla minimaalinen.

Esimerkkejä tehtävien ratkaisemisesta pienimmän neliösumman menetelmällä

Esimerkki 2.1. Kauppayrityksellä on 12 myymälän verkosto, joiden toiminnasta on tiedot taulukossa. 2.1.

Yrityksen johto haluaa tietää, miten vuosiliikevaihdon suuruus riippuu liikkeen liiketilasta.

Taulukko 2.1

Myymälän numero Vuotuinen liikevaihto, miljoonaa ruplaa. Liiketila, tuhat m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Pienimmän neliön ratkaisu. Merkitään myymälän vuosiliikevaihto, milj. ruplaa; - myymälän liiketila, tuhat m2.

Kuva 2.1. Esimerkin 2.1 sirontakaavio

Muuttujien ja muuttujien välisen funktionaalisen suhteen muodon määrittämiseksi rakennamme sirontadiagrammin (kuva 2.1).

Hajontakaavion perusteella voidaan päätellä, että vuosiliikevaihto on positiivisesti riippuvainen liiketilasta (eli y kasvaa kasvaessa). Sopivin toiminnallisen yhteyden muoto on lineaarinen.

Tietoja lisälaskelmista varten on esitetty taulukossa. 2.2. Pienimmän neliösumman menetelmällä estimoimme lineaarisen yksikerroisen ekonometrisen mallin parametrit

Taulukko 2.2

t y t x 1t v t 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Keskiverto 68,29 0,89

Täten,

Siksi, kun myyntipinta-ala kasvaa 1 tuhannella m2, muiden tekijöiden pysyessä samana, keskimääräinen vuotuinen liikevaihto kasvaa 67,8871 miljoonalla ruplalla.

Esimerkki 2.2. Yrityksen johto havaitsi, että vuosiliikevaihto ei riipu pelkästään myymälän myyntialueesta (ks. esimerkki 2.1), vaan myös keskimääräisestä kävijämäärästä. Asiaankuuluvat tiedot on esitetty taulukossa. 2.3.

Taulukko 2.3

Ratkaisu. Merkitään - th:n myymälän keskimääräinen kävijämäärä päivässä, tuhat ihmistä.

Muuttujien ja muuttujien välisen funktionaalisen suhteen muodon määrittämiseksi rakennamme sirontadiagrammin (kuva 2.2).

Sirontakaavion perusteella voidaan päätellä, että vuotuinen liikevaihto on positiivisesti riippuvainen keskimääräisestä vuorokauden kävijämäärästä (eli y kasvaa kasvaessa). Toiminnallisen riippuvuuden muoto on lineaarinen.

Riisi. 2.2. Esimerkin 2.2 sirontakaavio

Taulukko 2.4

t x 2t x 2t 2 v t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Keskiverto 10,65

Yleensä on tarpeen määrittää kaksitekijäisen ekonometrisen mallin parametrit

y t = a 0 + a 1 x 1t + a 2 x 2t + ε t

Lisälaskelmia varten tarvittavat tiedot on esitetty taulukossa. 2.4.

Arvioidaan lineaarisen kaksitekijäisen ekonometrisen mallin parametrit pienimmän neliösumman menetelmällä.

Täten,

Kertoimen arvio =61,6583 osoittaa, että muiden tekijöiden pysyessä liiketilojen kasvaessa tuhannella m 2:lla vuotuinen liikevaihto kasvaa keskimäärin 61,6583 miljoonaa ruplaa.

Kertoimen arvio = 2,2748 osoittaa, että muiden asioiden pysyessä samana, keskimääräisen kävijämäärän kasvu tuhatta ihmistä kohden. päivässä, vuotuinen liikevaihto kasvaa keskimäärin 2,2748 miljoonaa ruplaa.

Esimerkki 2.3. Käyttämällä taulukossa olevia tietoja. 2.2 ja 2.4, arvioi yksikerroisen ekonometrisen mallin parametri

missä on myymälän vuosiliikevaihdon keskiarvo, miljoonaa ruplaa; - t:nnen liikkeen keskimääräisen päivittäisen kävijämäärän keskitetty arvo, tuhat henkilöä. (katso esimerkit 2.1-2.2).

Ratkaisu. Laskelmiin tarvittavat lisätiedot on esitetty taulukossa. 2.5.

Taulukko 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Määrä 48,4344 431,0566

Kaavan (2.35) avulla saamme

Täten,

http://www.cleverstudents.ru/articles/mnk.html

Esimerkki.

Kokeellinen data muuttujien arvoista X Ja klo on annettu taulukossa.

Niiden kohdistuksen tuloksena saadaan funktio

Käyttämällä pienimmän neliösumman menetelmä, arvioi nämä tiedot lineaarisella riippuvuudella y=kirves+b(etsi parametrit A Ja b). Selvitä, kumpi kahdesta viivasta paremmin (pienimmän neliösumman menetelmässä) kohdistaa kokeelliset tiedot. Tee piirustus.

Ratkaisu.

Meidän esimerkissämme n = 5. Täytämme taulukon tarvittavien kertoimien kaavoihin sisältyvien määrien laskemisen helpottamiseksi.

Taulukon neljännen rivin arvot saadaan kertomalla 2. rivin arvot 3. rivin arvoilla jokaiselle numerolle i.

Taulukon viidennen rivin arvot saadaan neliöimällä 2. rivin arvot jokaiselle numerolle i.

Taulukon viimeisen sarakkeen arvot ovat eri rivien arvojen summat.

Käytämme pienimmän neliösumman menetelmän kaavoja kertoimien löytämiseen A Ja b. Korvaamme vastaavat arvot taulukon viimeisestä sarakkeesta niihin:

Siten, y = 0,165x+2,184- haluttu likimääräinen suora.

On vielä selvitettävä, mikä riveistä y = 0,165x+2,184 tai approksimoi paremmin alkuperäistä dataa, eli tekee arvion pienimmän neliösumman menetelmällä.

Todiste.

Siis kun löytyy A Ja b funktio saa pienimmän arvon, on välttämätöntä, että tässä vaiheessa funktion toisen asteen differentiaalin toisen asteen muodon matriisi oli ehdottomasti positiivinen. Näytä se.

Toisen asteen ero on muotoa:

Tuo on

Siksi neliömuodon matriisilla on muoto

ja elementtien arvot eivät riipu A Ja b.

Osoitetaan, että matriisi on positiivinen määrätty. Tätä varten kulmikas alaikäisten on oltava positiivisia.

Ensimmäisen asteen kulmikas molli . Epätasa-arvo on tiukka, koska pistettä

Koetietojen lähentäminen on menetelmä, joka perustuu kokeellisesti saatujen tietojen korvaamiseen analyyttisellä funktiolla, joka läpäisee tai osuu läheisimmin solmupisteissä alkuperäisten arvojen (kokeen tai kokeen aikana saatujen tietojen) kanssa. Tällä hetkellä on kaksi tapaa määrittää analyyttinen funktio:

Rakentamalla n-asteinen interpolaatiopolynomi, joka läpäisee suoraan kaikkien pisteiden läpi tiettyä datataulukkoa. Tässä tapauksessa approksimoiva funktio esitetään muodossa: interpolaatiopolynomi Lagrange-muodossa tai interpolaatiopolynomi Newton-muodossa.

Rakentamalla n-asteinen approksimoiva polynomi, joka läpäisee pisteiden välittömässä läheisyydessä tietystä datajoukosta. Näin ollen approksimoiva funktio tasoittaa kaiken kokeen aikana mahdollisesti syntyvän satunnaisen kohinan (tai virheet): kokeen aikana mitatut arvot riippuvat satunnaistekijöistä, jotka vaihtelevat omien satunnaislakiensa mukaan (mittaus- tai laitevirheet, epätarkkuus tai kokeellinen virheet). Tässä tapauksessa approksimoiva funktio määritetään pienimmän neliösumman menetelmällä.

Pienimmän neliön menetelmä(englanninkielisessä kirjallisuudessa Ordinary Least Squares, OLS) on matemaattinen menetelmä, joka perustuu approksimoivan funktion määrittämiseen, joka konstruoidaan pisteiden lähimpään läheisyyteen tietystä koetietojoukosta. Alkuperäisen ja approksimoivan funktion F(x) läheisyys määräytyy numeerisella mittauksella, nimittäin: kokeellisten tietojen neliöpoikkeamien summan approksimointikäyrästä F(x) tulee olla pienin.

Approksimoiva käyrä, joka on muodostettu pienimmän neliösumman menetelmällä

Pienimmän neliösumman menetelmää käytetään:

Ratkaisemaan ylimäärättyjä yhtälöjärjestelmiä, kun yhtälöiden lukumäärä ylittää tuntemattomien määrän;

Löytää ratkaisu tavallisten (ei ylimääritettyjen) epälineaaristen yhtälöjärjestelmien tapauksessa;

Pistearvojen likiarvo jollakin approksimoivalla funktiolla.

Pienimmän neliösumman menetelmää käyttävä approksimoiva funktio määritetään lasketun approksimoivan funktion neliöpoikkeamien minimisumman ehdosta tietystä kokeellisen datajoukosta. Tämä pienimmän neliösumman menetelmän kriteeri kirjoitetaan seuraavasti:

Lasketun approksimoivan funktion arvot solmupisteissä,

Tietty joukko kokeellisia tietoja solmupisteissä.

Kvadraattisella kriteerillä on useita "hyviä" ominaisuuksia, kuten differentiaatiokyky, mikä tarjoaa ainutlaatuisen ratkaisun approksimaatioongelmaan polynomisten approksimointifunktioiden kanssa.

Riippuen tehtävän ehdoista approksimoiva funktio on m-asteinen polynomi

Approksimoivan funktion aste ei riipu solmupisteiden lukumäärästä, vaan sen dimensio on aina pienempi kuin tietyn kokeellisen datataulukon dimensio (pisteiden lukumäärä).

∙ Jos approksimoivan funktion aste on m=1, niin taulukkofunktiota approksimoidaan suoralla (lineaarinen regressio).

∙ Jos approksimoivan funktion aste on m=2, niin taulukkofunktiota approksimoidaan neliöparaabelilla (neliöapproksimaatio).

∙ Jos approksimoivan funktion aste on m=3, niin taulukkofunktiota approksimoidaan kuutioparaabelilla (kuutioapproksimaatio).

Yleisessä tapauksessa, kun on tarpeen rakentaa m-asteen likimääräinen polynomi annetuille taulukon arvoille, ehto kaikkien solmupisteiden neliöpoikkeamien summalle kirjoitetaan uudelleen seuraavassa muodossa:

- m-asteisen approksimoivan polynomin tuntemattomat kertoimet;

Määritetty taulukkoarvojen määrä.

Välttämätön ehto funktion minimin olemassaololle on sen osittaisten derivaattojen yhtäläisyys nollaan tuntemattomien muuttujien suhteen . Tuloksena saamme seuraavan yhtälöjärjestelmän:

Muunnetaan tuloksena oleva lineaarinen yhtälöjärjestelmä: avaa sulut ja siirrä vapaat termit lausekkeen oikealle puolelle. Tämän seurauksena tuloksena oleva lineaaristen algebrallisten lausekkeiden järjestelmä kirjoitetaan seuraavassa muodossa:

Tämä lineaaristen algebrallisten lausekkeiden järjestelmä voidaan kirjoittaa uudelleen matriisimuotoon:

Tuloksena saatiin lineaarinen yhtälöjärjestelmä, jonka mitat ovat m+1 ja joka koostuu m+1 tuntemattomista. Tämä järjestelmä voidaan ratkaista millä tahansa menetelmällä lineaaristen algebrallisten yhtälöiden ratkaisemiseksi (esimerkiksi Gaussin menetelmä). Ratkaisun tuloksena löydetään approksimointifunktiolle tuntemattomia parametreja, jotka antavat approksimointifunktion neliöpoikkeamien minimisumman alkuperäisestä tiedosta, ts. paras mahdollinen neliöllinen approksimaatio. On syytä muistaa, että jos yksikin lähdetiedon arvo muuttuu, kaikki kertoimet muuttavat arvojaan, koska ne määräytyvät täysin lähdetietojen perusteella.

Lähdetietojen likimääräisyys lineaarisen riippuvuuden perusteella

(lineaarinen regressio)

Esimerkkinä tarkastellaan tekniikkaa approksimoivan funktion määrittämiseksi, joka on määritelty lineaarisen riippuvuuden muodossa. Pienimmän neliösumman menetelmän mukaisesti neliöpoikkeamien summan minimiehto kirjoitetaan seuraavassa muodossa:

Taulukon solmujen koordinaatit;

Lineaarisena riippuvuutena määritetyn approksimoivan funktion tuntemattomat kertoimet.

Funktion minimin olemassaolon välttämätön edellytys on sen osittaisten derivaattojen yhtäläisyys nollaan tuntemattomien muuttujien suhteen. Tuloksena saamme seuraavan yhtälöjärjestelmän:

Muunnetaan tuloksena oleva lineaarinen yhtälöjärjestelmä.

Ratkaisemme tuloksena olevan lineaariyhtälöjärjestelmän. Approksimoivan funktion kertoimet analyyttisessä muodossa määritetään seuraavasti (Cramerin menetelmä):

Nämä kertoimet varmistavat lineaarisen approksimoivan funktion rakentamisen kriteerin mukaisesti minimoida approksimoivan funktion neliösumma annetuista taulukkoarvoista (kokeellinen data).

Algoritmi pienimmän neliösumman menetelmän toteuttamiseksi

1. Alkutiedot:

Määritetään joukko kokeellisia tietoja, joissa on mittausten lukumäärä N

Approksimoivan polynomin aste (m) on määritelty

2. Laskenta-algoritmi:

2.1. Kertoimet määritetään dimensioiden yhtälöjärjestelmän muodostamista varten

Yhtälöjärjestelmän kertoimet (yhtälön vasen puoli)

- yhtälöjärjestelmän neliömatriisin sarakkeen numeron indeksi

Lineaarisen yhtälöjärjestelmän vapaat termit (yhtälön oikea puoli)

- yhtälöjärjestelmän neliömatriisin rivinumeron indeksi

2.2. Lineaarisen yhtälöjärjestelmän muodostaminen dimensiolla .

2.3. Lineaarisen yhtälöjärjestelmän ratkaiseminen m-asteisen approksimoivan polynomin tuntemattomien kertoimien määrittämiseksi.

2.4. Approksimoivan polynomin alkuperäisistä arvoista neliöityjen poikkeamien summan määrittäminen kaikissa solmupisteissä

Poikkeamien neliösumman löydetty arvo on pienin mahdollinen.

Arviointi muiden funktioiden avulla

On huomioitava, että approksimoiessa alkuperäistä dataa pienimmän neliösumman menetelmällä, joskus käytetään logaritmista funktiota, eksponentiaalifunktiota ja potenssifunktiota approksimoivana funktiona.

Logaritminen approksimaatio

Tarkastellaanpa tapausta, jossa approksimoiva funktio annetaan muodon logaritmisella funktiolla:

Sillä on monia sovelluksia, koska se mahdollistaa likimääräisen esityksen tietystä funktiosta muilla yksinkertaisemmilla. LSM voi olla erittäin hyödyllinen havaintojen käsittelyssä, ja sitä käytetään aktiivisesti arvioimaan joitain suureita toisten satunnaisvirheitä sisältävien mittaustulosten perusteella. Tässä artikkelissa opit toteuttamaan pienimmän neliösumman laskelmia Excelissä.

Ongelman selvitys tietyllä esimerkillä

Oletetaan, että on kaksi indikaattoria X ja Y. Lisäksi Y riippuu X:stä. Koska OLS kiinnostaa meitä regressioanalyysin näkökulmasta (Excelissä sen menetelmät toteutetaan sisäänrakennettujen funktioiden avulla), meidän on heti siirryttävä tarkastelemaan erityinen ongelma.

Olkoon X siis ruokakaupan myyntipinta-ala neliömetrinä mitattuna ja Y vuosiliikevaihto miljoonissa ruplissa mitattuna.

On tehtävä ennuste liikevaihdosta (Y), jos sillä on tätä tai toista myyntitilaa. On selvää, että funktio Y = f (X) kasvaa, koska hypermarket myy enemmän tavaraa kuin kioski.

Muutama sana ennustukseen käytettyjen lähtötietojen oikeellisuudesta

Oletetaan, että meillä on taulukko, joka on rakennettu käyttämällä n myymälän tietoja.

Matemaattisten tilastojen mukaan tulokset ovat enemmän tai vähemmän oikeita, jos tutkitaan vähintään 5-6 kohteen tietoja. Lisäksi "poikkeavia" tuloksia ei voida käyttää. Erityisesti eliittipienen putiikin liikevaihto voi olla useita kertoja suurempi kuin "masmarket"-luokan suurten vähittäismyyntipisteiden liikevaihto.

Menetelmän ydin

Taulukon tiedot voidaan kuvata suorakulmaisessa tasossa pisteiden M 1 (x 1, y 1), ... M n (x n, y n) muodossa. Nyt tehtävän ratkaisu pelkistetään approksimoivan funktion y = f (x) valintaan, jonka graafi kulkee mahdollisimman läheltä pisteitä M 1, M 2, .. M n.

Tietysti voit käyttää korkean asteen polynomia, mutta tämä vaihtoehto ei ole vain vaikea toteuttaa, vaan myös yksinkertaisesti virheellinen, koska se ei heijasta päätrendiä, joka on havaittava. Järkevin ratkaisu on etsiä suoraa y = ax + b, joka parhaiten approksimoi kokeellista dataa tai tarkemmin sanottuna kertoimia a ja b.

Tarkkuusarviointi

Millä tahansa likiarvolla sen tarkkuuden arvioiminen on erityisen tärkeää. Merkitään e i:llä pisteen x i toiminnallisten ja kokeellisten arvojen ero (poikkeama), eli e i = y i - f (x i).

On selvää, että arvioidaksesi likiarvon tarkkuutta, voit käyttää poikkeamien summaa, eli kun valitset suoran X:n riippuvuuden likimääräiselle esitykselle Y:stä, sinun tulee antaa etusijalle se, jonka arvo on pienin. summa e i kaikissa tarkasteltavissa olevissa kohdissa. Kaikki ei kuitenkaan ole niin yksinkertaista, koska positiivisten poikkeamien ohella on myös negatiivisia.

Ongelma voidaan ratkaista poikkeamamoduuleilla tai niiden neliöillä. Viimeinen menetelmä on yleisimmin käytetty. Sitä käytetään monilla aloilla, mukaan lukien regressioanalyysi (toteutettu Excelissä kahdella sisäänrakennetulla funktiolla), ja se on pitkään osoittanut tehokkuutensa.

Pienimmän neliön menetelmä

Kuten tiedät, Excelissä on sisäänrakennettu AutoSum-toiminto, jonka avulla voit laskea kaikkien valitulla alueella sijaitsevien arvojen arvot. Näin ollen mikään ei estä meitä laskemasta lausekkeen arvoa (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Matemaattisessa merkinnässä tämä näyttää tältä:

Koska päätös tehtiin alun perin likimääräiseksi suoralla viivalla, meillä on:

Siten tehtävä löytää suora, joka parhaiten kuvaa suureiden X ja Y ominaisriippuvuutta, tulee laskemaan kahden muuttujan funktion minimi:

Tätä varten sinun on rinnastettava uusien muuttujien a ja b osittaiset derivaatat nollaan ja ratkaistava primitiivinen järjestelmä, joka koostuu kahdesta yhtälöstä, joissa on 2 muodoltaan tuntematonta:

Muutaman yksinkertaisen muunnoksen jälkeen, mukaan lukien jakaminen kahdella ja summien manipulointi, saamme:

Ratkaisemalla sen esimerkiksi Cramerin menetelmällä saamme stationaarisen pisteen tietyillä kertoimilla a * ja b *. Tämä on minimi, eli liikkeen liikevaihdon ennustamiseen tietyllä alueella sopii suora y = a * x + b *, joka on regressiomalli kyseessä olevalle esimerkille. Tarkkaa tulosta ei tietenkään löydy, mutta se auttaa saamaan käsityksen siitä, kannattaako tietyn alueen ostaminen kauppaluotolla.

Kuinka ottaa pienimmän neliösumman käyttöön Excelissä

Excelissä on toiminto arvojen laskemiseen pienimmän neliösumman avulla. Sillä on seuraava muoto: "TREND" (tunnetut Y-arvot; tunnetut X-arvot; uudet X-arvot; vakio). Sovelletaan OLS:n laskentakaavaa Excelissä taulukkoomme.

Tätä varten syötä "="-merkki soluun, jossa Excelin pienimmän neliösumman menetelmällä suoritetun laskennan tulos tulee näkyä, ja valitse "TREND"-funktio. Täytä avautuvassa ikkunassa tarvittavat kentät korostaen:

  • Y:n tunnettujen arvojen alue (tässä tapauksessa tiedot kaupan liikevaihdosta);
  • alue x 1 , …x n , eli liiketilan koko;
  • sekä tunnetut että tuntemattomat x:n arvot, joille sinun on selvitettävä liikevaihdon koko (katso alta tietoja niiden sijainnista laskentataulukossa).

Lisäksi kaava sisältää loogisen muuttujan "Const". Jos syötät 1 vastaavaan kenttään, sinun tulee suorittaa laskelmat olettaen, että b = 0.

Jos sinun on selvitettävä ennuste useammalle kuin yhdelle x-arvolle, kaavan syöttämisen jälkeen sinun ei pitäisi painaa "Enter", vaan sinun on kirjoitettava näppäimistöllä yhdistelmä "Shift" + "Control" + "Enter".

Jotkut ominaisuudet

Regressioanalyysi voi olla jopa nukkejen saatavilla. Excel-kaavaa tuntemattomien muuttujien joukon arvon ennustamiseen – TREND – voivat käyttää myös ne, jotka eivät ole koskaan kuulleet pienimmän neliösumman käytöstä. Riittää, kun tietää joitakin sen työn ominaisuuksia. Erityisesti:

  • Jos järjestät muuttujan y tunnettujen arvojen alueen yhdelle riville tai sarakkeelle, ohjelma havaitsee jokaisen rivin (sarakkeen), jolla on tunnetut x:n arvot, erillisenä muuttujana.
  • Jos aluetta, jolla on tunnettu x, ei ole määritetty TREND-ikkunassa, käytettäessä funktiota Excelissä, ohjelma käsittelee sitä taulukkona, joka koostuu kokonaisluvuista, joiden lukumäärä vastaa aluetta annetuilla arvoilla. muuttuja y.
  • "Ennustettujen" arvojen taulukon tulostamiseksi trendin laskentalauseke on syötettävä taulukkokaavana.
  • Jos uusia x:n arvoja ei ole määritetty, TREND-funktio pitää niitä yhtä suurena kuin tunnetut arvot. Jos niitä ei ole määritetty, taulukko 1 otetaan argumentiksi; 2; 3; 4;…, joka on oikeassa suhteessa jo määritettyjen parametrien y alueeseen.
  • Uudet x-arvot sisältävällä alueella on oltava sama tai useampi rivi tai sarake kuin annetut y-arvot sisältävällä alueella. Toisin sanoen sen on oltava verrannollinen riippumattomiin muuttujiin.
  • Taulukko, jossa on tunnetut x-arvot, voi sisältää useita muuttujia. Jos kuitenkin puhumme vain yhdestä, vaaditaan, että alueet annetuilla x:n ja y:n arvoilla ovat verrannollisia. Useamman muuttujan tapauksessa on välttämätöntä, että alue annetuilla y-arvoilla mahtuu yhteen sarakkeeseen tai yhteen riviin.

PREDICTION-toiminto

Toteutettu useilla toiminnoilla. Yksi niistä on nimeltään "PREDICTION". Se on samanlainen kuin "TREND", eli se antaa laskelmien tuloksen pienimmän neliösumman menetelmällä. Kuitenkin vain yhdelle X:lle, jonka Y:n arvoa ei tunneta.

Nyt tiedät Excelissä kaavoja nukkeja varten, joiden avulla voit ennustaa tietyn indikaattorin tulevan arvon lineaarisen trendin mukaan.

Pienimmän neliön menetelmä käytetään arvioimaan regressioyhtälön parametreja.
Rivien lukumäärä (lähdetiedot)

Yksi menetelmistä ominaisuuksien välisten stokastisten suhteiden tutkimiseksi on regressioanalyysi.
Regressioanalyysi on regressioyhtälön johtaminen, jonka avulla saadaan satunnaismuuttujan (tulosattribuutin) keskiarvo, jos toisen (tai muun) muuttujan (tekijä-attribuutin) arvo tunnetaan. Se sisältää seuraavat vaiheet:

  1. yhteysmuodon valinta (analyyttisen regressioyhtälön tyyppi);
  2. yhtälöparametrien estimointi;
  3. analyyttisen regressioyhtälön laadun arviointi.
Useimmiten lineaarista muotoa käytetään kuvaamaan piirteiden tilastollista suhdetta. Lineaarisiin suhteisiin keskittyminen selittyy sen parametrien selkeällä taloudellisella tulkinnalla, muuttujien rajoitetulla vaihtelulla ja sillä, että useimmissa tapauksissa epälineaariset suhdemuodot muunnetaan (logaritmilla tai muuttujien korvaamalla) lineaariseen muotoon laskelmien suorittamista varten. .
Lineaarisen parittaisen suhteen tapauksessa regressioyhtälö saa muotoa: y i =a+b·x i +u i . Tämän yhtälön parametrit a ja b on arvioitu tilastollisista havaintotiedoista x ja y. Tällaisen arvioinnin tulos on yhtälö: , jossa , ovat parametrien a ja b estimaatteja, on regressioyhtälöstä saadun attribuutin (muuttujan) arvo (laskettu arvo).

Useimmiten käytetään parametrien arvioimiseen pienimmän neliösumman menetelmä (LSM).
Pienimmän neliösumman menetelmä tarjoaa parhaat (yhdenmukaiset, tehokkaat ja puolueettomat) estimaatit regressioyhtälön parametreille. Mutta vain, jos tietyt satunnaistermiä (u) ja riippumatonta muuttujaa (x) koskevat oletukset täyttyvät (katso OLS-oletukset).

Ongelma lineaarisen pariyhtälön parametrien estimoimiseksi pienimmän neliösumman menetelmällä on seuraava: saada sellaiset parametrien estimaatit , joissa tuloksena olevan ominaisuuden - y i - todellisten arvojen neliöpoikkeamien summa lasketuista arvoista on minimaalinen.
Muodollisesti OLS-kriteeri voidaan kirjoittaa näin: .

Pienimmän neliösumman menetelmien luokittelu

  1. Pienimmän neliön menetelmä.
  2. Maksimitodennäköisyysmenetelmä (normaalissa klassisessa lineaarisessa regressiomallissa oletetaan regressiojäännösten normaaliutta).
  3. Virheiden autokorrelaatiossa ja heteroskedastisuuden tapauksessa käytetään yleistettyä pienimmän neliösumman OLS-menetelmää.
  4. Painotettu pienimmän neliösumman menetelmä (OLS:n erikoistapaus heteroskedastisilla jäännöksillä).

Havainnollistetaan pointtia klassinen pienimmän neliösumman menetelmä graafisesti. Tätä varten rakennetaan havaintodataan (x i, y i, i=1;n) perustuva sirontakuvaaja suorakaiteen muotoiseen koordinaattijärjestelmään (tällaista sirontakuvaajaa kutsutaan korrelaatiokentällä). Yritetään valita suora, joka on lähinnä korrelaatiokentän pisteitä. Pienimmän neliösumman menetelmän mukaan viiva valitaan siten, että korrelaatiokentän pisteiden ja tämän suoran välisten pystyetäisyyksien neliöiden summa on minimaalinen.

Tämän ongelman matemaattinen merkintä: .
Arvot y i ja x i =1...n ovat meille tiedossa, nämä ovat havaintotietoja. S-funktiossa ne edustavat vakioita. Tämän funktion muuttujat ovat parametrien - , . Kahden muuttujan funktion minimin löytämiseksi on tarpeen laskea tämän funktion osittaiset derivaatat kullekin parametrille ja rinnastaa ne nollaan, ts. .
Tuloksena saamme kahden normaalin lineaarisen yhtälön järjestelmän:
Ratkaisemalla tämän järjestelmän löydämme tarvittavat parametriarviot:

Regressioyhtälön parametrien laskennan oikeellisuus voidaan tarkistaa vertaamalla summia (laskelmien pyöristämisestä voi aiheutua eroja).
Voit laskea parametriarviot rakentamalla taulukon 1.
Regressiokertoimen b etumerkki ilmaisee suhteen suunnan (jos b >0, suhde on suora, jos b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Muodollisesti parametrin a arvo on y:n keskiarvo, kun x on nolla. Jos attribuuttitekijällä ei ole eikä voi olla nolla-arvoa, niin yllä oleva parametrin a tulkinta ei ole järkevä.

Ominaisuuksien välisen suhteen läheisyyden arviointi suoritetaan käyttämällä lineaarista parikorrelaatiokerrointa - r x,y. Se voidaan laskea kaavalla: . Lisäksi lineaarinen parikorrelaatiokerroin voidaan määrittää regressiokertoimella b: .
Lineaarisen parin korrelaatiokertoimen hyväksyttävien arvojen alue on -1 - +1. Korrelaatiokertoimen etumerkki ilmaisee suhteen suunnan. Jos r x, y >0, yhteys on suora; jos r x, y<0, то связь обратная.
Jos tämä kerroin on suuruudeltaan lähellä yksikköä, ominaisuuksien välinen suhde voidaan tulkita melko läheiseksi lineaariseksi. Jos sen moduuli on yhtä suuri kuin yksi ê r x , y ê =1, niin ominaisuuksien välinen suhde on funktionaalinen lineaarinen. Jos ominaisuudet x ja y ovat lineaarisesti riippumattomia, niin r x,y on lähellä nollaa.
Voit myös käyttää taulukkoa 1 laskeaksesi r x,y.

pöytä 1

N havaintojax iy ix i ∙y i
1 x 1v 1x 1 v 1
2 x 2v 2x 2 v 2
...
nx ny nx n y n
Sarakkeen summa∑x∑y∑xy
Keskiarvo
Tuloksena olevan regressioyhtälön laadun arvioimiseksi laske teoreettinen määrityskerroin - R 2 yx:

,
missä d 2 on y:n varianssi, joka on selitetty regressioyhtälöllä;
e 2 - y:n jäännösvarianssi (regressioyhtälön selittämätön);
s 2 y - y:n kokonaisvarianssi.
Determinaatiokerroin kuvaa regressiolla selitetyn regression (ja siten tekijän x) y:n variaation (dispersion) osuutta kokonaisvariaatiossa (dispersiossa) y. Determinaatiokerroin R 2 yx saa arvot välillä 0 - 1. Vastaavasti arvo 1-R 2 yx kuvaa varianssin y osuutta, joka aiheutuu muiden mallissa huomioimattomien tekijöiden vaikutuksesta ja spesifikaatiovirheistä.
Lineaarisella regressiolla R 2 yx = r 2 yx.