Pienimmän neliösumman menetelmä lineaaristen funktioiden esimerkeille. Missä pienimmän neliösumman menetelmää käytetään?
- Opetusohjelma
Johdanto
Olen matemaatikko ja ohjelmoija. Suurin harppaus urallani oli, kun opin sanomaan: "En ymmärrä mitään!" Nyt en häpeä kertoa tieteen valoisalle, että hän pitää minulle luennon, etten ymmärrä, mitä hän, valokeikari, sanoo minulle. Ja se on erittäin vaikeaa. Kyllä, tietämättömyytesi myöntäminen on vaikeaa ja kiusallista. Kuka haluaa myöntää, ettei hän tiedä jonkin asian perusteita? Ammattini vuoksi minun on osallistuttava suuria määriä esityksiä ja luentoja, joissa, myönnän, suurimmassa osassa tapauksista haluan nukkua, koska en ymmärrä mitään. Mutta en ymmärrä, koska tieteen nykytilanteen valtava ongelma on matematiikassa. Se olettaa, että kaikki kuulijat tuntevat ehdottomasti kaikki matematiikan osa-alueet (mikä on absurdia). On häpeällistä myöntää, että et tiedä mitä johdannainen on (puhumme siitä vähän myöhemmin).
Mutta olen oppinut sanomaan, etten tiedä mitä kertolasku on. Kyllä, en tiedä mikä alialgebra lie-algebran yläpuolella on. Kyllä, en tiedä miksi niitä tarvitaan elämässä toisen asteen yhtälöt. Muuten, jos olet varma, että tiedät, meillä on jotain puhuttavaa! Matematiikka on sarja temppuja. Matemaatikot yrittävät hämmentää ja pelotella yleisöä; missä ei ole sekaannusta, ei ole mainetta, ei auktoriteettia. Kyllä, on arvovaltaa puhua mahdollisimman abstraktia kieltä, mikä on täyttä hölynpölyä.
Tiedätkö mikä on johdannainen? Todennäköisesti kerrot minulle erosuhteen rajasta. Ensimmäisenä vuonna matematiikan ja mekaniikan Pietarin valtionyliopistossa Viktor Petrovitš Khavin kertoi minulle päättänyt derivaatta funktion Taylor-sarjan ensimmäisen termin kertoimena pisteessä (tämä oli erillinen voimistelu Taylor-sarjan määrittämiseksi ilman derivaattoja). Nauroin tälle määritelmälle pitkään, kunnes vihdoin ymmärsin, mistä siinä oli kyse. Derivaata ei ole muuta kuin yksinkertainen mitta siitä, kuinka samanlainen erottamamme funktio on funktion y=x, y=x^2, y=x^3 kanssa.
Minulla on nyt kunnia luennoi opiskelijoille, jotka peloissaan matematiikka. Jos pelkäät matematiikkaa, olemme samalla tiellä. Heti kun yrität lukea tekstiä ja sinusta tuntuu, että se on liian monimutkaista, tiedä, että se on huonosti kirjoitettu. Väitän, ettei ole olemassa yhtä matematiikan aluetta, josta ei voida keskustella "sormilla" menettämättä tarkkuutta.
Tehtävä lähitulevaisuudessa: Annoin oppilailleni ymmärtää, mitä lineaarinen neliönsäätäjä on. Älä ole ujo, käytä kolme minuuttia elämästäsi ja seuraa linkkiä. Jos et ymmärrä mitään, olemme samalla tiellä. Minäkään (ammattimainen matemaatikko-ohjelmoija) en ymmärtänyt mitään. Ja voin vakuuttaa teille, että voit selvittää tämän "sormillasi". Päällä Tämä hetki En tiedä mikä se on, mutta voin vakuuttaa, että voimme selvittää sen.
Joten ensimmäinen luento, jonka aion pitää opiskelijoilleni sen jälkeen, kun he juoksevat luokseni kauhuissaan ja sanovat, että lineaarinen neliöllinen säädin on kauhea asia, jota et koskaan hallitse elämässäsi. menetelmiä pienimmän neliösumman . Voitko päättää lineaariset yhtälöt? Jos luet tätä tekstiä, luultavasti et.
Joten kun on annettu kaksi pistettä (x0, y0), (x1, y1), esimerkiksi (1,1) ja (3,2), tehtävänä on löytää näiden kahden pisteen kautta kulkevan suoran yhtälö:
kuva
Tällä rivillä pitäisi olla seuraavanlainen yhtälö:
Tässä alfa ja beta ovat meille tuntemattomia, mutta kaksi pistettä tästä viivasta tunnetaan:
Voimme kirjoittaa tämän yhtälön matriisimuodossa:
Tässä meidän pitäisi tehdä lyyrinen poikkeama: mikä on matriisi? Matriisi ei ole mitään muuta kuin kaksiulotteinen matriisi. Tämä on tapa tallentaa tietoja, eikä siihen saa liittää muita merkityksiä. Se riippuu meistä tarkalleen kuinka tulkita tietty matriisi. Ajoittain tulkitsen sen lineaariseksi kartoitukseksi, ajoittain kuten neliöllinen muoto, ja joskus vain vektoreiden joukkona. Tämä kaikki selvitetään kontekstissa.
Korvataan konkreettiset matriisit niiden symbolisella esityksellä:
Sitten (alfa, beta) löytyy helposti:
Tarkemmin aiemmista tiedoistamme:
Mikä johtaa pisteiden (1,1) ja (3,2) kautta kulkevan suoran seuraavaan yhtälöön:
Okei, kaikki on selvää täällä. Etsitään läpi kulkevan suoran yhtälö kolme pisteet: (x0,y0), (x1,y1) ja (x2,y2):
Voi-o-oi, mutta meillä on kolme yhtälöä kahdelle tuntemattomalle! Tavallinen matemaatikko sanoo, ettei ratkaisua ole. Mitä ohjelmoija sanoo? Ja hän kirjoittaa ensin uudelleen edellisen yhtälöjärjestelmän seuraavassa muodossa:
Meidän tapauksessamme vektorit i,j,b ovat kolmiulotteisia, joten (yleisessä tapauksessa) tähän järjestelmään ei ole ratkaisua. Mikä tahansa vektori (alfa\*i + beta\*j) on vektorien (i, j) kattamassa tasossa. Jos b ei kuulu tähän tasoon, ratkaisua ei ole (yhtälössä ei voida saavuttaa yhtäläisyyttä). Mitä tehdä? Etsitään kompromissia. Merkitään e (alfa, beta) kuinka pitkälle emme ole saavuttaneet tasa-arvoa:
Ja yritämme minimoida tämän virheen:
Miksi neliö?
Emme etsi vain normin minimiä, vaan normin neliön minimiä. Miksi? Itse minimipiste osuu yhteen, ja neliö antaa tasaisen funktion (argumenttien (alfa, beta) neliöfunktio), kun taas yksinkertaisesti pituus antaa kartion muotoisen funktion, joka ei erotu minimipisteessä. Brr. Neliö on kätevämpi.
Ilmeisesti virhe on minimoitu, kun vektori e kohtisuorassa vektorien kattamaa tasoa vastaan i Ja j.
Kuva
Toisin sanoen: etsimme sellaista suoraa, että kaikkien pisteiden ja tämän suoran välisten etäisyyksien neliöityjen pituuksien summa on minimaalinen:
PÄIVITYS: Minulla on ongelma tässä, etäisyys suoraan tulee mitata pystysuorassa, ei ortogonaalisella projektiolla. Tämä kommentoija on oikeassa.
Kuva
Täysin eri sanoin (huolellisesti, huonosti muotoiltu, mutta sen pitäisi olla selkeä): otamme kaikki mahdolliset viivat kaikkien pisteparien välillä ja etsimme keskimääräistä viivaa kaikkien välillä:
Kuva
Toinen selitys sormille: kiinnitämme jousen kaikkien datapisteiden (tässä niitä on kolme) ja etsimämme suoran ja suoran väliin tasapainotila siellä on juuri sitä mitä etsimme.
Minimi neliömuoto
Joten tämän vektorin perusteella b ja taso, joka ulottuu matriisin sarakevektorien kanssa A(tässä tapauksessa (x0,x1,x2) ja (1,1,1)), etsimme vektoria e jonka pituus on vähintään neliö. Ilmeisesti minimi on saavutettavissa vain vektorille e, kohtisuorassa matriisin sarakevektorien kattamaa tasoa vastaan A:Toisin sanoen etsimme vektoria x=(alfa, beta), joka on:
Haluan muistuttaa, että tämä vektori x=(alfa, beta) on minimi neliöfunktio||e(alfa, beta)||^2:
Tässä olisi hyvä muistaa, että matriisi voidaan tulkita myös neliömuotoiseksi, esimerkiksi identiteettimatriisi ((1,0),(0,1)) voidaan tulkita funktiona x^2 + y^ 2:
neliömuoto
Kaikki tämä voimistelu tunnetaan nimellä lineaarinen regressio.
Laplacen yhtälö Dirichlet-rajaehdon kanssa
Nyt yksinkertaisin todellinen tehtävä: siellä on tietty kolmiomainen pinta, se on tasoitettava. Ladataan esimerkiksi malli kasvoistani:Alkuperäinen sitoumus on saatavilla. Ulkoisten riippuvuuksien minimoimiseksi otin ohjelmiston renderöijani koodin jo Habreen. Ratkaisuja varten lineaarinen järjestelmä Käytän OpenNL:ää, se on erinomainen ratkaisu, joka on kuitenkin erittäin vaikea asentaa: sinun on kopioitava kaksi tiedostoa (.h+.c) projektisi kansioon. Kaikki tasoitus tehdään seuraavalla koodilla:
For (int d=0; d<3; d++) {
nlNewContext();
nlSolverParameteri(NL_NB_VARIABLES, verts.size());
nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE);
nlBegin(NL_SYSTEM);
nlBegin(NL_MATRIX);
for (int i=0; i<(int)verts.size(); i++) {
nlBegin(NL_ROW);
nlCoefficient(i, 1);
nlRightHandSide(verts[i][d]);
nlEnd(NL_ROW);
}
for (unsigned int i=0; i
X-, Y- ja Z-koordinaatit ovat erotettavissa, tasoitan ne erikseen. Eli ratkaisen kolme lineaariyhtälöjärjestelmää, joissa kussakin on mallissani olevien pisteiden lukumäärää vastaava määrä muuttujia. Matriisin A ensimmäisellä n rivillä on vain yksi 1 riviä kohden, ja vektorin b ensimmäisillä n rivillä on alkuperäiset mallikoordinaatit. Eli sidon jousen kärjen uuden sijainnin ja kärjen vanhan sijainnin väliin - uudet eivät saa siirtyä liian kauas vanhoista.
Kaikilla matriisin A myöhemmillä riveillä (faces.size()*3 = kaikkien verkon kolmioiden reunojen lukumäärä) on yksi esiintymä 1 ja yksi esiintyminen -1, vektorin b ollessa nollakomponentteja vastakkain. Tämä tarkoittaa, että laitan jousen kolmioverkkomme jokaiseen reunaan: kaikki reunat yrittävät saada saman kärjen kuin aloitus- ja loppupisteensä.
Jälleen kerran: kaikki kärjet ovat muuttujia, eivätkä ne voi liikkua kauas alkuperäisestä sijainnistaan, mutta samalla ne yrittävät tulla samanlaisiksi toistensa kanssa.
Tässä tulos:
Kaikki olisi hyvin, malli on todella tasoitettu, mutta se on siirtynyt pois alkuperäisestä reunastaan. Muutetaan koodia hieman:
For (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }
Matriisissamme A reunassa oleville pisteille en lisää riviä luokasta v_i = verts[i][d], vaan 1000*v_i = 1000*verts[i][d]. Mitä se muuttaa? Ja tämä muuttaa neliöllisen virhemuotomme. Nyt yksittäinen poikkeama ylhäältä reunassa ei maksa yhtä yksikköä, kuten ennen, vaan 1000*1000 yksikköä. Eli ripustimme vahvemman jousen ääripisteisiin, ratkaisu mieluummin venyttää muita voimakkaammin. Tässä tulos:
Kaksinkertaistetaan jousen vahvuus pisteiden välillä:
nlKerroin(face[ j ], 2); nlKerroin(kasvo[(j+1)%3], -2);
On loogista, että pinnasta on tullut tasaisempi:
Ja nyt jopa sata kertaa vahvempi:
Mikä tämä on? Kuvittele, että olemme kastaneet lankarenkaan saippuaveteen. Tämän seurauksena tuloksena oleva saippuakalvo yrittää saada mahdollisimman vähän kaarevuutta koskettaen reunaa - lankarengaamme. Juuri tämän saimme kiinnittämällä reunuksen ja pyytämällä sileää pintaa sisälle. Onnittelut, olemme juuri ratkaisseet Laplacen yhtälön Dirichlet-rajaehdoilla. Kuulostaa siistiltä? Mutta todellisuudessa sinun tarvitsee vain ratkaista yksi lineaarinen yhtälöjärjestelmä.
Poissonin yhtälö
Muistakaamme toinen hieno nimi.Oletetaan, että minulla on tällainen kuva:
Näyttää hyvältä kaikille, mutta en pidä tuolista.
Leikkaan kuvan puoliksi:
Ja valitsen tuolin käsilläni:
Sitten vedän kuvan vasemmalle puolelle kaiken, mikä on maskissa valkoista, ja samalla sanon koko kuvassa, että kahden vierekkäisen pikselin eron tulee olla yhtä suuri kuin oikean kahden vierekkäisen pikselin ero. kuva:
For (int i=0; i Tässä tulos: Koodi ja kuvat saatavilla Pienimmän neliön menetelmä Aiheen viimeisellä oppitunnilla tutustumme kuuluisimpaan sovellukseen FNP, joka löytää laajimman sovelluksen eri tieteenaloilla ja käytännön toiminnassa. Tämä voi olla fysiikka, kemia, biologia, taloustiede, sosiologia, psykologia ja niin edelleen ja niin edelleen. Kohtalon tahdosta joudun usein käsittelemään taloutta, ja siksi järjestän tänään sinulle matkan hämmästyttävään maahan ns. Ekonometria=) ...Miten et halua sitä?! Siellä on erittäin hyvä – sinun tarvitsee vain tehdä päätös! ...Mutta mitä varmasti haluat, on oppia ratkaisemaan ongelmia pienimmän neliösumman menetelmä. Ja erityisen ahkerat lukijat oppivat ratkaisemaan ne paitsi tarkasti, myös ERITTÄIN NOPEASTI ;-) Mutta ensin yleiskuvaus ongelmasta+ oheinen esimerkki: Tutkitaanpa tietyn aihealueen indikaattoreita, joilla on määrällinen ilmaisu. Samalla on täysi syy uskoa, että indikaattori riippuu indikaattorista. Tämä oletus voi olla joko tieteellinen hypoteesi tai perustua maalaisjärkeen. Jätetään kuitenkin tiede sivuun ja tutkitaan herkullisempia alueita - nimittäin ruokakauppoja. Merkitään: – ruokakaupan vähittäiskauppatila, neliömetri, On täysin selvää, että mitä suurempi myymäläpinta-ala, sitä suurempi on useimmissa tapauksissa sen liikevaihto. Oletetaan, että tamburiinilla tehtyjen havaintojen/kokeilujen/laskelmien/tanssien jälkeen meillä on käytössämme numeerista tietoa: Taulukkotiedot voidaan kirjoittaa myös pisteiden muodossa ja kuvata tutussa muodossa Karteesinen järjestelmä . Vastataanpa tärkeään kysymykseen: Kuinka monta pistettä laadulliseen tutkimukseen tarvitaan? Mitä isompi sen parempi. Pienin hyväksyttävä sarja koostuu 5-6 pisteestä. Lisäksi, kun dataa on vähän, "poikkeavia" tuloksia ei voida sisällyttää otokseen. Joten esimerkiksi pieni eliittikauppa voi ansaita suuruusluokkaa enemmän kuin "kollegansa", mikä vääristää yleistä mallia, joka sinun on löydettävä! Hyvin yksinkertaisesti sanottuna meidän on valittava toiminto, ajoittaa joka kulkee mahdollisimman läheltä pisteitä Siten haetun funktion on oltava melko yksinkertainen ja samalla heijastettava riittävästi riippuvuutta. Kuten arvata saattaa, yksi tällaisten funktioiden löytämismenetelmistä on nimeltään pienimmän neliösumman menetelmä. Katsotaanpa ensin sen olemusta yleisellä tasolla. Olkoon jonkin funktion likimääräinen kokeellinen data: Approksimoimalla koepisteitä eri funktioilla saamme erilaisia arvoja, ja on selvää, jos tämä summa on pienempi, se funktio on tarkempi. Tällainen menetelmä on olemassa ja sitä kutsutaan pienimmän moduulin menetelmä. Käytännössä se on kuitenkin yleistynyt huomattavasti pienimmän neliösumman menetelmä, jossa mahdollisia negatiivisia arvoja ei eliminoi moduuli vaan neliöimällä poikkeamat: Ja nyt palaamme toiseen tärkeään kohtaan: kuten yllä todettiin, valitun toiminnon tulisi olla melko yksinkertainen - mutta myös sellaisia toimintoja on monia: lineaarinen
,
hyperbolinen
,
eksponentiaalinen
,
logaritminen
,
neliöllinen
jne. Ja tietysti tässä haluaisin heti "vähentää toimintakenttää". Mikä toimintoluokka minun pitäisi valita tutkimukseen? Alkukantainen mutta tehokas tekniikka: – Helpoin tapa on kuvata pisteitä Jos pisteet sijaitsevat esimerkiksi pitkin hyperbolia, silloin on selvää, että lineaarinen funktio antaa huonon approksimaation. Tässä tapauksessa etsimme "suotuisimpia" kertoimia hyperboliyhtälölle Huomaa nyt, että molemmissa tapauksissa puhumme kahden muuttujan funktioita, jonka argumentit ovat haettiin riippuvuusparametreja: Ja pohjimmiltaan meidän on ratkaistava standardiongelma - löytää kahden muuttujan minimifunktio. Muistakaamme esimerkkimme: oletetaan, että "myymälä"-pisteet sijaitsevat yleensä suorassa linjassa ja on täysi syy uskoa, että lineaarinen riippuvuus liikevaihto liiketiloista. Etsitään SELLAISIA kertoimia “a” ja “olla” sellaisina, että poikkeamien neliösumma Jos haluat käyttää näitä tietoja esseessä tai lopputyössä, olen erittäin kiitollinen linkistä lähdeluettelossa; tällaisia yksityiskohtaisia laskelmia löytyy muutamasta paikasta: Luodaan vakiojärjestelmä: Vähennämme kutakin yhtälöä "kahdella" ja lisäksi "hajotamme" summat: Huomautus
: analysoi itsenäisesti, miksi "a" ja "be" voidaan poistaa summakuvakkeen jälkeen. Muuten, muodollisesti tämä voidaan tehdä summalla Kirjoitetaan järjestelmä uudelleen "soveltuun" muotoon: Tiedämmekö pisteiden koordinaatit? Me tiedämme. Summat Toiminto Käsiteltävänä olevalla ongelmalla on suuri käytännön merkitys. Esimerkkitilanteessamme Eq. Analysoin vain yhden ongelman "oikeilla" numeroilla, koska siinä ei ole vaikeuksia - kaikki laskelmat ovat 7-8-luokan koulun opetussuunnitelman tasolla. 95 prosentissa tapauksista sinua pyydetään löytämään vain lineaarinen funktio, mutta aivan artikkelin lopussa näytän, että optimaalisen hyperbolin, eksponentiaalisen ja joidenkin muiden funktioiden yhtälöiden löytäminen ei ole sen vaikeampaa. Itse asiassa jäljellä on vain jakaa luvatut herkut - jotta voit oppia ratkaisemaan tällaiset esimerkit paitsi tarkasti, myös nopeasti. Tutkimme standardia huolellisesti: Tehtävä Kahden indikaattorin välisen suhteen tutkimisen tuloksena saatiin seuraavat numeroparit: Huomaa, että "x" merkitykset ovat luonnollisia, ja tällä on tyypillinen merkityksellinen merkitys, josta puhun hieman myöhemmin; mutta ne voivat tietysti olla myös murto-osia. Lisäksi tietyn tehtävän sisällöstä riippuen sekä "X"- että "peli"-arvot voivat olla täysin tai osittain negatiivisia. No, meille on annettu "kasvoton" tehtävä, ja aloitamme sen ratkaisu: Löydämme optimaalisen funktion kertoimet ratkaisuksi järjestelmään: Kompaktimman tallennuksen vuoksi "laskuri"-muuttuja voidaan jättää pois, koska on jo selvää, että summaus suoritetaan 1 - . Tarvittavat määrät on helpompi laskea taulukkomuodossa: Siten saamme seuraavan järjestelmä: Täällä voit kertoa toisen yhtälön 3:lla ja vähennä 2. 1. yhtälöstä termi kerrallaan. Mutta tämä on onnea - käytännössä järjestelmät eivät usein ole lahja, ja sellaisissa tapauksissa se säästää Cramerin menetelmä: Tarkistetaan. Ymmärrän, että et halua, mutta miksi ohittaa virheet, joissa niitä ei todellakaan voi jättää huomiotta? Korvataan löydetty ratkaisu järjestelmän kunkin yhtälön vasempaan puoleen: Siten haluttu approksimoiva funktio: – alkaen kaikki lineaarifunktiot Hän arvioi parhaiten kokeelliset tiedot. Toisin kuin suoraan
myymälän liikevaihdon riippuvuus sen pinta-alasta, todettu riippuvuus on käänteinen
(periaate "mitä enemmän, sitä vähemmän"), ja tämä tosiasia paljastuu välittömästi negatiivisesti kaltevuus. Toiminto Approksimoivan funktion kaavion piirtämiseksi löydämme sen kaksi arvoa: ja suorita piirustus: Lasketaan poikkeamien neliösumma Tehdään laskelmat yhteenvetona taulukkoon: Toistamme vielä kerran: Mikä on saadun tuloksen merkitys? From kaikki lineaarifunktiot y-toiminto Etsitään vastaava neliöityjen poikkeamien summa - erottamiseksi, merkitsen ne kirjaimella "epsilon". Tekniikka on täsmälleen sama: Johtopäätös: , mikä tarkoittaa, että eksponentiaalinen funktio approkimoi koepisteitä huonommin kuin suora Mutta tässä on huomattava, että "huonompi" on ei tarkoita vielä, mikä hätänä. Nyt olen rakentanut kuvaajan tästä eksponentiaalisesta funktiosta - ja se myös kulkee lähellä pisteitä Tämä päättää ratkaisun, ja palaan kysymykseen väitteen luonnollisista arvoista. Useissa tutkimuksissa, yleensä taloudellisissa tai sosiologisissa tutkimuksissa, luonnollisia X:itä käytetään numeroimaan kuukausia, vuosia tai muita vastaavia aikavälejä. Harkitse esimerkiksi seuraavaa ongelmaa: Myymälän ensimmäisen vuosipuoliskon vähittäiskaupan liikevaihdosta on saatavilla seuraavat tiedot: Kyllä, ei hätää: numeroimme kuukaudet 1, 2, 3, 4, 5, 6 ja käytämme tavallista algoritmia, jonka seurauksena saamme yhtälön - ainoa asia on, että kun on kyse ajasta, he yleensä käyttävät kirjain "te" (vaikka tämä ei ole kriittinen). Tuloksena oleva yhtälö osoittaa, että vuoden ensimmäisellä puoliskolla kaupan liikevaihto kasvoi keskimäärin 27,74 yksikköä. kuukaudessa. Otetaan ennuste heinäkuulle (kuukausi nro 7): d.e. Ja tällaisia tehtäviä on lukemattomia. Halukkaat voivat käyttää lisäpalvelua, nimittäin minun Excelin laskin (demoversio), mikä ratkaisee analysoidun ongelman lähes välittömästi! Ohjelman toimiva versio on saatavilla vaihdossa tai varten symbolinen maksu. Oppitunnin lopussa lyhyt informaatio joidenkin muuntyyppisten riippuvuuksien löytämisestä. Itse asiassa ei ole paljon kerrottavaa, koska perustavanlaatuinen lähestymistapa ja ratkaisualgoritmi pysyvät samoina. Oletetaan, että koepisteiden järjestely muistuttaa hyperbolia. Sitten parhaan hyperbelin kertoimien löytämiseksi sinun on löydettävä funktion minimi - kuka tahansa voi suorittaa yksityiskohtaisia laskelmia ja päästä samanlaiseen järjestelmään: Muodollisesti tekniseltä kannalta se saadaan "lineaarisesta" järjestelmästä Jos on täysi syy uskoa, että pistettä Kun suoritat laskelmia Excelissä, käytä toimintoa LN. Myönnän, että minun ei olisi erityisen vaikeaa luoda laskureita jokaiseen tarkasteltavaan tapaukseen, mutta silti olisi parempi, jos "ohjelmoisit" laskelmat itse. Oppituntivideot avuksi. Eksponentiaalisella riippuvuudella tilanne on hieman monimutkaisempi. Supistaaksemme asian lineaariseen tapaukseen otamme funktion logaritmi ja käytämme logaritmin ominaisuudet: Vertaamalla nyt saatua funktiota lineaariseen funktioon, tulemme siihen tulokseen, että järjestelmässä (*) on korvattava merkillä , ja – . Merkitään mukavuuden vuoksi: Huomaa, että järjestelmä on ratkaistu suhteessa ja siksi juurien löytämisen jälkeen sinun ei pidä unohtaa löytää itse kerroin. Tuo kokeelliset kohdat lähemmäksi Kyllä, tietysti täällä on enemmän summia, mutta suosikkisovelluksesi käytössä ei ole vaikeuksia. Ja lopuksi kerron sinulle kuinka nopeasti suorittaa tarkistus Excelillä ja rakentaa haluttu trendiviiva: luo sirontakaavio, valitse mikä tahansa pisteistä hiirellä Kuten aina, haluan lopettaa artikkelin kauniilla lauseella, ja melkein kirjoitin "Ole trendissä!" Mutta hän muutti ajatuksensa. Eikä siksi, että se olisi stereotyyppinen. En tiedä miten se sopii kenellekään, mutta en todellakaan halua seurata edistettyä amerikkalaista ja varsinkaan eurooppalaista trendiä =) Siksi toivon, että jokainen teistä pysyy omassa linjassaan! http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html Pienimmän neliösumman menetelmä on yksi yleisimmistä ja kehittyneimmistä sen ansiosta lineaaristen ekonometristen mallien parametrien estimointimenetelmien yksinkertaisuus ja tehokkuus. Samanaikaisesti sitä käytettäessä tulee noudattaa tiettyä varovaisuutta, sillä sen avulla rakennetut mallit eivät välttämättä täytä useita parametrien laatuvaatimuksia eivätkä sen seurauksena heijasta prosessikehityksen malleja "hyvin". tarpeeksi. Tarkastellaan yksityiskohtaisemmin menettelyä lineaarisen ekonometrisen mallin parametrien estimoimiseksi pienimmän neliösumman menetelmällä. Tällainen malli voidaan yleensä esittää yhtälöllä (1.2): y t = a 0 + a 1 x 1t +...+ a n x nt + ε t. Alkutiedot parametreja a 0, a 1,..., a n arvioitaessa on riippuvan muuttujan arvojen vektori y= (y 1 , y 2 , ... , y T)" ja riippumattomien muuttujien arvojen matriisi jossa ensimmäinen sarake, joka koostuu ykkösistä, vastaa mallikerrointa. Pienimmän neliösumman menetelmä sai nimensä sillä perusperiaatteella, että sen perusteella saatujen parametriestimaattien tulee täyttää: mallivirheen neliösumman tulee olla minimaalinen. Esimerkkejä tehtävien ratkaisemisesta pienimmän neliösumman menetelmällä Esimerkki 2.1. Kauppayrityksellä on 12 myymälän verkosto, joiden toiminnasta on tiedot taulukossa. 2.1. Yrityksen johto haluaa tietää, miten vuosiliikevaihdon suuruus riippuu liikkeen liiketilasta. Taulukko 2.1 Pienimmän neliön ratkaisu. Merkitään myymälän vuosiliikevaihto, milj. ruplaa; - myymälän liiketila, tuhat m2. Kuva 2.1. Esimerkin 2.1 sirontakaavio Muuttujien ja muuttujien välisen funktionaalisen suhteen muodon määrittämiseksi rakennamme sirontadiagrammin (kuva 2.1). Hajontakaavion perusteella voidaan päätellä, että vuosiliikevaihto on positiivisesti riippuvainen liiketilasta (eli y kasvaa kasvaessa). Sopivin toiminnallisen yhteyden muoto on lineaarinen. Tietoja lisälaskelmista varten on esitetty taulukossa. 2.2. Pienimmän neliösumman menetelmällä estimoimme lineaarisen yksikerroisen ekonometrisen mallin parametrit Taulukko 2.2 Täten, Siksi, kun myyntipinta-ala kasvaa 1 tuhannella m2, muiden tekijöiden pysyessä samana, keskimääräinen vuotuinen liikevaihto kasvaa 67,8871 miljoonalla ruplalla. Esimerkki 2.2. Yrityksen johto havaitsi, että vuosiliikevaihto ei riipu pelkästään myymälän myyntialueesta (ks. esimerkki 2.1), vaan myös keskimääräisestä kävijämäärästä. Asiaankuuluvat tiedot on esitetty taulukossa. 2.3. Taulukko 2.3 Ratkaisu. Merkitään - th:n myymälän keskimääräinen kävijämäärä päivässä, tuhat ihmistä. Muuttujien ja muuttujien välisen funktionaalisen suhteen muodon määrittämiseksi rakennamme sirontadiagrammin (kuva 2.2). Sirontakaavion perusteella voidaan päätellä, että vuotuinen liikevaihto on positiivisesti riippuvainen keskimääräisestä vuorokauden kävijämäärästä (eli y kasvaa kasvaessa). Toiminnallisen riippuvuuden muoto on lineaarinen. Riisi. 2.2. Esimerkin 2.2 sirontakaavio Taulukko 2.4 Yleensä on tarpeen määrittää kaksitekijäisen ekonometrisen mallin parametrit y t = a 0 + a 1 x 1t + a 2 x 2t + ε t Lisälaskelmia varten tarvittavat tiedot on esitetty taulukossa. 2.4. Arvioidaan lineaarisen kaksitekijäisen ekonometrisen mallin parametrit pienimmän neliösumman menetelmällä. Täten, Kertoimen arvio =61,6583 osoittaa, että muiden tekijöiden pysyessä liiketilojen kasvaessa tuhannella m 2:lla vuotuinen liikevaihto kasvaa keskimäärin 61,6583 miljoonaa ruplaa. Kertoimen arvio = 2,2748 osoittaa, että muiden asioiden pysyessä samana, keskimääräisen kävijämäärän kasvu tuhatta ihmistä kohden. päivässä, vuotuinen liikevaihto kasvaa keskimäärin 2,2748 miljoonaa ruplaa. Esimerkki 2.3. Käyttämällä taulukossa olevia tietoja. 2.2 ja 2.4, arvioi yksikerroisen ekonometrisen mallin parametri missä on myymälän vuosiliikevaihdon keskiarvo, miljoonaa ruplaa; - t:nnen liikkeen keskimääräisen päivittäisen kävijämäärän keskitetty arvo, tuhat henkilöä. (katso esimerkit 2.1-2.2). Ratkaisu. Laskelmiin tarvittavat lisätiedot on esitetty taulukossa. 2.5. Taulukko 2.5 Kaavan (2.35) avulla saamme Täten, http://www.cleverstudents.ru/articles/mnk.html Esimerkki. Kokeellinen data muuttujien arvoista X Ja klo on annettu taulukossa. Niiden kohdistuksen tuloksena saadaan funktio Käyttämällä pienimmän neliösumman menetelmä, arvioi nämä tiedot lineaarisella riippuvuudella y=kirves+b(etsi parametrit A Ja b). Selvitä, kumpi kahdesta viivasta paremmin (pienimmän neliösumman menetelmässä) kohdistaa kokeelliset tiedot. Tee piirustus. Ratkaisu. Meidän esimerkissämme n = 5. Täytämme taulukon tarvittavien kertoimien kaavoihin sisältyvien määrien laskemisen helpottamiseksi. Taulukon neljännen rivin arvot saadaan kertomalla 2. rivin arvot 3. rivin arvoilla jokaiselle numerolle i. Taulukon viidennen rivin arvot saadaan neliöimällä 2. rivin arvot jokaiselle numerolle i. Taulukon viimeisen sarakkeen arvot ovat eri rivien arvojen summat. Käytämme pienimmän neliösumman menetelmän kaavoja kertoimien löytämiseen A Ja b. Korvaamme vastaavat arvot taulukon viimeisestä sarakkeesta niihin: Siten, y = 0,165x+2,184- haluttu likimääräinen suora. On vielä selvitettävä, mikä riveistä y = 0,165x+2,184 tai Todiste. Siis kun löytyy A Ja b funktio saa pienimmän arvon, on välttämätöntä, että tässä vaiheessa funktion toisen asteen differentiaalin toisen asteen muodon matriisi Toisen asteen ero on muotoa: Tuo on Siksi neliömuodon matriisilla on muoto Osoitetaan, että matriisi on positiivinen määrätty. Tätä varten kulmikas alaikäisten on oltava positiivisia. Ensimmäisen asteen kulmikas molli Koetietojen lähentäminen on menetelmä, joka perustuu kokeellisesti saatujen tietojen korvaamiseen analyyttisellä funktiolla, joka läpäisee tai osuu läheisimmin solmupisteissä alkuperäisten arvojen (kokeen tai kokeen aikana saatujen tietojen) kanssa. Tällä hetkellä on kaksi tapaa määrittää analyyttinen funktio: Rakentamalla n-asteinen interpolaatiopolynomi, joka läpäisee suoraan kaikkien pisteiden läpi tiettyä datataulukkoa. Tässä tapauksessa approksimoiva funktio esitetään muodossa: interpolaatiopolynomi Lagrange-muodossa tai interpolaatiopolynomi Newton-muodossa. Rakentamalla n-asteinen approksimoiva polynomi, joka läpäisee pisteiden välittömässä läheisyydessä tietystä datajoukosta. Näin ollen approksimoiva funktio tasoittaa kaiken kokeen aikana mahdollisesti syntyvän satunnaisen kohinan (tai virheet): kokeen aikana mitatut arvot riippuvat satunnaistekijöistä, jotka vaihtelevat omien satunnaislakiensa mukaan (mittaus- tai laitevirheet, epätarkkuus tai kokeellinen virheet). Tässä tapauksessa approksimoiva funktio määritetään pienimmän neliösumman menetelmällä. Pienimmän neliön menetelmä(englanninkielisessä kirjallisuudessa Ordinary Least Squares, OLS) on matemaattinen menetelmä, joka perustuu approksimoivan funktion määrittämiseen, joka konstruoidaan pisteiden lähimpään läheisyyteen tietystä koetietojoukosta. Alkuperäisen ja approksimoivan funktion F(x) läheisyys määräytyy numeerisella mittauksella, nimittäin: kokeellisten tietojen neliöpoikkeamien summan approksimointikäyrästä F(x) tulee olla pienin. Approksimoiva käyrä, joka on muodostettu pienimmän neliösumman menetelmällä Pienimmän neliösumman menetelmää käytetään: Ratkaisemaan ylimäärättyjä yhtälöjärjestelmiä, kun yhtälöiden lukumäärä ylittää tuntemattomien määrän; Löytää ratkaisu tavallisten (ei ylimääritettyjen) epälineaaristen yhtälöjärjestelmien tapauksessa; Pistearvojen likiarvo jollakin approksimoivalla funktiolla. Pienimmän neliösumman menetelmää käyttävä approksimoiva funktio määritetään lasketun approksimoivan funktion neliöpoikkeamien minimisumman ehdosta tietystä kokeellisen datajoukosta. Tämä pienimmän neliösumman menetelmän kriteeri kirjoitetaan seuraavasti: Lasketun approksimoivan funktion arvot solmupisteissä, Tietty joukko kokeellisia tietoja solmupisteissä. Kvadraattisella kriteerillä on useita "hyviä" ominaisuuksia, kuten differentiaatiokyky, mikä tarjoaa ainutlaatuisen ratkaisun approksimaatioongelmaan polynomisten approksimointifunktioiden kanssa. Riippuen tehtävän ehdoista approksimoiva funktio on m-asteinen polynomi Approksimoivan funktion aste ei riipu solmupisteiden lukumäärästä, vaan sen dimensio on aina pienempi kuin tietyn kokeellisen datataulukon dimensio (pisteiden lukumäärä). ∙ Jos approksimoivan funktion aste on m=1, niin taulukkofunktiota approksimoidaan suoralla (lineaarinen regressio). ∙ Jos approksimoivan funktion aste on m=2, niin taulukkofunktiota approksimoidaan neliöparaabelilla (neliöapproksimaatio). ∙ Jos approksimoivan funktion aste on m=3, niin taulukkofunktiota approksimoidaan kuutioparaabelilla (kuutioapproksimaatio). Yleisessä tapauksessa, kun on tarpeen rakentaa m-asteen likimääräinen polynomi annetuille taulukon arvoille, ehto kaikkien solmupisteiden neliöpoikkeamien summalle kirjoitetaan uudelleen seuraavassa muodossa: Määritetty taulukkoarvojen määrä. Välttämätön ehto funktion minimin olemassaololle on sen osittaisten derivaattojen yhtäläisyys nollaan tuntemattomien muuttujien suhteen Muunnetaan tuloksena oleva lineaarinen yhtälöjärjestelmä: avaa sulut ja siirrä vapaat termit lausekkeen oikealle puolelle. Tämän seurauksena tuloksena oleva lineaaristen algebrallisten lausekkeiden järjestelmä kirjoitetaan seuraavassa muodossa: Tämä lineaaristen algebrallisten lausekkeiden järjestelmä voidaan kirjoittaa uudelleen matriisimuotoon: Tuloksena saatiin lineaarinen yhtälöjärjestelmä, jonka mitat ovat m+1 ja joka koostuu m+1 tuntemattomista. Tämä järjestelmä voidaan ratkaista millä tahansa menetelmällä lineaaristen algebrallisten yhtälöiden ratkaisemiseksi (esimerkiksi Gaussin menetelmä). Ratkaisun tuloksena löydetään approksimointifunktiolle tuntemattomia parametreja, jotka antavat approksimointifunktion neliöpoikkeamien minimisumman alkuperäisestä tiedosta, ts. paras mahdollinen neliöllinen approksimaatio. On syytä muistaa, että jos yksikin lähdetiedon arvo muuttuu, kaikki kertoimet muuttavat arvojaan, koska ne määräytyvät täysin lähdetietojen perusteella. Lähdetietojen likimääräisyys lineaarisen riippuvuuden perusteella (lineaarinen regressio) Esimerkkinä tarkastellaan tekniikkaa approksimoivan funktion määrittämiseksi, joka on määritelty lineaarisen riippuvuuden muodossa. Pienimmän neliösumman menetelmän mukaisesti neliöpoikkeamien summan minimiehto kirjoitetaan seuraavassa muodossa: Taulukon solmujen koordinaatit; Lineaarisena riippuvuutena määritetyn approksimoivan funktion tuntemattomat kertoimet. Funktion minimin olemassaolon välttämätön edellytys on sen osittaisten derivaattojen yhtäläisyys nollaan tuntemattomien muuttujien suhteen. Tuloksena saamme seuraavan yhtälöjärjestelmän: Muunnetaan tuloksena oleva lineaarinen yhtälöjärjestelmä. Ratkaisemme tuloksena olevan lineaariyhtälöjärjestelmän. Approksimoivan funktion kertoimet analyyttisessä muodossa määritetään seuraavasti (Cramerin menetelmä): Nämä kertoimet varmistavat lineaarisen approksimoivan funktion rakentamisen kriteerin mukaisesti minimoida approksimoivan funktion neliösumma annetuista taulukkoarvoista (kokeellinen data). Algoritmi pienimmän neliösumman menetelmän toteuttamiseksi 1. Alkutiedot: Määritetään joukko kokeellisia tietoja, joissa on mittausten lukumäärä N Approksimoivan polynomin aste (m) on määritelty 2. Laskenta-algoritmi: 2.1. Kertoimet määritetään dimensioiden yhtälöjärjestelmän muodostamista varten Yhtälöjärjestelmän kertoimet (yhtälön vasen puoli) Lineaarisen yhtälöjärjestelmän vapaat termit (yhtälön oikea puoli) 2.2. Lineaarisen yhtälöjärjestelmän muodostaminen dimensiolla . 2.3. Lineaarisen yhtälöjärjestelmän ratkaiseminen m-asteisen approksimoivan polynomin tuntemattomien kertoimien määrittämiseksi. 2.4. Approksimoivan polynomin alkuperäisistä arvoista neliöityjen poikkeamien summan määrittäminen kaikissa solmupisteissä Poikkeamien neliösumman löydetty arvo on pienin mahdollinen. Arviointi muiden funktioiden avulla On huomioitava, että approksimoiessa alkuperäistä dataa pienimmän neliösumman menetelmällä, joskus käytetään logaritmista funktiota, eksponentiaalifunktiota ja potenssifunktiota approksimoivana funktiona. Logaritminen approksimaatio Tarkastellaanpa tapausta, jossa approksimoiva funktio annetaan muodon logaritmisella funktiolla: Sillä on monia sovelluksia, koska se mahdollistaa likimääräisen esityksen tietystä funktiosta muilla yksinkertaisemmilla. LSM voi olla erittäin hyödyllinen havaintojen käsittelyssä, ja sitä käytetään aktiivisesti arvioimaan joitain suureita toisten satunnaisvirheitä sisältävien mittaustulosten perusteella. Tässä artikkelissa opit toteuttamaan pienimmän neliösumman laskelmia Excelissä. Oletetaan, että on kaksi indikaattoria X ja Y. Lisäksi Y riippuu X:stä. Koska OLS kiinnostaa meitä regressioanalyysin näkökulmasta (Excelissä sen menetelmät toteutetaan sisäänrakennettujen funktioiden avulla), meidän on heti siirryttävä tarkastelemaan erityinen ongelma. Olkoon X siis ruokakaupan myyntipinta-ala neliömetrinä mitattuna ja Y vuosiliikevaihto miljoonissa ruplissa mitattuna. On tehtävä ennuste liikevaihdosta (Y), jos sillä on tätä tai toista myyntitilaa. On selvää, että funktio Y = f (X) kasvaa, koska hypermarket myy enemmän tavaraa kuin kioski. Oletetaan, että meillä on taulukko, joka on rakennettu käyttämällä n myymälän tietoja. Matemaattisten tilastojen mukaan tulokset ovat enemmän tai vähemmän oikeita, jos tutkitaan vähintään 5-6 kohteen tietoja. Lisäksi "poikkeavia" tuloksia ei voida käyttää. Erityisesti eliittipienen putiikin liikevaihto voi olla useita kertoja suurempi kuin "masmarket"-luokan suurten vähittäismyyntipisteiden liikevaihto. Taulukon tiedot voidaan kuvata suorakulmaisessa tasossa pisteiden M 1 (x 1, y 1), ... M n (x n, y n) muodossa. Nyt tehtävän ratkaisu pelkistetään approksimoivan funktion y = f (x) valintaan, jonka graafi kulkee mahdollisimman läheltä pisteitä M 1, M 2, .. M n. Tietysti voit käyttää korkean asteen polynomia, mutta tämä vaihtoehto ei ole vain vaikea toteuttaa, vaan myös yksinkertaisesti virheellinen, koska se ei heijasta päätrendiä, joka on havaittava. Järkevin ratkaisu on etsiä suoraa y = ax + b, joka parhaiten approksimoi kokeellista dataa tai tarkemmin sanottuna kertoimia a ja b. Millä tahansa likiarvolla sen tarkkuuden arvioiminen on erityisen tärkeää. Merkitään e i:llä pisteen x i toiminnallisten ja kokeellisten arvojen ero (poikkeama), eli e i = y i - f (x i). On selvää, että arvioidaksesi likiarvon tarkkuutta, voit käyttää poikkeamien summaa, eli kun valitset suoran X:n riippuvuuden likimääräiselle esitykselle Y:stä, sinun tulee antaa etusijalle se, jonka arvo on pienin. summa e i kaikissa tarkasteltavissa olevissa kohdissa. Kaikki ei kuitenkaan ole niin yksinkertaista, koska positiivisten poikkeamien ohella on myös negatiivisia. Ongelma voidaan ratkaista poikkeamamoduuleilla tai niiden neliöillä. Viimeinen menetelmä on yleisimmin käytetty. Sitä käytetään monilla aloilla, mukaan lukien regressioanalyysi (toteutettu Excelissä kahdella sisäänrakennetulla funktiolla), ja se on pitkään osoittanut tehokkuutensa. Kuten tiedät, Excelissä on sisäänrakennettu AutoSum-toiminto, jonka avulla voit laskea kaikkien valitulla alueella sijaitsevien arvojen arvot. Näin ollen mikään ei estä meitä laskemasta lausekkeen arvoa (e 1 2 + e 2 2 + e 3 2 + ... e n 2). Matemaattisessa merkinnässä tämä näyttää tältä: Koska päätös tehtiin alun perin likimääräiseksi suoralla viivalla, meillä on: Siten tehtävä löytää suora, joka parhaiten kuvaa suureiden X ja Y ominaisriippuvuutta, tulee laskemaan kahden muuttujan funktion minimi: Tätä varten sinun on rinnastettava uusien muuttujien a ja b osittaiset derivaatat nollaan ja ratkaistava primitiivinen järjestelmä, joka koostuu kahdesta yhtälöstä, joissa on 2 muodoltaan tuntematonta: Muutaman yksinkertaisen muunnoksen jälkeen, mukaan lukien jakaminen kahdella ja summien manipulointi, saamme: Ratkaisemalla sen esimerkiksi Cramerin menetelmällä saamme stationaarisen pisteen tietyillä kertoimilla a * ja b *. Tämä on minimi, eli liikkeen liikevaihdon ennustamiseen tietyllä alueella sopii suora y = a * x + b *, joka on regressiomalli kyseessä olevalle esimerkille. Tarkkaa tulosta ei tietenkään löydy, mutta se auttaa saamaan käsityksen siitä, kannattaako tietyn alueen ostaminen kauppaluotolla. Excelissä on toiminto arvojen laskemiseen pienimmän neliösumman avulla. Sillä on seuraava muoto: "TREND" (tunnetut Y-arvot; tunnetut X-arvot; uudet X-arvot; vakio). Sovelletaan OLS:n laskentakaavaa Excelissä taulukkoomme. Tätä varten syötä "="-merkki soluun, jossa Excelin pienimmän neliösumman menetelmällä suoritetun laskennan tulos tulee näkyä, ja valitse "TREND"-funktio. Täytä avautuvassa ikkunassa tarvittavat kentät korostaen: Lisäksi kaava sisältää loogisen muuttujan "Const". Jos syötät 1 vastaavaan kenttään, sinun tulee suorittaa laskelmat olettaen, että b = 0. Jos sinun on selvitettävä ennuste useammalle kuin yhdelle x-arvolle, kaavan syöttämisen jälkeen sinun ei pitäisi painaa "Enter", vaan sinun on kirjoitettava näppäimistöllä yhdistelmä "Shift" + "Control" + "Enter". Regressioanalyysi voi olla jopa nukkejen saatavilla. Excel-kaavaa tuntemattomien muuttujien joukon arvon ennustamiseen – TREND – voivat käyttää myös ne, jotka eivät ole koskaan kuulleet pienimmän neliösumman käytöstä. Riittää, kun tietää joitakin sen työn ominaisuuksia. Erityisesti: Toteutettu useilla toiminnoilla. Yksi niistä on nimeltään "PREDICTION". Se on samanlainen kuin "TREND", eli se antaa laskelmien tuloksen pienimmän neliösumman menetelmällä. Kuitenkin vain yhdelle X:lle, jonka Y:n arvoa ei tunneta. Nyt tiedät Excelissä kaavoja nukkeja varten, joiden avulla voit ennustaa tietyn indikaattorin tulevan arvon lineaarisen trendin mukaan. Yksi menetelmistä ominaisuuksien välisten stokastisten suhteiden tutkimiseksi on regressioanalyysi. Useimmiten käytetään parametrien arvioimiseen pienimmän neliösumman menetelmä (LSM).
Ongelma lineaarisen pariyhtälön parametrien estimoimiseksi pienimmän neliösumman menetelmällä on seuraava: saada sellaiset parametrien estimaatit , joissa tuloksena olevan ominaisuuden - y i - todellisten arvojen neliöpoikkeamien summa lasketuista arvoista on minimaalinen. Havainnollistetaan pointtia klassinen pienimmän neliösumman menetelmä graafisesti. Tätä varten rakennetaan havaintodataan (x i, y i, i=1;n) perustuva sirontakuvaaja suorakaiteen muotoiseen koordinaattijärjestelmään (tällaista sirontakuvaajaa kutsutaan korrelaatiokentällä). Yritetään valita suora, joka on lähinnä korrelaatiokentän pisteitä. Pienimmän neliösumman menetelmän mukaan viiva valitaan siten, että korrelaatiokentän pisteiden ja tämän suoran välisten pystyetäisyyksien neliöiden summa on minimaalinen. Ominaisuuksien välisen suhteen läheisyyden arviointi
suoritetaan käyttämällä lineaarista parikorrelaatiokerrointa - r x,y. Se voidaan laskea kaavalla: pöytä 1
– päivittäistavarakaupan vuosiliikevaihto, miljoonaa ruplaa.
Ruokakaupoissa mielestäni kaikki on selvää: - tämä on 1. myymälän pinta-ala, - sen vuosiliikevaihto, - 2. myymälän pinta-ala, - sen vuosiliikevaihto jne. Muuten, turvaluokiteltuihin aineistoihin pääsy ei ole ollenkaan välttämätöntä - melko tarkka arvio kaupan liikevaihdosta voidaan saada matemaattiset tilastot. Älkäämme kuitenkaan hämmentykö, kaupallinen vakoilukurssi on jo maksettu =). Tätä toimintoa kutsutaan likimääräinen
(likiarvo - likiarvo) tai teoreettinen toiminto
. Yleisesti ottaen tässä ilmestyy heti ilmeinen "kilpailija" - korkean asteen polynomi, jonka kuvaaja kulkee KAIKKI pisteet. Mutta tämä vaihtoehto on monimutkainen ja usein yksinkertaisesti väärä. (koska kaavio "kiertelee" koko ajan ja heijastaa huonosti päätrendiä).
Kuinka arvioida tämän likiarvon tarkkuus? Lasketaan myös erot (poikkeamat) kokeellisten ja toiminnallisten arvojen välillä (tutkimme piirustusta). Ensimmäinen ajatus joka tulee mieleen on arvioida kuinka suuri summa on, mutta ongelmana on, että erot voivat olla negatiivisia (Esimerkiksi, )
ja tällaisesta summauksesta johtuvat poikkeamat kumoavat toisensa. Siksi arviona likiarvon tarkkuudesta on otettava summa moduulit poikkeamat:
tai romahtanut: (jos joku ei tiedä:
on summakuvake ja
- apu "laskuri" muuttuja, joka ottaa arvot 1: stä
)
.
, jonka jälkeen pyritään valitsemaan funktio, joka on neliöityjen poikkeamien summa
oli mahdollisimman pieni. Itse asiassa tästä menetelmän nimi tulee.
piirustukseen ja analysoida niiden sijaintia. Jos niillä on tapana kulkea suorassa linjassa, sinun tulee etsiä suoran yhtälö
optimaalisilla arvoilla ja . Toisin sanoen tehtävänä on löytää SELLISIÄ kertoimia niin, että neliöpoikkeamien summa on pienin.
– ne, jotka antavat pienimmän neliösumman
.
oli pienin. Kaikki on tavalliseen tapaan - ensin Ensimmäisen asteen osajohdannaiset. Mukaan lineaarisuussääntö Voit tehdä eron suoraan summakuvakkeen alla:
jonka jälkeen algoritmi ongelmamme ratkaisemiseksi alkaa syntyä:voimmeko löytää sen? Helposti. Tehdään yksinkertaisin kahden lineaarisen yhtälön järjestelmä kahdessa tuntemattomassa("a" ja "olla"). Ratkaisemme järjestelmän mm. Cramerin menetelmä, jonka seurauksena saamme stationaarisen pisteen. Tarkistetaan riittävä kunto ääripäälle, voimme varmistaa, että tässä vaiheessa funktio
saavuttaa täsmälleen minimi. Tarkastukseen liittyy lisälaskelmia, joten jätämme sen kulissien taakse (tarvittaessa puuttuvaa kehystä voi katsoaTässä
)
. Teemme lopullisen johtopäätöksen:
paras tapa (ainakin verrattuna muihin lineaarisiin funktioihin) tuo koepisteitä lähemmäksi
. Karkeasti ottaen sen kaavio kulkee mahdollisimman läheltä näitä pisteitä. Perinteessä ekonometria kutsutaan myös tuloksena olevaa approksimointifunktiota pari yhtälö lineaarinen regressio
.
voit ennustaa kaupan liikevaihtoa ("Igrek") myymälällä on jokin myyntialueen arvo (X:n yksi tai toinen merkitys). Kyllä, tuloksena oleva ennuste on vain ennuste, mutta monissa tapauksissa se osoittautuu melko tarkkaksi.
Etsi pienimmän neliösumman menetelmällä lineaarinen funktio, joka parhaiten approksimoi empiiristä (kokenut) tiedot. Tee piirros, jolle voit rakentaa kokeellisia pisteitä, ja kuvaaja approksimoivasta funktiosta suorakulmaisessa koordinaattijärjestelmässä . Laske empiiristen ja teoreettisten arvojen neliöityjen poikkeamien summa. Ota selvää, olisiko ominaisuus parempi (pienimpien neliöiden menetelmän näkökulmasta) tuo koepisteitä lähemmäksi.
Laskelmat voidaan suorittaa mikrolaskimella, mutta on paljon parempi käyttää Exceliä - sekä nopeammin että ilman virheitä; katso lyhyt video:
, mikä tarkoittaa, että järjestelmässä on ainutlaatuinen ratkaisu.
Vastaavien yhtälöiden oikeat puolet saadaan, mikä tarkoittaa, että järjestelmä on ratkaistu oikein.kertoo meille, että kun tiettyä indikaattoria lisätään 1 yksiköllä, riippuvan indikaattorin arvo pienenee keskiverto 0,65 yksiköllä. Kuten sanotaan, mitä korkeampi tattari maksaa, sitä vähemmän sitä myydään.
Muodostettua suoraa kutsutaan trendiviiva
(eli lineaarinen trendiviiva, eli yleisessä tapauksessa trendi ei välttämättä ole suora). Kaikille on tuttu ilmaus "olla trendissä", eikä tämä termi mielestäni kaipaa lisäkommentteja.empiiristen ja teoreettisten arvojen välillä. Geometrisesti tämä on "vadelma" -osien pituuksien neliöiden summa (joista kaksi on niin pieniä, että niitä ei edes näy).
Jälleen ne voidaan tehdä manuaalisesti; varmuuden vuoksi annan esimerkin ensimmäisestä kohdasta:
mutta on paljon tehokkaampaa tehdä se jo tunnetulla tavalla:indikaattori on pienin, eli perheessään se on paras likiarvo. Ja tässä, muuten, ongelman viimeinen kysymys ei ole sattuma: entä jos ehdotettu eksponentiaalinen funktio
olisiko parempi tuoda koepisteitä lähemmäksi?
Ja vielä, varmuuden vuoksi, laskelmat 1. pisteestä:
Excelissä käytämme vakiofunktiota EXP (syntaksi löytyy Excelin ohjeesta). .
- niin paljon, että ilman analyyttistä tutkimusta on vaikea sanoa, kumpi funktio on tarkempi.
Määritä heinäkuun liikevaihdon volyymi analyyttisen suoraviivauksen avulla.(merkitään se tähdellä) korvataan "x":llä. No entä summat?
laskea, jonka jälkeen optimaalisiin kertoimiin "a" ja "be" käden ulottuvilla.
sijaitsevat logaritmisella käyrällä, niin optimaalisten arvojen löytämiseksi löydämme funktion minimin
. Muodollisesti järjestelmässä (*) on korvattava seuraavalla:
optimaalinen paraabeli
, pitäisi löytyä kolmen muuttujan vähimmäisfunktio
. Vakiotoimintojen suorittamisen jälkeen saamme seuraavan "toimivan" järjestelmä:
ja valitse vaihtoehto hiiren oikealla painikkeella "Lisää trendiviiva". Valitse seuraavaksi kaavion tyyppi ja välilehdeltä "Vaihtoehdot" aktivoi vaihtoehto "Näytä yhtälö kaaviossa". OK
Myymälän numero Vuotuinen liikevaihto, miljoonaa ruplaa. Liiketila, tuhat m2
19,76
0,24
38,09
0,31
40,95
0,55
41,08
0,48
56,29
0,78
68,51
0,98
75,01
0,94
89,05
1,21
91,13
1,29
91,26
1,12
99,84
1,29
108,55
1,49
t y t x 1t v t 2 x 1t 2 x 1t y t
19,76
0,24
390,4576
0,0576
4,7424
38,09
0,31
1450,8481
0,0961
11,8079
40,95
0,55
1676,9025
0,3025
22,5225
41,08
0,48
1687,5664
0,2304
19,7184
56,29
0,78
3168,5641
0,6084
43,9062
68,51
0,98
4693,6201
0,9604
67,1398
75,01
0,94
5626,5001
0,8836
70,5094
89,05
1,21
7929,9025
1,4641
107,7505
91,13
1,29
8304,6769
1,6641
117,5577
91,26
1,12
8328,3876
1,2544
102,2112
99,84
1,29
9968,0256
1,6641
128,7936
108,55
1,49
11783,1025
2,2201
161,7395
S 819,52
10,68
65008,554
11,4058
858,3991
Keskiverto 68,29
0,89
t x 2t x 2t 2 v t x 2t x 1t x 2t
8,25
68,0625
163,02
1,98
10,24
104,8575
390,0416
3,1744
9,31
86,6761
381,2445
5,1205
11,01
121,2201
452,2908
5,2848
8,54
72,9316
480,7166
6,6612
7,51
56,4001
514,5101
7,3598
12,36
152,7696
927,1236
11,6184
10,81
116,8561
962,6305
13,0801
9,89
97,8121
901,2757
12,7581
13,72
188,2384
1252,0872
15,3664
12,27
150,5529
1225,0368
15,8283
13,92
193,7664
1511,016
20,7408
S 127,83
1410,44
9160,9934
118,9728
Keskiverto 10,65
-48,53
-2,40
5,7720
116,6013
-30,20
-0,41
0,1702
12,4589
-27,34
-1,34
1,8023
36,7084
-27,21
0,36
0,1278
-9,7288
-12,00
-2,11
4,4627
25,3570
0,22
-3,14
9,8753
-0,6809
6,72
1,71
2,9156
11,4687
20,76
0,16
0,0348
3,2992
22,84
-0,76
0,5814
-17,413
22,97
3,07
9,4096
70,4503
31,55
1,62
2,6163
51,0267
40,26
3,27
10,6766
131,5387
Määrä
48,4344
431,0566
approksimoi paremmin alkuperäistä dataa, eli tekee arvion pienimmän neliösumman menetelmällä.
oli ehdottomasti positiivinen. Näytä se.
ja elementtien arvot eivät riipu A Ja b.. Epätasa-arvo on tiukka, koska pistettä
- m-asteisen approksimoivan polynomin tuntemattomat kertoimet;
. Tuloksena saamme seuraavan yhtälöjärjestelmän:
- yhtälöjärjestelmän neliömatriisin sarakkeen numeron indeksi
- yhtälöjärjestelmän neliömatriisin rivinumeron indeksi
Ongelman selvitys tietyllä esimerkillä
Muutama sana ennustukseen käytettyjen lähtötietojen oikeellisuudesta
Menetelmän ydin
Tarkkuusarviointi
Pienimmän neliön menetelmä
Kuinka ottaa pienimmän neliösumman käyttöön Excelissä
Jotkut ominaisuudet
PREDICTION-toiminto
Regressioanalyysi on regressioyhtälön johtaminen, jonka avulla saadaan satunnaismuuttujan (tulosattribuutin) keskiarvo, jos toisen (tai muun) muuttujan (tekijä-attribuutin) arvo tunnetaan. Se sisältää seuraavat vaiheet:
Useimmiten lineaarista muotoa käytetään kuvaamaan piirteiden tilastollista suhdetta. Lineaarisiin suhteisiin keskittyminen selittyy sen parametrien selkeällä taloudellisella tulkinnalla, muuttujien rajoitetulla vaihtelulla ja sillä, että useimmissa tapauksissa epälineaariset suhdemuodot muunnetaan (logaritmilla tai muuttujien korvaamalla) lineaariseen muotoon laskelmien suorittamista varten. .
Lineaarisen parittaisen suhteen tapauksessa regressioyhtälö saa muotoa: y i =a+b·x i +u i . Tämän yhtälön parametrit a ja b on arvioitu tilastollisista havaintotiedoista x ja y. Tällaisen arvioinnin tulos on yhtälö: , jossa , ovat parametrien a ja b estimaatteja, on regressioyhtälöstä saadun attribuutin (muuttujan) arvo (laskettu arvo).
Pienimmän neliösumman menetelmä tarjoaa parhaat (yhdenmukaiset, tehokkaat ja puolueettomat) estimaatit regressioyhtälön parametreille. Mutta vain, jos tietyt satunnaistermiä (u) ja riippumatonta muuttujaa (x) koskevat oletukset täyttyvät (katso OLS-oletukset).
Muodollisesti OLS-kriteeri voidaan kirjoittaa näin: .
Pienimmän neliösumman menetelmien luokittelu
Tämän ongelman matemaattinen merkintä: .
Arvot y i ja x i =1...n ovat meille tiedossa, nämä ovat havaintotietoja. S-funktiossa ne edustavat vakioita. Tämän funktion muuttujat ovat parametrien - , . Kahden muuttujan funktion minimin löytämiseksi on tarpeen laskea tämän funktion osittaiset derivaatat kullekin parametrille ja rinnastaa ne nollaan, ts. .
Tuloksena saamme kahden normaalin lineaarisen yhtälön järjestelmän:
Ratkaisemalla tämän järjestelmän löydämme tarvittavat parametriarviot:
Regressioyhtälön parametrien laskennan oikeellisuus voidaan tarkistaa vertaamalla summia (laskelmien pyöristämisestä voi aiheutua eroja).
Voit laskea parametriarviot rakentamalla taulukon 1.
Regressiokertoimen b etumerkki ilmaisee suhteen suunnan (jos b >0, suhde on suora, jos b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Muodollisesti parametrin a arvo on y:n keskiarvo, kun x on nolla. Jos attribuuttitekijällä ei ole eikä voi olla nolla-arvoa, niin yllä oleva parametrin a tulkinta ei ole järkevä.. Lisäksi lineaarinen parikorrelaatiokerroin voidaan määrittää regressiokertoimella b:
.
Lineaarisen parin korrelaatiokertoimen hyväksyttävien arvojen alue on -1 - +1. Korrelaatiokertoimen etumerkki ilmaisee suhteen suunnan. Jos r x, y >0, yhteys on suora; jos r x, y<0, то связь обратная.
Jos tämä kerroin on suuruudeltaan lähellä yksikköä, ominaisuuksien välinen suhde voidaan tulkita melko läheiseksi lineaariseksi. Jos sen moduuli on yhtä suuri kuin yksi ê r x , y ê =1, niin ominaisuuksien välinen suhde on funktionaalinen lineaarinen. Jos ominaisuudet x ja y ovat lineaarisesti riippumattomia, niin r x,y on lähellä nollaa.
Voit myös käyttää taulukkoa 1 laskeaksesi r x,y.
Tuloksena olevan regressioyhtälön laadun arvioimiseksi laske teoreettinen määrityskerroin - R 2 yx: N havaintoja x i y i x i ∙y i
1
x 1 v 1 x 1 v 1
2
x 2 v 2 x 2 v 2
...
n x n y n x n y n
Sarakkeen summa ∑x ∑y ∑xy
Keskiarvo
,
missä d 2 on y:n varianssi, joka on selitetty regressioyhtälöllä;
e 2 - y:n jäännösvarianssi (regressioyhtälön selittämätön);
s 2 y - y:n kokonaisvarianssi.
Determinaatiokerroin kuvaa regressiolla selitetyn regression (ja siten tekijän x) y:n variaation (dispersion) osuutta kokonaisvariaatiossa (dispersiossa) y. Determinaatiokerroin R 2 yx saa arvot välillä 0 - 1. Vastaavasti arvo 1-R 2 yx kuvaa varianssin y osuutta, joka aiheutuu muiden mallissa huomioimattomien tekijöiden vaikutuksesta ja spesifikaatiovirheistä.
Lineaarisella regressiolla R 2 yx = r 2 yx.