Tilastosarjojen käsite ja tyypit. Jakaumasarjat tilastoissa

Sosioekonomisten ilmiöiden ja prosessien tutkimuksen tärkein vaihe on perustiedon systematisointi ja sen pohjalta koko objektin ominaispiirteen saaminen yleisindikaattorein, mikä saavutetaan tiivistämällä ja ryhmittelemällä ensisijaista tilastoaineistoa.

Tilastollinen yhteenveto - Tämä on sarja peräkkäisiä operaatioita, joilla yleistetään tiettyjä yksittäisiä tosiasioita, jotka muodostavat joukon, jotta voidaan tunnistaa tyypilliset piirteet ja mallit, jotka ovat luontaisia ​​tutkittavalle ilmiölle kokonaisuutena. Tilastollisen yhteenvedon tekeminen sisältää seuraavat vaiheet :

  • ryhmittelyominaisuuksien valinta;
  • ryhmän muodostusjärjestyksen määrittäminen;
  • tilastollisten indikaattorien järjestelmän kehittäminen ryhmien ja kohteen karakterisoimiseksi kokonaisuutena;
  • tilastotaulukoiden asettelujen kehittäminen yhteenvetotulosten esittämiseksi.

Tilastollinen ryhmittely Sitä kutsutaan tutkittavan populaation yksiköiden jakamiseksi homogeenisiin ryhmiin tiettyjen niille olennaisten ominaisuuksien mukaan. Ryhmittelyt ovat tärkein tilastollinen tilastotietojen yhteenvetomenetelmä, perusta tilastollisten tunnuslukujen oikealle laskennalle.

Seuraavat ryhmittelytyypit erotellaan: typologinen, rakenteellinen, analyyttinen. Kaikkia näitä ryhmittelyjä yhdistää se, että kohteen yksiköt on jaettu ryhmiin jonkin ominaisuuden mukaan.

Ryhmittelyominaisuus on ominaisuus, jolla populaation yksiköt jaetaan erillisiin ryhmiin. Tilastollisen tutkimuksen päätelmät riippuvat ryhmittelyominaisuuden oikeasta valinnasta. Ryhmittelyn perustana on käytettävä merkittäviä, teoreettisesti perustuvia ominaisuuksia (kvantitatiivisia tai laadullisia).

Ryhmittelyn määrälliset ominaisuudet niillä on numeerinen lauseke (kaupankäyntimäärä, henkilön ikä, perheen tulot jne.) ja laadullisia ryhmittymisen merkkejä kuvastaa väestöyksikön tilaa (sukupuoli, Perhetilanne, yrityksen toimiala, sen omistusmuoto jne.).

Kun ryhmittelyn perusteet on selvitetty, on ratkaistava kysymys ryhmien lukumäärästä, joihin tutkittava populaatio tulisi jakaa. Ryhmien lukumäärä riippuu tutkimuksen tavoitteista ja ryhmittelyn taustalla olevan indikaattorin tyypistä, populaation määrästä ja ominaisuuden vaihteluasteesta.

Esimerkiksi yritysten ryhmittelyssä omistustyypin mukaan otetaan huomioon kuntien, liittovaltion ja liittovaltion subjektiomaisuus. Jos ryhmittely suoritetaan määrällisen kriteerin mukaan, on tarpeen kiinnittää erityistä huomiota tutkittavan kohteen yksikkömäärään ja ryhmittelyominaisuuden vaihteluasteeseen.

Kun ryhmien lukumäärä on määritetty, on määritettävä ryhmittelyvälit. Intervalli - nämä ovat vaihtelevan ominaisuuden arvoja, jotka sijaitsevat tietyissä rajoissa. Jokaisella intervallilla on oma arvonsa, ylä- ja alaraja tai ainakin yksi niistä.

Intervallin alaraja kutsutaan ominaisuuden pienimmäksi arvoksi välissä, ja yläraja - ominaisuuden suurin arvo välissä. Välin arvo on ylä- ja alarajan välinen ero.

Ryhmittelyvälit koostaan ​​riippuen ovat: yhtäläiset ja eriarvoiset. Jos ominaisuuden vaihtelu ilmenee suhteellisen kapeissa rajoissa ja jakauma on tasainen, niin ryhmä rakennetaan tasavälein. Samanvälin arvo määritetään seuraavalla kaavalla :

missä Xmax, Xmin ovat ominaisuuden enimmäis- ja vähimmäisarvot aggregaatissa; n - ryhmien lukumäärä.

Yksinkertaisin ryhmittely, jossa jokaiselle valitulle ryhmälle on tunnusomaista yksi indikaattori, edustaa jakaumasarjaa.

Tilastollinen jakaumasarja - tämä on väestöyksiköiden järjestynyt jakautuminen ryhmiin tietyn ominaisuuden mukaan. Jakaumasarjan muodostumisen taustalla olevasta ominaispiirteestä riippuen erotetaan attribuutio- ja variaatiojakaumasarjat.

Attribuuttinen kutsutaan jakautumissarjoiksi, jotka on rakennettu laadullisten ominaisuuksien mukaan, eli ominaisuuksilla, joilla ei ole numeerista ilmaisua (jakauma työn tyypin, sukupuolen, ammatin mukaan jne.). Attribuutiojakaumasarjat kuvaavat väestön koostumusta tiettyjen olennaisten ominaisuuksien mukaan. Useiden ajanjaksojen aikana nämä tiedot mahdollistavat rakenteen muutosten tutkimisen.

Variaatiosarja kutsutaan jakauman sarjoiksi, jotka on konstruoitu kvantitatiivisesti. Mikä tahansa variaatiosarja koostuu kahdesta elementistä: vaihtoehdoista ja taajuuksista. Vaihtoehdot kutsutaan ominaisuuden yksittäisiä arvoja, jotka se ottaa vaihtelusarjassa, eli muuttuvan ominaisuuden ominaisarvoksi.

Taajuudet kutsutaan yksittäisten varianttien tai variaatiosarjan ryhmien numeroita, eli nämä ovat numeroita, jotka osoittavat, kuinka usein tietyt variantit esiintyvät jakautumissarjoissa. Kaikkien taajuuksien summa määrittää koko populaation koon, sen tilavuuden. Taajuudet Niitä kutsutaan taajuuksiksi, jotka ilmaistaan ​​yksikön murto-osina tai prosentteina kokonaismäärästä. Vastaavasti taajuuksien summa on 1 tai 100 %.

Ominaisuuden vaihtelun luonteesta riippuen erotetaan kolme vaihtelusarjan muotoa: rankattu sarja, diskreettisarja ja intervallisarja.

Sijoitettu variaatiosarja - tämä on populaation yksittäisten yksiköiden jakautuminen tutkittavan ominaisuuden nousevassa tai laskevassa järjestyksessä. Luokituksen avulla voit helposti jakaa kvantitatiiviset tiedot ryhmiin, havaita välittömästi pienimmät ja korkein arvo ominaisuus, korosta arvot, jotka useimmiten toistuvat.

Diskreetti variaatiosarja luonnehtii populaatioyksiköiden jakautumista diskreetin ominaisuuden mukaan, joka ottaa vain kokonaislukuja. Esimerkiksi, tariffiluokka, lasten lukumäärä perheessä, työntekijöiden määrä yrityksessä jne.

Jos ominaisuudella on jatkuva muutos, joka tietyissä rajoissa voi saada mitä tahansa arvoa (" - -"), niin tälle ominaisuudelle on tarpeen rakentaa intervallivaihtelusarja . Esimerkiksi tulojen määrä, palvelusaika, yrityksen käyttöomaisuuden kustannukset jne.

Esimerkkejä ongelmien ratkaisemisesta aiheesta "Tilastollinen yhteenveto ja ryhmittely"

Ongelma 1 . Siellä on tietoa opiskelijoiden tilausten kautta saamien kirjojen määrästä kuluneen lukuvuoden aikana.

Muodosta rankattu ja diskreetti variaatiojakaumasarja, joka määrittelee sarjan elementit.

Ratkaisu

Tämä sarja edustaa monia vaihtoehtoja opiskelijoiden saamien kirjojen määrälle. Lasketaan tällaisten vaihtoehtojen lukumäärä ja järjestellään ne variaatiojärjestetyiksi jaksi.

Ongelma 2 . Tietoja käyttöomaisuuden kustannuksista on 50 yritykseltä, tuhatta ruplaa.

Muodosta jakelusarja, jossa korostetaan 5 yritysryhmää (tasaisin väliajoin).

Ratkaisu

Ratkaisua varten valitsemme suurimman ja pienin arvo yritysten käyttöomaisuuden arvo. Nämä ovat 30,0 ja 10,2 tuhatta ruplaa.

Etsitään välin koko: h = (30,0-10,2):5 = 3,96 tuhatta ruplaa.

Sitten ensimmäiseen ryhmään kuuluvat yritykset, joiden käyttöomaisuus on 10,2 tuhatta ruplaa. jopa 10,2+3,96=14,16 tuhatta ruplaa. Tällaisia ​​yrityksiä tulee olemaan 9. Toiseen ryhmään kuuluvat yritykset, joiden käyttöomaisuus on alkaen 14,16 tuhatta ruplaa. 14,16 + 3,96 = 18,12 tuhatta ruplaa asti. Tällaisia ​​yrityksiä tulee olemaan 16. Vastaavasti löydämme kolmanteen, neljänteen ja viidenteen ryhmään kuuluvien yritysten lukumäärän.

Sijoitamme tuloksena saadut jakaumasarjat taulukkoon.

Ongelma 3 . Seuraavat tiedot saatiin useista kevyen teollisuuden yrityksistä:

Ryhmittele yritykset työntekijöiden lukumäärän mukaan muodostaen 6 ryhmää tasavälein. Laske jokaiselle ryhmälle:

1. yritysten lukumäärä
2. työntekijöiden lukumäärä
3. tuotettujen tuotteiden määrä vuodessa
4. keskimääräinen todellinen tuotanto työntekijää kohti
5. käyttöomaisuuden määrä
6. yhden yrityksen käyttöomaisuuden keskimääräinen koko
7. yhden yrityksen tuottamien tuotteiden keskiarvo

Esitä laskennan tulokset taulukoina. Tehdä johtopäätös.

Ratkaisu

Ratkaisua varten valitsemme suurimmat ja pienimmät arvot yrityksen keskimääräisestä työntekijöiden lukumäärästä. Nämä ovat 43 ja 256.

Selvitetään välin koko: h = (256-43):6 = 35,5

Tällöin ensimmäiseen ryhmään kuuluvat yritykset, joiden keskimääräinen työntekijämäärä on 43-43 + 35,5 = 78,5 henkilöä. Tällaisia ​​yrityksiä tulee olemaan 5. Toiseen ryhmään kuuluvat yritykset, joiden keskimääräinen työntekijämäärä on 78,5-78,5+35,5=114 henkilöä. Tällaisia ​​yrityksiä tulee olemaan 12. Vastaavasti löydämme kolmanteen, neljänteen, viidenteen ja kuudenteen ryhmään kuuluvien yritysten lukumäärän.

Sijoitamme tuloksena saadut jakautumissarjat taulukkoon ja laskemme tarvittavat indikaattorit jokaiselle ryhmälle:

Johtopäätös : Kuten taulukosta voidaan nähdä, toinen ryhmä yrityksiä on lukuisin. Siihen kuuluu 12 yritystä. Pienimmät ryhmät ovat viides ja kuudes ryhmä (kaksi yritystä kummassakin). Nämä ovat suurimmat yritykset (työntekijöiden lukumäärällä mitattuna).

Koska toinen ryhmä on suurin, tämän ryhmän yritysten vuotuiset tuotemäärät ja käyttöomaisuuden volyymit ovat huomattavasti muita suurempia. Samanaikaisesti tämän ryhmän yritysten keskimääräinen todellinen tuotanto työntekijää kohti ei ole suurin. Neljännen ryhmän yritykset johtavat täällä. Tähän ryhmään kuuluu myös melko suuri määrä käyttöomaisuutta.

Yhteenvetona voidaan todeta, että kiinteän omaisuuden keskikoko ja yhden yrityksen tuottaman tuotannon keskimääräinen määrä ovat suoraan verrannollisia yrityksen kokoon (työntekijöiden lukumäärällä mitattuna).

Ne esitetään jakelusarjojen muodossa ja esitetään muodossa.

Jakelusarja on yksi ryhmittelytyypeistä.

Jakelualue— edustaa tutkittavan populaation yksiköiden järjestettyä jakautumista ryhmiin tietyn vaihtelevan ominaisuuden mukaan.

Jakelusarjan muodostumisen taustalla olevan ominaisuuden mukaan ne erotetaan toisistaan attribuutio ja variaatio jakelurivit:

  • Attribuuttinen- kutsutaan jakaumasarjoiksi, jotka on muodostettu laadullisten ominaisuuksien mukaan.
  • Jakaumasarjoja, jotka on muodostettu määrällisen ominaisuuden arvojen nousevassa tai laskevassa järjestyksessä, kutsutaan vaihtelevaa.
Jakauman variaatiosarja koostuu kahdesta sarakkeesta:

Ensimmäinen sarake tarjoaa muuttuvan ominaisuuden kvantitatiiviset arvot, joita kutsutaan vaihtoehtoja ja on nimetty. Diskreetti vaihtoehto - ilmaistaan ​​kokonaislukuna. Intervallivaihtoehto vaihtelee välillä ja -. Vaihtoehtojen tyypistä riippuen voit muodostaa diskreetin tai intervallivaihtelusarjan.
Toinen sarake sisältää tietyn vaihtoehdon määrä, ilmaistuna taajuuksina tai taajuuksina:

Taajuudet- Nämä ovat absoluuttisia lukuja, jotka osoittavat, kuinka monta kertaa tietty ominaisuuden arvo esiintyy aggregaatissa, mikä tarkoittaa . Kaikkien taajuuksien summan tulee olla yhtä suuri kuin yksiköiden lukumäärä koko populaatiossa.

Taajuudet() ovat taajuuksia ilmaistuna prosentteina kokonaismäärästä. Kaikkien taajuuksien summan prosentteina ilmaistuna on oltava 100 % ykkösen murto-osina.

Graafinen esitys jakelusarjoista

Jakelusarjat esitetään visuaalisesti graafisten kuvien avulla.

Jakelusarjat on kuvattu seuraavasti:
  • Monikulmio
  • Histogrammit
  • Kumuloituu
  • Ogives

Monikulmio

Monikulmiota rakennettaessa muuttuvan ominaisuuden arvot piirretään vaaka-akselille (x-akseli) ja taajuudet tai taajuudet piirretään pystyakselille (y-akseli).

Kuvan monikulmio. 6.1 perustuu Venäjän vuoden 1994 mikrolaskennan tietoihin.

6.1. Kotitalouksien kokojakauma

Kunto: Tiedot toimitetaan yhden yrityksen 25 työntekijän jakautumisesta tariffiluokkien mukaan:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Tehtävä: Muodosta diskreetti variaatiosarja ja kuvaa se graafisesti jakelupolygonina.
Ratkaisu:
Tässä esimerkissä vaihtoehdot ovat työntekijän palkkaluokka. Taajuuksien määrittämiseksi on tarpeen laskea työntekijöiden määrä vastaavalla tariffiluokalla.

Monikulmiota käytetään diskreeteille variaatiosarjoille.

Jakaumapolygonin (kuva 1) muodostamiseksi piirrämme vaihtelevan ominaisuuden kvantitatiiviset arvot - variantit - abskissa (X) -akselia pitkin ja taajuudet tai taajuudet ordinaattiselle akselille.

Jos ominaisuuden arvot ilmaistaan ​​intervalleina, niin tällaista sarjaa kutsutaan intervalliksi.
Intervallisarja jakaumat on kuvattu graafisesti histogrammin, kumulaation tai ogive-muodossa.

Tilastotaulukko

Kunto: Tiedot talletusten koosta annetaan 20 yksilöitä yhdessä pankissa (tuhatta ruplaa) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Tehtävä: Muodosta intervallivaihtelusarja yhtäläisin välein.
Ratkaisu:

  1. Alkupopulaatio koostuu 20 yksiköstä (N = 20).
  2. Sturgessin kaavalla määritetään tarvittava määrä käytettyjä ryhmiä: n=1+3.322*lg20=5
  3. Lasketaan yhtäläisen välin arvo: i=(152 - 2) /5 = 30 tuhatta ruplaa
  4. Jaetaan alkuperäinen väestö 5 ryhmään 30 tuhannen ruplan välein.
  5. Esitämme ryhmittelytulokset taulukossa:

Tällaisella jatkuvan ominaiskäyrän tallennuksella, kun sama arvo esiintyy kahdesti (yhden intervallin ylärajana ja toisen intervallin alarajana), tämä arvo kuuluu ryhmään, jossa tämä arvo toimii ylärajana.

pylväsdiagrammi

Histogrammin muodostamiseksi välien rajojen arvot osoitetaan abskissa-akselia pitkin ja niiden perusteella muodostetaan suorakulmioita, joiden korkeus on verrannollinen taajuuksiin (tai taajuuksiin).

Kuvassa 6.2. esittää histogrammin Venäjän väestön jakautumisesta vuonna 1997 ikäryhmittäin.

Riisi. 6.2. Venäjän väestön jakautuminen ikäryhmittäin

Kunto: Yrityksen 30 työntekijän kuukausipalkkajakauma on annettu

Tehtävä: Näytä intervallivaihtelusarjat graafisesti histogrammin muodossa ja kumuloi.
Ratkaisu:

  1. Avoimen (ensimmäisen) välin tuntematon raja määräytyy toisen intervallin arvon perusteella: 7000 - 5000 = 2000 ruplaa. Samalla arvolla löydämme ensimmäisen intervallin alarajan: 5000 - 2000 = 3000 ruplaa.
  2. Histogrammin rakentamiseksi suorakaiteen muotoiseen koordinaattijärjestelmään piirrämme abskissa-akselia pitkin segmentit, joiden arvot vastaavat suonikohjujen sarjan välejä.
    Nämä segmentit toimivat alempana pohjana ja vastaava taajuus (taajuus) toimii muodostettujen suorakulmioiden korkeutena.
  3. Rakennetaan histogrammi:

Kumulaattien muodostamiseksi on tarpeen laskea kertyneet taajuudet (taajuudet). Ne määritetään summaamalla peräkkäin aikaisempien intervallien taajuudet (taajuudet) ja merkitään S:llä. Kertyneet taajuudet osoittavat, kuinka monella populaation yksiköllä on ominaisarvo, joka ei ole suurempi kuin tarkasteltavana oleva.

Kumuloituu

Variaatiosarjan ominaisuuden jakautuminen kumuloituneille taajuuksille (taajuuksille) on kuvattu käyttämällä kumulaatiota.

Kumuloituu tai kumulatiivinen käyrä, toisin kuin monikulmio, muodostetaan kertyneistä taajuuksista tai taajuuksista. Tässä tapauksessa ominaisuuden arvot sijoitetaan abskissa-akselille ja kumuloituneet taajuudet tai taajuudet asetetaan ordinaatta-akselille (kuva 6.3).

Riisi. 6.3. Kotitalouden kokojakauman kumulat

4. Lasketaan kertyneet taajuudet:
Ensimmäisen aikavälin kumulatiivinen taajuus lasketaan seuraavasti: 0 + 4 = 4, toiselle: 4 + 12 = 16; kolmannelle: 4 + 12 + 8 = 24 jne.

Kumulaattia muodostettaessa vastaavan intervallin kertynyt taajuus (taajuus) määrätään sen ylärajaan:

Ogiva

Ogiva on rakennettu samalla tavalla kuin kumulaatti, sillä ainoa ero on, että kertyneet taajuudet sijoitetaan abskissa-akselille ja ominaisarvot ordinaattiselle akselille.

Eräs kumulaatin tyyppi on pitoisuuskäyrä tai Lorentzin käyrä. Konsentraatiokäyrän muodostamiseksi piirretään suorakaiteen muotoisen koordinaatiston molemmille akseleille asteikko prosentteina 0-100. Samalla abskissa-akselilla näytetään kertyneet taajuudet ja osuuden kumuloituneet arvot. (prosentteina) ominaisuuden tilavuudesta on merkitty ordinaatta-akselilla.

Ominaisuuden tasainen jakautuminen vastaa kaavion neliön diagonaalia (kuva 6.4). Epätasaisella jakautumisella kaavio edustaa koveraa käyrää piirteen pitoisuustasosta riippuen.

6.4 Pitoisuuskäyrä

Kokeellisessa tutkimuksessa saatu näyte on järjestämätön numerosarja, joka on kirjoitettu siihen järjestykseen, jossa mittaukset tehtiin. Tyypillisesti näyte laaditaan taulukon muotoon, jonka ensimmäisellä rivillä (tai sarakkeella) on koenumero i, ja toisessa (toisessa) - kiinteä arvo Satunnaismuuttuja merkki. Tässä muodossa näyte edustaa ensisijaisesti käsiteltävän tilastollisen materiaalin tallentamista eri tavoilla. Esimerkkinä otetaan huomioon kuulantyöntäjien yleisurheilukilpailuissa taulukossa 1 näkyvät tulokset. Tämän taulukon ensimmäisellä rivillä on mittausten numerot ja toisella - niiden numeeriset arvot metreinä.

pöytä 1

Laukantyöntökilpailun tulokset

x i 16,36 14,91 15,31 14,26 14,77 13,88 14,97 14,01 14,07 14,48
x i 14,44 14,81 13,81 15,15 15,23 15,69 14,29 14,15 14,57 13,92
x i 13,62 14,92 15,73 13,22 14,65 14,8 13,04 15,1 13,3

Kuten taulukosta 1 voidaan nähdä, yksinkertainen tilastollinen aggregaatti lakkaa olemasta kätevä tapa esittää tilastoaineistoa jopa suhteellisen pienellä otoskoolla: se on melko hankala eikä kovin visuaalinen. Saatuja kokeellisia tietoja on erittäin vaikea analysoida, saati tehdä niistä johtopäätöksiä. Tämän perusteella saatu tilastollinen aineisto tulee käsitellä jatkotutkimusta varten. Yksinkertaisin tapa käsitellä näyte on ranking. Ranking tarkoittaa vaihtoehtojen järjestystä nousevaan tai laskevaan järjestykseen niiden arvojen mukaan. Alla olevassa taulukossa 2 on järjestetty otos, jonka elementit on järjestetty nousevaan järjestykseen.

taulukko 2

Ranking-kilpailutulokset kuulantyönnässä

x i 13,04 13,22 13,3 13,62 13,81 13,88 13,92 14,01 14,07 14,15
x i 14,26 14,29 14,44 14,48 14,57 14,65 14,77 14,8 14,81 14,91
x i 14,92 14,97 15,1 15,15 15,23 15,31 15,69 15,73 16,36

Mutta myös tässä muodossa saadut kokeelliset tiedot ovat huonosti näkyviä ja niistä on vähän hyötyä suorassa analyysissä. Siksi tilastoaineiston tiivistämiseksi ja visuaaliseksi tekemiseksi se on alistettava jatkokäsittelyyn - ns. tilastollinen sarja. Tilastosarjan rakentaminen alkaa ryhmittelystä.

Ryhmittely on kokeen aikana saadun tiedon järjestämis- ja systematisointiprosessi, jonka tarkoituksena on poimia niiden sisältämä tieto. Ryhmittelyprosessissa näyte jaetaan ryhmiin tai ryhmittelyväleihin, joista jokainen sisältää tietyn alueen tutkittavan ominaisuuden arvoja. Ryhmittelyprosessi alkaa jakamalla ominaisuuden koko vaihtelualue ryhmittelyväleihin.

Jokaista tilastollisen tutkimuksen erityistä tarkoitusta, tarkasteltavan otoksen kokoa ja siinä olevan ominaisuuden vaihteluastetta varten on optimaalinen arvo intervallien lukumäärälle ja kunkin leveydelle. Intervallien optimaalisen lukumäärän likimääräinen arvo k voidaan määrittää näytteen koon perusteella P joko käyttämällä taulukossa 3 annettuja tietoja tai käyttämällä Sturgessin kaavaa:

k = 1 + 3,322 lg n.

Taulukko 3

Ryhmittelyvälien lukumäärän määrittäminen

Kaavasta saatu arvo k melkein aina osoittautuu murto-osaksi, joka on pyöristettävä kokonaislukuun, koska välien lukumäärä ei voi olla murtoluku. Käytäntö osoittaa, että yleensä on parempi pyöristää alaspäin, koska kaava antaa hyviä tuloksia suurille arvoille n, ja kun se on pieni - hieman yliarvioitu.

Harkitse esimerkkivaihtoehdon ryhmittelyä konkreettinen esimerkki. Katsotaanpa tätä varten esimerkkiä kuulantyöntäjistä (katso taulukot 1, 2). Määritämme ryhmittelyvälien lukumäärän taulukon 3 tietojen perusteella. Otoskoolla n=29 on suositeltavaa valita välien määrä yhtä suuri kuin k=5 (Sturgessin kaava antaa arvon k =5,9).

Sovitaan, että tässä esimerkissä käytetään yhtä leveitä välejä. Tässä tapauksessa, kun ryhmittelyvälien lukumäärä on määritetty, kunkin leveys tulisi laskea käyttämällä suhdetta:

Tässä h- välien leveys ja X max ja X min - näytteen attribuutin enimmäis- ja minimiarvo. Määrät X max ja X min määritetään suoraan lähdetietotaulukosta (katso taulukko 2). Tässä tapauksessa:

(m).

Tässä on tarpeen keskittyä intervallin leveyden määrittämisen tarkkuuteen. Kaksi mahdollista tilannetta: lasketun arvon tarkkuus h vastaa kokeen tarkkuutta tai ylittää sen. Jälkimmäisessä tapauksessa on mahdollista käyttää kahta lähestymistapaa intervallien rajojen määrittämiseen. Teoreettisesta näkökulmasta on oikein käyttää saatua arvoa h intervallien rakentamiseen. Tämä lähestymistapa ei aiheuta kokeellisten tietojen käsittelyyn liittyviä ylimääräisiä vääristymiä. Käytännön tarkoituksiin liittyvissä tilastotutkimuksissa fyysinen kulttuuri ja urheilussa, on tapana pyöristää saatu arvo h mittaustietojen tarkkuuteen. Tämä johtuu siitä, että saatujen tulosten visuaalista esittämistä varten on kätevää, että intervallien rajat ovat attribuutin mahdollisia arvoja. Näin ollen tuloksena oleva intervallin leveyden arvo tulee pyöristää ottaen huomioon kokeen tarkkuus. Erityisesti huomioimme, että pyöristystä ei tule tehdä yleisesti hyväksytyssä matemaattisessa mielessä, vaan ylöspäin, ts. yli, jotta ominaisuuden vaihteluväliä ei vähennetä - kaikkien välien leveyden summa ei saa olla pienempi kuin ominaisuuden enimmäis- ja vähimmäisarvojen välinen ero. Tarkasteltavassa esimerkissä kokeelliset tiedot on määritetty lähimpään sadasosaan (0,01 m), joten edellä saatu välin leveyden arvo tulee pyöristää ylöspäin lähimpään sadasosaan. Tuloksena saamme:

h= 0,67 (m).

Ryhmittelyvälien leveyden määrittämisen jälkeen on määritettävä niiden rajat. On suositeltavaa ottaa ensimmäisen välin alaraja, joka on yhtä suuri kuin attribuutin vähimmäisarvo otoksessa x min:

x H1 = x min.

Tarkasteltavassa esimerkissä x H1 = 13,04 (m).

Saadaksesi ensimmäisen intervallin ylärajan ( x B1) sinun tulee lisätä intervallin leveyden arvo ensimmäisen intervallin alarajan arvoon:

x B1 = X H1 + h.

Huomaa, että kunkin intervallin yläraja (tässä ensimmäinen) on samanaikaisesti seuraavan (tässä tapauksessa toisen) intervallin alaraja: x H2 = x KOHDASSA 1 .

Kaikkien jäljellä olevien intervallien ala- ja ylärajojen arvot määritetään samalla tavalla:

x B i = x N i +1 = x N i + h.

Tässä esimerkissä:

x B1 = x H2 = x H1 + h= 13,04 + 0,67 = 13,71 (m),

x B2 = x H3 = x H2+ h= 13,71 + 0,67 = 14,38 (m),

x B3 = x H4 = x H3+ h= 14,38 + 0,67 = 15,05 (m),

x B4 = x H5 = x H4 + h= 15,05 + 0,67 = 15,72 (m),

x B5 = x H5+ h= 15,72 + 0,67 = 16,39 (m).

Ennen vaihtoehdon ryhmittelyä esittelemme konseptin intervallin mediaaniarvo x i, yhtä suuri kuin määritteen arvo yhtä kaukana tämän intervallin päistä. Ottaen huomioon, että se on erotettu alarajasta määrällä, joka on yhtä suuri kuin puolet välin leveydestä, sen määrittämiseen on kätevää käyttää suhdetta:

x i=x N i+ h/2,

Missä x N i - alaraja i-ro intervalli ja h- sen leveys. Välien mediaaniarvoja käytetään myöhemmin ryhmiteltyjen tietojen käsittelyssä.

Kun kaikkien intervallien rajat on määritetty, näytevaihtoehdot tulisi jakaa näille aikaväleille. Mutta ensin sinun on päätettävä, mihin väliin sisällyttää arvo, joka sijaitsee täsmälleen kahden intervallin rajalla, eli kun vaihtoehtojen arvo osuu yhteen ylärajan ja sen vieressä olevan välin alarajan kanssa. Tässä tapauksessa vaihtoehto voidaan osoittaa mille tahansa kahdesta vierekkäisestä aikavälistä ja ryhmittelyn epäselvyyden poistamiseksi suostumme sellaisissa tapauksissa osoittamaan valinnat ylempään väliin. Seuraava argumentti voidaan esittää tämän lähestymistavan puolesta. Koska attribuutin minimiarvo osuu yhteen ensimmäisen välin alarajan kanssa ja sisältyy tähän väliin, niin kahden intervallin rajalle osuva vaihtoehto tulee luokitella yhdeksi niistä, jonka alarajan arvo on sama kuin harkittava vaihtoehto.

Siirrytään tarkastelemaan tilastotaulukkoa - katso taulukko 4, joka koostuu seitsemästä sarakkeesta.

Taulukko 4

Taulukkoesitys pallontyönnön tuloksista

Tilastotaulukon kolme ensimmäistä saraketta sisältävät vastaavasti ryhmittelyvälien numerot i, niiden rajoja x N minä - x SISÄÄN i ja välien mediaaniarvot x i .

Neljäs sarake sisältää intervallien taajuudet. Taajuus intervalli on luku, joka osoittaa kuinka monta vaihtoehtoa on, ts. mittaustulokset jäivät tälle aikavälille. Tämän määrän ilmaisemiseksi on tapana käyttää symbolia n i. Kaikkien intervallien kaikkien taajuuksien summa on aina yhtä suuri kuin otoskoko P, jonka avulla voidaan tarkistaa ryhmittelyn oikeellisuus.

Taulukon 4 viides sarake on tarkoitettu siihen syöttämiseen kertynyt taajuus intervalli - luku, joka saadaan summaamalla nykyisen aikavälin taajuus kaikkien aikaisempien aikavälien taajuuksiin. Kertynyt taajuus on yleensä merkitty latinalaisella kirjaimella N i. Kertynyt taajuus osoittaa, kuinka monella vaihtoehdolla on arvot, jotka eivät ylitä intervallin ylärajaa.

Taulukon kuudes sarake sisältää taajuuden. Taajuus kutsutaan taajuudella, joka esitetään suhteellisesti, ts. taajuuden suhde näytteen kokoon. Kaikkien taajuuksien summa on aina yhtä suuri kuin 1. Symbolia käytetään ilmaisemaan taajuutta f i:

f i=n i /n.

Välin taajuus liittyy todennäköisyyteen, että satunnaismuuttuja osuu tähän väliin. Bernoullin lauseen mukaan kokeiden määrän rajattomasti lisääntyessä tapahtuman taajuus konvergoi todennäköisyydessään sen todennäköisyyteen. Jos ymmärrämme tapahtumalla, että tutkittavan muuttujan arvo putoaa tietylle välille, niin käy selväksi, että suurella määrällä kokeita intervallin taajuus lähestyy todennäköisyyttä, että mitattu satunnaismuuttuja putoaa tähän väliin.

Sekä taajuus että taajuus kuvaavat tulosten toistettavuutta näytteessä. Niiden tilastollista merkitsevyyttä verrattaessa on huomattava, että frekvenssin tietosisältö on merkittävästi suurempi kuin frekvenssin tietosisältö. Todellakin, jos, kuten esimerkiksi taulukossa 4, toisen intervallin taajuus on 8 ja siksi 8 tulosta osui tähän väliin, niin on vaikea ymmärtää, onko tämä vähän vai paljon; jos otoksessa on 1000 varianttia, niin tämä taajuus on pieni, ja jos niitä on 20, niin se on korkea. Tässä tapauksessa objektiivista arviointia varten on tarpeen verrata frekvenssiarvoa otoskokoon. Jos käytät taajuutta, voit heti kertoa, mikä osuus tuloksista osui tarkasteluvälille (noin 28 % annetussa esimerkissä). Siksi taajuus antaa visuaalisen esityksen ominaisuuden toistettavuudesta näytteessä. Toinen tärkeä taajuuden etu on erityisesti huomioitava. Sen käyttö mahdollistaa erikokoisten näytteiden vertailun. Taajuutta ei voida soveltaa tällaisiin tarkoituksiin.

Taulukon seitsemäs sarake sisältää kertyneen taajuuden. Kumulatiivinen taajuus on kertyneen taajuuden suhde otoksen kokoon. Kertynyt taajuus on merkitty kirjaimella F i:

Kertynyt taajuus osoittaa, missä osuudessa näytevariantista on arvoja, jotka eivät ylitä intervallin ylärajan arvoa.

Tilastotaulukon viimeistä riviä käytetään ryhmittelyn ohjaamiseen.

Taulukon täyttämisen jälkeen palataan tilastosarjan määritelmään. Tilastosarja esitetään pääsääntöisesti taulukon muodossa, jonka ensimmäisellä rivillä on lueteltu intervallit ja toisella rivillä niitä vastaavat taajuudet tai taajuudet. Täten, tilastollisesti lähellä kutsutaan kaksoisnumeeriseksi sarjaksi, joka muodostaa yhteyden tutkittavan ominaisuuden numeerisen arvon ja sen taajuuden välille näytteessä. Tilastosarjojen merkittävä etu on, että ne antavat, toisin kuin tilastolliset aggregaatit, selkeän käsityksen ominaispiirteet merkkien vaihtelu.


©2015-2019 sivusto
Kaikki oikeudet kuuluvat niiden tekijöille. Tämä sivusto ei vaadi tekijää, mutta tarjoaa ilmaisen käytön.
Sivun luomispäivämäärä: 20.8.2016

Tiedon ryhmittelyn erityismuotoa edustaa ns tilastollinen sarja, tai numeerisia arvoja ominaisuus, joka on järjestetty tiettyyn järjestykseen. Riippuen siitä, mitä ominaisuuksia tutkitaan, tilastosarjat jaetaan attribuutio-, variaatio-, dynamiikka-, regressiosarjoihin, rankattujen ominaisuusarvojen sarjoihin ja kertyneiden taajuuksien sarjoihin. Useimmiten käytetty psykologiassa vaihtelevaa rivejä, rivejä regressio ja rivit ominaisuuksien rankattuja arvoja.

Jakauman variaatiosarja on kaksinkertainen lukusarja, joka näyttää kuinka ominaisuuden numeeriset arvot liittyvät niiden esiintymistiheyteen tietyssä otoksessa. Esimerkiksi psykologi suoritti älykkyystestin Wechslerin testillä 25 koululaiselle, ja toisen osatestin raakapisteet olivat seuraavat: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. Kuten näet, jotkut numerot esiintyvät tällä rivillä useita kertoja. Siksi, kun otetaan huomioon toistojen määrä, nämä sarjat voidaan esittää kätevämmässä, kompaktissa muodossa:

Tämä on variaatiosarja. Lukuja, jotka osoittavat, kuinka monta kertaa yksittäisiä optioita esiintyy tietyssä populaatiossa, kutsutaan frekvensseiksi tai optiopainoiksi. Ne on merkitty latinalaisten aakkosten pienellä kirjaimella. f i ja niillä on indeksi "i", joka vastaa vaihtelusarjan muuttujan numeroa.

Taajuuksien prosentuaalinen esitys on hyödyllinen tapauksissa, joissa on tarpeen verrata vaihtelusarjoja, jotka eroavat volyymiltaan suuresti. Esimerkiksi testattaessa kouluvalmius Kaupungin, taajaman ja kylän lapset tutkittiin 1000, 300 ja 100 lapsen otoksista. Ero näytteiden kokoissa on ilmeinen. Siksi on parempi verrata testituloksia frekvenssiprosenttien avulla.

Yllä oleva sarja (3.1) voidaan esittää eri tavalla. Jos sarjan elementit on järjestetty nousevaan järjestykseen, saadaan ns. ranked variation series:

Tämä esitysmuoto (3.3) on edullisempi kuin (3.1), koska se kuvaa paremmin attribuutin vaihtelumallia.

Rankoitua variaatiosarjoja kuvaavia taajuuksia voidaan lisätä tai kumuloida. Kertyneet taajuudet saadaan summaamalla peräkkäin taajuusarvot ensimmäisestä taajuudesta viimeiseen.

Katsotaanpa esimerkkinä uudelleen riviä 3.3. Muunnetaan se sarjaksi 3.4, jossa esittelemme lisärivin ja kutsumme sitä "taajuuskumulaatioiksi":

Katsotaanpa tarkemmin, kuinka viimeinen rivi muodostui. Taajuussarjan alussa on 1. Kumulatiivisessa sarjassa 2 on toisella sijalla - tämä on ensimmäisen ja toisen taajuuden summa, ts. 1 + 1, kolmannella paikalla on 4, tämä on toisen (jo kertyneen taajuuden) ja kolmannen taajuuden summa, ts. 2 + 2, neljännellä 8 = 4 + 4 jne.


Laajuus(joskus tätä määrää kutsutaan levitän) näytteet on merkitty kirjaimella R. Tämä on yksinkertaisin indikaattori, joka voidaan saada näytteelle - tietyn vaihtelusarjan enimmäis- ja vähimmäisarvojen välinen ero, ts.

On selvää, että mitä enemmän mitattu ominaisuus vaihtelee, sitä suurempi arvo on R, ja päinvastoin.

Saattaa kuitenkin käydä niin, että kahdella näytesarjalla on sekä keskiarvo että vaihteluväli sama, mutta näiden sarjojen vaihtelun luonne on erilainen. Esimerkiksi kaksi esimerkkiä:

Jos keskiarvot ja erot ovat samat näille kahdelle näytesarjalle, niiden vaihtelun luonne on erilainen. Näytteiden vaihtelun luonteen ymmärtämiseksi selkeämmin kannattaa viitata niiden jakaumiin.

Taajuusjakaumataulukot ja -kaaviot

Tietojen analysointi alkaa pääsääntöisesti tutkimalla, kuinka usein tutkijaa kiinnostavan ominaisuuden (muuttujan) tietyt arvot esiintyvät käytettävissä olevassa havaintosarjassa. Tätä tarkoitusta varten he rakentavat taajuusjakaumataulukot ja -kaaviot. Ne ovat usein perusta arvokkaiden, merkityksellisten tutkimustulosten saamiseksi.

Jos ominaisuus ottaa vain muutaman mahdollisen arvon (enintään 10-15), taajuusjakaumataulukko näyttää kunkin ominaisarvon esiintymistiheyden. Jos ilmoitetaan, kuinka monta kertaa kukin ominaisarvo esiintyy, tämä on taulukko ehdoton taajuusjakauma, jos osoitetaan havaintojen osuus, joka osuu ominaisuuden tiettyyn arvoon, niin puhutaan suhteellinen jakelutaajuuksia.

Monissa tapauksissa merkki voi ottaa monia erilaisia ​​merkityksiä, jos esimerkiksi mittaamme aikaa testitehtävän ratkaisemiseen. Tässä tapauksessa ominaisuuden jakautuminen voidaan arvioida ryhmitettyjen taajuuksien taulukko, jossa taajuudet on ryhmitelty attribuuttiarvojen ryhmien tai intervallien mukaan.

Toinen jakelutaulukoiden tyyppi ovat jakelutaulukot kertynyt taajuus Ne osoittavat, kuinka taajuudet kerääntyvät ominaisuusarvojen kasvaessa. Jokaisen arvon (intervallin) vastapäätä on esitetty kaikkien niiden havaintojen esiintymistiheysten summa, joissa ominaisuuden arvo ei ylitä tätä arvoa (pienempi kuin tämän välin yläraja). Kertyneet taajuudet ovat taulukon oikeanpuoleisissa sarakkeissa. 3.2 ja 3.3.

Visuaalisempaa esitystä varten muodostetaan taajuusjakaumakaavio tai kaavio kumuloituneista taajuuksista - histogrammi tai tasoitettu jakautumiskäyrä.

Taajuusjakauman histogrammi on pylväskaavio, jonka jokainen sarake perustuu tiettyyn attribuutin arvoon tai bittiväliin (ryhmitetyille taajuuksille). Pylvään korkeus on verrannollinen vastaavan arvon esiintymistiheyteen. Kuvassa Kohdassa 3.1 on esitetty taulukon esimerkin taajuusjakauman histogrammi. 3.2.

Vääristyneiden taajuuksien histogrammi eroaa jakauman histogrammista siten, että jokaisen palkin korkeus on verrannollinen tiettyyn arvoon (väliin) kertyneeseen taajuuteen. Kuvassa 3.2 näyttää histogrammin taulukon tiedoista kertyneistä taajuuksista. 3.2.

Rakentaminen taajuusjakauman monikulmio muistuttaa histogrammin rakennetta. Histogrammissa jokaisen sarakkeen yläosa, joka vastaa ominaisuuden tietyn arvon (välin) esiintymistiheyttä, on suoraviivainen segmentti. Ja monikulmiolle on merkitty tämän janan keskikohtaa vastaava piste. Seuraavaksi kaikki pisteet yhdistetään katkoviivalla (kuva 3.3). Histogrammin tai monikulmion sijasta kuvataan usein tasoitettu taajuusjakaumakäyrä. Kuvassa Kuva 3.4 esittää jakauman histogrammin esimerkille taulukosta. 3.3 (palkkeja) ja tasoitettu käyrä, jolla on sama taajuusjakauma.

Taajuusjakaumataulukot ja -kaaviot tarjoavat tärkeitä alustavia tietoja ominaisuuden jakautumismuoto: mitkä arvot löytyvät harvemmin ja mitkä useammin ja kuinka voimakasta ominaisuuden vaihtelu on. Yleensä erotetaan seuraavat tyypillisiä muotoja jakelut. Virka-asujen jakelu - kun kaikki merkitykset esiintyvät yhtä (tai melkein yhtä) usein. Symmetrinen jakautuminen - kun ääriarvoja esiintyy yhtä usein. Normaalijakauma- symmetrinen jakauma, jossa ääriarvot ovat harvinaisia ​​ja taajuus kasvaa vähitellen ominaisuuden ääriarvoista keskiarvoihin. Vino jakaumat- vasenkätinen(ensisijaisesti alhaisten arvojen taajuudet), oikeanpuoleinen(jossa vallitsee korkeiden arvojen taajuudet).

Taulukot ja kaaviot piirteen jakautumisesta itsessään antavat mahdollisuuden tehdä merkityksellisiä johtopäätöksiä vertailtaessa kohderyhmiä keskenään. Jakaumia vertaamalla emme voi vain arvioida, mitkä arvot ovat yleisempiä tietyssä ryhmässä, vaan myös verrata ryhmiä yksilöllisten erojen vakavuuden mukaan - vaihtelua tällä pohjalla.

Akkumuloituneiden taajuuksien taulukoiden ja kaavioiden avulla voit saada nopeasti lisätietoa siitä, kuinka monella koehenkilöllä (tai kuinka suurella osalla niistä) on ominaisuuden vakavuus, joka ei ylitä tiettyä arvoa.

Osa 4. Kuvailevat tilastot
(Tilastollinen jakauma ja sen numeeriset ominaisuudet)

Muuttuja voi saada useita arvoja. Päällä alkuvaiheessa Dataa käsiteltäessä on suositeltavaa analysoida kuvaavia tilastoja sen sijaan, että otettaisiin huomioon muuttujan kaikki arvot. Ne antavat yleiskuvan muuttujan arvoista tai arvoalueista.

Ensisijaisiin kuvaaviin tilastoihin ( Kuvailevia tilastoja) viittaavat yleensä näytteessä mitatun ominaisuuden jakauman numeerisiin ominaisuuksiin. Jokainen tällainen ominaisuus heijastaa yhdessä numeroarvossa jakeluomaisuutta joukko mittaustuloksia: heidän näkökulmastaan sijainti numeroakselilla tai niiden suhteen vaihtelua. Jokaisen ensisijaisen kuvaavan tilaston päätarkoituksena on korvata monet näytteessä mitatun ominaisuuden arvot yhdellä numerolla (esimerkiksi keskiarvo keskeisen suuntauksen mittana). Tiivis kuvaus ryhmästä primaaritilastoilla mahdollistaa mittaustulosten tulkinnan erityisesti vertailemalla eri ryhmien perustilastoja.

Jakelu sarja

Tilastollinen jakaumasarja edustavat väestöyksiköiden järjestettyä jakautumista ryhmiin ja ryhmiin. Jakaumasarjat tutkivat populaation rakennetta, jolloin voimme tutkia sen homogeenisuutta, laajuutta ja rajoja. Jakelusarja, jonka muodostavat korkealaatuinen merkkejä kutsutaan attribuutio. Kun ryhmitellään määrällinen vaihtelusarjat erotetaan ominaisuudesta. Vaihteleva sarja - sarja populaatioyksiköiden jakautumista ominaisuuksien mukaan, joilla on määrällinen lauseke, eli ne muodostuvat numeerisista arvoista.

Muutossarjat rakenteensa mukaan jaetaan:

  1. Diskreetti(epäjatkuva) – perustuu ominaisuuden epäjatkuviin muunnelmiin. Nämä ovat sarjoja, joissa muunnelmaarvoilla on kokonaislukujen arvot (eli ne eivät voi ottaa murto-osia). Erilliset ominaisuudet eroavat toisistaan ​​tietyllä määrällä.
  2. Intervalli(jatkuva) – niillä on mitkä tahansa, mukaan lukien murto-osat, kvantitatiiviset lausekkeet ja ne esitetään intervalleina. Jatkuvat ominaisuudet voivat poiketa toisistaan ​​mielivaltaisen vähän.

Variaatiosarjassa on kaksi elementtiä:

  1. vaihtoehto(x)
  2. taajuus(f)

Vaihtoehto– muuttujan ominaisuuden erillinen arvo, jonka se ottaa jakaumasarjassa.

Taajuus– yksittäisten muunnelmien tai muunnelmasarjan kunkin ryhmän lukumäärä. Joissakin tapauksissa sitä käytetään taajuus. Kutsutaan taajuuksia, jotka ilmaistaan ​​prosentteina tai prosenttiosuuksina taajuuksia ja lasketaan paikallisten taajuuksien muunnelmien suhteeksi kertyneiden taajuuksien summaan.

Taajuus puolestaan ​​on:

  • paikallinen
  • kertynyt (kumulatiivisesti - suoriteperusteisesti)

Jos variaatiosarjassa on epätasaiset välit, yksittäisten intervallien taajuudet eivät ole vertailukelpoisia, koska ne riippuvat intervallin leveydestä. Näissä tapauksissa lasketaan jakautumistiheys, joka antaa oikean kuvan muunnelmien (populaatioyksiköiden) jakautumisen luonteesta. Jakaumatiheys puolestaan ​​on:

  • absoluuttinen jakautumistiheys - taajuuden suhde välin arvoon (leveyteen).
  • suhteellinen jakautumistiheys - taajuuden suhde intervallin leveyteen

Intervallit

Paikallinen taajuus (f)

Kumulatiivinen taajuus (Σf)

Taajuus (ω)

Jakaantumistiheys (φ)

20-30

0,03

30-40

0,05

40-50

0,01

50-60

0,01

Jakaumasarjan karakterisoimiseksi käytetään seuraavia indikaattoreita:

  • keskiteho
  • muoti
  • mediaani

Esimerkki:

Kunto

20 samanlaisen vähittäismyymälän jakautuminen päivittäisen voiton mukaan (tuhatta ruplaa) tunnetaan:

11,3; 10,2; 13,9; 10,7; 11,8; 8,2; 12,4; 9,6; 13,1; 10,6; 6,3; 11,3; 10,2; 15,1; 10,5; 11,0; 15,1; 11,6; 10,4; 11,7.

  1. Luo intervallijakaumasarja.
  2. Muodosta histogrammi suhteellisesta taajuustiheysjakaumasta.

Ratkaisu

Kirjoitetaan alkutiedot rankatun sarjan muodossa:

6,3; 8,2; 9,6; 10,2; 10,2; 10,4; 10,5; 10,6; 10,7; 11,0; 11,3; 11,3; 11,6; 11,7; 11,8; 12,4; 13,1; 13,9; 15,1; 15,1.

Otoksen vaihteluväli on 6–16. Jaamme tämän alueen useisiin aikaväleihin. Laskemme intervallin leveyden (askeleen) kaavalla:

On syytä muistaa, että mitä pienempi väli, sitä tarkempia tuloksia saadaan. Meidän tapauksessamme välin kooksi otetaan 2 yksikköä, eli h=2.Ryhmien lukumäärän (n) ja populaatioyksiköiden lukumäärän (N) välinen suhde ilmaistaan ​​Sturgessin kaavalla edellyttäen, että tämä jakauma noudattaa normaalijakauman lakia (ND) ja yhtäläisiä välejä sovelletaan:

SISÄÄN käytännön työ voit käyttää taulukkotietoja:

N 15-24 25-44 45-89 90-179 180-359 360-719 720-1439
n 5 6 7 8 9 10 11

Saamme viisi väliä: ensimmäinen 6–8, toinen 8–10, kolmas 10–12, neljäs 12–14, viides 14–16.

Määritetään kuhunkin väliin osuvan näytevariantin taajuus.

Sarjan yksi arvo osuu ensimmäiseen väliin: 6.3, joten f 1 =1. Toinen väli sisältää kaksi arvoa: 8.2 ja 9.6, joten f 2 =2. Samalla tavalla löydämme f 3 =12, f 4 =3, f 5 =2. Määritetään kuhunkin väliin osuvan näytevariantin suhteelliset taajuudet:

1 välissä

2. välissä

3 välein

4 välein

5 välein

Suhteellisten taajuuksien summa

Siksi laskelmat suoritettiin oikein.

Määritellään suhteellisten taajuuksien tiheys suhteellisen taajuuden (ω i) suhteeksi intervallin leveyteen (h):

ensimmäiselle välille

toiselle välille

kolmanteen väliin

neljännelle välille

viidennelle välille

Tehtyjen laskelmien tulokset on koottu taulukkoon.

Yrityksen voitonjaon intervallisarja

Voittoarvoväli (h) 6 — 8 8 – 10 10 — 12 12 — 14 14 — 16
Taajuusvaihtoehto (f i) 1 2 12 3 2
Suhteelliset taajuudet (ωi) 0,05 0,10 0,60 0,15 0,10
Suhteellinen taajuustiheys (φ i) 0,025 0,050 0,300 0,075 0,050

Jakauman histogrammi

Muodostetaan histogrammi, joka näyttää suhteellisten taajuuksien tiheyden riippuvuuden option arvosta. Vaaka-akselilla piirrämme vaihtoehdon mahdollisten arvojen asteikon, pystyakselilla - suhteellisten taajuuksien tiheys; Suhteellisen tiheyden arvoa pidetään vakiona vastaavan välin sisällä. Saamme pylväsdiagrammin, jota kutsutaan suhteellisen tiheysjakauman histogrammiksi.

Katso myös