Kako pravilno lagati koristeći statistiku. Kako lagati sa statistikom Kako lagati sa statistikom

Kako lagati koristeći statistiku Darell Huff

(procjene: 2 , prosjek: 5,00 od 5)

Naslov: Kako lagati koristeći statistiku

O knjizi “Kako lagati sa statistikom” autora Darella Huffa

U ovom svijetu poznata knjiga Darell Huff govori o tome na razne načine zloupotreba statistike u cilju obmane publike i manipulisanja njihovim mišljenjima. Svakodnevno pokušavaju uticati na vas da vas ohrabre da kupite neki “pravi” proizvod ili odaberete “pravog” kandidata: “Zahvaljujući pasti “Clean Teeth”, stvaranje karijesa je smanjeno za 23%!”; „Politiku N podržava 85% građana“... Kako razumjeti koliko su određeni podaci pouzdani? Kako se prave kalkulacije? O čemu se vodi računa, a šta ostaje iza kulisa? Autor otkriva tajne alate statističara i opremi čitaoca znanjem koje će mu pomoći da shvati sve zamršenosti ove nauke i neće dozvoliti da bude zaveden.

Na našoj web stranici o knjigama možete besplatno preuzeti stranicu bez registracije ili čitanja online knjiga“Kako lagati sa statistikom” autora Darell Huffa u epub, fb2, txt, rtf, pdf formatima za iPad, iPhone, Android i Kindle. Knjiga će vam pružiti puno ugodnih trenutaka i pravog užitka čitanja. Kupi puna verzija možete od našeg partnera. Također, ovdje ćete pronaći najnovije vijesti iz književnog svijeta, naučite biografiju svojih omiljenih autora. Za pisce početnike postoji poseban odjeljak sa korisni savjeti i preporuke, zanimljivi članci, zahvaljujući kojoj se i sami možete okušati u književnim zanatima.

Preuzmite besplatnu knjigu “Kako lagati sa statistikom” autora Darella Huffa

(Fragment)

U formatu fb2: Preuzimanje
U formatu rtf: Preuzimanje
U formatu epub: Preuzimanje
U formatu txt:

(engleski) ruski 1954. godine. Ona govori o različitim načinima na koje se statistika može koristiti za obmanu publike i manipulisanje njihovim mišljenjima. Razmatraju se mnogi konkretni primjeri, uglavnom iz Američki život(reklama, politika, propaganda i agitacija).

Prvi epigraf knjige je citat Earla Beaconsfielda (B. Disraeli) o statistici: “Postoje tri vrste laži: laži, očigledne laži i statistika.”

Knjiga je namenjena nestručnim čitaocima i opremljena je svetlim ilustracijama. Materijal je prikazan slikovito i u pristupačnoj formi, što je osiguralo veliku popularnost knjige – jedna je od najmasovnijih publikacija o statistici u drugoj polovini 20. stoljeća.

Uzorak je inherentno pristrasan

Upotreba grafičkih objekata povezanih sa predstavljenim informacijama otvara široke mogućnosti za zloupotrebu. Ova izjava je ilustrovana brojnim primjerima:

  • Da biste uporedili dvije plate, možete koristiti infografiku i nacrtati dvije vreće novca. Ako drugi plate je dvostruko veća od prve, onda će druga vreća biti ne samo viša, već i dvostruko šira (što je neophodno za održavanje proporcije). A budući da je torba trodimenzionalni objekt, obris druge torbe će biti dvostruko deblji od prve. Kao rezultat, naša vizija drugu torbu doživljava kao vreću 8 (ne 2!) puta veću od prve. Ovu tehniku ​​koristio je časopis Newsweek.
  • Oglas za Američki institut za čelik i legure koristio je infografiku da prikaže povećanje proizvodnje čelika između 1930. i 1940. godine za 4,25 miliona tona (sa 10 miliona na 14,25 miliona). Infografska tehnika (namjerno narušavanje proporcija dodano je prethodno razmatranim metodama) dovela je do toga da je naznačeno povećanje topljenja vizualno percipirano kao 1500%. Autor napominje da je to slučaj kada se „aritmetika pretvara u fantaziju“.
  • Korištenje slika krava različitih veličina za prikaz različitih prinosa mlijeka tijekom godina. Pored efekata o kojima je već bilo reči, ova metoda dovodi do još jednog nesporazuma - čitalac može pomisliti da je ne samo mlečnost veća, već su i krave veće.

Na slici ispod prikazan je primjer zloupotrebe u infografiji - drugi objekt je vizualno 8 puta veći.

“, u kojoj se djeci daju savjeti, a djeca, kao što znate, rade sve obrnuto i sve ispadne baš kako treba. Možda će se tako dogoditi i sa svim ostalim?

Statistika, infografika, veliki podaci, analiza podataka i nauka o podacima - sada niko nije zauzet ovim. Svi znaju kako se sve ovo pravilno radi, ostaje samo da neko napiše kako se to NE radi. U ovom članku ćemo učiniti upravo to.

Narodna umjetnost o ovoj pojavi:

Prema onlajn glasanju, 100% ljudi koristi internet.
Plate diplomaca
Je li se iko iznenadio da kada čujemo o platama diplomaca, iz nekog razloga su ove brojke uvijek nevjerovatno visoke? U SAD-u stvari sada idu čak i na sud, gdje diplomci tvrde da su podaci o platama umjetno naduvani.


(slika iz Kako lagati sa statistikom)

Ovo je prilično star problem prema Darrell Huffu, Yale '24 je imao slično pitanje. I zapravo, svi govore istinu, ali ne i cijelu istinu. Statistike su prikupljane u obliku anketa (a tih godina i papirnom poštom). Ne šalju svi odgovor, već samo mali dio svih diplomaca; Oni koji rade dobro (što se često ogleda u dobroj plati) reagiraju aktivnije od drugih, tako da vidimo samo „dobar“ dio slike. To je ono što stvara pristrasnost uzorkovanja i čini rezultate takvih istraživanja potpuno beskorisnim.

Odabir pravog prosjeka (dobro odabran prosjek)

Zamislimo kompaniju u kojoj menadžer prima 25 hiljada, njegov zamenik 7,6 hiljada, top menadžeri 5,5 hiljada, srednji menadžeri 3,5 hiljada, mlađi menadžeri 2,5 hiljada, a obični zaposleni 1,4 hiljade (apstraktno funti) mesečno.

A naš zadatak je da informacije o kompaniji prezentiramo u pozitivnom svjetlu. Možemo pisati prosečna plata u kompaniji je X, ali šta to znači prosjek? Hajde da razmotrimo moguće opcije(vidi dijagram ispod):


(slika iz Kako lagati sa statistikom)

Aritmetička sredina nekog konačnog skupa X=(x i ) je broj m jednak srednjoj (X) iz jednačine:

Ovo je najbeskorisniji podatak sa stanovišta zaposlenog - 3.472 prosječne plate, ali šta je razlog za tako visoku cifru? Zbog visokih plata menadžmenta, što stvara iluziju da će zaposleni dobiti isti iznos. Sa stanovišta zaposlenika, ova vrijednost nije posebno informativna.

Naravno narodna umjetnost ovo svojstvo “prosječne vrijednosti” u obliku aritmetičke sredine nije izbjeglo

Zvaničnici jedu meso, ja jedem kupus. U prosjeku jedemo sarmice.

Medijan neke distribucije P(X) (X=(x i )), je takva vrijednost m da zadovoljava sljedeću jednačinu:

Jednostavno, polovina radnika prima više od ove vrijednosti, a polovina manje - tačno sredinu raspodjele! Ova statistika je prilično informativna za zaposlene u kompaniji, jer vam omogućava da odredite koliko je plata zaposlenog u poređenju sa većinom zaposlenih.

Mod konačnog skupa X=(x i ) je broj m koji se najčešće javlja u X. U ovom slučaju, moda može biti najinformativnija za osobu koja će početi raditi u datoj kompaniji.

Dakle, ovisno o situaciji pod prosječna vrijednost može se shvatiti kao bilo koja od navedenih veličina (u principu, a ne samo od njih). Stoga je fundamentalno važno razumjeti kako se izračunava ova prosječna vrijednost.

I još 10 neuspjelih eksperimenata o kojima nismo pisali

Hajde da stavimo obične novine sumporna kiselina, i magazin TV Park - u destilovanu vodu! Jeste li osjetili razliku? Magazinu se ništa nije dogodilo - novine su kao nove! (Cijeli video.)

Naše istraživanje pokazuje da je Doakeova pasta za zube 23% efikasnija od konkurencije, a sve to zahvaljujući prahu za zube Dr Cornisha! (Koji je vjerovatno sadržavao β-karoten i tajnu formulu šume – prim. autora.) Možda ćete biti iznenađeni, ali oni su zapravo sproveli studiju i čak objavili tehnički izvještaj. A eksperiment je zaista pokazao da je pasta za zube 23% efikasnija od svojih konkurenata (šta god to značilo). Ali da li je ovo cela priča?

U stvarnosti, veličina uzorka za eksperiment bila je samo desetak ljudi (prema Darrell Huffu i već spomenutoj knjizi). Ovo je upravo uzorak koji vam je potreban da biste dobili bilo kakve rezultate! Zamislimo da bacimo novčić pet puta. Kolika je vjerovatnoća da dobijete glave svih pet puta? (1/2) 5 = 1/32. To je samo jedan trideset i dva, ne može biti samo slučajnost ako se svih pet glava pojavi, zar ne? Sada zamislite da ovaj eksperiment ponovimo 50 puta. Barem jedan od ovih pokušaja će uspjeti. O tome ćemo pisati u izvještaju, ali svi ostali eksperimenti neće biti nikakvi. Na taj način ćemo dobiti isključivo nasumične podatke koji se savršeno uklapaju u naš zadatak.

Igranje sa vagom

Pretpostavimo da sutra na sastanku treba da pokažemo da smo sustigli naše konkurente, ali brojke se ne zbrajaju malo, šta da radimo? Pomerimo malo točkić! Čak i poznat po svom kvalitetan rad sa podacima, New York Times je objavio sličan, potpuno zbunjujući grafikon (obratite pažnju na skok sa 800k na 1,5m u centru skale).

Sakrivanje traženih brojeva

Najbolji način da nešto sakrijete je da skrenete pažnju. Na primjer, razmotrite zavisnost broja privatnih i javnih škola (u hiljadama) po godinama. Grafikon pokazuje da se broj državnih škola smanjuje, dok se broj privatnih ne mijenja značajno.

Naime, rast broja privatnih škola krije se u pozadini broja javnih škola. Budući da se razlikuju po redu veličine, praktično nikakve promjene neće biti primjetne na skali s dovoljno velikim korakom. Nacrtajmo zasebno broj privatnih škola; Sada jasno vidimo značajan porast broja privatnih škola, što je bilo „skriveno“ u prethodnom grafikonu.


(primjer i grafikoni iz Kako loše prikazati podatke, Howard Wainer. The American Statistician, 1984.)

Vizuelna metafora

Ako nemate sa čime da poredite, ali zaista želite da pobrkate stvari, onda je vreme za nerazumljive vizuelne metafore. Na primjer, ako grafički prikažemo područje umjesto dužine, svaki rast će izgledati mnogo veći.

Pogledajmo potrošnju piva u SAD-u od 1970. do 1978. u milionima barela i tržišni udio Schlitz-a (vidi grafikon ispod). Izgleda dobro, impresivno. Zar nije istina?

Sada se riješimo nepotrebnog "smeća" na ovom grafikonu i precrtajmo ga u normalnom obliku. Nekako više ne izgleda tako impresivno i ozbiljno.


(grafovi i primjeri Johna P. Boyda, bilješke s predavanja Kako loše prikazati grafikon ili šta. NE raditi)

Prva slika ne laže, svi brojevi na njoj su tačni, ali implicitno prikazuje podatke u potpuno drugačijem svjetlu.


(slika iz Kako lagati sa statistikom).

Primjer visokokvalitetne vizualizacije

Visokokvalitetna vizualizacija prvenstveno predstavlja rezultate, izbjegava dvosmislenost i prenosi dovoljnu količinu informacija u sažetom obimu. Dobro je rečeno o radu Charles-Josepha Minarda:
Ovdje je sve savršeno, gledalac se ne tretira kao idiot, a njegovo vrijeme se ne gubi na cenzuru. Široka bež pruga pokazuje veličinu vojske na svakoj tački marša. U gornjem desnom uglu je Moskva, u koju stiže francuska vojska i odakle počinje povlačenje, prikazano crnom trakom. Grafikon vremena i temperature je priložen uz rutu povlačenja radi dodatnog interesa.

Konačni zaključak: začuđeni gledalac upoređuje veličinu vojske na početku sa onom koja se vratila kući. Gledalac je pun osećanja, naučio je nešto novo, osetio razmere, bio je hipnotizovan, shvatio je da ništa nije naučio u školi.


(Charles Joseph Minard: Napoleonovo povlačenje iz Moskve (Ruska kampanja 1812-1813), 1869.)

Zaključak i dalje čitanje

76% svih statistika uzima se iz glave

Ovaj izbor pokriva daleko od puna lista tehnike koje svjesno ili nesvjesno iskrivljuju podatke. Ovaj članak prije svega pokazuje da moramo vrlo pažljivo pratiti statističke podatke koji su nam dostavljeni i zaključke koji se na osnovu njih donose.

Kratka lista za dalje čitanje:
Kako lagati sa statistikom je divna mala knjiga, neverovatno zanimljiva i dobro napisana, pročitana u jednom dahu. Pokazuje glavne “greške” koje mediji (i ne samo oni) prave pri radu s podacima.
Kako loše prikazati podatke. Howard Wainer. The American Statistician (1984) - kompilacija tipične greške i opća „štetna” pravila koja se najčešće nalaze u radu vizualizacije podataka.

Tagovi:

  • statistika
  • loš savjet
Dodaj oznake

Postoje tri vrste laži: laži, proklete laži i statistika...(Benjamin Disraeli)...
Doći će vrijeme kada će statističko razmišljanje postati jednako neophodan kvalitet za pravog građanina kao i sposobnost čitanja i pisanja... (H.G. Wells)...
Okrugli brojevi uvijek lažu... (Samuel Johnson)
Statistika je zaista podmukla i lukava stvar, pogotovo u pravim rukama...

Darell Huff

Pet trikova koji zaista rade...

Darrell Huff: Kako lagati sa statistikom.

Da imam svoj način, ovu knjigu bih nazvao još kraće – “Kako lagati”, jer je laž dobila uvjerljivost, logiku i, što je još važnije, brojke iza kojih se sve može sakriti u “vještim rukama”. A ima i puno “vještih ruku”.

U našem vremenu, pitanja laži i istine su i dalje aktuelna. Pored direktne obmane, pojavilo se mnogo načina da se “izkrivi istina” ili se stvarnost prikaže na takav način da čak upućena osoba teško je prepoznati laž koja se krije iza toga.

Svi koji traže načine da iskrive statistiku su zainteresovani za iskrivljenje statistike. javno mnjenje i koriste ovo za vlastito bogaćenje.

Mnogo je i onih koji žele da sakriju prave brojke, jer odražavaju krajnje ružne činjenice. Konačno, statistika je podložna direktnoj manipulaciji kad god je dio vladinog procesa donošenja odluka.

Sam autor piše: „I dalje vjerujem da je mogu opravdati na način bivšeg pljačkaša koji je objavio memoare koji su u suštini kurs obuke na temu kako uskladiti glavni ključ sa bravom. Lopovi i lopovi odavno znaju sve ove trikove, ali pristojni ljudi bi trebali naučiti o njima kako bi mogli zaštititi svoj dom od nepozvanih gostiju.”

Iako je knjiga napisana davne 1954. godine, nije izgubila na aktuelnosti, kao ni podmukle tehnike opisane u njoj.

Pristrasno uzorkovanje

Da bi bili od vrijednosti, podaci o uzorkovanju moraju se zasnivati ​​na reprezentativnom uzorku iz kojeg su uklonjeni svi mogući izvori pristranosti.


Evo primjera nereprezentativnog uzorka koji Huff daje...:

Jedan psihijatar je rekao da je skoro svaka osoba neurasteničar. Ali zapitajmo se: šta je poslužilo kao osnova za takav zaključak? Kakve je ljude vidio ovaj psihijatar? Pokazalo se da je do ovog poučnog zaključka došao proučavajući svoje pacijente, a oni su više nego neprikladni kandidati za ulogu uzorka iz cijele populacije. Ako je osoba potpuno normalna, onda psihijatar nema šanse da je vidi na svom pregledu.

Još jedan - već školski - primjer povezan je s američkim predsjedničkim izborima.

Časopis Literary Digest iz 1936. godine, anketirajući svoje pretplatnike, predviđa trijumfalna pobeda Republikanac Alfred Landon nad demokratom Franklinom Rooseveltom. Časopis je zaboravio da uzme u obzir da su njegovi pretplatnici uglavnom bogati i bogati Amerikanci, najčešće pristalice Republikanske stranke. Ruzvelt je pobedio na izborima.

Zaključak: ako vam kažu da će 74% birača podržati kandidata na predstojećim predsjedničkim izborima, zapitajte se kojih 74%građana glasači?

Dobro odabran prosjek

Zvaničnici jedu meso, ja jedem kupus. U prosjeku jedemo sarmice.

Izraz "prosjek" ima vrlo nejasno tumačenje. U gornjem citatu, ovo je aritmetička sredina. Pored njega, postoji modus i medijan.

Koja je razlika - pročitajte u nastavku.

U mnogim slučajevima, sva tri prosjeka su toliko bliska po vrijednosti da nema potrebe za razlikovanjem između njih. Ali ako govorimo o prihodima, onda je razlika između tri prosjeka ogromna.

“Ako naiđete na izjavu vlasnika kompanije da njegovi zaposleni imaju prilično visoku prosječnu platu, to može značiti nešto konkretno, a možda i ništa.

Ako je navedeni prosjek medijan, onda će to značiti da polovina zaposlenih zarađuje više od navedenog iznosa, a druga polovina manje.
Ali ako vidite aritmetički prosek (a možete mi vjerovati, to se događa ako tip prosjeka nije naveden), onda vam ova brojka neće dati nikakav korisne informacije“, piše Darell Huff.
Što se tiče mode, ovo je najčešća vrijednost kompleta i, možda, najbolje karakterizira nivo plata u kompaniji.

Ovako to izgleda na konkretnom primeru, gde vlasnik kompanije zarađuje 45 hiljada dolara, aritmetički prosek je 5,7 hiljada, a većina zaposlenih se zadovoljava sa 2 hiljade dolara.

Inače, prosječna plata na kraju februara 2016. bila je skoro 28 hiljada rubalja. Pa razumes...

Prekrasna grafika

Najjednostavniji tip statističke slike je graf.


Korisna stvar- kada treba da pokažete određene sklonosti, uplašite se ili smirite. Sve što je potrebno je postaviti željenu jedinicu podjele na koordinatne osi. 10% može izgledati i kao uzlazni trend i kao impresivan rast. Bez falsifikata, iste vrijednosti, ista kriva, ali drugačiji efekat.


Pseudo-potkrijepljena cifra

“Ako ne možete dokazati ono što želite, pokažite nešto drugo i insistirajte da je to isto. Vezivanje figure koja odražava činjenicu za drugu činjenicu je dobro poznata tehnika i uvijek će vam dobro poslužiti. Radi besprijekorno,” kaže Huff.


Primjeri? Da molim!

Poginuo u avionskim nesrećama 1953 više ljudi nego 1910. Treba li zaključiti da je putovanje avionom postalo opasnije? Ne! Ljudi su upravo počeli letjeti stotine puta više nego prije, to je sve.


Stopa smrtnosti u američkoj mornarici tokom špansko-američkog rata 1898. bila je devet promila. U istom periodu, stopa smrtnosti civila u Njujorku dostigla je šesnaest promila. Da li je sigurnije u ratu nego kod kuće?

Naravno da ne!

U redovima mornarica služe uglavnom mladima i zdravi muškarci. Civilno stanovništvo čine, između ostalog, mala djeca, starci i bolesni, a za ove kategorije stanovništva stopa smrtnosti je veća gdje god da se nalaze.

Netačna uzročnost

Posle ne znači uvek kao rezultat! I Darell Huff to dokazuje konkretnim primjerima i poziva na oprez.

„Da li studenti pušači zaostaju za studentima nepušačima u studijama? Prema jednom istraživanju, da, zaostaju. “Mnogima se to svidjelo, otišli su dalje i zaključili da pušenje štetno djeluje na mentalne sposobnosti”, piše Huff. - Navedeno istraživanje je, vjerujem, obavljeno po svim pravilima: uzorak je bio dovoljno velik, odabran je savjesno i pažljivo, vrijednost korelacije se pokazala značajnom. Ali to čini neopravdanu pretpostavku da je pušenje uzrok lošeg učinka. Ali zar se sve ovo ne bi moglo isto tako okrenuti na drugu stranu? Možda su loše ocjene natjerale učenike da traže utjehu u pušenju? što se toga tiče, ovaj zaključak jednako vjerovatno i ništa manje potkrijepljeno činjenicama.”


Često se dešava ovako: veza postoji, ali je nemoguće reći koja je od varijabli uzrok, a koja posljedica. Mnogo je podmuklije kada nijedna varijabla ne utiče na drugu, ali i dalje postoji korelacija između njih, i to značajna.

Evo primjera takve fiktivne korelacije. Stopa samoubistava dostiže vrhunac u junu, rekao je Huff. Onda postoje najveći broj mladenci. sta je bilo? Da li samoubistva uzrokuju toliko vjenčanja? Ili vjenčanja provociraju odbijenu mladu ili mladoženju na samoubistvo? Uvjerljivije, ali i nedokazano objašnjenje bi bilo sljedeće. Očajna osoba se bori s depresijom cijelu zimu u nadi da će se oblaci razvedriti na proljeće. Ali konačno odustane kada dođe ljeto, izađe sunce, ali nema svjetla...

Zaključak: kako ne biste podlegli zabludi „poslije znači kao rezultat“, svaku izjavu podvrgnuti analizi.

Općenito, držite oči otvorene i zapamtite da postoje tri vrste laži: laži, proklete laži i statistike.

Ilustracije iz knjige “Kako lagati sa statistikom”

Prvi korak u prikupljanju statističkih podataka je da odredite šta želite da analizirate. Statističari informacije u ovoj fazi nazivaju populacijom. Zatim morate definirati podklasu podataka koja bi, kada se analizira, trebala predstavljati cijelu populaciju. Što je uzorak veći i precizniji, rezultati istraživanja će biti precizniji.

Naravno da postoji različite načine slučajno ili namjerno pokvariti statistički uzorak:

  • Pristrasnost odabira. Ova greška se javlja kada se ljudi koji učestvuju u studiji identifikuju kao dio grupe koja nije reprezentativna za cijelu populaciju.
  • Slučajno uzorkovanje. Pojavljuje se kada se analiziraju lako dostupne informacije umjesto pokušaja prikupljanja reprezentativnih podataka. Na primjer, informativni kanal može provesti političku anketu među svojim gledaocima. Bez anketiranja ljudi koji gledaju druge kanale (ili uopće ne gledaju TV), ne može se reći da će rezultati takve studije odražavati stvarnost.
  • Odbijanje ispitanika da učestvuju. Ova statistička greška nastaje kada neki ljudi ne odgovore na pitanja postavljena u statističkoj studiji. Ovo uzrokuje da se rezultati netočno prikazuju. Na primjer, ako studija postavi pitanje: „Jeste li ikada prevarili svog supružnika?“, neki ljudi to jednostavno neće htjeti priznati. Kao rezultat toga, činit će se da je varanje rijetko.
  • Besplatan pristup anketama. U ovakvim anketama može učestvovati svako. Često se čak i ne provjerava koliko je puta ista osoba odgovorila na pitanja. Primjer su razne ankete na internetu. Vrlo je zanimljivo proći kroz njih, ali se ne mogu smatrati objektivnim.

Ljepota pristrasnosti selekcije je u tome što će neko negdje vjerovatno provesti nenaučno istraživanje koje će potvrditi bilo koju teoriju koju imate. Stoga samo potražite anketu koja vam je potrebna na internetu ili kreirajte vlastitu.

Odaberite rezultate koji podržavaju vaše ideje

Budući da statistika koristi brojeve, mislimo da one pružaju uvjerljive dokaze za svaku ideju. Statistike se oslanjaju na složenu matematiku, koja, ako se postupa na pogrešan način, može dovesti do potpuno suprotnih rezultata.

Da bi pokazao nedostatke u analizi podataka, engleski matematičar Francis Anscombe stvorio je Anscombe Quartet. Sastoji se od četiri skupa numeričkih podataka koji na grafikonima izgledaju potpuno drugačije.

Na slici X1 je standardni dijagram raspršenja; X2 je kriva koja prvo ide gore, a zatim se spušta; X3 - linija koja se lagano uzdiže prema gore, s jednim izlazom na Y osi; X4 - podaci na osi X, osim za jedan izlaz koji se nalazi visoko na obje ose.

Za svaki od grafova su tačne sljedeće tvrdnje:

  • Varijabilna sredina x za svaki skup podataka je 9.
  • Varijabilna sredina y za svaki skup podataka je 7,5.
  • Varijanca (širjenje) varijable x- 11, varijabilno y - 4,12.
  • Korelacija između varijabli x I y za svaki skup podataka je 0,816.

Kada bismo ove podatke vidjeli samo u tekstualnom obliku, pomislili bismo da su situacije potpuno iste, iako grafikoni to opovrgavaju.

Stoga je Anscombe predložio prvo vizualizaciju podataka, a tek onda izvođenje zaključaka. Naravno, ako želite nekoga da dovedete u zabludu, preskočite ovaj korak.

Kreirajte grafikone koji ističu vaše željene rezultate.

Većina ljudi nema vremena za vlastitu statističku analizu. Očekuju da im pokažete grafikone koji sumiraju sva vaša istraživanja. Pravilno dizajnirani grafikoni trebaju odražavati ideje koje odgovaraju stvarnosti. Ali oni također mogu istaknuti podatke koje želite prikazati.

Izostavite nazive nekih parametara, malo promijenite skalu na koordinatnoj osi i ne objašnjavajte kontekst. Na ovaj način možete uvjeriti sve da ste u pravu.

Sakrijte svoje izvore na svaki način.

Ako ste transparentni u vezi sa svojim izvorima, ljudima je lako provjeriti vaše nalaze. Naravno, ako pokušavate sve prevariti, nikada nam nemojte reći kako ste došli do svojih zaključaka.

Tipično, članci i studije uvijek sadrže veze do izvora. Međutim, originalni radovi možda neće biti dostavljeni u cijelosti. Glavna stvar je da izvor odgovori na sljedeća pitanja:

Sada znate kako manipulirati brojevima i koristiti statistiku da dokažete gotovo sve. Ovo će vam pomoći da prepoznate laži i opovrgnete izmišljene teorije.