Što su rezultati bez statistike?

iz prakse za praksu
Što su rezultati bez statistike?
Miljenko KOŠIČEK
O
vaj članak daje odgovore na pitanja zašto nam je potrebna statistika, što
nestatističar treba znati o statistici, kad će statistika dati pouzdan rezultat.
Ono što je najvažnije, nakon što pročitate ovaj članak, shvatit ćete da nam statistika može biti samo pomoć, a nikako zamjena za zdrav razum.
Uvod
Svjedoci smo svakodnevnog stvaranja golemog broja podataka. Uznapredovala tehnologija potpomognuta računalnim sustavima omogućuje nam mjerenje različitih poslovnih procesa te pohranu i laku dostupnost mjernih rezultata. Pored svog tog bogatstva podataka često se nađemo u problemima i
nedoumici kako napraviti traženu analizu naših procesa i kako odgovoriti na
razna pitanja kao što su: koliko ste poboljšali proces u odnosu na prošlu godinu, koliko ste bolji ili lošiji od konkurencije, kolika je pogreška analitičke
metode, kolika je preciznost mjerenja i slično. Samo na osnovi prikupljenih
podataka nemoguće je bilo što zaključiti o našim procesima. Zato nam je potreban alat koji podatke pretvara u kratku i objektivnu informaciju na osnovi koje možemo analizirati naše procese, donijeti valjane odluke i poduzeti
potrebne radnje. Taj je alat statistika.
Zašto baš statistika?
Da bismo mogli donijeti pravovaljane odluke u svakodnevnom radu,
potrebne su nam objektivne informacije o našim procesima. Mjerenjem dobivamo velik broj rezultata
i samo na osnovi njih teško je zaključiti nešto o procesu. Potreban nam
je alat s pomoću kojeg ćemo iz velikog broja rezultata dobiti kratku i
objektivnu informaciju na osnovi
koje možemo donositi odluke i poduzeti potrebne radnje za unapređenje
procesa i poboljšanje kvalitete proizvoda. Taj je alat statistika.
Svi se procesi mijenjaju zbog utjecaja različitih čimbenika koji su izvan našega nadzora. Zato ponavljanjem mjerenja dobivamo različite rezultate, odnosno rezultati mjerenja nisu jednoznačni. Takve rezultate nije moguće obraditi egzaktnim alatom kao što je matematika. Podatke koji u sebi imaju
ugrađenu slučajnost možemo objektivno i pravilno obraditi i tumačiti koristeći se statistikom.
Statističkim metodama procjenjujemo pravu vrijednost promatrane veličine
i moguću pogrešku. Statistika je nužna za zaključivanje o odnosu između
mjerenih veličina, za provjeru pretpostavljenih relacija među njima i određivanje vrijednosti parametara koji su svojstveni konkretnom sustavu. S pomoću statistike oblikujemo procese tako da proizvedu pouzdanije i preciznije
rezultate.
Može li se izbjeći statistika?
Ljudi u pravilu ne vole statistiku i žele je izbjeći gdje god je to moguće, ali
danas u tome sve manje uspijevaju. Prošlo je vrijeme kad smo valjanost svo113
iz prakse za praksu
no neprestano praćenje proizvodnje i česte
popravne radnje povećavaju cijenu proizvoda. Uspoređujući s medicinom, procesni
nadzor odgovara terapiji. Terapija liječi pacijenta, kao što procesni nadzor spašava proizvod, ali to košta. Taguchi, želeći postići bolju kvalitetu i smanjiti cijenu proizvoda,
prebacuje nadzor u fazu razvoja proizvoda.
Cilj je off-line nadzora nad kvalitetom oblikovati proizvod koji je otporan na utjecaje
vanjskih čimbenika, kvarenje i nesavršenost
proizvodnog postupka, ugraditi kvalitetu u
proizvod, učiniti ga pouzdanijim i lakše proizvodivim te smanjiti troškove razvoja, proizvodnje i jamstvenog roka proizvoda. Off-line nadzor nad kvalitetom zasniva se na
statističkom planiranju pokusa i trajno je i
financijski povoljnije rješenje.
Uspoređujući s medicinom, off-line nadzor
nad kvalitetom odgovara preventivi. Kako je
preventiva najbolji način sprečavanja pojave
bolesti, tako je off-line nadzor nad kvalitetom
najbolji način za sprečavanje nastanka lošeg
proizvoda koji ne možemo staviti na tržište.
jih procesa mogli epski opisivati i pozivati se na dugogodišnje
iskustvo. Zahtjevi regulative i kupaca postaju sve stroži i traži se objektivan dokaz da radimo onako kako se od nas zahtijeva. Proporcionalno zahtjevima raste i potreba za statistikom. Nove metodologije za unapređenje procesa, kao što je
Six Sigma metodologija, zasnivaju se na mjerenju i statistici.
Sve veća potreba i primjena statistike lijepo se može vidjeti
na primjeru razvoja nadzora nad kvalitetom proizvoda. Svaki
proizvod prolazi kroz tri faze u svojem »životnom ciklusu«:
životni ciklus proizvoda razvoj  proizvodnja  uporaba
razvoj nadzora nad
kvalitetom proizvoda
medicina
off-line
on-line
završni
nadzor nad  nadzor nad  nadzor nad
kvalitetom
kvalitetom
kvalitetom
Taguchi
Deming
Shewhart
(1980)
(1940)
(1920)
preventiva
terapija
patologija
Kronološki gledano, započelo se sa završnim nadzorom koji
može spriječiti slanje neodgovarajućeg proizvoda na tržište, no
ne može poboljšati kvalitetu proizvoda. Shewhart je 20-ih godina prošlog stoljeća utemeljio statističke metode u nadzoru
nad kvalitetom naglašavajući da je varijabilnost životna činjenica. Uspoređujući ih s medicinom, završni bi nadzor nad kvalitetom odgovarao patologiji; kao što patolog može samo utvrditi da je pacijent mrtav, tako završni nadzor, u slučaju lošeg
proizvoda, može samo utvrditi da je proizvod neupotrebljiv.
Daljnji razvoj nadzora nad kvalitetom imao je cilj da se što je
moguće više smanji neželjena varijabilnost. Radeći na unapređenju kvalitete u Japanu, Deming je koristeći se tehnikom
statističkoga procesnog nadzora uveo on-line nadzor nad kvalitetom, odnosno uspostavio nadzor nad kvalitetom i u fazi
proizvodnje. Taj postupak smanjuje varijabilnost proizvodnog procesa, što omogućuje poboljšanje kvalitete proizvoda,
114
Prema tome, ako sami ne shvatite da je danas
statistiku nemoguće izbjeći i počnete primjenjivati statistiku u
svakodnevnom radu, na to će vas prisiliti kupci, konkurencija
i regulativa.
Je li statistika
pouzdan alat?
Sigurno ste čuli za izreku »Postoje tri vrste laži: laž, prokleta
laž i statistika«. Kako u svakoj izreci ima bar malo istine,
opravdano se pitate kako ćemo takvim alatom obrađivati naše podatke. Istina je da se s pomoću statistike može svjesno
ili nesvjesno lagati i da smo često svjedoci zlouporabe statistike u propagandne, političke i slične svrhe.
Ali je li za to kriva statistika? Statistika je kao i svaki drugi alat;
u rukama dobrog gospodara može biti od velike pomoći, a u
rukama lošeg gospodara može nam odmoći pa čak i postati
opasna. Ako stavite crvenu vunenu vestu u stroj za pranje rublja i pokrenete program za iskuhavanje te kada nakon pranja
izvadite bijelu, tri broja manju vestu, hoćete li za to kriviti stroj
za pranje rublja?
Danas se svatko, i oni bez ikakvog znanja o statistici, pokušava baviti statistikom. Veliki broj programskih aplikacija, od
Excela do specijaliziranih statističkih paketa koji danas postoje na tržištu, omogućuje da na brz i lak način statistički obradite podatke bez mukotrpnog računanja i korištenja složenim
i nerazumljivim formulama. Sve to računalo izračuna u nekoliko sekunda. Ali veliko je pitanje što ste dobili i imaju li
dobiveni statistički rezultati ikakve veze s podacima i problemom za koji ste tražili statistički odgovor. Ako želite pravilno
upotrebljavati stroj za pranje rublja, morate pročitati priložene upute. Vjerujem da se slažete, ako želite pravilno upotrebljavati statistiku, morate mnogo više toga pročitati i naučiti.
Mnogo je opasnije i gore namjerno laganje statistikom. To
obično rade statistički znalci kojima su vlastiti interesi ispred
struke i morala, koji se vješto koriste statistikom ili interpretiraju statističke rezultate kako bi udovoljili željama naručioca, pa i kad one ne odgovaraju istini.
Cilj je ovog članka, kao i budućih članaka povezanih sa statistikom u ovom časopisu, naučiti vas pravilno se koristiti
statistikom, znati što od statistike možete očekivati i prepoznati kad vam netko pokušava lagati koristeći se statistikom.
Zašto u statistici ne
možemo ništa tvrditi sa
100 %-tnom sigurnošću?
Uspoređujući sa svakidašnjim životom, statističko ispitivanje
jako sliči postupku suđenja. Sudac ne zna pravu istinu. Optužba i obrana iznose načelno moguća tumačenja događaja,
a sudac mora odlučiti između dviju različitih tvrdnja: krivice
i nevinosti optuženoga. U tom postupku moguće su dvije
pogreške: da nevin bude proglašen krivim i da kriv bude proglašen nevinim.
Slično se događa i u statistici. Statistički se obrađuje konačan
broj podataka (uzorak) uzet iz nekog procesa i na osnovi se
tog uzorka zaključuje o cijelom procesu. Znači, mi ne znamo
pravu istinu o promatranom procesu, nego proces procjenjujemo na osnovi uzetog uzorka. Naravno, pri tome možemo
napraviti dvije vrste pogreške: zaključiti da je proces loš kad
je on uistinu dobar i suprotno, zaključiti da je proces dobar
kad je on loš.
U nadzoru nad kvalitetom proizvoda ispitujemo odgovara li
kvaliteta našeg proizvoda postavljenoj specifikaciji (zahtjevima). Pri tom nadzoru možemo pogriješiti na dva načina:
– proglasiti proizvod zadovoljavajućim kad proizvod ne
zadovoljava postavljene zahtjeve za kvalitetom i pri
tome pustiti na tržište loš proizvod; ta se pogreška naziva rizikom kupca
– proglasiti proizvod nezadovoljavajućim kad proizvod
zadovoljava postavljene kvalitetne zahtjeve i pri tome
ne pustiti na tržište dobar proizvod. Počinjena se pogreška naziva rizikom proizvođača.
iz prakse za praksu
Takvu upotreba statistike koju upotrebljavaju statističke neznalice možemo svrstati u nenamjerno laganje statistikom.
Što nestatističar treba znati
o statistici?
Kad želite riješiti problem koji zahtijeva složeniju statističku
obradbu, najbolje je zatražiti pomoć statističara. Ako je riječ
o jednostavnijim ili rutinskim statističkim obradbama, onda
to mogu načiniti i nestatističari. U oba slučaja, i kad statističku obradbu radite sami i kad će to načiniti statističar, o statistici morate znati sljedeće:
Statistički se obrađuju relevantni podaci.
Statistički rezultat ovisi o podacima koje obrađuje. Statistički
se mogu obraditi bilo kakvi podaci, kao na primjer telefonski
brojevi. Ako su ulazni podaci telefonski brojevi, što nam znači dobiveni statistički rezultat? Točni i smisleni podaci dati će
točan i smislen statistički rezultat i o tome uvijek treba voditi računa.
Koje statističke metode postoje, čemu služe i za rješavanje
kojih problema ih možemo primijeniti?
Radite li sami statističku obradbu ili će to za vas načiniti statističar, trebate znati što sve statistika pruža i za rješavanje kakvih problema se možete njome koristiti. Ako sami radite
statističku obradbu, onda je to nužno znati. Ako statističku
obradbu radi statističar, onda je poželjno to znati kako biste
znali postaviti zahtjeve i kako biste imali dobru komunikaciju sa statističarom. Kako statističar mora razumjeti problem
koji rješava da bi načinio odgovarajuću obradbu, tako i vi
morate razumjeti osnove statistike kako bi razumjeli dobivene statističke rezultate.
Koje uvjete moraju zadovoljiti podaci da bi primijenjena
statistička metoda dala pouzdane rezultate?
Podaci se ne mogu obraditi bilo kojom statističkom metodom. Svaka statistička metoda postavlja određene uvjete za
podatke. Ako podaci zadovoljavaju te uvjete, onda će ta statistička metoda dati pouzdan statistički rezultat. Ako primijenimo statističku metodu na podatke koji ne zadovoljavaju
postavljene uvjete, onda ne možemo biti sigurni u pouzdanost dobivenog rezultata.
To se lijepo vidi iz primjera koji često susrećemo u praksi.
Raspodjela osobnih dohodaka djelatnika gotovo svake tvrtke
ima asimetričan oblik kako je prikazano na slici.
Kao i u svakodnevnom životu, i u statistici je potrebno povući granicu, što obično nije lako. U statistici je potrebno
odrediti granice za svaku od spomenutih pogrešaka. Pri nadzoru nad kvalitetom postavljanjem granica određujemo veličinu rizika kupca i proizvođača. Kako ćemo postaviti granicu,
ovisi o vrsti proizvoda. Ako je riječ o proizvodu čija loša kvaliteta može ugroziti život kupca, rizik kupca moramo svesti
na najmanju moguću mjeru. Pri tome, naravno, povećavamo
rizik proizvođača. Ako loša kvaliteta proizvoda ne može ugroziti kupca, tada možemo dopustiti smanjenje rizika proizvođača na račun povećanja rizika kupca.
medijan
prosjek
115
iz prakse za praksu
Uzrok asimetričnosti raspodjele rep je udesno koji nastaje
zbog visokih primanja rukovodeće strukture. Ako se za izračun srednje plaće koristi prosječnom vrijednosti (aritmetička
sredina), što se obično radi u praksi, onda srednja plaća neće
biti točno prikazana jer visoke plaće povećaju prosječnu vrijednost. Pravu vrijednost srednje plaće pokazuje medijan jer
u njegov izračun ne ulaze ekstremne plaće.
Prosječna vrijednost kao statistička mjera može se upotrijebiti za podatke koji slijede normalnu raspodjelu. Ako podaci
ne slijede normalnu raspodjelu, kao u ovom primjeru, prosječna vrijednost bit će pogrešan statistički pokazatelj.
– Kako pravilno interpretirati rezultate statističke obradbe?
Statistički rezultat broj je koji je potrebno interpretirati u
kontekstu problema koji se rješava kako bi se u potpunosti
dobio odgovor na postavljeno pitanje. Interpretacija statističkog rezultata igra važnu ulogu u zaključivanju u statistici.
Upravo pogrešna interpretacija dovodi da pogrešnog zaključivanja i često i dobar statistički rezultat pretvara u potpuno
pogrešan zaključak.
Ako nekog zanima koje je mjesto najrizičnije u čovjekovu životu, u statističkom godišnjaku naći će podatak da ljudi najčešće umiru u krevetu. Ako na osnovi toga točnog statističkog
rezultata, zaključi da je krevet najrizičnije mjesto u čovjekovu
životu, svi će mu se nasmijati. To je banalan primjer, no u
statistici postoje složene situacije i rezultati u kojima nije lako
odmah vidjeti je li zaključak smislen ili besmislen kao u tom
primjeru. Zato je pri donošenju zaključka na osnovi statističkog rezultata iznimno važna suradnja statističara i stručnjaka
čiji se problem rješava.
Sa zaključivanjem u statistici uvijek treba biti oprezan, posebno s generaliziranjem dobivenih rezultata. Treba imati na
umu da smo statistički rezultat dobili na osnovi ograničenog
broja podataka i na osnovi određenog broja parametara koje
smo uzeli u analizu. Uvijek se treba pitati postoji li možda
neki parametar koji nismo uzeli u razmatranje, a koji je mogao dovesti do drukčijega dobivenog rezultata.
Gdje naći dodatne
obavijesti?
O razmatranom u ovom članku i mnogo iscrpnije o statistici
možete čuti na seminarima Hrvatskoga mjeriteljskog društva:
Statističke metode za analizu mjernih rezultata i Statistika u validaciji analitičkih metoda. Seminare drži autor ovog članka.
O drugim statističkim temama možete pročitati u sljedećim
brojevima ovog časopisa.
Zaključak
Bez statistike, samo na osnovi rezultata mjerenja, ne možemo
u potpunosti spoznati procese koje mjerimo. Zato svakodnevno raste potreba za statistikom, ona se sve više primjenjuje u svakodnevnom radu, a time raste i potreba za njezinim
poznavanjem.
Osnovno što treba znati je hoće li statistika dati pouzdan rezultat onda i samo onda ako je zadovoljeno sljedeće:
• statistički se obrađuju relevantni podaci
• za obradbu se koristi odgovarajućom statističkom metodom
• rezultati statističke obradbe pravilno su interpretirani.
Iako statistika postaje nužno potrebna u svakodnevnoj praksi, uvijek treba imati na umu da je statistika samo alat, a nije
zamjena za zdrav razum.
Literatura
[1] Petz, B. (1981). Osnovne statističke metode za nematematičare. Zagreb.SNL.
[2] 2. I.E.Frank, I. E., Todeschini, R. (1994). The data analysis handbook – Data Handling in
Science and Technology – Volume 14. Elsevier Science B.V.
[3] 3. Pyzdek, T (2002). Six Sigma Handbook; A Complete Guide for Greenbelts, Blackbelts and Managers
at all Levels. McGraw-Hill Education-Europe.
[4] 4. NIST/SEMATECH: Engineering Statistics Handbook
http://www.itl.nist.gov/div898/handbook
U SLJEDEĆEM BROJU
Što je statistika bez
reprezentativnog uzorka?
116