iz prakse za praksu Što su rezultati bez statistike? Miljenko KOŠIČEK O vaj članak daje odgovore na pitanja zašto nam je potrebna statistika, što nestatističar treba znati o statistici, kad će statistika dati pouzdan rezultat. Ono što je najvažnije, nakon što pročitate ovaj članak, shvatit ćete da nam statistika može biti samo pomoć, a nikako zamjena za zdrav razum. Uvod Svjedoci smo svakodnevnog stvaranja golemog broja podataka. Uznapredovala tehnologija potpomognuta računalnim sustavima omogućuje nam mjerenje različitih poslovnih procesa te pohranu i laku dostupnost mjernih rezultata. Pored svog tog bogatstva podataka često se nađemo u problemima i nedoumici kako napraviti traženu analizu naših procesa i kako odgovoriti na razna pitanja kao što su: koliko ste poboljšali proces u odnosu na prošlu godinu, koliko ste bolji ili lošiji od konkurencije, kolika je pogreška analitičke metode, kolika je preciznost mjerenja i slično. Samo na osnovi prikupljenih podataka nemoguće je bilo što zaključiti o našim procesima. Zato nam je potreban alat koji podatke pretvara u kratku i objektivnu informaciju na osnovi koje možemo analizirati naše procese, donijeti valjane odluke i poduzeti potrebne radnje. Taj je alat statistika. Zašto baš statistika? Da bismo mogli donijeti pravovaljane odluke u svakodnevnom radu, potrebne su nam objektivne informacije o našim procesima. Mjerenjem dobivamo velik broj rezultata i samo na osnovi njih teško je zaključiti nešto o procesu. Potreban nam je alat s pomoću kojeg ćemo iz velikog broja rezultata dobiti kratku i objektivnu informaciju na osnovi koje možemo donositi odluke i poduzeti potrebne radnje za unapređenje procesa i poboljšanje kvalitete proizvoda. Taj je alat statistika. Svi se procesi mijenjaju zbog utjecaja različitih čimbenika koji su izvan našega nadzora. Zato ponavljanjem mjerenja dobivamo različite rezultate, odnosno rezultati mjerenja nisu jednoznačni. Takve rezultate nije moguće obraditi egzaktnim alatom kao što je matematika. Podatke koji u sebi imaju ugrađenu slučajnost možemo objektivno i pravilno obraditi i tumačiti koristeći se statistikom. Statističkim metodama procjenjujemo pravu vrijednost promatrane veličine i moguću pogrešku. Statistika je nužna za zaključivanje o odnosu između mjerenih veličina, za provjeru pretpostavljenih relacija među njima i određivanje vrijednosti parametara koji su svojstveni konkretnom sustavu. S pomoću statistike oblikujemo procese tako da proizvedu pouzdanije i preciznije rezultate. Može li se izbjeći statistika? Ljudi u pravilu ne vole statistiku i žele je izbjeći gdje god je to moguće, ali danas u tome sve manje uspijevaju. Prošlo je vrijeme kad smo valjanost svo113 iz prakse za praksu no neprestano praćenje proizvodnje i česte popravne radnje povećavaju cijenu proizvoda. Uspoređujući s medicinom, procesni nadzor odgovara terapiji. Terapija liječi pacijenta, kao što procesni nadzor spašava proizvod, ali to košta. Taguchi, želeći postići bolju kvalitetu i smanjiti cijenu proizvoda, prebacuje nadzor u fazu razvoja proizvoda. Cilj je off-line nadzora nad kvalitetom oblikovati proizvod koji je otporan na utjecaje vanjskih čimbenika, kvarenje i nesavršenost proizvodnog postupka, ugraditi kvalitetu u proizvod, učiniti ga pouzdanijim i lakše proizvodivim te smanjiti troškove razvoja, proizvodnje i jamstvenog roka proizvoda. Off-line nadzor nad kvalitetom zasniva se na statističkom planiranju pokusa i trajno je i financijski povoljnije rješenje. Uspoređujući s medicinom, off-line nadzor nad kvalitetom odgovara preventivi. Kako je preventiva najbolji način sprečavanja pojave bolesti, tako je off-line nadzor nad kvalitetom najbolji način za sprečavanje nastanka lošeg proizvoda koji ne možemo staviti na tržište. jih procesa mogli epski opisivati i pozivati se na dugogodišnje iskustvo. Zahtjevi regulative i kupaca postaju sve stroži i traži se objektivan dokaz da radimo onako kako se od nas zahtijeva. Proporcionalno zahtjevima raste i potreba za statistikom. Nove metodologije za unapređenje procesa, kao što je Six Sigma metodologija, zasnivaju se na mjerenju i statistici. Sve veća potreba i primjena statistike lijepo se može vidjeti na primjeru razvoja nadzora nad kvalitetom proizvoda. Svaki proizvod prolazi kroz tri faze u svojem »životnom ciklusu«: životni ciklus proizvoda razvoj proizvodnja uporaba razvoj nadzora nad kvalitetom proizvoda medicina off-line on-line završni nadzor nad nadzor nad nadzor nad kvalitetom kvalitetom kvalitetom Taguchi Deming Shewhart (1980) (1940) (1920) preventiva terapija patologija Kronološki gledano, započelo se sa završnim nadzorom koji može spriječiti slanje neodgovarajućeg proizvoda na tržište, no ne može poboljšati kvalitetu proizvoda. Shewhart je 20-ih godina prošlog stoljeća utemeljio statističke metode u nadzoru nad kvalitetom naglašavajući da je varijabilnost životna činjenica. Uspoređujući ih s medicinom, završni bi nadzor nad kvalitetom odgovarao patologiji; kao što patolog može samo utvrditi da je pacijent mrtav, tako završni nadzor, u slučaju lošeg proizvoda, može samo utvrditi da je proizvod neupotrebljiv. Daljnji razvoj nadzora nad kvalitetom imao je cilj da se što je moguće više smanji neželjena varijabilnost. Radeći na unapređenju kvalitete u Japanu, Deming je koristeći se tehnikom statističkoga procesnog nadzora uveo on-line nadzor nad kvalitetom, odnosno uspostavio nadzor nad kvalitetom i u fazi proizvodnje. Taj postupak smanjuje varijabilnost proizvodnog procesa, što omogućuje poboljšanje kvalitete proizvoda, 114 Prema tome, ako sami ne shvatite da je danas statistiku nemoguće izbjeći i počnete primjenjivati statistiku u svakodnevnom radu, na to će vas prisiliti kupci, konkurencija i regulativa. Je li statistika pouzdan alat? Sigurno ste čuli za izreku »Postoje tri vrste laži: laž, prokleta laž i statistika«. Kako u svakoj izreci ima bar malo istine, opravdano se pitate kako ćemo takvim alatom obrađivati naše podatke. Istina je da se s pomoću statistike može svjesno ili nesvjesno lagati i da smo često svjedoci zlouporabe statistike u propagandne, političke i slične svrhe. Ali je li za to kriva statistika? Statistika je kao i svaki drugi alat; u rukama dobrog gospodara može biti od velike pomoći, a u rukama lošeg gospodara može nam odmoći pa čak i postati opasna. Ako stavite crvenu vunenu vestu u stroj za pranje rublja i pokrenete program za iskuhavanje te kada nakon pranja izvadite bijelu, tri broja manju vestu, hoćete li za to kriviti stroj za pranje rublja? Danas se svatko, i oni bez ikakvog znanja o statistici, pokušava baviti statistikom. Veliki broj programskih aplikacija, od Excela do specijaliziranih statističkih paketa koji danas postoje na tržištu, omogućuje da na brz i lak način statistički obradite podatke bez mukotrpnog računanja i korištenja složenim i nerazumljivim formulama. Sve to računalo izračuna u nekoliko sekunda. Ali veliko je pitanje što ste dobili i imaju li dobiveni statistički rezultati ikakve veze s podacima i problemom za koji ste tražili statistički odgovor. Ako želite pravilno upotrebljavati stroj za pranje rublja, morate pročitati priložene upute. Vjerujem da se slažete, ako želite pravilno upotrebljavati statistiku, morate mnogo više toga pročitati i naučiti. Mnogo je opasnije i gore namjerno laganje statistikom. To obično rade statistički znalci kojima su vlastiti interesi ispred struke i morala, koji se vješto koriste statistikom ili interpretiraju statističke rezultate kako bi udovoljili željama naručioca, pa i kad one ne odgovaraju istini. Cilj je ovog članka, kao i budućih članaka povezanih sa statistikom u ovom časopisu, naučiti vas pravilno se koristiti statistikom, znati što od statistike možete očekivati i prepoznati kad vam netko pokušava lagati koristeći se statistikom. Zašto u statistici ne možemo ništa tvrditi sa 100 %-tnom sigurnošću? Uspoređujući sa svakidašnjim životom, statističko ispitivanje jako sliči postupku suđenja. Sudac ne zna pravu istinu. Optužba i obrana iznose načelno moguća tumačenja događaja, a sudac mora odlučiti između dviju različitih tvrdnja: krivice i nevinosti optuženoga. U tom postupku moguće su dvije pogreške: da nevin bude proglašen krivim i da kriv bude proglašen nevinim. Slično se događa i u statistici. Statistički se obrađuje konačan broj podataka (uzorak) uzet iz nekog procesa i na osnovi se tog uzorka zaključuje o cijelom procesu. Znači, mi ne znamo pravu istinu o promatranom procesu, nego proces procjenjujemo na osnovi uzetog uzorka. Naravno, pri tome možemo napraviti dvije vrste pogreške: zaključiti da je proces loš kad je on uistinu dobar i suprotno, zaključiti da je proces dobar kad je on loš. U nadzoru nad kvalitetom proizvoda ispitujemo odgovara li kvaliteta našeg proizvoda postavljenoj specifikaciji (zahtjevima). Pri tom nadzoru možemo pogriješiti na dva načina: – proglasiti proizvod zadovoljavajućim kad proizvod ne zadovoljava postavljene zahtjeve za kvalitetom i pri tome pustiti na tržište loš proizvod; ta se pogreška naziva rizikom kupca – proglasiti proizvod nezadovoljavajućim kad proizvod zadovoljava postavljene kvalitetne zahtjeve i pri tome ne pustiti na tržište dobar proizvod. Počinjena se pogreška naziva rizikom proizvođača. iz prakse za praksu Takvu upotreba statistike koju upotrebljavaju statističke neznalice možemo svrstati u nenamjerno laganje statistikom. Što nestatističar treba znati o statistici? Kad želite riješiti problem koji zahtijeva složeniju statističku obradbu, najbolje je zatražiti pomoć statističara. Ako je riječ o jednostavnijim ili rutinskim statističkim obradbama, onda to mogu načiniti i nestatističari. U oba slučaja, i kad statističku obradbu radite sami i kad će to načiniti statističar, o statistici morate znati sljedeće: Statistički se obrađuju relevantni podaci. Statistički rezultat ovisi o podacima koje obrađuje. Statistički se mogu obraditi bilo kakvi podaci, kao na primjer telefonski brojevi. Ako su ulazni podaci telefonski brojevi, što nam znači dobiveni statistički rezultat? Točni i smisleni podaci dati će točan i smislen statistički rezultat i o tome uvijek treba voditi računa. Koje statističke metode postoje, čemu služe i za rješavanje kojih problema ih možemo primijeniti? Radite li sami statističku obradbu ili će to za vas načiniti statističar, trebate znati što sve statistika pruža i za rješavanje kakvih problema se možete njome koristiti. Ako sami radite statističku obradbu, onda je to nužno znati. Ako statističku obradbu radi statističar, onda je poželjno to znati kako biste znali postaviti zahtjeve i kako biste imali dobru komunikaciju sa statističarom. Kako statističar mora razumjeti problem koji rješava da bi načinio odgovarajuću obradbu, tako i vi morate razumjeti osnove statistike kako bi razumjeli dobivene statističke rezultate. Koje uvjete moraju zadovoljiti podaci da bi primijenjena statistička metoda dala pouzdane rezultate? Podaci se ne mogu obraditi bilo kojom statističkom metodom. Svaka statistička metoda postavlja određene uvjete za podatke. Ako podaci zadovoljavaju te uvjete, onda će ta statistička metoda dati pouzdan statistički rezultat. Ako primijenimo statističku metodu na podatke koji ne zadovoljavaju postavljene uvjete, onda ne možemo biti sigurni u pouzdanost dobivenog rezultata. To se lijepo vidi iz primjera koji često susrećemo u praksi. Raspodjela osobnih dohodaka djelatnika gotovo svake tvrtke ima asimetričan oblik kako je prikazano na slici. Kao i u svakodnevnom životu, i u statistici je potrebno povući granicu, što obično nije lako. U statistici je potrebno odrediti granice za svaku od spomenutih pogrešaka. Pri nadzoru nad kvalitetom postavljanjem granica određujemo veličinu rizika kupca i proizvođača. Kako ćemo postaviti granicu, ovisi o vrsti proizvoda. Ako je riječ o proizvodu čija loša kvaliteta može ugroziti život kupca, rizik kupca moramo svesti na najmanju moguću mjeru. Pri tome, naravno, povećavamo rizik proizvođača. Ako loša kvaliteta proizvoda ne može ugroziti kupca, tada možemo dopustiti smanjenje rizika proizvođača na račun povećanja rizika kupca. medijan prosjek 115 iz prakse za praksu Uzrok asimetričnosti raspodjele rep je udesno koji nastaje zbog visokih primanja rukovodeće strukture. Ako se za izračun srednje plaće koristi prosječnom vrijednosti (aritmetička sredina), što se obično radi u praksi, onda srednja plaća neće biti točno prikazana jer visoke plaće povećaju prosječnu vrijednost. Pravu vrijednost srednje plaće pokazuje medijan jer u njegov izračun ne ulaze ekstremne plaće. Prosječna vrijednost kao statistička mjera može se upotrijebiti za podatke koji slijede normalnu raspodjelu. Ako podaci ne slijede normalnu raspodjelu, kao u ovom primjeru, prosječna vrijednost bit će pogrešan statistički pokazatelj. – Kako pravilno interpretirati rezultate statističke obradbe? Statistički rezultat broj je koji je potrebno interpretirati u kontekstu problema koji se rješava kako bi se u potpunosti dobio odgovor na postavljeno pitanje. Interpretacija statističkog rezultata igra važnu ulogu u zaključivanju u statistici. Upravo pogrešna interpretacija dovodi da pogrešnog zaključivanja i često i dobar statistički rezultat pretvara u potpuno pogrešan zaključak. Ako nekog zanima koje je mjesto najrizičnije u čovjekovu životu, u statističkom godišnjaku naći će podatak da ljudi najčešće umiru u krevetu. Ako na osnovi toga točnog statističkog rezultata, zaključi da je krevet najrizičnije mjesto u čovjekovu životu, svi će mu se nasmijati. To je banalan primjer, no u statistici postoje složene situacije i rezultati u kojima nije lako odmah vidjeti je li zaključak smislen ili besmislen kao u tom primjeru. Zato je pri donošenju zaključka na osnovi statističkog rezultata iznimno važna suradnja statističara i stručnjaka čiji se problem rješava. Sa zaključivanjem u statistici uvijek treba biti oprezan, posebno s generaliziranjem dobivenih rezultata. Treba imati na umu da smo statistički rezultat dobili na osnovi ograničenog broja podataka i na osnovi određenog broja parametara koje smo uzeli u analizu. Uvijek se treba pitati postoji li možda neki parametar koji nismo uzeli u razmatranje, a koji je mogao dovesti do drukčijega dobivenog rezultata. Gdje naći dodatne obavijesti? O razmatranom u ovom članku i mnogo iscrpnije o statistici možete čuti na seminarima Hrvatskoga mjeriteljskog društva: Statističke metode za analizu mjernih rezultata i Statistika u validaciji analitičkih metoda. Seminare drži autor ovog članka. O drugim statističkim temama možete pročitati u sljedećim brojevima ovog časopisa. Zaključak Bez statistike, samo na osnovi rezultata mjerenja, ne možemo u potpunosti spoznati procese koje mjerimo. Zato svakodnevno raste potreba za statistikom, ona se sve više primjenjuje u svakodnevnom radu, a time raste i potreba za njezinim poznavanjem. Osnovno što treba znati je hoće li statistika dati pouzdan rezultat onda i samo onda ako je zadovoljeno sljedeće: • statistički se obrađuju relevantni podaci • za obradbu se koristi odgovarajućom statističkom metodom • rezultati statističke obradbe pravilno su interpretirani. Iako statistika postaje nužno potrebna u svakodnevnoj praksi, uvijek treba imati na umu da je statistika samo alat, a nije zamjena za zdrav razum. Literatura [1] Petz, B. (1981). Osnovne statističke metode za nematematičare. Zagreb.SNL. [2] 2. I.E.Frank, I. E., Todeschini, R. (1994). The data analysis handbook – Data Handling in Science and Technology – Volume 14. Elsevier Science B.V. [3] 3. Pyzdek, T (2002). Six Sigma Handbook; A Complete Guide for Greenbelts, Blackbelts and Managers at all Levels. McGraw-Hill Education-Europe. [4] 4. NIST/SEMATECH: Engineering Statistics Handbook http://www.itl.nist.gov/div898/handbook U SLJEDEĆEM BROJU Što je statistika bez reprezentativnog uzorka? 116
© Copyright 2024 Paperzz