metodologija metodologija političkih i društvenih nauka ii nauka ii

METODOLOGIJA
POLITIČKIH I DRUŠTVENIH
NAUKA II
VJEŽBE 2
PAVLE GEGAJ
12. NOVEMBAR 2012.
Metodologija
političkih nauka
Distribucija frekvencija je predstavljanje svih vrijednosti koje varijabla
može da ima, i njihove učestalosti u uzroku, bilo u apsolutnim
brojevima, procentima ili kumulativnim procentima; intuitivan i
informativan način predstavljanja varijable; ukoliko je varijabla
nominalnog ili ordinalnog tipa, onda je u najvećem broju slučajeva
jedina univarijantna statistika koja nam stoji na raspolaganju;
Distribucija frekvencija može biti predstavljena tabelom, ali isto tako i
grafikonom, ili tekstom;
DISTRIBUCIJA
FREKVENCIJA
Tabela 1. Svako ima sve što mu je potrebno kad je zemlja jaka
U potpunosti se slažem
Djelimično se slažem
Niti... niti...
Djelimično se ne slažem
U št se ne slažem
Uopšte
l ž
Total
Frequency
6548
9513
2722
1733
326
20843
Valid Percent
Cumulative
Percent
31.4
31
4
45.6
13.1
8.3
16
1.6
100.0
31.4
31
4
77.1
90.1
98.4
100 0
100.0
Neće biti koristna ukoliko jje varijabla
j
intervalnogg tipa;
p ; takođe,, poređenje
p
j
dvije distribucije frekvencija nije jednostvano i često je nemoguće izvući
zaključak iz takvog poređenja;
2 od 25
Metodologija
političkih nauka
Staros ispitanika
0
100
200
300
400
261
18
390
21
24
30
33
36
39
42
45
48
51
54
FREKVENCIJA
57
(NASTAVLJENO)
63
60
66
69
72
75
78
81
84
87
90
93
443
600
700
544
568
608
530
576
470
493
453
414
488
442
440
405
394
421
410
433
476
425
551
431
499
519
451
513
385
417
430
411
475
347
363
423
335
335
316
27
DISTRIBUCIJA
500
21
15
20
11
5
4
3
3
5
1
2
1
1
70
48
66
98
90
161
160
179
156
133
249
244
235
266
219
247
256
244
297
217
231
235
211
214
3 od 25
Metodologija
političkih nauka
Tabela 1. Obaveza je djeteta da vodi računa o bolesnim roditeljima
DISTRIBUCIJA
FREKVENCIJA
(NASTAVLJENO)
U potpunosti se slažem
Djelimično se slažem
Niti... niti...
Crna Gora
63.2%
29.2%
5.7%
Srbija
45.8%
44.0%
7.9%
Dj li ič se ne slažem
Djelimično
l ž
1 4%
1.4%
1 7%
1.7%
Uopšte se ne slažem
0.5%
0.5%
100.0%
100.0%
Total
4 od 25
Metodologija
političkih nauka
Mjere centralne tendencije su statistički modeli koji cijelu
varijablu predstavljaju jednim brojem;
Treba imati u vidu da su mjere centralne tendencije dobri
modeli u situacijama gdje postoji tendencija grupisanja
opservacija
ij oko
k jedne
j d vrijednosti
ij d
i na način
či kako
k k to predviđa
d iđ
noramlana distribucija, što je najčešće slučaj sa intervalnim
varijablama;
MJERE CENTRALNE
TENDENCIJE
(NASTAVLJENO)
5 od 25
Metodologija
političkih nauka
MJERE CENTRALNE
TENDENCIJE
(NASTAVLJENO)
6 od 25
Metodologija
političkih nauka
MJERE CENTRALNE
TENDENCIJE
(NASTAVLJENO)
Postoji veliki broj mjera centralne tendencije; najčešće korišćene
u društvenim naukama su: modus, medijana i aritmetička
sredina; neke rjeđe korišćene mjere centralne tendencije su: 5%
odsječene sredine, M-estimator;
Koju mjeru ćemo u konkretnom slučaju koristiti zavisi od
nekoliko faktora:
1. Koji tip varijable treba predstaviti (nominalna vs intervalna)
2. Da li imamo pproblem sa ekstremnim vrijednostima
j
3. Koja mjera centralne tendencije na najbolji način oslikava
populaciju;
AAritmetička
it tičk sredina
di jje ddaleko
l k najrasprostranjenija
j
t j ij mjera
j
centralne tendencije, ali postoje situacije u kojima ne samo da
nije optimalna mjera, već može biti i pogrešna;
Mjere centralne tendencije, cijelu varijablu svode na jedan broj,
što je sa jedne strane korisno u predstavljanju varijable, ali sa
druge strane skriva veliki dio informacije; Zbog toga uvjek uz
mjeru centralne tendencije treba koristiti i neke druge podatke
koji će bliže predstaviti populaciju;
7 od 25
Metodologija
političkih nauka
Najjednostavnija mjera centralne tendencije, i kaže koja
kategorija ima nejveću frekvenciju; ima smisla ukoliko je
frekvencija jedne kategorije značajno veća od svih ostalih;
Kada
K
d govorimo
i o nivou
i mjerenja,
j
j modus
d se može
ž koristiti
k i i i kod
k d
svih varijabli (nominalnih, ordinalnih i intervalnih);
MODUS
Bez obzira na jednostavnost modusa kao mjere,
mjere postoji dosta
scenarija u kojim je najinformativniji, tj njime se najlakše
predstavi suština varijable;
Najčešće će varijabla imati jedan modus (unimodalna);
međutim, postoje varijable koje imaju dva modusa, tj dvije
vrijednosti
j
koje
j su podjednako
p j
učestale u ppopulaciji
p
j
(bimodalna varijabla), pa treba prijaviti oba modusa;
Da bi varijabla bila bimodalna, nije neophodno da obije
kategorije imaju tačno jednaku frekvenciju, već da dvije
kategorije dominiraju distribucijom;
8 od 25
Metodologija
političkih nauka
Medijana je srednja vrijednost varijable, dobijena kada sve
vrijednosti poređamo od najmanje ka najvećoj, i izaberemo
srednju; ukoliko varijabla ima paran broj opservacija, srednja
vrijednos je prosjek od dvije “srednje” vrijednosti;
Medijana se može računati kod ordnilanih i intervalnih
varijabli, dok kod nominalnih nema smisla;
MEDIJANA
Imajući u vidu način na koji se računa, medijana dijeli
populaciju na dva jednaka dijela, tj 50% populacije je ispod a
50% populacije je iznad medijane;
Korisna je kao mjera centralne tendencije kod malih uzoraka
ggotovo uvjek,
j , kao i kod uzoraka kod kojih
j bi ekstremne
vrijednosti mogle da prave problem, kao i kod veoma
“iskrivljenih” distribucija;
9 od 25
Metodologija
političkih nauka
Najlešće korišćena mjera centralne tendencije, i najkorisnija;
Često se za aritmetičku sredinu kaže da je projek, iako bi se
to moglo reći za sve mjere centralne tendencije;
Aritmetičku sredinu po pravilu možemo računati samo kod
intervalnih varijabli; ipak, često ćemo koristiti artimetičku
sredinu ordinalnih varijabli;
ARITMETIČKA
SREDINA
Kod računanja aritmetičke sredine, sve opservacije imaju
podjednaku važnust,
važnust pa je zato osjetljivija na exstremne
vrijednosti;
10 od 25
Metodologija
političkih nauka
Tabela 2. Mjere centralne tendencije
MJERE CENTRALNE
TENDENCIJE
Ocjena političara A
Ocjena političara B
Kada bi Crna Gora mogla da
postane član EU
Sk l sreće
Skala
ć
Socio-ekonomski status (0 do
100)
Starost ispitanika
Modus
Medijana
Aritmetička
sredina
3
1, 5
2019
3
3
2020
3,25
3,10
2025
7
44,75
6
40
55,85
85
40,25
45
43
43,76
11 od 25
Metodologija
političkih nauka
Osim što varijable imaju tendenciju da se grupišu oko
određene vrijednosti, imaju i tendenciju da budu
distribuirane na određeni način;
Distribucija
Di
ib ij koju
k j pratii većina
ći varijabli
ij bli se naziva
i normalna
l
distribucija, i ima oblik zvona;
MJERE
DISTRIBUCIJE
12 od 25
Metodologija
političkih nauka
Normalna distribucija, odnosno pretpostavka da je varijabla
normalno distribuirana, je osnova za većinu statističkih
modela koje ćemo izučavati (uključujući i aritmetičku
sredinu), pa je zato veoma bitno utvrditi valjanost takve
pretpostavke;
k
Da bismo ocijenili distribuciju varijable, koristimo mjere
distribucije: zakrivljenost (skewness) i spljoštenost (kurtosis)
MJERE
DISTRIBUCIJE
(NASTAVLJENO)
Ukoliko je distribucija zakrivljena, postojaće više nego što bi
očekivali vrijednosti sa jedne ili druge strane aritmetičke
sredine (lijevo ili desno zakrivljena distribucija)
Kod spljoštene
pj
odnosno zašiljene
j
distribucije,
j , vrijednosti
j
su
više raširene odnosno više skoncentrisane oko aritmetičke
sredine;
13 od 25
Metodologija
političkih nauka
Kod normalne distribucije vrijednost zakrivljenosti i
spljoštenosti iznosi 0;
Ukoliko je vrijednost zakrivljenosti (skewness) negativna onda
j distribucija
je
di ib ij zakrivljena
k i lj
u lijevo,
lij
a ukoliko
k lik je
j pozitivna
i i onda
d
je distrbucija zakrivljena u desno;
MJERE
DISTRIBUCIJE
(NASTAVLJENO)
Ukoliko je vrijednost spljoštenosti negativna onda je
distribucija spljoštena, a ukoliko je pozitivna distribucija je
zašiljena;
U društvenim naukama se odstupanje spljoštenosti i
zakrivljenosti u granicama od -1 do +1 najčešće može
zanemariti;;
14 od 25
Metodologija
političkih nauka
Mjere varijabilnosti teže da otkriju onaj dio varijable koji se
“skriva” iza mjera centralne tendencije;
Naime, ista aritmetička sredina (isto kao i medijana) se mogu
d bi i odd beskonačno
dobiti
b k č mnogo različitih
liči ih populacija;
l ij prostim
i
uvidom u samo aritmetičku sredino ne bismo mogli da
napravimo distinkciju između takvih populacija:
MJERE
VARIJABILNOSTI
S1: 100, 200, 300, 400, 500
S2: 300, 300, 300, 300
S3: 200,
200 250,
250 300,
300 350,
350 400
Mjere distribucije koje ćemo najčešće korisitti su opseg i
standardna devijacija;
j j ;
15 od 25
Metodologija
političkih nauka
Opseg predstavlja razliku između najmanje i najveće
vrijednosti u uzorku;
Ima smisla ukolik ogovorimo o izuzetno malim uzorcima, jer
ć većina
će
ći velikih
likih uzoraka
k imati
i i sličan
lič opseg, što
š ne znači
či da
d
su i distribucije iste;
MJERE
VARIJABILNOSTI
S4: 100,
100 250,
250 250,
250 250,
250 350,
350 350,
350 350,
350 500
S5: 100, 100, 100, 100, 500, 500, 500, 500
Kod velikih uzoraka
uzoraka, bolja mjera varijabilnosti je varijansa,
varijansa
odnosno standardna devijacija;
Varijansa
j
je
j koristan podatak
p
jer
j nam,, govori
g
koliko je
j
prosječno odstupanje populacije od aritmetičke sredine;
Koristeći varijansu i pravilo “68, 95, 97.7” možemo da
konstruišemo određene intervale povjerenja u datoj
populaciji;
16 od 25
Metodologija
političkih nauka
Tabela 3. Mjere disperzije
MJERE
VARIJABILNOSTI
Skup podataka 1
Skup podataka 2
Skup
pp
podataka 3
Skup podataka 4
Skup podataka 5
Aritmetička
sredina
300
300
300
300
300
Opseg
400
0
200
400
400
Standardna
devijacija
158
0
79
116
214
17 od 25