Neka pitanja

Neka pitanja
Navedite mere centralne tendencije? Navedite mere disperzije?
Koje su osnovne merne skale u društvenim naukama?
Na osnovu čega se vrši klasifikacija na zavisne i nezavisne varijable? Koji su
kriterijumi za tu podelu? Navedi jedan primer.
Navedite nekoliko primera operacionalizacije nacionalne vezanosti?
Šta je nulta hipoteza?
Šta znače intervali pouzdanosti? Koji su standardni intervali pouzdanosti u
statističkim merenjima?
Koje su mere odstupanja od normalne raspodele?
Navedi statističke tehnike koje upoređuju odnose između aritmetičkih sredina,
i statističke tehnike koje upoređuju odnose između varijansi.
Koja je razlika između koeficijenta korelacije i regresione analize?
Šta predviđa nulta hipoteza za B pondere u regresionoj analizi?
Za koje vrste mernih skala se koristi Hi2? Objasni ukratko pretpostavke ove
statističke mere.
Na kojim statističkim merama se zasniva linearna regresija?
Predložena poglavlja iz Tenjović (2002). Statistika u psihologiji.
Centar za primenjenu psihologiju. Beograd
• Testiranje hipoteza o normalnosti raspodele varijable u
populaciji, str 59
• Testiranje hipoteza o aritmetičkoj sredini populacije, str 63
• Testiranje značajnosti razlika između aritmetičkih sredina, str
65
• Analiza varijanse, str 71
• Linearna korelacija i jednostruka regresija, str 103
• Hi-kvadrat test, str 123
Korelaciona analiza
• Korelaciona analiza ispituje samo kovarijaciju
između dve varijable.
• Korelaciona analiza ne govori ništa o prirodi
veze između varijabli koje kovariraju.
• Regresiona analiza nam govori o PRIRODI veze
između varijabli: U KOJOJ MERI SE VREDNOSTI
NA JEDNOJ VARIJABLI MOGU PREDVIDETI
DISTRIBUCIJOM VREDNOSTI DRUGE
VARIJABLE
Regresiona analiza
• Regresiona analiza ima za cilj PREDVIDJANJE
• Distribucijom vrednosti jedne varijable
predviđa se vrednost druge varijable
• Prediktorska analiza:
– Kriterijumska varijabla (varijabla čije vrednosti
želimo da previdimo) - ZV
– Prediktorska varijabla (varijabla koja je osnov za
predikciju) - NV
Regresiona analiza
• Linearna regresija je tehnika kojom možemo
na osnovu rezultata na jednoj varijabli (ili
skupu varijabli) predviđati rezultate na drugoj
• Na primer, na osnovu rezultata na nekom
testu možemo predvideti uspešnost obavljanja
nekog posla.
Linearna regresija je model koji se koristi
kada imamo:
• jednu zavisnu i jednu nezavisnu varijablu
(jednostruka regresija) ili – simple
(jednostavna) regresija
• jednu zavisnu i više nezavisnih (multipla
regresija) – višestruka (multipla) regresija
• kada imamo više zavisnih varijabli koristićemo
kanoničku korelacionu analizu.
Pomoću regresione analize možemo da
utvrdimo
• Da li postoji veza između nezavisnih varijabli i
zavisne varijable? Kakva je priroda
povezanosti?
• U kakvom su odnosu pojedine nezavisne
varijable i zavisna?
• Kakav je međusobni odnos nezavisnih
varijabli?
• Koliki je specifični doprinos pojedinih
prediktora u objašnjenju (predviđanju)
kriterijuma?
• Kakva je struktura latentne dimenzije
(regresionog faktora)?
• Koliki postotak varijanse zavisne varijable
(kriterijuma) možemo objasniti pomoću
nezavisnih varijabli?
• Na osnovu linearne regresije možemo
predviđati rezultate na zavisnoj varijabli
ukoliko su nam poznati rezultati na nezavisnoj,
pa u tom smislu ima značajnu praktičnu
primenu
Kada izmerimo X i Y najčešće imamo
Pogledajmo kako to izgleda na manjem broju
tačaka?
Linearna regresija koristi jednačinu prave
linije
• Opšta jednačina prave je
Y = b*X + a
• a je konstanta i grafički je jednaka odsečku na y osi intercept
• b je nagib regresione prave – slope
• Y – kriterijumska varijabla
• X - prediktorska varijabla
Grafički prikaz regresione prave
Veličina b (nagib prave) je jednostavno jednak
količniku AC/AB.
Regresiona analiza
• Možemo da zaključimo da b govori o stepenu
promene varijable Y koja je uzrokovana
promenom u varijabli X.
• Što je veće b, tj. strmija regresiona linija, veća
ja odgovarajuća promena varijable Y.
Regresiona analiza
• U realnosti nemamo nikad ovako idealnu
situciju
• Ova situacija odgovara situaciji kada je
korelacija između varijabli 1.
– Tada jednoj vrednosti x odgovara uvek ista
vrednost y
• Šta odgovara situaciji kada je korelacija 0?
• Tada jednoj vrednosti x odgovara bilo koja
vrednost y
Koeficijenti regresione prave
• Kada su varijable standardizovane b je jednako
koeficijentu korelacije i u regresionim
jednačinama se najčešće označava kao
parcijalni β ponder (koeficijent)
• β ponder nam kaže za koliko standardnih
devijacija se promeni Y kada se X promeni za
jednu standardnu devijaciju?
Standardna greška prognoze
• Standardna greška prognoze (predviđanja) zavisi od
koeficijenta korelacije i standardne devijacije
kriterijumske varijable.
• σg=σy(1-r2xy)1/2
• Prognoza će biti uspešnija (σg manje) ako je
koeficijent korelacije veći i varijansa kriterijumske
varijable manja.
Multipla regresija
• Napravimo sada malu generalizaciju
• Zamislimo da umesto jednog imamo nekoliko
nezavisnih standardizovanih prediktora.
• NEZAVISNIH ZNAČI DA JE KORELACIJA IZMEĐU NJIH
NULA.
• STANDARDIZOVANIH ZNAČI DA IM je M=0 i SD=1
• Kada su prediktorske varijable međusobno nezavisne
njihov pojedinačni parcijalni doprinos je jednak
njihovoj izvornoj korelaciji sa kriterijumom
• β ponder je DAKLE veći što je korelacija prediktorske
varijable sa kriterijumom veća!
Šta se dešava kada varijable nisu
nezavisne?
• Parcijalni (specifični) doprinos svake varijable je
manji za onaj deo varijanse koji deli sa ostalim
varijablama!
• DAKLE beta ponder je manji što je korelacija
prediktora sa ostalim prediktorima veća.
Značajnost Beta pondera
• Nulta hipoteza je?
• β ponder je jednak 0
• Određenim transformacijama β ponder se
može transformisati tako da ima t ili F
distribuciju tj. izračunava se korespondentni t
ili F test.
MULTIPLO R
• bx*=standardizovani regresioni koeficijent
(beta)
• Multiplo R je korelacija između linearnog
kompozita prediktorskih varijabli i
kriterijumske varijable.
Multiplo R2
• Multiplo R2 je odnos između varijanse
predviđenih rezultata i varijanse dobijenih
rezultata u Y
• Multiplo R2 je koeficijent MULTIPLE
DETERMINACIJE koji kaže koju proporciju
varijanse kriterijuma maksimalno može da
objasni ova linearna kombinacija prediktora
Značajnost multiplog R2
• Značajnost multiplog R2 zavisi od njegove
veličine, broja ispitanika i broja prediktorskih
varijabli.
• Manja je verovatnoća slučajnog dobijanja
nekog multiplog R2
• ako je R2 veći
• ako je uzorak ispitanika veći i
• ako je broj prediktora manji.
Značajnost multiplog R2
• To su parametri koji se uzimaju u obzir kod vrednovanja
nekog R2 .
• Broj ispitanika i broj varijabli predstavljaju osnovu za
računanje stepeni slobode
• F – količnik se dobija kao odnos sume kvadrata
predviđenih vrednosti i sume kvadrata odstupanja
predviđenih vrednosti od dobijenih (F=SSreg / SSrez, ali
ovako bi bilo da je napisano, sume kvadrata odsupanja
predviđenih vrednosti od AS kriterijumske varijable)
Adjusted R2 – Korigovani (prilagođ
prilagođeni
eni)) R2
• Gde je
– n broj ispitanika
– m broj varijabli
• Najveću inflaciju pravi broj prediktora.
Parametri koji se odnose na pojedinačne
varijable
Za svaku pojedinačnu varijablu je prilikom interpretacije
potrebno uzeti u obzir:
• njenu izvornu korelaciju sa kriterijumom;
• njene izvorne korelacije sa ostalim prediktorima;
• njenu parcijalnu korelaciju s prediktorom i parcijalni
β ponder;
• njenu korelaciju sa regresionim faktorom.
• Regresioni faktor se dobija kao najobičnija Pirsonova
korelacija predviđenih vrednosti u kriterijumskoj
varijabli i izvornih prediktorskih varijabli
• Izvorna korelacija sa faktorom je polazna osnova za
tumačenje odnosa prediktorske varijable sa
kriterijumom. Znamo da što je ona veća veći je i β
ponder.
• Parcijalna korelacija :
• Kolika bi bila korelacija između prediktora i
kriterijuma kada bi ispitanici bili izjednačeni po svim
učestvujućim varijablama osim varijable čiju
parcijalnu korelaciju promatramo,
• tj. kada bi se i iz prediktora i kriterijuma isključila sva
varijansa koja se može predvideti preostalim
varijablama
Za interpretaciju je naročito bitan odnos između
parcijalnog β pondera i izvorne korelacije
Moguće su kombinacije
1. visok β ponder visoka izvorna korelacija
varijabla je dobar prediktor
2. nizak β ponder visoka izvorna korelacijavarijansa kriterijumske varijable predviđena
drugim varijablama koje su bolji prediktori a
koreliraju s ovom varijablom
Za interpretaciju je naročito bitan odnos između
parcijalnog β pondera i izvorne korelacije
3. nizak β ponder niska korelacija
varijabla loš prediktor
4. visok β ponder niska izvorna korelacija
supresorski efekat
Pretpostavke linearne regresije
• Za linearnu regresiju treba odabrati varijable koje
visoko koreliraju sa kriterijumom, a nisko
medjusobno.
• Distribucija varijabli treba biti normalna
• Varijable traba da budu merene na najmanje
intervalnom nivou
• Linearan odnos varijabli – uvek je poželjno vizuelno
proučiti odnos varijabli i ako značajno odstupa od
linearnog transformisati podatke ili upotrebiti neku
drugu analizu
Neke dodatne mogućnosti korišćenja
linearne regresije
• Da bi se iz jedne šire baterije testova dobila
neka manja u praksi se često koristi
stupnjevite (stepwise) regresione analize
(forward i backward)
Metod forward
• Regresija metod korak po korak unapred (forward)
počinje sa varijablom koja je najbolji prediktor
• U sledećem koraku se dodaje varijabla čiji je
parcijalni doprinos kada se u obzir uzme prethodno
ubačena varijabla najveći
• Proverava se da li je razlika između novodobijenog i
prethodno dobijenog R2 značajna.
• Postupak se ponavlja sve dok se ubacivanjem nove
varijable statistički značajno povećava R2.
Metod backward
• Metod korak po korak unazad (backward) započinje
kompletnom baterijom prediktora
• U prvom koraku se izbacuje varijabla sa najmanjim
parcijalnim doprinosom
• Proverava se da li je razlika između novodobijenog i
prethodno dobijenog R2 značajna.
• Postupak se ponavlja sve dotle dok se između dva
sukcesivna koraka ne dobije statistički značajna
razlika
Metod stepwise regresija
• Stupnjevita regresija nam, dakle, omogućava da uz
manji broj prediktora zadržimo istu prediktivnu moć.
• Budući da je rešenje dobijeno ovim postupcima jako
zavisno od konteksta dobijenim rešenjima ne treba
davati dublji naučni smisao
Provera različitih modela
• Pojedine varijable se mogu uvoditi u igru i na osnovu
nekog modela (metod enter).
• U tom slučaju mi određujemo redosled kojim će se
varijable uvoditi u jednačinu, a zatim pratimo efekte
kako na prediktivnu moć tako i na ostale varijable
• To se može promatrati i kao forma eksperimenta u
kome je na osnovu “ponašanja” parcijalnih
regresionih koeficijenata moguće “otkriti” i neke
forme kauzalnosti (path analiza)
Primer u SPSS
Možemo zaključiti
• Da postoji statistički značajna povezanost
između linearne kombinacije prediktora i
kriterijuma (R i F-test za R)
• Da se pomoću ove linearne kombinacije može
objasniti 23.4% varijanse kriterijuma
• Imajući u vidu odnos broja prediktora i
kriterijuma realistična procena je oko 18 %
Možemo zaključiti
• Da statistički značajnu prediktivnu moć
(nenulte nagibe) gledajući visinu i značajnost
Beta pondera imaju samoprocena
matematičke kompetentnosti, zatim
inteligencija merena testom rezonovanja
likova te samoprocena inteligencije kaja je
tipičan supresor
• Eksternalnost koja je treća varijabla po visini
korelacije i koja značajno korelira se
kriterijumom u kontekstu drugih varijabli gubi
na važnosti
• Isto se može reći i za domino test
Vežba
• Potrebno je da ispitate socioekonomski status
i suočavanje sa stresom samohranih roditelja
u Crnoj Gori
• Definišite:
– Koje samohrane roditelje biste ispitivali
(samohrane majke, očeve, razvedene, koga još?)
– Kako biste operacionalizovali socioekonomski
status?
– Kako biste ispitali suočavanje sa stresom?