ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΤΑΞΙΝΟΜΗΜΕΝΑ ∆Ε

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
ΑΤΑΞΙΝΟΜΗΜΕΝΑ ∆Ε∆ΟΜΕΝΑ
Αριθµητικός Μέσος:
∑ Xi
όπου n: αριθµός παρατηρήσεων
n
1

∆ιάµεσος: εάν n άρτιος M =  X n + X n 
+1
2

2
2

1
2

X


εάν n περιττός M = X n +1
2
Παράδειγµα:
∆ηλ.: Εάν n=4 → X:1, 2, 3, 4 → M =
=
n
+1
2
+ X
n
2




1
( X 3 + X 2 ) = 1 (3 + 2 ) = 5 = 2 ,5
2
2
2
Εάν n=3 → X:1, 2, 3 → M = X 3+1 = X 4 = X 2 = 2
2
2
Επικρατούσα Τιµή: Η τιµή µε την µεγαλύτερη συχνότητα εµφάνισης
Εύρος: Χmax – Xmin
1
ΤΕΤΑΡΤΗΜΟΡΙΟ – i
Qi = Η τιµή της παρατήρησης στη θέση

i ( n + 1)
→  X
4

i (n + 1 )
4




Qi = X i ( n+1) = ΧAQ + ∆ Q (ΧΑQ+1 - ΧAQ)
4
Όπου: ΑQ:Το ακέραιο µέρος του πηλίκου
i (n + 1)
4
∆Q:Το δεκαδικό µέρος του πηλίκου
i (n + 1)
4
Παράδειγµα: Χi: 0, 2, 6, 12, 12, 60, 62, 63, 100, 100, 100
Εύρος: Χmax – Xmin = 100 – 0 =100
∆ιάµεσος: X 11+1 = X 12 = X 6 = 60
2
2
Αριθµ. Μέσος:
∑ Xi = 47
n
Q1 = X i ( n +1) = X 1(11+1) = X 12 = X 3 → 6 → Q1 = 6
4
4
4
Q3 = X i ( n +1) X 3(11+1) = X 9 → 100 → Q3 = 100
4
0
2
4
6
12
12
Q1
60
Q2
62
63
100
100
100
Q3
1ο ΤΕΤΑΡΤΗΜΟΡΙΟ: ΤΙΜΗ ΑΡΙΣΤΕΡΑ ΤΗΣ ΟΠΟΙΑΣ ΒΡΙΣΚΕΤΑΙ ΤΟ 25% ΤΟΥ ΣΥΝΟΛΙΚΟΥ
ΑΡΙΘΜΟΥ ΤΩΝ ∆Ε∆ΟΜΕΝΩΝ
2ο ΤΕΤΑΡΤΗΜΟΡΙΟ:ΟΡΙΖΕΤΑΙ ΑΠΟ ΤΗΝ ∆ΙΑΜΕΣΟ (ΑΡΙΣΤΕΡΑ ΤΟΥ 50%)
3ο ΤΕΤΑΡΤΗΜΟΡΙΟ: ΤΙΜΗ ΑΡΙΣΤΕΡΑ ΤΗΣ ΟΠΟΙΑΣ ΒΡΙΣΚΕΤΑΙ ΤΟ 75% ΤΩΝ ∆Ε∆ΟΜΕΝΩΝ
Ενδοτεταρτηµοριακό Εύρος: IR = Q3 - Q1 = 100 - 6 = 94 ΕΙΝΑΙ ΣΧΕ∆ΟΝ ΙΣΟ ΜΕ ΤΟ
ΕΥΡΟΣ
2
∆ιακύµανση: S
2
∑X
=
2
i
− nX
Τυπική Απόκλιση: S = S 2
n −1
ΠΑΡΑ∆ΕΙΓΜΑ:
Χi:
0
2
6
12
12
60
62
63
Xi2: 0
4
36
144
144
3600
3844
3969 10000 10000 10000
∑X
X =
n
i
517
=
= 47
11
S
2
∑X
=
Συντελεστής Ασυµµετρίας: Sp =
2
i
− nX
n −1
X − To
S
=
100
100
41741 − 11 * 47
= 4122,9
10
ή Sp =
100
ΣXi = 517
Σ Xi2 = 41741
S = S 2 = 4122,4 = 64,21
3( x − M )
S
όπου X → Μέσος, Τ0 → Επικρατούσα Τιµή, S → Τυπική Απόκλιση
Άρα: Sp =
X − T0 47 − 100
=
= −0,825 : Η κατανοµή των δεδοµένων εµφανίζει αρνητική
S
64,21
ασυµµετρία
ΘΗΚΟΓΡΑΜΜΑ: Το θηκόγραµµα αποτελεί γραφικό τρόπο παρουσίασης 5 περιληπτικών
µέτρων µιας κατανοµής: Χmax, Xmin, Μ, Q3, Q1
∆ηλ.
Q1
M
Q3
Χmin
Xmax
25%
25%
50%
3
ΤΑΞΙΝΟΜΗΜΕΝΑ ∆Ε∆ΟΜΕΝΑ
ΤΑΞΗ
ΚΕΝΤΡΙΚΗ ΤΙΜΗ
ΤΑΞΗΣ mi
ΣΥΧΝΟΤΗΤΑ
fi
mi Χ fi
ΑΘΡΟΙΣΤΙΚΗ
ΣΥΧΝΟΤΗΤΑ
Fi
mi - 16,23
(mi - 16,23)
10-12
11
4
44
4
-5.23
27.35
109.4
12-14
13
21
273
25
-3.23
10.43
219.03
14-16
15
57
855
82
-1.23
1.51
86.07
16-18
17
39
663
121
0.77
0.59
23.01
18-20
19
22
418
143
2.77
7.67
168.74
20-22
21
8
168
151
4.77
22.75
182
22-24
23
2
46
153
6.77
45.83
91.66
24-26
25
2
50
155
8.77
76.91
153.82
155
2517
ΣΥΝΟΛΑ
Αριθµητικός Μέσος: X = ∑
f i mi
∑f
Επικρατούσα Τιµή: T0 = LT + δ
0
i
=
2
fi (mi –
2
16,23)
1033.73
2517
= 16.23
155
∆1
∆1 + ∆ 2
* Η τάξη που περιέχει την επικρατούσα τιµή είναι αυτή µε την µεγαλύτερη συχνότητα
LT0 : Κατώτερο άκρο της τάσης που περιέχει την επικρατούσα τιµή
∆1: Η διαφορά συχνοτήτων της οµάδας που περιέχει την επικρατούσα τιµή και της
προηγούµενης οµάδας
∆2: Η διαφορά των συχνοτήτων µεταξύ της οµάδας που περιέχει την επικρατούσα τιµή και
της επόµενης οµάδας
T0 = LT0 + δ
∆1
57 − 21
=14+2
= 15.33
∆1 + ∆ 2
(57 − 21) + (57 − 39)
LT0 =14 διότι η τάξη µε την µεγαλύτερη συχνότητα είναι η (14-16)
δ=2, ∆1=57-21, ∆2=57-39
4
n
( − FM −1 )
∆ιάµεσος: Μ= LM + δ 2
fM
*Η τάξη που περιέχει τον διάµεσο εντοπίζεται σαν αυτή που έχει αθροιστική συχνότητα ≥
LM: Κατώτερο άκρο της τάξης που περιέχει το διάµεσο (Μ)
FM-1: Αθροιστική συχνότητα πριν από την οµάδα που περιέχει τον διάµεσο
fM: Συχνότητα της οµάδας που περιέχει τον διάµεσο
n
155
( − FM −1 )
(
− 25)
2
2
Μ= LM + δ
=14+2
= 15.84
57
fM
n 155
=
= 77,5 άρα η τάξη (14-16) έχει αθροιστική συχνότητα = 82 > 77,5
2
2
LM = 14, FM-1 = 25, fM = 57
ΤΕΤΑΡΤΗΜΟΡΙΟ – i
Q1
n
( − FQ1−1 )
Q1= LQ1 + δ 4
f Q1
*Η τάξη που περιέχει το Q1 εντοπίζεται σαν αυτή που έχει αθροιστική συχνότητα ≥
∆ηλ.
155
= 38.75 και είναι η (14-16) ↔ FQ1 = 82
4
LQ1: Κατώτερο άκρο της τάξης που περιέχει το Q1 (LQ1=14)
FQ1-1: Αθροιστική συχνότητα πριν από την οµάδα που περιέχει το Q1 ( FQ =25)
1−1
fQ1: Συχνότητα της οµάδας που περιέχει το Q1 (fQ1=57)
155
− 25)
Άρα µε: LQ1=14, δ=2, FQ1−1 =25, n=155 Q1=14+2 4
= 14,48
57
(
5
n
4
n
2
Q3
3n
− FQ 3−1 )
4
Q3= LQ3 + δ
fQ 3
(
*Η τάξη που περιέχει το Q3 εντοπίζεται σαν αυτή που έχει αθροιστική συχνότητα ≥
∆ηλ.
3n
4
3 * 155
= 116,25 και είναι η (16-18) ↔ FQ3 =121
4
LQ3: Κατώτερο άκρο της τάξης που περιέχει το Q3 (LQ3=16)
FQ3-1: Αθροιστική συχνότητα πριν από την οµάδα που περιέχει το Q3 ( FQ 3−1 =82)
fQ3: Συχνότητα της οµάδας που περιέχει το Q3 (fQ3=39)
3n
3 *155
− 82
− FQ 3 −1 )
Άρα µε: LQ3 =16, FQ 3−1 = 82, f Q 3 =39 Q3= LQ3 + δ 4
= 16+2 4
= .......
39
fQ3
(
2
∆ιακύµανση: S =
∑ f (m
∑f
i
i
− X )2
i
−1
∑ f (m − 16.23)
=
∑ f −1
i
i
i
2
=
1033.73
= 6.71
155 − 1
Τυπική Απόκλιση: S = S 2 = 6.71 = 2.59
Συντελεστής Μεταβλητότητας: CV =
S
* 100
X
Παράδειγµα:
∆εύτερο δείγµα µε: X =16 και S=3 Να συγκριθεί µε το προηγούµενο:
X =16.23 και
S=2.59
CVA=
2.59
3
*100 = 15.958% & CVB = *100 = 18.75%
16.23
16
Το δεύτερο δείγµα έχει µεγαλύτερη διασπορά εν σχέσει µε τον πρώτο
6
ΠΙΘΑΝΟΤΗΤΕΣ
∆ειγµατικός Χώρος: Το σύνολο των δυνατών αποτελεσµάτων ενός τυχαίου πειράµατος
αποτελεί το δειγµατικό χώρο Ω.
∆ειγµατικό Σηµείο ή Στοιχειώδες Ενδεχόµενο: Κάθε ένα από τα δυνατά αποτελέσµατα
ενός τυχαίου πειράµατος ονοµάζεται στοιχειώδες ενδεχόµενο ή δειγµατικό σηµείο.
Ενδεχόµενο: Κάθε υποσύνολο Α του δειγµατικού χώρου Ω ονοµάζεται ενδεχόµενο.
Παράδειγµα: Η ρίψη ενός νοµίσµατος 2 φορές: Ω = {ΚΓ, ΓΓ, ΚΚ, ΓΚ}
Ενδεχόµενο: Α = {ΚΚ, ΓΓ} ⊆ Ω
7
Συµβολισµός
Ενδεχόµενο
Σηµασία
"ΑήΒ"
To A ∪ B πραγµατοποιείται
όταν πραγµατοποιείται ένα
τουλάχιστον από τα Α,Β
A∩ B
" Α και Β "
To A ∩ B πραγµατοποιείται
όταν πραγµατοποιούνται
συγρόνως το Α και Β
Α'
Όχι Α ή
αντίθετο του
Το Α΄ πραγµατοποιείται
Αή
όταν πραγµατοποιείται το Α
συµπληρωµατι
κό του Α
Α-Β
Η διαφορά
του Β από το
Α
A∪ B
Παράσταση
Το Α-Β πραγµατοποιείται,
όταν πραγµατοποιείται το Α
αλλά όχι το Β
8
∆ύο ενδεχόµενα Α και Β είναι ασυµβίβαστα όταν A ∩ B = ∅
Έστω Ω = {w1, w2, …….., wν} ένας δειγµατικός χώρος µε πεπερασµένο πλήθος
στοιχείων. Σε κάθε απλό ενδεχόµενο αντιστοιχεί µια πιθανότητα του ενδεχοµένου {wi}.
Επίσης ισχύει 0 ≤ P(wi) ≤ 1 και P(w1) + P(w2) + P(w3) +….+ P(wν) = 1.
ΠΡΟΣΘΕΣΗ ΠΙΘΑΝΟΤΗΤΩΝ
2 ΕΝ∆ΕΧΟΜΕΝΑ:
P( A1 ∪ A2 ) = P( A1 ) + P( A2 ) − P( A1 ∩ A2 )
3 ΕΝ∆ΕΧΟΜΕΝΑ:
P( A1 ∪ A2 ∪ A3 ) = P( A1 ) + P( A2 ) + P ( A3 ) − P( A1 ∩ A2 ) − P( A1 ∩ A3 ) − P( A2 ∩ A3 ) − P( A1 ∩ A2 ∩ A3 )
Για 2 ενδεχόµενα Α, Β για τα οποία A ⊆ B ισχύει: P(Α) ≤ P(B)
Για κάθε ενδεχόµενο Α ισχύει: P(A) + P(A’) = 1
9
∆ΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ: Αν Α και Β είναι δύο ενδεχόµενα ενός δειγµατικού
χώρου Ω και P(B) > 0, τότε ο λόγος
P( A ∩ B)
λέγεται δεσµευµένη πιθανότητα του Α µε
P( B)
δεδοµένο το Β και συµβολίζεται µε Ρ(Α| Β). ∆ηλαδή: Ρ(Α| Β)=
P( A ∩ B)
µε P(B)>0.
P( B)
Άρα P( A ∩ B =P(A|B)*P(B)= Ρ(Β| Α) * Ρ(Α) Πολλαπλασιαστικός Νόµος των Πιθανοτήτων
ΠΑΡΑ∆ΕΙΓΜΑ: Μια κάλπη περιέχει 7 σφαίρες µπλε και 3 κόκκινες. ∆ύο σφαίρες
εκλέγονται τυχαία, διαδοχικά χωρίς επανατοποθέτηση. Θέλουµε να υπολογίσουµε την
πιθανότητα η πρώτη σφαίρα να είναι κόκκινη και η δεύτερη µπλε.
ΛΥΣΗ: Έστω: Α – Η σφαίρα είναι κόκκινη και Β – Η σφαίρα είναι µπλε. Η πιθανότητα η
πρώτη σφαίρα να είναι κόκκινη είναι Ρ(Α) =
3
. Η δεύτερη σφαίρα επιλέγεται από την
10
κάλπη που περιέχει 7 µπλε σφαίρες και 2 κόκκινες. Η πιθανότητα η δεύτερη σφαίρα να είναι
µπλε είναι: P(B|A)=7/9. Άρα η πιθανότητα η πρώτη επιλογή να είναι κόκκινη σφαίρα και η
δεύτερη µπλε είναι: P(A ∩ B)=P(A)*P(B|A)=(3/10)*(7/9)=7/30
ΑΝΕΞΑΡΤΗΤΑ ΕΝ∆ΕΧΟΜΕΝΑ: Ρ(Α| Β) = Ρ(Α) ή Ρ(Β| Α) = Ρ(Β)
P( A ∩ B ) = Ρ(Α) * Ρ(Β)
P( A ∩ B ∩ Γ) = P( A) * P( B) * P (Γ)
Παράδειγµα: Έστω ότι βγάζουµε ένα χαρτί από µια τράπουλα και θέλουµε το χαρτί αυτό
να είναι άσσος σπαθί. Ποια η πιθανότητα;
Λύση: Α = {Το χαρτί είναι άσσος} ↔ P( A) =
Β = {Το χαρτί είναι σπαθί} ↔ P( B) =
P( A ∩ B ) = Ρ(Α) * Ρ(Β) =
4
1
=
52 13
13 1
=
52 4
1 1 1
* =
13 4 52
10
ΘΕΩΡΗΜΑ ΟΛΙΚΗΣ ΠΙΘΑΝΟΤΗΤΑΣ: Έστω ότι Α1, Α2, ……… Αn
είναι µία
διαµέριση του δειγµατικού χώρου S τέτοια ώστε Ρ(Αi) ≠ 0, i=1,2,…….,n τότε για κάθε
n
ενδεχόµενο E έχουµε: Ρ(E) =
∑ P( A ) * P( E / A )
i
i
i =1
Ρ(E) = Ρ(Α1) * Ρ(E| Α1)+ Ρ(Α2) * Ρ(E| Α2) + Ρ(Α3) * Ρ(E| Α3) + Ρ(Α4) * Ρ(E| Α4) + Ρ(Α5)*
Ρ(E| Α5)
Παράδειγµα: Τρία κουτιά περιέχουν στοιχεία, µερικά από τα οποία είναι ελαττωµατικά.
Η αναλογία φαίνεται στον παρακάτω πίνακα.
ΑΡΙΘΜΟΣ ΣΤΟΙΧΕΙΩΝ
ΑΡΙΘΜΟΣ ΕΛΑΤΤΩΜΑΤΙΚΩΝ
ΚΟΥΤΙ 1
10
4
ΚΟΥΤΙ 2
6
1
ΚΟΥΤΙ 3
8
3
∆ιαλέγουµε ένα κουτί στην τύχη και στην συνέχεια διαλέγουµε ένα στοιχείο στην τύχη
από το κουτί αυτό. Να βρεθεί η πιθανότητα το στοιχείο να είναι ελαττωµατικό.
Λύση: Έστω Αi = {το στοιχείο προέρχεται από το κουτί i} i = 1,2,3
E = {το στοιχείο να είναι ελαττωµατικό}
Ρ(Ε) = Ρ(Ε| Α1) * Ρ(Α1) + Ρ(Ε| Α2) * Ρ(Α2) + Ρ(Ε| Α3) * Ρ(Α3) = (4 / 10) * (1/3) + (1/6) *
(1/3) + (3/ 8) * (1/3) = 113 / 360
11
ΘΕΩΡΗΜΑ BAYES: Έστω Α1, Α2, ……… Αn µια διαµέριση του δειγµατικού χώρου S
µε P(Αi) > 0 για κάθε i=1,2,….,n τότε, για κάθε ενδεχόµενο Ε µε Ρ(Ε) > 0 έχουµε ότι:
Ρ(Ακ|Ε) =
P( E / Ak ) * P( Ak )
P( E / Ak ) * P( Ak )
=
P( E )
∑i P( E / Ai ) * P( Ai )
Παράδειγµα: Στην αρχή του χρόνου, διατυπώθηκαν τρεις οικονοµικές θεωρίες για την
πιθανή εξέλιξη της Ελληνικής οικονοµίας. Όταν διατυπώθηκαν και οι τρεις θεωρίες
φαίνονταν ισοπιθανές. Στο τέλος του έτους εξετάσθηκε η πραγµατική κατάσταση της
οικονοµίας µε αναφορά τις τρεις θεωρίες. Η ανάλυση κατέληξε στο συµπέρασµα ότι αν η
πρώτη θεωρία ήταν αληθινή η οικονοµία θα είχε πιθανότητα 0,6 να καταλήξει στην
παρούσα κατάσταση. Οι αντίστοιχες πιθανότητες για την δεύτερη και την τρίτη
πρόβλεψη είναι 0,4 και 0,2. Να υπολογισθεί η πιθανότητα µε την οποία η παρούσα
κατάσταση της οικονοµίας µπορεί να θεωρηθεί αποτέλεσµα της θεωρίας i, i = 1,2,3
Λύση: Έστω Αi = {η θεωρία i είναι σωστή} i = 1,2,3
Έχουµε: Ρ(Α1) = Ρ(Α2) = Ρ(Α3) = 1/3
Έστω Ε ={Η οικονοµία βρίσκεται στην παρούσα κατάσταση}
Με βάση το θεώρηµα Bayes έχουµε για την πρώτη θεωρία:
 6  1
 * 
P( E / A1 ) * P( A1 )
 10   3 
P( A1 / E ) =
=
6
1
P( E / A1 ) * P( A1 ) + P( E / A2 ) * P( A2 ) + P( E / A3 ) * P( A3 )      4   1   2   1 
 *  +  *  +  * 
 10   3   10   3   10   3 
6 1
=
=
12 2
κλπ. για τις άλλες θεωρίες
12
ΚΑΤΑΝΟΜΕΣ
 n
n!
∆ιωνυµική Κατανοµή: Pn,x = P(X=x) =   p x q n − x =
p x q n− x
x!(n − x)!
 x
Μέση Τιµή: µ = np
Τυπική Απόκλιση: σ =
npq
ΠΑΡΑ∆ΕΙΓΜΑ: Ένα εργοστάσιο παράγει προϊόντα από τα οποία το 10% είναι
ελαττωµατικά. Έστω ότι επιλέγονται τυχαία 4 προϊόντα. Ποια η πιθανότητα από το
δείγµα των 4 συγκεκριµένων προϊόντων τα δυο να είναι ελαττωµατικά;
ΛΥΣΗ: x=2, n=4, p=0.10, q=0.90
 n
 4
P(x=2) =   p x q n − x ⇒ P ( x = 2) =   * 0,10 2 * 0,90 4− 2 = 0,049 ⇒ P ( x = 2) = 4,860%
 x
 2
Όταν Ερωτηθείτε: Ποια η πιθανότητα από το δείγµα των 4 προϊόντων τουλάχιστον δύο
να είναι ελαττωµατικά. Τότε πρέπει να βρείτε τις εξής πιθανότητες: Ρ(x=2), Ρ(x=3),
Ρ(x=4) και άρα η P(x≥2)=P(x=2)+P(x=3)+P(x=4). Ή να βρείτε P(x=0), P(x=1) και άρα η
Ρ(x≥2) = 1 – Ρ(x=0) – Ρ(x=1)
13
e − λ λκ
Κατανοµή Poisson: Ρ(x=κ) =
κ= 0,1,2……
κ!
Μέση Τιµή: µ=λ
Τυπική Απόκλιση: σ=λ
Παράδειγµα: Μεταξύ των ωρών 6µµ και 7µµ η υπηρεσία καταλόγου Αττικής του ΟΤΕ
δέχεται κατά µέσο όρο 2 κλήσεις το λεπτό. Υποθέτοντας ότι οι κλήσεις κατανέµονται
τυχαία στο χρόνο, βρείτε την πιθανότητα η τηλεφωνήτρια της συγκεκριµένης υπηρεσίας
να δεχθεί σε κάποιο τυχαία επιλεγµένο λεπτό: α) 4 κλήσεις, β)6 κλήσεις σε τυχαία
περίοδο δύο λεπτών.
Λύση: α)Συµβολίζουµε µε x τον αριθµό των κλήσεων που γίνονται σε τυχαίο λεπτό
e −2 * 2 4
Ρ[x=4] =
= 0,090
4!
β) Ρ[x=6] =
e −2 * 2 6
= 0,104
6!
14
r 
 
k
Υπεργεωµετρική Κατανοµή: Ρ(x=κ) =  
r 
N − r


r
N −r
 n − k  = C (r , k ) * C ( N − r , n − k ) = Ck * Cn − k
c ( N , n)
CnN
N
 
n 
r!
Όπου:   = C (r , k ) = Ckr =
k!(r − k )!
k 
Παράδειγµα: Σε µια στέρνα υπάρχουν Ν=15 ψάρια από τα οποία r=5 είναι
κόκκινα και τα υπόλοιπα Ν-r=10 είναι µαύρα. Ποια είναι η πιθανότητα στα n=4
ψάρια που θα πιάσουµε τα 3 να είναι κόκκινα;
Λύση: κ=3, Ν=15, r=5, Ν-r=10, n=4
5
 
3
P(x=3) =  
15 − 5 


4 − 3  =
15 
 
4 
 5  10 
   
 3  1  = 0,033
15 
 
4 
H πιθανότητα στα 4 ψάρια που θα πιάσουµε
τα 3 να είναι κόκκινα είναι 0,033
15
ΣΥΝ∆ΥΑΣΜΟΙ
Ορισµός: Έστω ένα σύνολο S περιέχει n στοιχεία. Ένα υποσύνολο του S από r
στοιχεία είναι ένας συνδυασµός των n ανά r. Το σύνολο των διαφορετικών
n
συνδυασµών των n ανά r συµβολίζεται µε:   ή Crn ή C (r, n)
r
 
n
n!
Πόρισµα:   =
 r  r!(n − r )!
Παράδειγµα: Να βρεθεί ο αριθµός των τριµελών επιτροπών που είναι δυνατόν
να ορισθούν από ένα σύνολο 8 ατόµων
8
8!
Λύση:   =
= 56
 3  3!(8 − 3)!
Παράδειγµα: Ένας µαθητής πρέπει να απαντήσει στις εξετάσεις της ιστορίας σε
6 από 9 ερωτήσεις. Πόσες επιλογές έχει;
9
9!
9!
Λύση:   =
=
=
 6  6!(9 − 6)! 6!⋅3!
6!⋅7 ⋅ 8 ⋅ 9 7 ⋅ 8 ⋅ 9
=
= 84
6!⋅3!
1⋅ 2 ⋅ 3
16
ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ
F(x)
68%
95%
-∞
µ-26
µ-6
µ
µ+6
µ+26
+∞
- Η κανονική κατανοµή είναι συµµετρική περί το µ που είναι ο µέσος όρος όλων των
δυνατών τιµών της τ.µ.χ.
- Η επικρατούσα τιµή, η διάµεσος και ο µέσος ταυτίζονται λόγω συµµετρίας της
καµπύλης της κατανοµής
- Το συνολικό εµβαδόν που περικλείεται από την καµπύλη και τον άξονα των X είναι
µοναδιαίο
ΕΠΙΣΗΣ: X ~ N ( µ ,σ 2 ),
E[ X ] = µ ,
Var ( X ) = σ 2
17
Τυποποιηµένη Κανονική Κατανοµή: Αν η τυχαία µεταβλητή Χ έχει µέσο µ και
X −µ
διακύµανση σ2, τότε η τυχαία µεταβλητή Z =
σ
αποκλείει την τυποποιηµένη
µορφή της X και έχει µέσο ίσο µε µηδέν (0) και διακύµανση ίση µε τη µονάδα (1)
→ Z ~Ν(0,1)
* Αν η τυχαία µεταβλητή Χ~Ν(µ, σ2), τότε η τυχαία µεταβλητή Ζ~Ν(0,1)
Παράδειγµα: Η τυχαία µεταβλητή Χ~Ν(100, 152), να υπολογισθεί η πιθανότητα Ρ(115
< Χ < 130)
Απάντηση: Z =
X −µ
σ
=
X − 100
~ Ν(0,1)
15
Ν(100, 152)
Ν(0,1)
100 115 130
0
1
2
115 − 100 X − 100 130 − 100 
Ρ(115<Χ<130) = Ρ 
<
<
 = Ρ(1<Ζ<2)

15
15
15

Το σκιαγραφηµένο εµβαδόν της Ν(100, 152) ισοδυναµεί µε το σκιαγραφηµένο κόκκινο
εµβαδόν της
Ν(0,1). Πρέπει πρώτα να µιλήσουµε για την αθροιστική κατανοµή
προκειµένου να υπολογίσουµε την πιο πάνω πιθανότητα. Είναι ανάγκη λοιπόν να
ορίσουµε τη συνάρτηση αθροιστικής κατανοµής ή απλώς συνάρτηση κατανοµής της
τυποποιηµένης κανονικής κατανοµής Ν(0,1).
18
Αθροιστική Κατανοµή ή Συνάρτηση Κατανοµής της Τυποποιηµένης Κανονικής
Κατανοµής Ν(0,1).
Η συνάρτηση κατανοµής της Ν(0,1) συµβολίζεται µε Φ(z) και ορίζεται από την
Ρ(-∞<Ζ<z) = Ρ(Ζ<z). ∆ηλαδή, για κάποιο z0 η Ρ(-∞<Ζ<z0) = Φ(z0)
z0
Βασιζόµενοι λοιπόν στον ορισµό της Φ(z) είναι φανερό ότι οι πιθανότητες της
µορφής Ρ(α<Χ<β), µετασχηµατιζόµενες σε πιθανότητες της µορφής Ρ(zα<Ζ< zβ)
υπολογίζονται ως ακολούθως:
α − µ Χ − µ β − µ 
Ρ(α<Χ<β) = P
〈
〈
 = Ρ(zα<Ζ<zβ)
σ
σ 
 σ
Ρ(-∞<Ζ<zβ) - Ρ(-∞<Ζ<zα) = Φ(zβ) – Φ(zα)
Όπου zα =
α −µ
σ
και zβ =
β −µ
είναι οι τυποποιηµένες τιµές της µεταβλητής
σ
Χ~Ν(µ, σ2)
Φ(Ζβ) – Φ(Ζα)
zα
zβ
19
Λύση του Προηγούµενου Παραδείγµατος:
115 − 100 X − 100 130 − 100 
Ρ(115<Χ<130) = P
〈
〈
 = Ρ(1<Ζ<2) = Ρ(-∞<Ζ<2) - Ρ(
15
15
15

∞<Ζ<1) = Φ(2) – Φ(1) = 0,9772 – 0,8413 = 0,135
Η εύρεση τιµών της Φ(Ζ) διευκολύνεται από την ύπαρξη πινάκων. Από τους
πίνακες Φ(2) = 0,9772 και Φ(Α) = 0,8413.
Επίσης: Φ(-Ζ) = 1-Φ(Ζ)
Παράδειγµα: Να βρεθεί η πιθανότητα Ρ(-∞<Ζ<-1,4)
Λύση: Ρ(-∞<Ζ<-1,4) = Φ(-1,4) = 1 – Φ(1,4) = 1 – 0,9192 = 0,0808
1 – Φ(1,4) = Φ(-1,4)
Φ(-1,4)
0
20
ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ∆ΡΟΜΗΣΗ
ΜΗΝΕΣ
ΠΩΛΗΣΕΙΣ
∆ΙΑΦΗΜΙΣΗ
Υ
Χ
Χ2
Υ2
ΧΥ
1
48.0
3.2
10.24
2304
153.6
2
74.5
4.1
16.81
5478
305.45
3
35.7
1.1
1.21
1274.49
39.27
4
33.4
2.0
4.0
1115.57
66.8
5
60.0
3.3
10.89
3600
198
6
77.3
5.6
31.36
5975.29
432.88
7
55.8
2.5
6.25
3113.64
139.5
8
58.2
3.8
14.44
3387.24
221.16
9
60.1
4.8
23.04
3612.01
288.48
10
92.4
4.8
23.04
8537.76
443.52
11
63.7
3.9
15.21
4057.69
248.43
12
44.0
2.2
4.84
1936
96.8
ΑΘΡΟΙΣΜΑ
703.1
30.9
161.33
44389.68
2633.89
Υ
∧
●
●
●
●
●
Y = α0 + α1 Χ
α1
●
●
α0
0
●
●
Χ
21
a1 =
Άρα :
∧
∑ XY −
∑ X ∑Y
∑Y − a ∑ X
n
, a0 =
1
2
n
n
(∑ X )
2
∑X − n
a1 =
∑ XY −
∑ X ∑Y
n
(∑ X )2
2
∑X − n
2633.89 −
=
(703.1)(30.9)
12
2
(
30.9)
(161.33) −
12
=
2633.89 − 1810.48
⇒
161.33 − 79.57
α1 =
823.41
⇒ α 1 = 10
81.76
α0 =
703.1
30.9
− 10 *
= 58.59 − 10 * 2.575 ⇒ a0 = 32.84
12
12
∧
Y = α0 + α1 Χ ⇒ Y = 32.84 + 10 *Χ
Χρησιµοποιώντας το τυπολόγιο βρίσκουµε τον Συντελεστή Συσχέτισης → r και τον
Συντελεστή Προσδιορισµού R2 = r2
22
Εναλλακτικά για την εκτίµηση του α1 µπορούµε να χρησιµοποιήσουµε τον τύπο των
αποκλίσεων των τιµών από τους µέσους:
α1 =
∑ [(Υ − Y )(X − X )]
∑ (X − X )
i
]
Υ
X −Y
Y −Y
(X − X )
(Y − Y )
(X − X ) (Y − Y )
3
4
6
2
10
12
17
4
-0.75
0.25
2.25
-1.75
-0.75
1.25
6.25
-6.76
0.5625
0.0625
5.0625
3.0625
8.75
0.5625
1.5625
39.0625
45.5625
86.75
0.5625
0.3125
14.0625
11.8125
26.75
∑X
Y=
∑Y
n
α1 =
2
i
Χ
X=
n
[
i
=
2
2
15
= 3.75
4
43
= 10.75
4
=
∑ [(Υ − Y )(X − X )] =
∑ (X − X )
i
[
i
2
i
]
26.75
⇒ a1 = 30.57
8.75
Επίσης βασιζόµενοι στο τυπολόγιο µπορούµε να υπολογίσουµε r και R2
χρησιµοποιώντας τους τύπους των αποκλίσεων των τιµών από τους µέσους.
23