∆ρ. Ευστρατία Μούρτου

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ∆ΕΥΤΙΚΟ
Ι∆ΡΥΜΑ ΠΑΤΡΩΝ
ΣΧΟΛΗ ΕΠΑΓΓΕΛΜΑΤΩΝ ΥΓΕΙΑΣ ΚΑΙ ΠΡΟΝΟΙΑΣ
ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ
ΕΞΑΜΗΝΟ : Ε’
ΑΚΑ∆ΗΜΑΪΚΟ ΕΤΟΣ : 2009 - 2010
ΜΑΘΗΜΑ
«ΒΙΟΣΤΑΤΙΣΤΙΚΗ»
ΚΕΦ. 4
ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ
∆ρ. Ευστρατία Μούρτου
∆ρ. Ευστρατία Μούρτου
1
4.5. Η Κανονική Κατανοµή (normal distribution)ή Κατανοµή του Gauss
(Gaussian distribution )ή κατανοµή των σφαλµάτων (law of errors)
H κανονική κατανοµή θεωρείται η σπουδαιότερη συνεχής κατανοµή
στην Στατιστική, όχι µόνο γιατί αρκετές τυχαίες µεταβλητές Χ περιγράφονται
από αυτήν σε αρκετά ικανοποιητικό βαθµό, αλλά και γιατί πολλές από της
ιδιότητές της προσεγγίζουν πολλές παρατηρήσεις και πειράµατα τύχης.
Πολλά φυσικά φαινόµενα καθώς και µετρήσεις ακολουθούν την κανονική
κατανοµή, όπως για παράδειγµα το βάρος, το ύψος και η αρτηριακή πίεση, τα
επίπεδα ουρίας και χοληστερόλης σε µεγάλο πλήθος ατόµων (πλήθος
µεγαλύτερο ή ίσο του 1000). Αυτό σηµαίνει ότι η απεικόνιση του πολύγωνου
συχνοτήτων αυτών των µετρήσεων, τείνει να ακολουθήσει την κανονική
καµπύλη ή καµπύλη του Gauss.
Το χαρακτηριστικό της κανονικής κατανοµής είναι η απεικόνισή της µε
την κανονική καµπύλη, η οποία έχει κωδωνοειδή µορφή, είναι συµµετρική και
το αριστερό και δεξί άκρο της τείνουν να ακουµπήσουν ασυµπτωτικά τον
οριζόντιο άξονα χχ’.
Ο µεγάλος αριθµός των εφαρµογών που ακολουθούν την κανονική
κατανοµή στηρίζεται στο Κεντρικό
Οριακό
Θεώρηµα της Θεωρίας
Πιθανοτήτων, κατά το οποίο κάθε ποσότητα της οποίας η τιµή µπορεί να
θεωρηθεί
ότι
διαµορφώνεται
από
ένα
µεγάλο
αριθµό
ανεξάρτητων
παραγόντων ή µεταβλητών ακολουθεί προσεγγιστικά την κανονική κατανοµή.
Οι ανεξάρτητοι παράγοντες είναι αυτοί που παίζουν σηµαντικό ρόλο σε µια
παρατήρηση και φυσικά την επηρεάζουν σε διαφορετικό βαθµό, χωρίς όµως ο
∆ρ. Ευστρατία Μούρτου
2
ένας να επηρεάζει τον άλλο. Για παράδειγµα, τα επίπεδα χοληστερόλης στο
αίµα ενός ενήλικα είναι αποτέλεσµα πολλών παραγόντων, όπως η
κληρονοµικότητα, η διατροφή, η ηλικία, η έλλειψη άσκησης, το υπερβολικό
πάχος, ο υποδραστήριος θυρεοειδής αδένας, ο διαβήτης ή προβλήµατα µε τα
νεφρά. Καθένας από τους παράγοντες αυτούς επιβαρύνει τα επίπεδα
χοληστερόλης και αν αυτοί συνυπάρχουν τότε αθροιστικά επιβαρύνουν
περισσότερο την κατάσταση αυτή. Αυτό ακριβώς εκφράζει και το Κεντρικό
Οριακό
Θεώρηµα:
“Ας θεωρήσουµε καθένα
από
τους παραπάνω
παράγοντες ως ανεξάρτητες µεταβλητές και ας τους συµβολίσουµε αντίστοιχα
µε Χ1, Χ2, ..., Χn . Αν υποθέσουµε ότι έχουν µέση τιµή µ και διακύµανση σ²,
τότε το άθροισµα Σi= Χ1+ Χ2+...+Χn , i-1,2,…,n, προσεγγίζει την κανονική
κατανοµή”.
Η ονοµασία της κανονικής κατανοµής ως και κατανοµή των σφαλµάτων
οφείλεται στην διαπίστωση του µεγάλου µαθηµατικού Gauss ότι τα σφάλµατα
των αστρονοµικών παρατηρήσεων περιγράφονται ικανοποιητικά από την
κανονική κατανοµή.
Η συνάρτηση πιθανότητας της κανονικής κατανοµής, µε παραµέτρους
την διακύµανση σ2 και την µέση τιµή μ , δίνεται από τον παρακάτω τύπο,
όπου µε χ € (− ∞, +∞) :
f ( x) = P( x < X < x + dx) =
1
2π *σ 2
-
*e
(x-µ)2
2*σ2
Όπου π=3,14 και e=2,71.
Στον ανωτέρω τύπο προσέχουµε την διαφορά της f(x) µε την αντίστοιχη των
διακριτών µεταβλητών , στις οποίες η f(x) εκφράζει την πιθανότητα P(X=x).
Αντίθετα στις συνεχείς µεταβλητές η F(x) εκφράζει συνάρτηση πυκνότητας,
x
διότι
P (X
= xi) =
i
∫
x
f ( x ) dx
= 0
i
Τότε λέµε ότι η τυχαία µεταβλητή Χ ακολουθεί την κανονική κατανοµή και
γράφουµε X ~ N ( µ , σ )
2
∆ρ. Ευστρατία Μούρτου
3
ΠΑΡΑΜΕΤΡΟΙ ΤΗΣ ΚΑΝΟΝΙΚΗΣ ΚΑΤΑΝΟΜΗΣ
[1].
Ο µέσος µ ή η µαθηµατική ελπίδα Ε(Χ) ή η αναµενόµενη µέση τιµή
της τ.µ. Χ: Ορίζεται ως το παρακάτω ολοκλήρωµα:
+∞
E(X ) = µ =
∫ xf ( x ) dx
−∞
[2].
Η διακύµανση σ
2
της τ.µ. Χ, συµβολίζεται µε V(X) και ορίζεται ως ο
σταθµισµένος µέσος όρος των τετραγωνισµένων αποκλίσεων από την µέση
τιµή και δίνεται από την σχέση:
+∞
V (X ) = σ =
2
2
(
x
−
µ
)
f ( x ) dx
∫
−∞
Για τον υπολογισµό της διακύµανσης (ή διασπορά) µπορεί να χρησιµοποιηθεί
και ο τύπος:
V ( X ) = σ 2 = E(X2 ) −[E( X )]2
[3].
Η τυπική απόκλιση σ της τ.µ. Χ, δίνεται από την σχέση:
σ = σ2
Ι∆ΙΟΤΗΤΕΣ ΤΗΣ ΚΑΝΟΝΙΚΗΣ ΚΑΤΑΝΟΜΗΣ
1. Η µέση τιµή, η διάµεσος και η επικρατούσα τιµή (Μο) συµπίπτουν
2. Είναι συµµετρική ως προς τη µέση τιµή
3. Στο σηµείο x = μ παρουσιάζει µέγιστο που ισούται µε
1
2 πσ
2
4. Στα σηµεία μ −σ και μ +σ παρουσιάζει σηµεία καµπής
∆ρ. Ευστρατία Μούρτου
4
[5].
Η συνάρτηση πυκνότητας της κανονικής κατανοµής ορίζει µια
οικογένεια κανονικών κατανοµών δηλαδή ένα σύνολο συµµετρικών
καµπύλων τύπου καµπάνας για τις διαφορετικές τιµές των παραµέτρων μ και
σ.
Για παράδειγµα: Στο σχήµα 5α βλέπουµε µια οικογένεια κανονικών
κατανοµών µε ίδια µέση τιµή και διαφορετικές τυπικές αποκλίσεις, ενώ στο
σχήµα 5β βλέπουµε µια οικογένεια κανονικών κατανοµών µε διαφορετικές
µέσες τιµές και ίδια τυπική απόκλιση.
f(x)
Ίδιο µ
x
Σχήµα 5α: καµπύλες κανονικής κατανοµής µε ίδιο µ
∆ρ. Ευστρατία Μούρτου
5
f(x)
x
Ίδιο σ
Σχήµα 5β: καµπύλες κανονικής κατανοµής µε ίδιο σ
Η ΤΥΠΟΠΟΙΗΜΕΝΗ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ
Όπως είναι εύκολα αντιληπτό ανάλογα µε τις τιµές του ζεύγους (µ, σ2)
ορίζονται τα διάφορα µέλη της οικογένειας των κανονικών κατανοµών
N ( µ , σ 2 ) . Αν έχουµε µια κανονική κατανοµή που έχει µέση τιµή µ= 0 και
τυπική απόκλιση σ=1 (διασπορά σ2 =1), τότε αυτή συµβολίζεται µε N(0,1) και
ονοµάζεται
τυποποιηµένη
κανονική
κατανοµή
(standard
normal
distribution).
Η συνάρτηση πυκνότητας πιθανότητας της N(0,1) µε παραµέτρους την
διακύµανση σ2=1 και την µέση τιµή μ=0, δίνεται από τον παρακάτω τύπο,
όπου µε χ € (− ∞, +∞) :
f ( x) = P( x < X < x + dx) =
1
*e
2π
-
x2
2
Όπου π=3,14 και e=2,71.
Ο λόγος για τον οποίο χρησιµοποιούµε την
τυποποιηµένη κανονική
κατανοµή είναι ότι µας δίνει την δυνατότητα της τυποποίησης µιας τυχαίας
∆ρ. Ευστρατία Μούρτου
6
µεταβλητής η οποία ακολουθεί την κανονική κατανοµή. Αναλυτικότερα
αποδεικνύεται ότι:
ΠΡΟΤΑΣΗ 1
Αν η τυχαία µεταβλητή Χ ακολουθεί την κανονική κατανοµή,
δηλαδή αν X ~ N ( µ , σ ) , τότε η τυχαία µεταβλητή Ζ που ορίζεται ως
2
X −µ
Z=
σ
δηλαδή
, ακολουθεί την τυποποιηµένη κανονική κατανοµή,
Z ~ N (0,1) µε την παρακάτω γραφική παράσταση.
-3
-2
-1
+1
+2
+3
ΥΠΟΛΟΓΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΩΝ - ΜΕΘΟ∆ΟΛΟΓΙΑ
Α. ΟΤΑΝ Η Τ.Μ. Ζ ΑΚΟΛΟΥΘΕΙ ΤΗΝ ΤΥΠΟΠΟΙΗΜΕΝΗ ΚΑΝΟΝΙΚΗ
ΚΑΤΑΝΟΜΗ
Για να υπολογίσουµε διάφορες πιθανότητες της τυχαίας µεταβλητής Ζ
η οποία ακολουθεί την τυποποιηµένη κανονική κατανοµή, χρησιµοποιούµε
τον πίνακα πιθανοτήτων (Πίνακας ∆, Παράρτηµα, βιβλίο), µε τον ακόλουθο
τρόπο:
∆ρ. Ευστρατία Μούρτου
7
Ας δούµε τον πίνακα ∆1 που αποτελεί ένα τµήµα από τον πίνακα ∆, µε
τιµές που αντιπροσωπεύουν την επιφάνεια που περιέχεται µεταξύ της
καµπύλης της τυποποιηµένης κανονικής κατανοµής και τα σηµεία εκείνα του
άξονα των χχ’
για τα οποία 0<χ<z . Τότε θα είναι P(0<χ<z) = το
γραµµοσκιασµένο εµβαδόν, όπως φαίνεται στο παρακάτω σχήµα.
0
∆ρ. Ευστρατία Μούρτου
z
x
8
Πίνακας ∆1
∆ρ. Ευστρατία Μούρτου
9
Με την βοήθεια του ανωτέρω πίνακα θα υπολογίσουµε ζητούµενες πιθανότητες ως εξής:
1. Ας υποθέσουµε ότι ζητείται η πιθανότητα η τ. µ Z να παίρνει τιµές στο διάστηµα [0, 1.46] , δηλαδή πρέπει να
υπολογίσουµε την
P (0 ≤ z ≤ 1,46)
Τότε θεωρούµε τον αριθµό 1,46 ως αποτελούµενο από 2 τµήµατα:
α) Τα 2 πρώτα ψηφία δηλαδή το 1,4 και
β) το δεύτερο δεκαδικό ψηφίο ως 0,06 (προφανώς 1,46 = 1,4 + 0,06) .
Τότε το α) τµήµα ορίζει την γραµµή που πρέπει να εντοπίσουµε στον πίνακα ∆1 και το β) τµήµα ορίζει την στήλη που
πρέπει να εντοπίσουµε στον πίνακα αυτόν.
Η τοµή της γραµµής µε την στήλη που εντοπίσαµε ορίζει την ζητούµενη πιθανότητα, που όπως φαίνεται είναι 0,9279.
Αρα
P (0 ≤ z ≤ 1,46 ) = P (0 < z < 1,46) = 0,9279 ,
∆ιότι
p ( z = 1,46) = 0, και p( z = 0) = 0
2. Ας υποθέσουµε ότι ζητείται η πιθανότητα η τ. µ Z να παίρνει τιµές στο διάστηµα [-1.46, 0], δηλαδή πρέπει να
υπολογίσουµε την
P(−1,46 ≤ z ≤ 0)
Επειδή η καµπύλη της τυποποιηµένης κανονικής κατανοµής είναι συµµετρική ως προς τον µέσο µ (µ=0) , θα ισχύει:
∆ρ. Ευστρατία Μούρτου
10
P(−1,46 ≤ z ≤ 0) = P(−1,46 < z < 0) = p(0 < z < 1,46) = 0,9279
3. Ας υποθέσουµε ότι ζητείται η πιθανότητα η τ. µ Z να παίρνει τιµές στο διάστηµα (1.46, + ∞ ), δηλαδή πρέπει να
υπολογίσουµε την
P ( z > 1, 46 )
Εφαρµόζουµε την ιδιότητα :
Έτσι έχουµε:
P( z > k ) = 1 − P( z < k )
P( z > 1,46) = 1 − P(z < 1,46) = 1 − 0,9279= 0,0721
4. Ας υποθέσουµε ότι ζητείται η πιθανότητα
Τότε από τον πίνακα έχουµε
P ( z ≤ 0 ) = 0 ,5
5. Ας υποθέσουµε ότι ζητείται η πιθανότητα
Εφαρµόζουµε την ιδιότητα:
∆ρ. Ευστρατία Μούρτου
P( z ≤ 0)
p(−2 < Z < 2)
p(−a < Z < a) = p ( Z ≤ a) − P ( Z ≤ −a )
11
Αρα
p(−2 < Z < 2) = p( z ≤ 2) − p( Z ≤ −2) = 0.9772 − [1 − p( Z ≤ 2)] =
= 0,9772 − [1 − 0,9972 ] = 0,9772 − 0,0228 = 0,9544
∆ιότι ισχύει ότι:
6.
P(Z ≤ − z) = 1 − p(Z ≤ z)
Ας υποθέσουµε ότι ζητείται η πιθανότητα
Εφαρµόζουµε την ιδιότητα:
P ( − 1, 55 ≤ Z ≤ 2 ,1)
P(a ≤ Z ≤ b) = P(Z ≤ b) − P(Z ≤ a)
Άρα
P ( − 1 , 55 ≤ Z ≤ 2 ,1 ) = P ( Z ≤ 2 ,1 ) − P ( Z ≤ − 1 , 55 )
= P ( Z ≤ 2 ,1) − [1 − P ( Z ≤ 1, 55 )] = 0 , 9821 − 1 + 0 , 9394 = 0 , 9215
∆ρ. Ευστρατία Μούρτου
12
Β. ΟΤΑΝ Η Τ.Μ. Ζ ΑΚΟΛΟΥΘΕΙ ΤΗΝ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ
Για να υπολογίσουµε διάφορες πιθανότητες της τυχαίας µεταβλητής Χ
η οποία ακολουθεί την κανονική κατανοµή, θα πρέπει πρώτα να
τυποποιήσουµε την Χ, δηλαδή να την µετατρέψουµε σε τυποποιηµένη
κανονική κατανοµή, χρησιµοποιώντας την πρόταση 1.
Αναλυτικότερα προσέξτε τα παρακάτω παραδείγµατα (βιβλίο σελ.160 -164):
ΠΑΡΑ∆ΕΙΓΜΑ Α
Έστω ότι η τυχαία µεταβλητή Χ, ακολουθεί κανονική κατανοµή µε µέσο μ =
210 και τυπική απόκλιση σ = 30. Τότε:
1.
P (180 ≤ X ≤ 210 )
Ζητείται η πιθανότητα
ΛΥΣΗ
∆ίνεται ότι X ~ N ( µ , σ
2
) = N ( 210 , 900 )
Θα τυποποιήσουµε µε τον παρακάτω τρόπο την τ.µ. Χ χρησιµοποιώντας τον
τύπο : Z =
X −µ
σ
Έτσι θα έχουµε:
P (180 ≤ X ≤ 210 )
=
180 − 210
210 − 210
≤ Z ≤
) =
P(
=
30
30
= P ( −1 ≤ Z ≤ 0) = P ( Z ≤ 0) − P ( Z ≤ −1) =
= P ( Z ≤ 0 ) − [1 − P ( Z ≤ 1)] =
=0,5 – 1 + 0,8413 = 0,3413 = 34,13%
2.
Ζητείται η πιθανότητα
P ( X ≥ 225 )
ΛΥΣΗ
∆ρ. Ευστρατία Μούρτου
13
Θα τυποποιήσουµε µε τον παρακάτω τρόπο την τ.µ. Χ χρησιµοποιώντας τον
τύπο : Z =
X −µ
σ
Έτσι θα έχουµε:
P ( X ≥ 225 ) = P (
X − 210
225 − 210
≥
) =
30
30
= P ( Z ≥ 0 ,5 ) = 1 − P ( Z ≤ 0 ,5 )
= 1 − 0 , 6915
3.
= 0 , 3085
Ζητείται η πιθανότητα
= 30 , 85 %
P ( X ≤ 150 )
ΛΥΣΗ
Θα τυποποιήσουµε οµοίως την τ.µ. Χ και έτσι έχουµε:
P ( X ≤ 150 ) = P (
X − 210
150 − 210
≤
) =
30
30
= P ( Z ≤ −2) = 1 − P ( Z ≤ 2) =
=1- 0,9772 = 0,0228 = 2,28%
4.
Ζητείται η πιθανότητα
P (195 ≤ X ≤ 225 )
ΛΥΣΗ
Θα τυποποιήσουµε οµοίως την τ.µ. Χ και έτσι έχουµε:
P (195 ≤ X ≤ 225 ) =
= P(
195 − 210
X − 210
225 − 210
≤
≤
)=
30
30
30
= P ( −0,5 ≤ Z ≤ 0,5) =
= P(Z ≤ 0,5) − P(Z ≤ −0,5) = P(Z ≤ 0,5) − [1 − P(Z ≤ 0,5)] =
=0,6915-1+0,6915 = 0,383 = 38,3 %
∆ρ. Ευστρατία Μούρτου
14
ΠΑΡΑ∆ΕΙΓΜΑ Β
Έστω ότι η τυχαία µεταβλητή Χ, ακολουθεί κανονική κατανοµή µε µέσο
μ = 123,9 και τυπική απόκλιση σ = 13,74. Ζητείται ο πραγµατικός αριθµός κ
έτσι ώστε η πιθανότητα P(Χ>κ) να είναι ίση µε 0,10.
ΛΥΣΗ
∆ίνεται ότι X ~ N ( µ , σ
2
) = N (123 . 9 ,13 . 74 )
Θα τυποποιήσουµε την τ.µ. Χ χρησιµοποιώντας τον τύπο : Z =
X −µ
σ
∆ίνεται ότι
P ( Χ > κ ) = 0,10 P(
X − 123 , 9
k − 123 , 9
>
) = 0 ,10 ⇔
13 , 74
13 , 74
P (Z >
k − 123 , 9
) = 0 ,10 ⇔
13 , 74
1 − P( Z <
P( Z <
k − 123,9
) = 0,10 ⇔
13,74
k − 123,9
) = 0,90 ⇔
13,74
Με την βοήθεια του πίνακα ∆1 βλέπουµε ότι το 0,90 αντιστοιχεί σε z = 1,29.
Άρα θα είναι :
k − 123,9
= 1,29 ⇔
13,74
k − 123 , 9 = 1, 29 * 13 , 74 ⇔
k = 141 , 62
∆ρ. Ευστρατία Μούρτου
15