JEOLOJİDE MATEMATİK VE İSTATİSTİKSEL
YÖNTEMLER
Prof. Dr. Hüseyin Çelebi
Ders Notları
İstanbul 2014
1
Jeolojide matematik ve statistiksel yöntemler
Önsöz
“Jeolojide matematik ve istatistiksel yöntemler” ders notları kapsamında 2002/2003 öğretim
yılında jeoloji öğrencileri için hazırlanmıştır. Sınırlı yarıyıl süresi içinde mümkün olduğu
kadar uygulamaya yer vermek için derin teorik işlemlere yer verilmemiştir. Bu konuya ilgi
duyulduğunda kaynakçadaki özel kaynaklara başvurulabilir.
Bu ders notları yaklaşık 25 yıllık deneyimden ve jeoistatistikte mevcut çok sayıdaki eserin
incelenmesinden sonra hazırlanmıştır. Bunlardan David (1978), Akın ve Siemes (1988),
Wellmer (1989), Schönwiese (1992) ve Arıcı (2001) en önemlileridir. Örnekler, çoğunlukla
Türkiye’deki özgün çalışmalardan ve yerbilimlerinden başka dallara da örnek oluşturacak
şekilde seçilmiştir.
Bu çalışmanın amacı istatistikteki güncel durumu ve yöntemleri tanıtmak, ileride yapılacak
çalışmalar için temel kaynak yaratmak, özgün verilerle uygulama örneklerini oluşturarak
matematiğin çeşitli yöntemlerini yerbilimlerine uygulamaktır. Bir jeoistatistiksel işlemde çok
sayıda değişken ve parametre işleme katılır. Ancak bunların doğru tanımı ve hesaplanması
sonunda doğru jeoistatistiksel çözüm bulunur ve yorumlanabilir. Burada bu amaçla kullanılacak
temel kavram ve bunlara bağlı değişkenler tanıtılacaktır.
Bu notların yazılmasını sağlayan asıl neden öğrencilerin derslerde gösterdikleri yakın ilgi ve
eleştirileri olmuştur. Kendilerine çok teşekkür ederim.
H. Çelebi
İstanbul, Kasım 2014
Prof. Dr. H. Çelebi
2
Birkaç ünlü sözü
İstatistik!
Matematiğin yardımı olmadan doğa bilimlerini incelemek demek, gerçekleştirilmiyecek
işe girişmek demektir.
Galileo Galilei
Her bilimin matematiğe gereksinimi vardır, ancak matematiğin hiçbirine.
Jakob Bernoulli
Matematik bilimleri, her şeyden önce, berraklığı nedeniyle hoşuma gider.
René Descartes
Hiçbir şey iyi bir teori kadar pratik olamaz.
Hermann von Helmholtz
2
3
Jeolojide matematik ve statistiksel yöntemler
İçindekiler
1 GİRİŞ
Sayfa
1.1 Genel bakış
1.2 Tarihsel gelişim
1.3 Temel kavramlar ve tanımlar
1.4 Sıklık dağılımı
1.5 Olasılık
Kaynakça
5
5
6
7
8
12
2 TEK BOYUTLU DAĞILIMLARIN TANIMLANMASI
2.1 Giriş
2.2 Merkezi değerler
2.2.1 Ortalama değerler
2.2.2.Ortanca (xo, medyan,)
2.2.3 Tepe değer (xt, mod)
2.3 Değişkenlik ölçüleri
2.3.1 Değişim aralığı (R)
2.3.2 Standart sapma (s)
2.3.3 Değişkenlik katsayısı (v)
2.3.4 Değişke (s2, σ2, varyans)
2.4 Momentler
2.4.1 Kayma (g, çarpıklık, asimetri, ing. skewness)
2.4.2 Basıklık (e, yassılık veya sivrilik, ing. exess, kurtosis)
Kaynakça
13
13
13
20
22
22
23
24
25
26
27
27
28
33
3 KURAMSAL DAĞILIMLAR
3.1 Temel esaslar
3.2 Normal dağılım (ND)
3.2.1 Standart normal dağılım (çan eğrisi, SND)
3.3 Birikimli normal dağılım (BND)
3.4 Logaritmik normal dağılım (logND)
Kaynakça
Ekler
34
34
36
39
41
45
46
4 VARYANS ANALİZİ
4.1 Tanımlar
49
Prof. Dr. H. Çelebi
4
4.2 Tek değişkenli varyans analizi
4.3 Sapmaların hesaplanması
4.4 Çok değişkenli varyans analizi
Kaynakça
Ekler
51
52
54
55
56
5 BAĞINTI (KORELASYON) ANALİZİ
5.1 Genel bakış
5.2 Bağıntı analizi (BA) ve çeşitleri
5.2.1 Bağıntı katsayısı (r, BK)
5.2.2 Anlamlılık katsayısı (r2)
5.3. Bağınım (regresyon) analizi (BaA)
5.3.1 Bağınım doğrusu (BD)
5.3.2 Kalıntı değerler (ei)
5.3.3 Bağınım doğrusunun parametrelerinin hesaplanması
5.4 Sonuçların sağlanması
5.5 Çok değişkenli bağıntılar
Kaynakça
Ekler
59
59
61
62
65
65
66
68
70
73
74
75
6. JEOİSTATİSTİĞE GİRİŞ
6.1 Başlangıç
6.2 Jeoistatistik yöntemleri ve uygulama alanları
6.3 Bölgesel değişkenler
6.3.1 Varyogram
6.3.1.1 Varyogram çeşitleri (tipleri)
6.3.1.2 Varyogram modelleri
6.3.1.3 Küresel modelin uyarlanması
6.4 Varyogramların uygulanma alanları
6.4.1 Yapısal analiz
6.4.1.1 Anizotropi
6.4.1.2 Ardalanma (boşluk etkeni, hole effect)
6.4.1.3 Artan eğilim veya yönelim (trend, drift)
6.4.1.4 Diğer özellikler
6.5 Değişkelerin hesaplanması
6.5.1. Saçınım (dağılım veya blok örnekler) değişkesi σ2 (O/v)
6.5.2 Yayılım (kestirim veya blok) değişkesi σ2 (v/V)
6.5.3 Kriging değişkesi
6.6 İleri jeoistatistik yöntemleri
Kaynakça
Ekler
4
77
77
78
81
84
86
89
90
92
92
93
93
94
94
94
96
99
103
104
105
5
Jeolojide matematik ve statistiksel yöntemler
1 GİRİŞ
1.1 Genel bakış
İstatistik, belirsizlik durumundan en iyi sonucu çıkarmaya veya kararı vermeye yarayan yöntemlerin özetidir. Amaç, yanıltıcı yorumlardan kaçınmak ve ileriyi doğru kestirmektir.
İstatistik, gözlemler sonucu elde edilen sayısal verileri inceler ve bunlar arasındaki bağıntıları
ortaya çıkararak sonuçların grafik veya çizelgeler halinde sunulmasını sağlayan bir inceleme
yöntemidir. Özet olarak istatistik, rasgele/tesadüfi ve tesadüf şeklindeki olayları inceleyen bir
yöntemsel (metodik) bilimdir ve birçok bilim dalında uygulanabilmektedir. Elde edilen
sonuçlardan çeşitli yorumların yapılması ile sorunlara çözüm aranır. Sonuca varmak için bazen
kısıtlı bilgi ile yetinmek gerekebilir.
İstatistiğin çalışma yöntemleri,
a) Tanımlamak veya örneklemek (deskriptiv),
b) Dağılım şekillerini incelemek (anakütle/popülasyon veya küme özelliklerini incelemek),
c) Tahmin etmek ve kestirmek (olasılıkları araştırmak),
d) Teste tabi tutmak (hipotezler, karar teorileri uygulamak),
e) Analiz etmek (bağıntıları ortaya çıkarmak) ve
f) Özel yöntemler uygulamaktır.
İstatistikte veri, 1. Saymak, 2. Ölçmek, 3. Gözlemek, 4. Anket yapmak, 5. Haritalamak ve 6.
Tahmin etmek yöntemleri ile derlenir. Bunlardan gözlemler, istatistiğin temelini oluşturur.
Planlama ve karşılaştırma istatistiğin en yaygın kullanıldığı alanlardır.
1.2 Tarihsel gelişim
Eski çağlardan beri insanlar geleceği bilmek isterler. Gelecekte ne olacağını şimdiden bilmek
başarı ve üstünlük sağlamanın önkoşulu olarak kabul edilmiştir. Ancak geleceği bilmek
mümkün değildir. Çünkü gelecek bilindiği zaman, gelecek şimdi olur ve geleceğin kendisi
ortadan kalkar. Bu da doğa yasalarına, öncelikle zaman kavramına, ters düşer.
Bu engeli aşmak için insanlar büyü ve fal gibi dayanaksız yöntemlere yönelerek geleceği
kestirme yollarını aramışlardır. Bu uygulamalar, güvensizliklerinden dolayı, zamanla
inandırıcılıklarını kaybetmiştir. Bunların yerini gözlem ve ölçümlere dayanan basit istatistiksel
hesaplamalar almıştır. Örneğin İ.Ö. Mısır’da ve Çin’de planlama, nüfus sayımı, asker ve vergi
toplama işlemlerinde temel istatistiksel işlemlerden yararlanılmıştır.
Günümüz istatistiğinin kökleri ancak 15. yy’a kadar uzanmaktadır. Metafiziğe karşı pozitif
düşüncenin üstünlük sağlaması, modern istatistiğin gelişmesine de ivme kazandırmıştır. Bunun
da esas kaynağı sohbet matematiği, şans oyunları (kumar), yani insanın yine ileriyi kestirme
Prof. Dr. H. Çelebi
6
veya önceden bilme merakı, olmuştur. Bugün de istatistik bu alanların temel dayanağı olmaya
devam etmektedir (loto ve toto gibi).
Tarihte istatistiği bilimsel olarak ilk irdeleyen ve kuramlara bağlamaya çalışan matematikçi
İtalyan Pacioli (1445-1514) ve Cardano’dur (1501-1576). Bunlar zar atma üzerine
çalışmışlardır. Ancak bugünkü istatistiğin kuramlarının temelleri İsviçreli Bernoulli (16541705) tarafından atılmıştır. Geliştirdiği yöntemler, olasılık, şans ve risk oranlarının
hesaplanmasını kolaylaştırmıştır. Bernoulli’yi Fransız Laplace (1749-1827, Laplace teoremi),
Poisson (1781-1840, Poisson dağılımı) ve Alman Gauss (1774-1855, Çan eğrisi) tarafından
daha ileriye götürülmüştür. 20. yy istatistikçileri arasında Galton (1822-1911, log dağılımı),
Pearson (1857-1936) ve Fisher (1890-1962, çeşitli testler) önemli yer tutmaktadırlar.
İstatistik sürekli geliştirilmekte ve yaygın kullanım alanı bulmaktadır. Örneğin, istatistiğin
yerbilimlerdeki adı jeoistatistiktir. 20. yy’ın ikinci yarısından itibaren bu alanda kullanılmaya
başlamıştır. Jeoloji, madencilik, coğrafya, çevre, tarım ve ormancılık bu alanların sadece
birkaçıdır. Jeoistatistik bugün güvenilen ve kendine özgü bölgesel veya yere bağlı değişkenler
teorisine dayanmakta ve Varyogram gibi araçlara sahip bulunmaktadır.
1.3 Temel kavramlar ve tanımlar
Bir araştırmada incelenecek bireyler veya malzemenin tümünün incelenmesi mümkün değil. Bu
hem ekonomik değil, hem de yeterli örnekle elde edilen sonucu değiştirmez (bak. büyük sayı
teorisi). Bu nedenle incelenecek anakütlenin ancak bir kısmı temsilen incelenir. Anakütleye
popülasyon veya örnek evreni (sample space), temsilen incelenecek kısmına da örneklem
denir. Bir anakütlede verilerin tüm özellikleri ortaktır. Bulundukları yeri, ana maddeyi veya
kaynağı tüm özellikleri ile temsil eder. Dolayısı ile bir örnek evreninin ancak bir temsili parçası
veya örneklemi olabilir. Aynı şekilde bir örneklemin de sadece 1 ortalama değeri bulunur. Bu
değer, tüm gözlemleri aynı oranda temsil eder. Aşağıdaki şekil örnek evreni, örneklem ve
ortalama değeri açıklamaktadır:
Örnek evreni
o
ooo
ooooo
oooooo
Örneklem xi
Ortalama değer
o
ooo
o
x
İstatistiksel değerlendirmenin ilk adımı, seçilmiş az sayıdaki örneklerin dağılımı ve bunların bir
örneklem (bir bütünlük) oluşturup oluşturmadığı özelliğinin araştırılmasıdır. Analiz aygıtlarının
son 40 - 50 yılda güvenilebilir geniş kapsamlı veri üretebilmesi ve bilgi-sayarın uzun
matematiksel işlemleri kolaylaştırması ile jeoistatistik, yerbilimlrinin vazgeçilmez unsuru
haline gelmiştir. Jeolojik veya bölgesel değişimler, matematiksel olarak tanımlanmakta, örnek
6
7
Jeolojide matematik ve statistiksel yöntemler
ve sondajlardın optimal aralıkları, rezerv hesaplarının kesinlik dereceleri ile tenör dağılımları,
izotropi, anizotropi ve tabakalanma gibi özellikler ayrıntılı incelenebilmektedir.
Mühendislikte kullanılan bu yöntemler yanında, sıkça bağıntı (korelasyon), bağınım (regresyon), cluster, faktör ve diskriminant analiz yöntemleri de kullanılmaktadır. Tüm yöntemlerin
temeli analizlere dayanmaktadır. Bir örneklemin güvenirliği içerdiği gözlem veya veri sayısına
bağlıdır. Ancak çok farklı yöntemleri bulunan örnek alma başlı başına bir konudur (sistematik
ve rastlantısal örnek alma gibi). En az veya en iyi örnek sayısı ve miktarı hakkında da objektif
ilkeler ve yöntemler bulunmamaktadır. En az gözlem sayısı amaca göre değişir (normalde n >
20). Bu nedenle ilgili özel kaynaklara başvurmakta yarar vardır. Analizler sonucu elde edilen
verilerin amaca uygun ve doğru olarak değerlendirilmeleri şarttır. Bunun için,
a) Veri çeşidinin seçilen değerlendirme yöntemine uygun olması,
b) Bağıntıların ortaya çıkarılabilmesi için yeterli ve uygun örneğin alınması,
c) Eksik veya gereksiz verinin toplanmaması ve
d) İstatistiksel homojenliğin korunması
esastır. Çoğu kez aynı maddeden birçok özellik araştırılır. Bunları mümkün olduğu kadar
azaltmak gerekir. Bunu yaparken özellikler arası bağıntıların bozulmamasına veya ona göre
inceleme yöntemi seçilmesine dikkat edilmelidir. Bu amaçla oranlar, tanımlayıcı katsayılar v.s.
alınmalıdır. Veriler matematiksel işlemlere tabi tutulabilmeleri için listelerde derlenir. Bunlara
şema, grafik ve diyagramlarla yeni veriler eklenebilir.
1.4 Sıklık dağılımı
Sıklık dağılımı bir örneklemin dağılım şeklidir ve sadece bir veri grubunun veya örneklemin
özelliklerini inceleyen yöntemdir. Varılan sonuçlar teorik esaslara göre yorumlanarak çözümler
aranır. Sıklık dağılımının başlıca araştırma sonuçları normal, logaritmik ve binom dağılımı ile
bunların ortalama değer, standart sapma v.s. parametreleridir.
Aynı koşullar altında n kez yinelenen bir deneyde meydana gelen A olay sayısına A’nın H (A)
H ( A)
mutlak sıklık dağılımı, bunun
oranına da A’nın h(A) göreceli sıklık dağılımı denir.
n
Görüldüğü gibi sıklık dağılımı klasik olasılık tanımına benzemektedir: Çünkü h(A) artan n ile
P(A) olasılığına yaklaşmaktadır. Büyük sapmaların meydana gelme olasılığı giderek azalır
(büyük sayı teorisi). Bir zar atmada atılan göz sayısı rastlantısal x1 büyüklüğünü ifade ederken
para atmada olası yazı (y) veya tura (t) sayılarının rastlantısal büyüklüğü x2’dir. Örneğin,12 kez
zar atmada elde edilen sayılar {1, 2, 6, 2, 5, 4, 5, 4, 2, 3, 2, 5} ise, bunların dağılımına sıklık
dağılımı denir. Buna ilişkin dağılım fonksiyonuna da olasılık veya dağılım fonksiyonu denir.
Uygulamada her zar yüzünün gelen rastlantısal değeri bir dikdörtgen ile birbirini örtmeyecek
şekilde apsis üzerinde gösterilir. Sınıf sayısının bulunması için birçok yöntem bulunmaktadır.
Ancak burada her zar yüzü doğrudan 1’den 6’ya kadar gelebilecek sayıların bir sınıfını temsil
etmektedir. Bu nedenle zar atma iyi bir örnektir. Sıklık dağılımları aynı zamanda bir sunum
Prof. Dr. H. Çelebi
8
veya gösterim şeklidir. Çizelge 1.1 ile Şekil 1.1 buradaki zar atmanın sıklık dağılımını
göstermektedir.
Çizelge 1.1.
12 kez atılan bir zarın gelen yüzlerinin sıklık dağılımı (her zar yüzü bir sınıftır [= xi]).
Zar yüzü
Sıklık dağılımı (h (A)/n)
Listeler H(A)
Çizgi
Sayısal
Göreceli
Göreceli birikimli
Mutlak birikimli
1
2
3
4
5
6
/
////
/
//
///
/
1
4
1
2
3
1
0,0833
0,3333
0,0833
0,1667
0,2500
0,0833
0,0833
0,4167
0,5000
0,6667
0,9167
1,0000
1
5
6
8
11
12
8,33
41,67
50,00
66,67
91,67
100,00
12
1,0000
1,0000
12
100,00
n=
12
Gelen zar yüzünün oranı, %
30
20
10
0
1
a
2
3
4
% Birikimli
Birkimli soklık dağılım
Sıklık dağılımı
Gelen zar yüzünün oranı, %
.
xi
5
6
100
75
50
25
0
1
Zarın gelen yüzü
b
2
3
4
5
6
Zarın gelen yüzü
Şekil 1.1:
Atılan bir zarın gelen yüzlerinin sıklık dağılımı (sütun diyagram, histogram).
1.5 Olasılık
Yukarıda verilen zar atma örneği para atma (yazı/tura) örneği ile değiştirilebilir. İki oyun
arasındaki fark sadece olasılıkların azalmasıdır. Para atmada iki seçenek varken, zar atmada bu
seçenekler zarın 6 yüzünden dolayı altıya çıkmaktadır. Bu nedenle zarda bir yüzün gelme
olasılığı 1:6, para atmada ise 1:2’dir. Bu iki oyunla olasılık kavramı kısmen açıklanmaktadır.
Burada olasılık tanımından amaç, olasılığı bir norma bağlamaktır.
8
9
Jeolojide matematik ve statistiksel yöntemler
Doğa yasalarına uyan olaylara determinist (belirlenimci), hiçbir kurala uymayan olaylara da
kaotik olaylar denir. İstatistikte rastlantısal (stokastik) olaylar incelenir. Rastlantısal olaylar
için her zaman,
lim P(O) = c
n
= sabit
1.1
eşitliği geçerlidir. Yinelenen bir deneyde, örneğin para atmada, n atış sayısı arttıkça sonuç sabit
bir c değerine yaklaşır. Bununla ilgili teoriye büyük sayı teorisi denir. Yazı y ve tura t ise, n 
 yaklaştığında,
H(y) = H(t)
= 0,5
1.2
olduğu görülür. Örneğin,
1. atışta yazı geldiğinde, y=1/2,
2. atışta tura geldiğinde, t=1/2,
3. atışta yazı veya tura geldiğinde, y veya t=1/2.1/2=1/4 v. s. olur.
Bu, uygulamada
lim P(O) = c
1.3
n
olarak sınırlanabilir demektir.
Olasılık,
P(O) = O/Ω
Gözlenen  olaylar
=
Olası  olaylarin  toplamı
1.4
olarak tanımlanır (O, olay; Ω, olay evreni). Bir değerin [α, β] aralığına düşme olasılığı (Şekil
1.2a, beklenen sıklık dağılımı = alan ),
β
P{O| α } = P(α≤x≤β)
1.5
β
= ∫ f(x)dx
α
= F(β) – F(α)
şeklinde ifade edilir. Buna, yukarıda da belirtildiği gibi, normal dağılım denir ve entegrali
alındığında,
+∞
∫ f(x)dx =1
1.6
-∞
olduğu görülür. Bunun gibi,
F(g)max = 1
1.7
Prof. Dr. H. Çelebi
10
de bir normal dağılımdır. Ancak bu önceki dağılımın bir birikimli (kümülatif) dağılımıdır ve
f(x) = F́ (g) şekli ile normlanmıştır (Şekil 1.2b). Normal dağılım, sonlu, eşit olasılıklara sahip
özellikleri içeren ve istatistiksel dağılım koşullarını sağlıyan bir dağılımdır. En sık rastlanır.
f(x)
a
F(g)
b
50
F(g) = dağılım
fonksiyonu
f(x) = olasılık
fonksiyonu
 

x
g
f(x) = F́ (g)
Şekil 1.2.
Olasılık tanımı. a, sıklık dağılımı, b, birikimli sıklık dağılımı. x ve g argümanları farklıdır. x, sürekli özellik
koordinatlarını (sınıf ortalarını), g ise, sınıf üst sınırlarını (özellik üst sınır değerlerini) gösterir (bak Şekil 1.1; a’da
olasılık alan şeklinde gösterilmiştir).
Olasılık, P(O) = % 100 veya 1/1 olabilir ve mümkün veya olasıdır. Ancak P(O) = 0, yani 0/1,
olması mümkün değildir. Çünkü olasılık, 0<P(O)<1 arasında yer alır (istatistiksel olasılık).
Buna hafif bir yağmurun 2 taştan birine 1 damlasının zamanla düşmesi (bireysel olay) örnek
verilebilir. Buna karşın yoğun yağmur damlası kesinlikle hemen çarpar (kolektif olay).
Örnek 1.1:
1 zarla 1 defada,
a) 6,
b) 5 veya 6 atma olasılığının hesaplanması:
Çözüm:
a) P(O1) = 1:6 ≈ % 17 ve
b) P(O2) = (1:6)+(1:6)
= 2/6
= 0,33
= % 33
bulunur (bağımsız olaylar, ancak biri diğerini dışlar).
10
11
Jeolojide matematik ve statistiksel yöntemler
Örnek 1.2:
2 zarla 1 atışta düşeş atma olasılığının hesaplanması:
Çözüm:
P(x1)=1/6 ve P(x2) = (1/6)’dan,
P(x1, x2) = (1/6).(1/6) (çarpım yasası)
= (1/6)2
=1/36
= 0,02778
= % 2,78
elde edilir. Deney, zarların arka arkaya atılması ile, 2 kısma ayrılır.
Örnek 1.3:
2 zarla 1 atışta her birinde 4 veya 2 atma olasılığının hesaplanması:
Çözüm: P(O1): 1. zar
P(O2): 2. zar.
P(O)=0 olanaksız.
P(O1)=1,
P(O2)=1
→
1 1
P(O)= .
6 6
1

36
P(O1)=1, P(O2)=2 ve davamı sonucu,
1 1 1 1
.  .
6 6 6 6
1
1
=

36 36
2
=
36
1
=
18
P(O)=
=0,0555
Prof. Dr. H. Çelebi
12
= % 5,55
sonucuna varılır.
Örnek 1.4:
Bir zarla 1 defada 3’e bölünebilen bir çift sayıyı atma olasılığı.
Çözüm: P(O) = 3/6.2/6
= 6/36
= 1/6
= % 17
bulunur. Bu durumda olayların bağımsızlığı verildiğinden, birbirlerini dışlamıyor ve 3/6 ile
2/6 da olasılık teorisine uygundur.
1
4
2
5
3|
6| 3’e bölünebilen sayılar
Alıştırma 1.1:
2 zarla 5, 6 veya 7 atma olasılığını hesaplayınız.
Yanıt: P(O) = 15/36 ≈ % 42. 12’nin nasıl 1/36 ettiğini düşünün.
Alıştırma 1.2:
Bir iş yerinde çalışan 25 kişinin doğum günleri aşağıdaki şekilde aylara dağılmış bulunmaktadır. Sıklık dağılımını
çizerek irdeleyiniz.
Aylar
1
Doğum günü s. 2
2
3
3
2
4
4
5
1
6
3
7
0
8
1
9
1
10
4
11
2
Kaynakça
1. Barsch, H. ve Billwitz, K., 1990: Geowissenschaftliche Arbeitsmethoden. Verl. Harri
Deutsch, 256 s., Thun ve Frankfurt am Main.
2. Reinhardt, F. ve Heinrich, S., 1994: dtv-Atlas zur Mathematik. Cilt 1 ve 2., dtv Verlag, 498
s., München.
3. Wessel, P., 2001: Geological data analysis. www.higp.hawaii.edu./cecily/courses, 325 s.
12
12
2
13
Jeolojide matematik ve statistiksel yöntemler
2 TEK BOYUTLU DAĞILIMLARIN TANIMLANMASI
2. 1 Giriş
Bir örnek dizisi ancak yeteri kadar kapsamlı ve kesinlikle tanımlandıktan sonra istatistiksel
verilerin ait olduğu örneklem özellikleri ve gelecekte beklenen olasılıklar hakkında bir
düşünce yürütülebilir. Tek boyutlu dağılım demek, tek bir değişkenle tanımlanan ana kitle/
popülasyon demektir. Bu ana kitledeki parametrelerin kesinlik derecesi ve birimlerinin aynı
olması istenir. Örnek çeşidi olaylara bağlıdır. Genelde f(x, y) ve f(t) şeklinde ifade edilirler.
Alınmış ve alınacak örnekleri ayırmak lazım. Alınacak örnekler açıklık kazanacak, benzeştirilebilir (simüle edilebilir) ve hazırlanabilir olmalıdır.
Örnek tanımlanması, verilerin değişken ve etken şeklinde özetlenmesi demektir. Bunun için:
1. Ortalama ve en sık değer,
2. Saçınım, sapma değerleri (değişkeler),
3. Sıklık oranları (kısımları, yüzdelikler),
4. Dağılım şekillerini gösteren değişkenler (simetri, yassılık)
5. Eğilim/eğim yön, gösteren değişkenler ve
6. Dağılım fonksiyonları, uyum ve sınıflandırma bakımından örnekler karşılaştırılmalı ve
incelenmelidir.
2.2 Merkezi değerler
Bir veri dizisinde bulunan parametrelerin bazıları bu dizinin orta kısımlarında yer alırlar ve
merkezi değer* olarak anılırlar. Bir örneklemin merkezi değerleri, ortalama değer, tepe değeri
(modal değer) ve ortancadır (medyan). 1. konuda tanımlanan kavramlar bu ve bundan sonraki
konuda veri kümelerinin parametrelerinin ve sıklık dağılımlarının tanımlanmasında kullanılacaklar. Veriler çizelge, şema ve diyagram şeklinde düzenlenerek çeşitli ölçü sayıları bulunur
(bak. Çizelge 2.1).
2.2.1 Ortalama değerler
Bir rastlantısal veri hem dağılım fonksiyonu, hem de sıklık dağılımı ile kesinlikle tanımlanır.
Ancak istatistikte rastlantısal bir büyüklüğü yeteri kesinlikle tanımlayan bazı parametrelerle de
yetinilir. Bu değerlerin en önemlisi istatistikte en çok kullanılan beklenti değeri veya
ortalama değerdir. Ortalama değer, rastlantısal saklı x değerlerinin,
_____________
* Merkezi değer demek, ortalama değeri x  0 olan değer demektir. Bir transformasyon yoluyla, örneğin, x1,
...,xn değerleri, yi = xi- x (i = 1,..,n) şeklinde merkezileştirilirler. Bu arada değişke σ 2 değişmez.
Merkezileştirilmiş ve standart sapması s = 1 olan veriler standardize edilmiş demektir. Standardizasyon ui =
xi  x (i = 1,...,n) gibi bir transformasyonla mümkündür (Standardize veriler birimlere bağlı değil. Dolayısı
s
ile değişik birimli verilerin matematiksel işlenmesi mümkün olur.
Prof. Dr. H. Çelebi
14
 x P( x )
i
i
2.1
i
sonlu veya sonsuz i üzerinden toplamı veya,

 xf ( x)dx
2.2

fonksiyonunun değeridir ( f , sıklık fonksiyonudur). Çok çeşitli olan ortalama değerlerin en
yaygın kullanılanları aşağıya çıkarılmıştır.
A) Aritmetik ortalama ( x )
Aritmetik ortalama verilerin, çan eğrisinin altında kalan alanın ağırlık merkezini oluşturur.
Gauss çan eğrisi için önemli olan aritmetik ortalama değeridir. Bu, bir örnekleme ait
değerlerin toplamının örnek sayısına bölümü ile elde edinilir.
Çizelge 2. 1:
Isı ölçümleri (˚C, Antalya, Temmuz/2004).
Ölçüm Ölçüm değerleri Ortalama sapma Sapmanın karesi Sabit değer farkı
numarası
xi
|xi- x |
(xi- x )2
(xi-D, D=33)
1
34
0,429
0,184
1
2
36
1,571
2,468
3
3
40
5,571
31,04
7
4
35
0,571
0,326
2
5
33
1,429
2,042
0
6
32
2,429
5,900
-1
7
31
3,429
11,758
-2
Σ n=7
241
15,429
53, 714
10
a) Sınıflandırılmamış verilerin aritmetik ortalama değeri x ,
x=
=
1
n
n
x
i 1
i
1
(x1+x2+...+xn)
n
2.3
2.4
şeklinde tanımlanmaktadır. xi, veri veya özelliktir (i =1,2,..., n). Toplam i üzerinden n’ye kadar
sürer. Buna göre Çizelge 2.1’deki ölçümlerin aritmetik ortalaması x ,
x =
1
.241
7
14
15
Jeolojide matematik ve statistiksel yöntemler
= 34,429 ˚C
bulunur.
b) Sınıflandırılmış verilerin aritmetik ortalama değeri için,
n
fx
x=
i 1
n
i
f
i 1
i
2.5
i
formülü kullanılır. Burada n, sınıf (frekans, aralık) sayısı, fi, i sınıfına düşen veri sayısı ve xi,
sınıf orta noktasıdır (Çizelge 2.2).
Çizelge 2.2.
Çizelge 2.1’deki verilerin sınıflandırılması (bak. 2.3.1 d, Sturge Kuralı).
Sınıf aralığı,
Sınıf ortası
frekans f (˚C)
xi
31,00-33,39
33,40-35,79
35,80-38,19
38,20-40,59
Σ n=
Örnek sayısı
32,20
34,60
37,00
39,40
5
Sınıf ort. x örnek s.
Birikimli toplam, %
fi
xi.fi
∑fi
3
2
1
1
7
96,60
69,20
37,00
39,40
242,20
3
5
6
7
∑(xi.fi .100/∑xi.fi)
39,88
68,45
83,73
100,00
Örnek 2.1:
Çizelge 2.2‘deki sınıflandırılmış değerlerin ortalaması x ,
x =
1
7
n
 (x . f )
i 1
i
i
1
.242,20
7
= 34,600 ˚C
=
bulunur (değerlerin kısaltılması nedeniyle sonuç az yüksek çıkmıştır).
c) Sabit bir değer yardımı ile hesaplama. Burada x ,
1 n
2.6
 (  D)
n i 1 xi
şeklinde ifade edilir. (D, gelişigüzel bir değerdir). D = 33 ˚C alındığında, yukarıdaki çizelgeye
göre x ,
x=D+
Prof. Dr. H. Çelebi
16
10
7
= 33+1,429
= 34,429 ˚C
x = 33+
bulunur (Çizelge 2.1).
Aritmetik ortalama çok kullanışlıdır, analiz değerlerinin irdelenmesinde en sık kullanılan
parametredir. İrdelemeden kabul etmek doğru değildir. Örneğin, uç değerlerden çok etkilenir.
En önemli üstünlükleri,
1. Kolay hesaplanması,
2. Tüm değerleri kapsaması ve
3. Başka değerlere, örneğin, ağırlıklı ortalamaya, çevrilmesinin kolay olmasıdır.
Aritmetik ortalamanın sakıncaları,
1. En büyük ve en küçük değerlerin çok etkilemesi,
2. Gerçek bir değerin bulunmadığı bir noktada bir değer verebilmesi ve
3. Metrik sistemin şart olması.
Diğer ortalama değer çeşitleri aşağıda kısaca tanıtılmıştır:
B) Ağırlıklı ortalama değeri (xa)
Çeşitli hesaplamalarda süre ve mesafe gibi etkenlerin önemini de hesaplamalara katmak için
ağırlıklı ortalama değeri hesaplanır. Örneğin, yer ve çevre bilimlerinde örnek değerleri, örneğin derişimler, örneklerin arasındaki mesafe ile çarpılır, toplanır ve toplam mesafeye bölünür.
Bu ortalama değerle, uç değerlerin, örneğin kalınlıkların da hesaplamada etkin olması ile, aritmetik ortalamaya oranla etkisi azaltılmış oluyor ve daha gerçekçi bir değer elde edilmiş olur.
n
m x
Ağırlıklı ortalama
xa =
i 1
n
m
i 1
formülü ile hesaplanır.
n
m
i 1
i
i
i
2.7
i
= 1 durumunda sadece genel formül geçerlidir. Burada i, örnek
sayısı (i=1, 2,...,n), mi, örnekler arasındaki mesafe, tenör veya zaman gibi bir faktördür ve xi’ye
veya mesafeye göre değişen değerler alır. xi, ölçüm değerlerini gösterir. Ağırlıklı ortalamaya
en iyi örnek, ara ve bitirme sınavı notlarının farklı ağırlıkla (örneğin, % 40 ve % 60) geçme
notuna katılmasıdır.
Örnek 2.2:
16
17
Jeolojide matematik ve statistiksel yöntemler
Bir sondajdaki ağırlıklı P2O5 değerinin hesaplanması (SP-9, Pınarbaşı/Adıyaman).
Çizelge 2.3:
Verilerin düzenlenmesi (Örnek 2.2)
Derinlik, m
29,35-33,60
33,60-35,35
35,35-37,05
Σ n=3
Ölçüm xi, %
1,78
2,35
1,62
5,75
Mesafe, mi
4,25
1,75
1,70
7,70
Faktör, fi
xi. mi
0,55 (4,25/7,70) 7,57
0,23
4,11
0,22
2,75
1,00
14,43
xi.fi
0,98
0,54
0,36
1,88
Buna göre,
x a=
1,78.4,25  2,35.1,75  1,62.1,70
4,25  1,75  1,70
14,43
1,88
(≈
)
7,70
1,00
= % 1,87 P2O5
=
bulunur. Bu değerlerin aritmetik ortalaması esasında,
x = 5,75/3
= % 1,92 P2O5
çıkmaktadır. Aradaki % 0,05’lik fark burada önemli değildir. Ancak altın veya gümüş gibi
değerleri hammaddeler için çok önemlidir ((1,92-1,87).100/1,92= % 2,60’lık bir fark eder).
C) Geometrik ortalama (xg)
Bunlardan başka mühendislik bilimlerinde yaygın bir şekilde kullanılan geometrik ortalama
bulunmaktadır. Bu ortalama değer öncelikle log dağılımlarında kullanılır. Burada değer
çarpımının çarpılan tüm değerlerin sayısına eşit dereceden kökü alınır. Yani,
xg =
n
 .x i
2.8
 n x1.x2 ...xn
şeklinde bulunur (n, örnek sayısı; Π, büyük pi = çarpım). xg, aritmetik ortalamadan küçüktür.
Geometrik ortalamanın üstünlükleri,
a) Tüm değerlerin kullanılması,
b) Çok açıktır ve
Prof. Dr. H. Çelebi
18
c) Uç değerlerin etkisini azaltır.
Buna karşın sakıncaları,
a) Bir değerin dizide sıfır olması durumunda kullanılamaması ve
b) Elde edilen değerin dizide bulunmayan bir yere karşılık gelmesidir.
Örnek 2.3:
Ölçülen çeşitli deneylerdeki yoğunluk ortalaması.
Ölçüm numarası
Yoğunluk (g/cm3)
1
5,41
2
5,63
3
5,35
4
5,70
5 .
5,58
verileri verilmiş ise, geometrik ortalama,
xg = n x1 .x2 ...xn
=
5
5,41.5,63.5,35.5,70.5,58
= 5182,85 1 / 5
= 5,53
g/cm3 sonucuna varılır.
Geometrik ortalama hesaplamada kök yerine logaritma alınması, çok veri çarpımının kökünü
alma işlemindeki zorluktan kaynaklanır. Bu nedenle kök alma yerine logaritma alınır. Örneğin,
1
log( x1  x2  ...  xn )
n
1
= (log x1  log x2  ...  log xn )
n
log xg =
2.9
logaritma kuralına göre logaritmaları alınan değer toplamının anti logaritması alınarak
geometrik ortalama bulunur. Örnek 2.3’teki değerlerin log toplamı 3,69, örnek sayısı da 5
olduğuna göre,
xg = antilog (3,715/5)
= antilog 0,743
=100,743
= 5,53
bulunur.
D) Harmonik ortalama (xh)
18
19
Jeolojide matematik ve statistiksel yöntemler
Özellikle doğa bilimlerinde, örneğin fizikte, kullanılan bir ortalama değer de harmonik
değerdir. Ölçüm değerlerinin tersi (1/a) aritmetik ortalamasının tersi olarak hesaplanır ve
1 1 n 1
 
x h n i 1 x i
2.10
şeklinde formüle edilir. Burada da geometrik ortalamada olduğu gibi değerlerin hepsinin sıfırdan büyük olması gerekir. Harmonik ortalama öncelikle zaman oranlarının (hız, yol ve zaman)
ortalamasının hesaplanmasında kullanılır.
Örnek. 2.4:
80 soruluk test sınavında 60 soruya 50, 20 soruya da 30 dakikada yanıt veren bir öğrencinin yanıt başına ortalama
yanıt süresinin bulunması.
Sınav başında ortalama olarak her soruya 1 dakika süre verilmiştir. Ancak öğrenci sınavın ilk
50 dakikasında soru başına 50/60 = 5/6 dakika, geri kalan 20 dakikasında da 30/20 = 3/2 dakika
kullanmıştır. Buna göre harmonik ortalama,
1 n 1
1/xh= 
2 i 1 xi
=1/2(5/6+3/2)
=1/2(5/6+9/6)
=1/2.14/6
=14/12
=7/6
=1,17 min.
elde edilir (1/2, sorunun 2 etaptan oluşmasından gelir).
Alıştırma 2.1:
Verilen {4-5-8-7-11-4-3}dizisinin harmonik ortalamasını bulunuz. Yanıt: xh=5,03
E) Değişim aralığı ortası (Ro, uç değer ortası):
Bu ortalama değerlere ek olara değişim aralığı ortası da bir ortalama değer olarak görülürler.
Yayılım aralığı R (range),
R = xmax-xmin
2.11
formülü ile tanımlanır. Bunun ortalaması veya ortası Ro,
Ro =
x max  x min
2
2.12
Prof. Dr. H. Çelebi
20
formülü ile bulunur ve yayılım alanın ortasını verir. Bu aralık frekans veya sınıf sayısının
bulunmasında kullanılır (Sturge Kuralı* ve Örnek 2.6).
2.2.2. Ortanca (xo, medyan,)
Ortanca, bir diziyi ortalıyan veya çan eğrisinin altındaki alanı eşit iki kısma ayıran değerdir.
Örneklemdeki değerlerin yarısı ortancadan küçük, yarısı da büyüktür.
Matematiksel olarak ortanca xo,
xo
xo =
 f ( x)dx
2.13

 F ( x)
xo
 F ( xo )  F ()
 xo  0
= 0,5
veya

xo=
 f ( x)dx
xo
xo
=
 f (x )
i
i 1
2.14
= 0,5
olarak tanımlanmaktadır (Schönwiese, 1992 ve Arıcı, 2001). Bu değer toplam için ortanca =
F(0,5) = % 50 anlamına gelir. Bu da tek sayılı dizilerde orta değere, çift sayılı dizilerde ise,
xo = xn/2 +1
2.15
şeklinde belirlenmektedir (xn/2, ilk yarının son değeridir). Dolayısı ile çift sayılarda ortanca,
ikinci yarının ilk değeri olur.
Örnek 2.5:
Bir akarsuyun debi değerleri (m3/s, Peri Suyu, Tunceli):
Sıra no.
1
2
3
4
5
6
7
Ölçümler: 32,20 39,10 47,40 103,20 157,30 207,90 270,40
Büyüklük sırasına göre dizilen Örnek 2.5’teki değerlerin 4. değeri, yani 103,20, veri dizisinin
tam ortasına düşmektedir. Burada ortanca 103,20’dir. Ortanca çarpık dağılımlar için ortalama
değere göre daha uygundur ve az örnek sayısı için de önemlidir. Metrik ve sıralama ölçü
birimleri de kullanılabilir ve aşırı değerlerden çok etkilenir.
20
21
Jeolojide matematik ve statistiksel yöntemler
Ortancanın üstünlükleri,
a)
b)
c)
d)
Hesap yapmadan bulunabilmesi
Gerçek bir değeri temsil etmesi,
Uc değerleri dışlaması ve
Başka benzer büyüklükler yerine kullanılmamasıdır.
Buna karşın,
a) Bazen zor saptanabilmesi ve
b) Çevirmelere uygun olmayışı
gibi sakıncaları bulunmaktadır.
f(x) = Frekans f
(örnek/aralık)
F1 =
a
F2
F
F
1
b
2
x
x  xo  xt
c
Aralık, %
xt
d
α
α
xt<xo< x
x <xo<xt
Şekil 2.1.
Çan eğrisi ve merkezi parametrelerinin dağılıma göre konumları: a, Çan eğrisi ve ortalama değer x , ortanca xo
ve tepe değeri xt’nin bir normal dağılımda çakışması. F1 ve F2 ortanca tarafından 2’ye bölünen alanın eşit parçalarıdır. b, Histogram, eğrinin yerleşimi ve ortanca xo. c, Sağa çarpık (sağ asimetrik) dağılımda tepe değeriortanca-ortalama değerin konumu ve d, Sola çarpık (sağ asimetrik) dağılımda tepe değeri-ortanca-ortalama
değerin konumu. α, teğet-absis açısı. tg α > 0: düşük değer dağılım tipi (c) ve tg α < 0, yüksek değer dağılım tipi
(d) dağılım grafikleri.
2.2.3 Tepe değer (xt, mod)
Prof. Dr. H. Çelebi
22
Tepe değeri veya modal değer, dağılım fonksiyonunun sahip olduğu en yüksek frekans
değeridir. Yani en çok örneğin bulunduğu, başka hiçbir sınıf tarafından aşılamayan sınıftır.
Teorik olarak xt,
xt (mod) = f(x)max
2.16
olarak tanımlanmaktadır. Bir normal dağılımda, simetriden dolayı,
tepe değeri (xt) = ortalama değer ( x ) = Ortancadır (xo)
2.17
bağıntısı mevcuttur. Bu durumda eğri altındaki alan ortanca tarafından 2 eşit parçaya yarılır (F1
= F2, Şekil 2.1.). Sağa kayan (kuyruk sağda) veya pozitif eğimli (tg α >0) dağılımlarda
ortalama değer, ortanca ve tepe değerinden büyüktür (xt < xo < x ), sola kayan (kuyruk solda)
veya negatif eğimli (tg α < 0) dağılımlarda ise, ortanca ve tepe değer’den küçüktür ( x < xo<xt).
1. durumun zayıf değerlerin dağılıma hakim olduğu anlamına gelir. Buna bir toplumdaki genç
nüfusun çoğunlukta olması örnek verilebilir. 2. durumda ise, yaşlı nüfusun etkin olduğu
anlaşılır. Bu özellik, yerbilimlerinde örneğin, maden yataklarının oluşmasını sağlar ve yüksek
değerlerin hakim olduğu bir dağılımı yansıtır (zengin cevher tipi). Çevre bilimlerinde bu,
örneğin, aşırı kirliliği veya bir etkenin ortalamanın üstünde artışını gösterir. Şekil 2.1 c-d
çarpıklık ve eğri-teğet ilişkisini göstermektedir. Birçok tepelikli dağılımlarda, 1., 2. ve 3. tepe
değeri diye sıralanır. Çok tepelikli dağılıma Şekil 1 örnek verilebilir.
Çizelge 2.2’deki en yüksek frekans değeri, yani tepe değeri, 3’tür ve 3.100:7= % 45,86’ya
karşılık gelir. Dağılımda bu değerden daha yüksek değer bulunmamaktadır. Bu aralıklara
düşen değerler gibi bir dizide yinelenen değer tepe değerini oluşturur.
Bu değerlerin hepsi de gözlem sayısına bağlıdır. Ne kadar çok gözlem kapsama alınırsa, o kadar güvenilir ve gözlem kümesi için o kadar tanımlayıcı olurlar. Tepe değerinin Üstünlükleri,
a) 2 veya daha çok tepelikli dağılım için de önemlidir,
b) Uç değerlerden etkilenmez,
c) Her ölçü birimi için kullanılabilir.
Sakıncası ise, her zaman kesin ölçülememesidir.
2.3 Değişkenlik ölçüleri
Verilerin istatistiksel tanımlanmasında sadece ortalama değerler yeterli olmamaktadır.
Ortalama değerlerle elde edilen sonuçların yanılma oranları yüksek olur. Örneğin, bir kiracı ev
sahibinin verdiği 1,40 m’lik çocuklarının yüzdüğü havuzun ortalama derinliğine ne kadar
inanır? Bu gibi durumlar için ortalama değerler tarafından kapsanmayan parametreleri de
incelemek gerekir. Yani bir veri kümesi veya anakütle, çeşitli dağılım parametreleriyle de
tanımlanabilir. Bu parametreler öncelikle aşağıda tanıtılan değişim aralığı, standart sapma,
değişke (varyans) ve momentlerdir.
22
23
Jeolojide matematik ve statistiksel yöntemler
2.3.1 Değişim aralığı (R)
Bir veri kümesindeki veya popülasyondaki en yüksek ve en düşük değerlerinin arasındaki fark,
değişim veya yayılım aralığı R,
R = xmax - xmin
2.18
ile tanımlanarak belirtilir. Burada sadece 2 değer, en düşük ve en yüksek değer, hesaba
katılmak-tadır. Dolayısı ile uç değerlerin bulunması durumunda sonuç yanıltıcı olabilmektedir.
Örneğin, bir kayaç veya bir mineral çeşidinin içerdiği bir elementin, bu uç değerleri arasındaki
farkı değişik olabilir. Ana elementlerde bu fark nispeten küçüktür (homojen dağılım). İz
elementlerde ise, büyük olabilmektedir (heterojen dağılım). Uc değerlere göre çan eğrisinin
değişimini Şekil 2.2 göstermektedir. Örneğin, yukarıdaki debi ölçümleri için değişim aralığı,
R = 270,40-32,20
= 238,20
m3/s’dir. Sadece metrik ölçü birimlerinde yararlanılan değişim aralığının hesaplanması kolaydır
ve verilerin dağınıklığı hakkında bilgi verir. Sadece 2 değerden hesaplandığından, içerikle ilgili
yorum yapılamaz.
Ancak değişim aralığı R, sıklık dağılımının oluşturulması ve incelenmesi için çok önemlidir. Çünkü
dağılım R tarafından sınırlanır. Bu neden burada R üzerinde durmakta yarar vardır:
Sıklık dağılımlarında bir örneklemin bir özelliği incelenir. Bunun için özelliklerden oluşan
verilerin düzenlenip sıkıştırılması gerekir. Böylece dağılımın gözlenmesi ve başka verilerle
karşılaştırılması için iyi bir temel sağlanmış olur. Sonuç grafik olarak gösterilir (Bak. Şekil 2.5)
Bir sıklık dağılımında sınıflama, sıralama ve metrik sayılar kullanılabilmektedir. Eşit koşullar
altında n kez yinelenen bir deneyde rastlanan i olay sayısına i’nin mutlak sıklığı denir ve burada fi
ile gösterilir. fi/n = hi de i’nın göreceli sıklığıdır. Bu, P(O) olasılık tanımı ile uyumludur. n arttıkça,
göreceli sıklıktaki büyük sapmalar olanaksızlaşmaktadır (büyük sayı teorisi).
Sıklık dağılımını oluşturmak için:
Sayılar büyüklük sırasına göre dizilir (x1 < x2...<xk).
Dizi her eşit i aralığı için fi özellik değer sınıflarına ayrılır (fi, mutlak sıklık).
Buradan hi = fi:n ile göreceli sıklık dağılımı değerleri hesaplanır (n, toplam örnek sayısı).
Sonuçlar bir x-y koordinat sisteminin absisinde özelliklerin aralıkları (xi = eşit aralıklar),
ordinatında da bunların göreceli sıklıkları (hi=f=hi:i) gösterilerek çizim tamamlanır (bak.
aşağıdaki Örnek 2.6 ve Şekil 2.5).
Çan eğrisinin veya sıklık dağılımının uygulanması ve çizimi için çeşitli yöntemler bulunmaktadır.
Yöntemlerin hepsinin ortak özelliği, verilerin bilgi kaybı yaratmadan, kolay çizim için sınıflara
ayrılmasıdır. Bunun için örneğin, sınıf sayısının örnek sayısına göre değişmesi ve örnek sayısının
a)
b)
c)
d)
Prof. Dr. H. Çelebi
24
kare kökünden az olması istenir. Bu sınıfların 10’dan fazla olmaması tavsiye edilir. Ancak 8 ve 19
sınıfın en iyi olduğu da belirtilmektedir (Perillo ve Marone, 1986). Aralık (sınıf üst sınır aralıkları)
veya frekanslar eşit aralıklar olabileceği gibi, örneğin, s, veya √n gibi, artan veya azalan aralık
olarak da alınabilmektedir. Frekans hesaplamada en sık uygulanan Sturge Kuralı log esasına
dayanmaktadır (bak. Örnek 2.6). Buna göre sınıf sayısı k,
k = 1+log n/log 2
=1+3,32.log n
2.19
eşitliği ile bulunur. Aralıklar da R değişim aralığının k’ya bölünmesi ile,
R= (xmax-xmin)/k
2.20
elde edilir. Buna göre sınıf üst sınırları sıralanır (x1 < x2 ....< xk gibi). Sınıf sınırları kesin olmalı ve
sınıfa ait tüm verileri kapsamalıdır (xi-1< x <xi gibi). Enformasyon kaybı olmaksızın sınıflar
birleştirilebilir veya bölünebilir (hi/3 yerine hi/5 gibi).
Sınıf sınırları rasgele seçilemezler. Bunların özelliklerine ve dağılım şekillerine uymaları ve bir
hesaplama ilkesine dayanması gerekir. Bunun için birkaç yöntem denenebilir ve en uygunu seçilir.
Sınıf aralıkları tamamlanmış tam sayı olarak alınır. Dağılımın başlangıç noktası değişim
aralığının başlangıç noktasıdır. Böylece en küçük değerin bulunduğu sınıf, grafiğin başlangıç
noktası olur.
Daha sade bir şekilde Stem-and-Leaf (sap ve yaprak) yöntemi ile de sıklık dağılımı yapılabilir.
Burada sadece bir örnekle yetinilecektir. Bu amaçla Çizelge 2.4’teki Fe değerlerinin bu yöntemle
sınıflandırılması ve sıklık dağılım grafiği aşağıda verilmiştir. Bu yöntemin en iyi yönü, hem ham
verileri, hem de veri sınıflarını bir histogram şeklinde göstermesidir.
% Fe
10 |
20 |
30 |
40 |
Örnek sayısı/aralık
1
1 2 9
1 2 5 7
0 1 3
2.3.2 Standart sapma (s)
Verilerin ortalama değer etrafında ne kadar yoğunlaştıklarını gösterir. geometrik olarak,
standart sapma, aritmetik ortalama değerinin üstünde ve altında kalan veri sapmalarının
ortalamasıdır. Bu nedenle bir (+), bir de (-) değeri bulunur. Şekil: 2.2b standart sapmayı
geometrik olarak göstermektedir.
24
25
Jeolojide matematik ve statistiksel yöntemler
%dB
80
a
b
dB
+s
60
x
-s
40
20
25
50
75
100
Ses şiddeti, dB
1 2 3 4 5 6 7 8
Ölçümler
Şekil 2.2:
Verilerin değişim aralıkları a ve standart sapmanın geometrik anlamı b.
Ortalama mutlak sapmaya aynı zamanda standart sapma da denir. s ile gösterilir ve genel
olarak,
1 n
s=
 xi
n  1 i 1
=
2
2.21
1 n
( xi  x ) 2

n  1 i 1
n
2.22
n
n xi2  ( xi ) 2
=
i 1
i 1
n(n  1)
2.23
formülleri ile hesaplanır ( xi  xi  x ’dir). Ortalama değerle olan farkların toplamı 0
ettiğinden, kareleri alınır, toplanır ve karekökünün pozitif değeri standart sapma olarak
kullanılır. Ortalama değer hesaplanmadan da standart sapma bulunabilir (bak. formül 2.21).
2.21’daki n yerine alınan n-1 teriminin sadece genel bir teorik anlamı vardır. Değerin
anakütleye değil, örneklem’e ait olduğunu ifade eder ve serbestlik derecesi sayısını veriyor. Bu
terim aslında Sınıflandırılmış verilerin standart sapması 2.21 eşitliğinin 2.5 eşitliği şekline
benzetilmesi ile hesaplanabilir (bak. 2.5, xi = fi.xi ve n(n-1)=Σfi). Örnek sayısı arttıkça, n, n-1’e
yaklaşır. Standart sapma s, n >1 ve s2 >0 durumları için bir anlam taşır.1 örnek için s2 = + ∞’dur
(belirsiz). Sadece metrik ölçü birimlerinde kullanılan standart sapmadan, sonuçların
yorumlanmasından nadiren yararlanılır.
2.3.3 Değişkenlik katsayısı (v)
Standart sapmanın aritmetik ortalamanın yüzdesi olarak ifade edilmesine değişkenlik katsayısı
denir. Göreceli standart sapma olarak da bilinen bu parametre,
s
v = .100
2.24
x
Prof. Dr. H. Çelebi
26
olarak bilinir (%). Bu orana göre veriler,
- düzenli (v < % 40),
- düzensiz (% 40 < v < % 80) ve
- çok düzensiz (v > % 80)
olarak sınıflandırılırlar (Wilke, 1975). Özellikle yerbilimlerinde yaklaşık örnek sayısının,
örneğin, milyon t rezerv başına, saptanmasında bu parametre önemli bir ölçüt olarak kabul
edilir. Ayrıca dağılımların saçınım farkını saptamada, ortalama değere bağlı değişiminden
(orantı etkeni=oransallık) normal ve log dağılımlarının ayırt edilmesinde yararlanılır.
2.3.4 Değişke (s2, σ2, varyans)
Standart sapmanın karesine değişke (varyans) denir. s2 veya sıkça σ2 (sigma) ile gösterilir. Bir
istatistiksel dağılımın esas parametresi değişkedir ve

σ2 =  ( x  x ) 2 f ( x)dx
2.25

olarak tanımlanır (σ2, anakütlenin değişkesidir). Buradan bir örneklemin değişkesi,
s2 =
1 n
( xi  x ) 2

n  1 i 1
2.26
formülü ile hesaplanır. Verilerin ortalama değerden sapma derecesini, değişkenliğini, gösterir.
Değişke, a = x için minimum değer alır (a, ortalama değerden farklı bir değerdir). Bu,
saçınımların ortalama değer yakınında en az olduğunu gösterir.
Değişke ile standart sapmanın istatistikte çok büyük önemi vardır. İstatistiksel hipotezlerin
doğruluğunda ve testlerde kullanılırlar. Varyans, korelasyon ve regresyon analizi ile bunlara
dayanan yüksek derecedeki istatistiksel değerlendirmelerde (örneğin, varyogram hesaplamalarında) vazgeçilmez bir ölçüttür. Ayrıca standart program yapımında temel teşkil ederler.
Uygulamada varyansla standart sapmayı birbirinden ayırt etmek gerekir. Aralarındaki fark,
değişkenin gözlemleri tüm, standart sapmanın ise, tek tek göstermesidir. Bu yüzden değişkede
bazen Σxi toplam değerleri tüm örnek sayısına bölünürken, standart sapmada örnek sayısının 1
eksiğine bölünür. Bu nedenle σ’nın karekökü, standart sapmadan daima küçüktür. σ ve s
değerleri bir güvenirlik derecesi içerirler. Bu da örneğin, t-student testi ile kontrol edilebilir.
Değişke, kısımlarına ayrılabilir. Çünkü bir örneklemin varyansı, örneklemdeki grupların varyanslarının toplamına eşittir. Örneğin,
s2 =
I
J
K
1
( xi2   x 2j  ...   xk2 )
n  1 i 1
j 1
k nk
26
2.27
27
Jeolojide matematik ve statistiksel yöntemler
gibi. Bu özellikten, varyans analizinde ve jeoistatistikte yayılım değişkesi gibi çeşitli
değişkelerin hesaplanmasında yararlanılır.
2.4 Momentler
İstatistikte dağılımların çoğu simetrik değildir. Bazen değerler ortancanın sağında veya solunda
yoğunlaşır (Şekil 2.1 c ve d). Bu dağılım özellikleri yukarıda açıklanan teğet açısı ve parametre
sıralaması gibi yöntemler yanında 3. momentle, dağılımın standart çan eğrisinden yüksek veya
basık (yassı) olduğu da 4. momentle saptanabilmektedir.
Bir moment genel olarak
1 n
( xi ) k

n i 1
mk =
2.28
denklemiyle ifade edilmektedir. Bir dağılımda 4 büyüklüğün, merkezi momentlerin*, yani
ortalama değer ( x ), standart sapma (s), kayma (m3, kayma, çarpıklık) ve basıklığın (yassılık,
m4) incelenmesi yararlı olur.
2.4.1 Kayma (g, çarpıklık, asimetri, ing. skewness)
Bir normal dağılımda ortalama değer, ortanca ve tepe değerin eşit oldukları yukarıda
belirtilmişti. Bu değerlerin karşılaştırılması ile ortalama değere göre kayma saptanabilir. Ancak
kayma durumunda bunların oranı değişir.
Kesin bir kayma değeri ancak 3. moment m3’ün hesaplanması ile elde edilebilir. Bu,
m3 =
n
1
n
 (x
i 1
i
 x)3
2.29
olarak tanımlanmaktadır. Buradan kayma, standart sapmaya bölünerek standartlaştırılır. Yani,
m3
s3
1 n x x 3
= ( i
)
n i 1
s
g=
n
 (x
=
i 1
i
 x)3
n.s 3
2.30
eşitliği ile birimsiz hale getirilir. g = 0 için normal dağılım, g > 0 için pozitif ve g < 0 için de
negatif eğimli bir dağılım mevcut demektir (Şekil 2.3). Kayma, esasında bir logaritmik
dağılımın belirtisidir.
Prof. Dr. H. Çelebi
28
g=0
g<0
g>0
Şekil: 2.3.
Farklı kaymalara örnek dağılım çeşitleri.
2.4.2 Basıklık (e, yassılık veya sivrilik, ing. exess, kurtosis)
Basıklık veya sivrilik tanımı için de 4. moment m4 (exess, kurtosis) kullanılır. Bu moment
tepelik durumunu belirtmeye yarar ve
1 n
m4 =  ( x i  x ) 4
2.31
n i 1
şeklinde tanımlanmaktadır.
m
Buradan basıklık,
e = 44  3
s
=
1 n xi  x 4
( s )  3
n i 1
n
 (x
=
i 1
i
 x) 4
n.s 4
3
2.32
formülünden çıkarılır. Bir normal dağılımda e = 3’tür (eşitlikte 0 alınmıştır). Bu durumda
normal çan eğrisinden basık olan dağılımlarda e < 0, sivri olanlarda ise, e > 0’dır (Şekil 2.4).
Bu dağılımların ortalama değeri eşit, ancak standart sapmaları farklıdır.
e>0
e=0
e<0
Şekil 2.4:
Farklı basıklığa örnek dağılım çeşitleri. Standart sapmaları aynı olan bu dağılımların e < 0
olanlarına platokurtik, e > 0 olanlarına da leptokurtik denir.
28
29
Jeolojide matematik ve statistiksel yöntemler
Basık dağılım, denelde granit gibi çeşitli minerallerden oluşan ve değişik derişimde örneğin
element içeren kayaçların element dağılımında görülür. Sivri dağılım tiplerine ise, bunun
tersine, örneğin, krom gibi sadece kromitte (FeO.Cr2O3), yani bir tek mineralde, derişen
element dağılımlarında rastlanır.
Logaritmik dağılımların incelenmesi, metrik değerlerin logaritması alınarak aynı yöntemlerle
gerçekleştirilir.
Örnek 2.6.
Bir sondajdaki demir tenörünün (% Fe) sıklık dağılımı parametrelerinin hesaplan-ması ve dağılım grafiğinin
çizilmesi (SP-5, Pınarbaşı/Adıyaman, Şekil 2.5).
Çizelge 2.4:
Verilerin düzenlenmesi (Örnek 2.6).
Sıra No. Derinlik, m Mesafe, mi xi (% Fe)
mi.xi
xi - x
(xi - x )2
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
Σ n = 11
137,64
50,25
78,21
47,09
19,68
42,42
146,07
165,88
21,42
2,25
67,02
-9,34
8,65
11,91
9,41
87,24
-814,78 7.610,05
75,00
649,46 5.624,34
141,85
1.689,41 20.120,88
88,55
833,24 7.840,77
93,51
-904,23 8.743,91
14,52
55,31
210,72
2,99
-5,18
8,96
37,95
233,74 1.439,87
1,99
2,80
3,95
411,68 -8.353,07 169.483,80
0,14
-0,05
0,02
955,40 -6.613,35 228.621,22
40,60
46,80
48,05
49,85
50,20
51,10
52,30
57,20
61,60
62,25
62,45
6,20
1,25
1,80
1,15
0,90
1,20
4,90
4,40
0,65
0,20
2,15
24,80
22,20
40,20
43,45
40,95
21,87
35,35
29,81
37,70
32,95
11,25
31,17
346,90
777,93
-9,67
3,81
-1,73
6,16
1,41
-20,28
0,37
0,00
(xi - x )3
(xi - x )4
1. Parametrelerin bulunması
11 örnekten oluşan ve Çizelge 2.4’te düzenlenen örneklemin en küçük değeri % 11,25, en
yüksek değeri de % 43,45 Fe’dir. Yinelenen değer bulunmadığından, tepe değeri saptanamamaktadır. Ancak % 32,95 Fe değeri ortancayı göstermektedir. Bu değer aritmetik ortalama
yerine de kullanılabilir. xi- x ’nın mutlak değerlerinin ortalamasına mutlak sapma denir.
11
Aritmetik ortalama,
x   xi / n
i 1
=346,90/11
= % 31,54 Fe
Prof. Dr. H. Çelebi
30
n
Ağırlıklı ortalama,
m x
xa =
i 1
n
i
m
i 1
i
i
777,93
24,80
= % 31,37 Fe
=
Geometrik ortalama,
xg =
11
22,20.40,20...31,17
= 1115940758615313011,23
= 28,72
Hem ağırlıklı, hem de geometrik ortalama değerleri aritmetik ortalamanın altında çıkmıştır.
Dolayısı ile daha gerçekçi veya güvenli kabul edilecekler.
n
 (x
Standart sapma,
i 1
s=
=
i
 x) 2
n 1
955,40
11  1
= 95,54
= ± % 9,77 Fe
Buna göre aritmetik ortalama değeri x  x  s
= 31,54 ± 9,77
aralığı için geçerlidir. Bu aralık, % 21,77<x<41,31 Fe şeklinde ifade edilir.
n
Değişke,
σ2 =
Kayma,
g=
 (x
i 1
i
 x) 2
n 1
955,40
=
11  1
= %2 95,54 Fe
m3
s3
n
 (x
=
i 1
i
 x)3
n.s 3
30
31
Jeolojide matematik ve statistiksel yöntemler
 6613,35
11.9,77 3
 6613,35
=
11.932,57
=
 6613,35
10258,32
= - 0,64
=
Dağılım negatif eğimlidir (sola kayan, zengin cevher tipi).
Basıklık,
e=
m4
3
s4
n
 (x
i 1
=
i
 x) 4
-3
n.s 4
228621,227
=
3
11.9,77 4
=
228621,22
3
11.9111,26
228621,22
3
100223,82
=2,28-3
= - 0,72
=
bulunur. Buna göre negatif eğimli (sola kayan), standart çan eğrisinden basık bir eğri veya
dağılım bulunmaktadır.
Değişkenlik katsayısı,
v = s.100 / x
= 9,77.100/31,54
= 977/31,54
= % 30,97
bulunur. Bu oranla veriler çok düzenli bir dağılıma sahiptir.
2. Dağılım grafiğinin çizimi:
1. Adım: Değişim aralığının bulunması:
Değişim aralığı R = xmax-xmin
= 43,45- 11,25
= % 32,20 Fe
Prof. Dr. H. Çelebi
32
2. Adım: Sınıf sayısının hesaplanması (Sturge Kutralı, bak. 2.3.1):
k = 1+3,32 log n
= 1+3,32.log 11
= 1+3,32.1,04
= 1+3,46
= 4,46
≈ 4,50
sınıf veya grup bulunur. Burada çıkan sayı tama tamlanabilir, örneğin, 4,46 ≈ 4,50 alınacağı
gibi, ≈ 4,0 de alınabilir.
3. Adım: Frekans veya sınıf sınır değerlerinin bulunması:
Frekans f = R/k
= 32,20/4,50
= 7,16
≈ % 7,20 Fe
elde edilir (7,00 da alınabilir).
4.Adım: Sıklık dağılım çizelgesi: Açıklama: Frekans f = xmin = 11,25 ile başlar. Ancak sürekliliği
sağlamak için 11,25+7,20=18,45 yerine 18,44 ile bitirilir ve 2. aralık 18.45 ile başlatılır.
Çizelge 2.5.
Örnek 2.6’nın sıklık dağılım verileri
Frekans (% Fe) Mutlak sıklık
f
11,25-18,44
18,45-25,64
25,65-32,84
32,85-40,04
> 40,04
Σ=
Göreceli sıklık (%)
fi
hi
1
2
2
3
3
11
9,10
18,18
18,18
27,27
27,27
100,00
32
Birikimli sıklık
Σ fi Σ hi (%)
1
3
5
8
11
9,10
27,28
45,46
72,73
100,00
33
Jeolojide matematik ve statistiksel yöntemler
Birikimli sıklık, % Fe
Sıklık dağılımı, Fe
100
Birikimli sıklık, %
Sıklık, %
30
20
10
0
75
50
25
0
11,25
18,45
25,65
32,85
40,04
Sınır değerleri, % Fe
11,25
18,45
25,65
32,85
40,04
Sınır değerleri, % Fe
Şekil 2.5:
Örnek 2.6’daki değerlerin sıklık dağılımı
Alıştırma 2.2.
Çan eğrisinin uygulanması.
Konu: Bir ana caddede ölçülen gürültünün günlük dağılım ölçüleri (dB, n = 15):
Ölçümler: {100-92-22-75-65-110-80-40-13-30-55-95-50-60-70} (= 957 dB).
Soru: Dağılım özelliklerinin bulunması ve irdelenmesi
Yanıtlar:
x = 63,80 dB, s= ±29,23 dB, s2 = 854,31dB2, g= -0,15, e= 1,24 ve f= 20 dB.
Kaynakça
1. Arıcı, H., 2001. İstatistik. Metaksan basımevi, 13. baskı, 269 s., İstanbul.
2. Barsch, H. ve Billwitz, K., 1990: Geowissenschaftliche Arbeitsmethoden. Verl. Harri Deutsch, 256 s., Thun
ve Frankfurt am Main.
3. David, M., 1979. Geostatistical Ore Reserve Estimation II,Elsevier Sc. Publ. Comp., 3. Baskı, 364 s.,
Amsterdam.
4. Reinhardt, F. ve Heinrich, S., 1994: dtv-Atlas zur Mathematik. Cilt 1 ve 2., dtv Verlag, 498 s., München.
5. Schönwiese, Ch.-D., 1992: Praktische Statistik für Meteorologen und Geowissenschaftler. Borntraeger, 2. basım,
231 s., Berlin, Stuttgart.
6. Schroll, E., 1976: Analytische Geochemie . Ferdinand Enke Verl, 374 S., Stuttgart.
7. Şeniş, F., 1996: İstatistik. Anadolu Üniversitesi yayını No.: 175, 312 s., Eskişehir.
8. Tüysüz, N. ve Yaylalı, G., 2005: Jeoistatistik. KTÜ yayını 220, Trabzon, 382 s.
9. Wellmer, f.-W., 1989: Rechnen für Lagerstaettenkundler und Rohstoffwirtschaftler. Ellen Pilger, 462 S.,
Clausthal-Zellerfeld.
10. Wessel, P., 2001: Geological data analysis. http//www.higp.hawaii.edu./cecily/courses, 325 s.
11. Wilke, A., 1975: Verfahren zur Probenahme von Erzen (Konzentraten) und ähnlichen
Rohstoffen . In Analyse der Metalle. 3, 3. Aufl., Berlin-Heidelberg.
Prof. Dr. H. Çelebi
34
3. KURAMSAL DAĞILIMLAR
3.1 Temel esaslar
İlk 2 konuda işlenen örnek tanımlamaları sonuçları bakımından rastlantılar (belirsizlikler) taşımaktadır. Çünkü bu örneklemler sonlu bir veri dizisini kapsıyor. Bu nedenle incelenen olaylar (işlev
veya mekanizma) sadece kısmen işlemlere tabi tutulabilmektedir. Dolayısı ile deneysel sıklık dağılımlarının görünümleri örnek kapsamının genişlemesi ile değişir.
Sözkonusu olay genel olarak, yani örneklem rastlantılarının etkisi dışında, istatistiksel olarak incelenmek istenirse, örneklemin geldiği anakütlenin özelliklerinin incelenmesi gerekir. Ancak bunlar
genelde bilinmedikleri için istatistikte çeşitli kuramsal anakütle dağılımlarının bulunması için
değişik yollar bulunarak deneysel dağılımlara uyarlanırlar.
Uygulamda birçok teorik dağılım şekli bulunmaktadır. Burada bunların ancak önemli olanları
üzerinde durulacaktır. Herhangi bir veriyi inceliyebilmek maksadiyle teorik dağılımların sadece
normlu şekli, yani olasılık sıklık dağılımı f(x) yardımıyla, tanımlanacaktır. Bir görsel dağılımın bir
kuramsal dağılıma uyarlanması demek, görsel dağılıma en yakın kuramsal dağılımın bulunması
demektir. Görsel dağılımın kuramsal dağılıma uyumu için çevirme işlemlerinin yapılması, uyum
derecesinin (anlamlılığının) saptanması ve sınanması şarttır.
İşlenecek kuramsal yöntemler ilk önce sadece tek boyutlu durumlar için uygulanır. Bunların çok
boyutlu durumlar için uygulanması sıkça sorunlar doğurur. Hesaplanacak parametrelerin örneklem
ve anakütle (popülasyon) ilişkisinin ayırdedilmesi için kullanılan değişik karakterler aşağıya
çıkarılmıştır:
Parametre
Örneklem
Anakütle
Ortalama değer
Ortanca
Tepe değeri
Standart sapma
Değişke
Kayma
Basıklık
Kapsam
x
xo
xt
s
s2
g
e
n
µ
µo
µt
σ
σ2
γ
η
ν
3.2 Normal dağılım (ND)
Doğadaki dağılımların büyük çoğunluğu normal dağılım (ND)göstermektedir. Buradaki normal
dağılımın anlamı sadece çok sayıdaki işleve uygulanabilirliğini ifade eder. Tüm dağılım çeşitleri
oluştukları yerin mevcut koşullarına göre gelişirler. Örneğin, bakkal ve manavların bir şehrin her
tarafına yaklaşık aynı sıklıkta dağılmalarına karşın, fotoğraf dükkanlarının sadece şehir merkezinde
34
35
Jeolojide matematik ve statistiksel yöntemler
yoğunlaştıkları görülür. Bu gözlem sonucunun, yani hipotezin, genelleşmesi için açıklanması ve
teorik bir toplu sistemde ya doğrulanması, ya da reddilmesi gerekir.
Normal dağılımın en önemli özelliği, verilerin ortalama değer etrafında yoğunlaşmasıdır. Uclara,
yani ortalama değereden uzaklaştıkça veriler seyrelir. Örneğin, dünyanın yaklaşık 7,3 milyar (2014)
nüfusunun ancak yaklaşık 4,1 milyarı normal kilolu, 1,1 milyarı kötü beslenmeden dolayı zayıf ve
1,1 milyarı da şişmandır. Bu durum, azalarak sonsuza yaklaşır. Aynı şey çalışanların aylıkları ve
yumurta ağırlığı için de geçerlidir.
Böyle bir dağılımda örneklerin tek tek incelenmesi oldukça zordur. Dağılım üzerinde denetimi
sağlamak amacıyla ve bilgi kaybına neden olmadan, yukarıda da anlatıldığı gibi, veriler veya
ölçümler gruplara (sınıflara) ayrılır (bak. Örnek.2.6.). Bu sınıflardan bir dağılımın eğilimini
gösteren sütun diyagramlar elde edilir. Elde edilen sütun dağılımına uyarlanan bir eğri dağılım
fonksiyonunu meydana getirir (Şekil 2.1b ve 2.6). Bu dağılım fonksiyonu sürekli ve simetrik
normal sıklık dağılımını* gösterir ve
f(x) =
1
 2
e
1 x 2
 (
)
2 
3.1
eşitliği ile tanımlanmaktadır (-∞<x<+∞; -∞<µ<+∞; σ>0). Eşitlikten birbirine benziyen (maksimum
µ, simetrik dönü noktaları µ-σ ve µ+σ) çok sayıda sıklık dağılımı fonksiyonunun bulunduğu
anlaşılmaktadır.
Şekil 3.1.
Standart sapma ile eğrinin alan içeriği arasındaki ilişki (Wellmer, 1989).
Normal dağılım, ortalama değerlerin en sık ve en olası oldukları her yerde dağılım modeli olarak
beklenebilir. Ortalama değerin üstündeki ve altındaki sapmalar eşit olasılığa sahiptir. Artan sapma
değeri ile azalarak daha az olası duruma giderler. Bu özelliği ile normal dağılım istatistiğin temelini
oluşturan bir öneme sahiptir. Hata hesaplamaları, standart sapma gibi formüller ve yöntemler
normal dağılımın esaslarına dayanmaktadır. Bu nedenle incelenen her dağılımın normal dağılımı
Prof. Dr. H. Çelebi
36
gerektirip gerektirmediği araştırılır (parametrik, dağılıma bağlı veya non parametrik, dağılıma bağlı
olmıyan, yöntemler). Bütün istatistiksel analizlerdeki ilk ana kural, örneklemdeki normal
dağılımın gerekliliğidir. Bu kural iyi ve güvenilir sonuçlar için kaçınılmaz bir zorunluluktur. Bir
veri kümesindeki normal dağılımın varlığı ise, histogramlarda görülebilir. Bu durumda dağılım
eğrisi bir çan şeklindedir. Normal dağılım fonksiyon değerleri Ek-3.1’de verilmiştir.
Bir normal dağılıma sahip f(x) eğrisinin dönü noktaları absise yansıtıldığında bu eksen üzerinde
anakütlenin µ ortalama değerinden itibaren örneklemin tam σ değerine karşılık gelen değerleri elde
edilir. Bir örneklemin standart sapması bu oluşuma bağlıdır (dağılıma bağlı formül, Şekil 3.1).
Buna karşın diğer değişkenler ve yüzdelikler dağılıma bağlı değildir. f(x) fonksiyonunun dönü
noktalarındaki teğetler x eksenini μ’den itibaren 2σ’da keserler.
Bir örneğin dağılım fonksiyonunun μ±σ aralığına (1. dönü noktaları) düşme olasılığı % 68,27,
μ±2σ aralığına (2. dönü noktaları) % 95,45 ve μ±3σ aralığına (3. dönü noktaları) da % 99,73’tür.
Bu oranlar aynı zamanda verilen sınırlar arasındaki alanın eğri altında kalan toplam alana oranına
karşılık gelir (Şekil 3.1).
3.2.1 Standart normal dağılım (çan eğrisi, SND)
μ = 0 ve σ =1 durumu için f(x) dağılım fonksiyonu,
f(x) =
1
2
e
1
 x2
2
şeklini alır. Böylece dağılım fonksiyonu parametrelerden bağımsız hale gelir ve z =
formasyonu ile
f(z) =
1
2
e
3.2
x

trans-
1
 z2
2
3.3
şekline dönüştürülmüş olur. Bu durumdaki bir dağılım fonksiyonuna standardize normal dağılım
denir. Bu şekildeki fonksiyonlar (z dağılımı) birimsiz hale geldikleri için değişik yöntemlerle daha
kolay hesaplanırlar. İstatistikteki sınama (test) ve tahmin için oldukça önemlidir. Yüzdeliklerin
hesaplanması entegral gerektirdiğinden, zordur. Ancak bu, çizelgelerden yararlanarak, aşılabilir. z
dağılımı değerleri Ek 3.1’de verilmiştir.
z’ye standart değer denir. Bir dağılımda her Xi değerine karşılık bir xi sapma değeri belirlendiği
gibi, bir zi değeri de belirlenebilir. Standart değer,
zi = xi/s
3.4
eşitliği ile tanımlanır ve bununla sapma değerleri standart değerlere çevrilir. Örneğin, x i = Xi - x
değeri için zi= xi/s standart değeri bulunur.
________
* Gauss dağılımı veya çana benzediği için çan eğrisi de denir. Carl-Friedrich Gauss (1777-1855), sıklık dağılımını
Göttingen Üniversitesi’nde çalışırken ilk formüle eden alman matematikç, fizikçi ve astronomdur.
36
37
Jeolojide matematik ve statistiksel yöntemler
Örnek 3.1.
Ortalama değeri
gelir?
x = 5 ve stanadart sapması s = ± 2 olan bir dağılımdaki Xi =7 ölçümü hangi standart değere karşılık
Çözüm: zi = xi /s = (Xi - x ) / 2 = (7 – 5) / 2 = 2 / 2 = +1 bulunur.
Burada xi = x +s değerine karşılık geldiği için +1 değeri, tolerans ölçüsü, elde edilmiştir. Yani
ortalama değerden bir standart sapma kadar büyük değerlerin standart değeri 1’dir. Bunun gibi 2s
kadar büyük olan değerlerin standart değerleri 2, 3s kadar büyük olanların da 3’tür. Aynı sonuçlar
standart sapmadan küçük değerler için de geçerlidir ve -1, -2, ile -3 bulunur. Ortalama değere eşit
(Xi = x ) bir değerin standart değeri ise, 0’dır (zi = xi/s = [ x - xi]/s = [ x - x ]/s = 0/s = 0). Bu
nedenle standart çan eğrisi 0’a (y ekseni) göre simetrik verilir (bak Şekil 3.2).
Örnek 3.2.
Bir çakıl örnekleminin tane boyu ortalaması
tanesini bulma olasılığı % kaçtır?
x = 14,2, standart sapması s=4,3 mm’dir. 3 mm’den küçük çaplı bir kum
Çözüm: Aranan 3 mm’lik değeri çizelgeden okuyacak değere çevrilmesi ve z değerinin bulunması
lazım. z değeri,
3,00  14,2
z=
4,7
= - 2,4
formülünden -2,4 bulunur. z Çizelgesinde (Ek-3.2) bu değere karşılık gelen standart değer 0,0082
gibi çok küçük bir sayı olduğundan, zayıf bir olasılıktir.
Görüldüğü gibi standart çan eğrisinin parametreleri normal çan eğrisinin parametrelerinden farklı
olmaktadır. Standardize edilmemiş çan eğrisinin dönü noktaları μ±σ, μ±2σ ve μ±3σ iken, standart
çan eğrisinde ±1, ±2 ve ±3 olmaktadır. Ortalama değerin standart değeri 0’dır. Bu nedenle standart
çan eğrisi ölçümler yerine bu değerlerle tanımlanır ve bu sayede normal çan eğrisinden ayırt edilir
(Ek-3.1-3.3).
Sıklık dağılımı fonksiyonu,
F(x)=
1
 2
x
e
1 y 2
 (
)
2 
dy
3.5

şekliyle doğrusal ve entegrale benziyen dağılım toplamını verir (birikimli toplam, Şekil 3.2). Bu
dağılım olasılık kağıdında özel bir dağılımla bir doğruya çevrilir ve hesaplamaların denetiminde
kullanılır. Olasılık kağıdının absisi doğrusal, ordinatı ise, 3.5 eşitliğine göre düzenlenmiştir. Bu
yaklaşık doğrunun başka özelliklerinden biri de F(-1) = 0,84 ve F(+1) = 0,16 olmasıdır. Buradan
0,84-0,16 = 0,68 elde edilir. Bu, eğrinin altındaki alanın µ-σ ve µ+σ sınırları arasında kalan
alanıdır.
Prof. Dr. H. Çelebi
38
Şekil 3.2.
Standart normal dağılım (çan eğrisi, μ=0, s=1) ve olasılık kağıdına dönüştürülmesi (Wellmer,
1989).
Yukarıda da belirtildiği gibi normal dağılım simetrik olduğundan, birçok özel duruma sahiptir.
Örneğin,
Ortalama değer = ortanca = tepe değeri = μ’dür (1. moment).
Değişke = σ/ n (2. moment) ve
Kayma (g) ile basıklık (e) = 0
y
z
x
Şekil 3.3.
İdeal simetrik 2 boyutlu sıklık dağılım yüzeyi perspektifi. (Sachs, 1984, değiştirilmiştir).
38
39
Jeolojide matematik ve statistiksel yöntemler
değerlerine sahiptir. μ parametresi olasılık sıklık dağılımında değerlerin absis üzerinde sağa veya
sola kayarak kaymayı (g, kayma), σ da ordinat boyunca ortalama değer μ etrafında yoğunlaşıp
seyrelerek basıklığı (e, basıklık/sivrilik) meydana getirir.
3.3 Birikimli normal dağılım (BND)
Bir dağılımın kesin sağlanması ancak matematiksel sınamalarla (testlerle), örneğin χ2 (ki kare, bak.
örneğin, Arıcı, 2001) sınaması ile, sağlanabilir. Burada bu konulara geniş yer ayırmak bu notların
kapsamını aşacağından, uygulamadaki yaklaşık grafik denetimi ile yetinilecektir.
Ordinatın doğrusal bölünmesi durumunda fonksiyon entegral işareti veya S şeklinde bir eğri
verdiği yukarıda belirtilmişti (Şekil 3.2). Bu eğrinin kıvrım derecesi standart sapmanın
büyüklüğüne bağlıdır. Doğru, ortanca (% 50) noktasına göre simetriktir. 0 ve % 100 noktaları, y
eksenine asimtot olarak yaklaştıklarından, sonsuza yönelirler ( ). Uygulamada bu uc değerler
önemli görülmez ve çok ender durumlarda, örneğin, uc değerlerin elimine dilmesi durumunda,
yararlanılır.
Grafikle çözüm piyasada satılan olasılık kağıdı ile yapılır (Şekil 3.4). Olasılık ağı veya kağıdı çan
eğrisinin veya bir normal dağılımın bir doğru şeklini alacağı bir x-y diyagramıdır. y ekseni buna
göre bölünmüştür. Ancak x ekseni doğrusaldır. Gerektiğinde logaritmik de yapılabilir. Bu ağla
normal dağılımların doğruluğu sınanır. Bu nedenle birikimli sıklık dağılımı ölçüm sonuçlarının
düzenlenmesinden sonra hesaplanır. Bunun için bu ağın absisine özellik sınıfı üst sınırları x i,
ordinatına da bunların birikimli sıklığı hi kaydedilir (Örnek 2.6 ve Şekil 2.5). Sınıfların göreceli
değerleri, en küçük değerden başlamak üzere, her sınıf için ayrı ayrı toplanır. Buna göre birikimli
sıklık, özellik sınıflarının üst sınır değerlerinden küçük veya bunlara eşit değerlerin toplamıdır.
Bunun dağılım fonksiyonuna birikimli sıklık dağılım fonksiyonu denir (bak. Eşitlik 3.5). Bu
dağılımın fonksiyonu normal dağılım halinde bir doğru verir (Hazan Doğrusu). Aksi durumlarda
fonksiyon kırık çizgi şeklinde görülür. Doğrunun çizimi sırasında başlangıç ve bitiş kısımları büyük
önem taşımaz. Ancak % 50 civarının bir doğru çıkması belirleyicidir. Grafikten ayrıca şu değerler
okunabilir:
a) Ordinatın % 50 değerinden absise çizilen paralelin doğruyu kestiği noktadan absise inilen
dik, absisi ortalama değerde veya ortanca noktasında keser,
b) % 16 ve % 84 noktalarından aynı şekilde absise çizilen paralellerin doğruyu kestiği
noktadan absise inilen dikler de absisi µ±σ noktalarından, yani standart sapma veya
tolerans ölçüsü 1’de keser. Bu iki sınır arasında kalan alan tüm analiz değerlerinin %
68,26’sına tekabül eder (84, 68 ile 100’ün; 16 da 0 ile 32’nin ortasıdır). x sadece bu aralık
için geçerlidir.
Prof. Dr. H. Çelebi
40
Böylece elde edilen bir birikimli sıklık dağılım doğrusuna ortanca noktasından bakıldığında,
standart sapmanın,  veya s’nin, birkaç kat dilimlerinden oluştuğu görülür. Doğrunun eğimi artan
standart sapma ile azalır ve uc kısımlar çoğu kez uyumda sorun yaratır. Ancak bu araçla gerçek
dağılımların grafiklerle karşılaştırılması mümkün olmakta ve önemli parametreleri doğrudan
okunabilmektedir.
Şekil 3.4.
Olasılık kağıdı ve birikimli sıklık dağılımında kullanılması (veriler için bak. Çelebi, 2003: İstatistik ders notları, Örnek
3.2.).
Dağılımın doğru vermemesi durumunda heterojen bir örneklemin, başka dağılımların mevcut
olabileceği veya değerlerin belli ölçüde kaydırılması gerektiği üzerinde durmak gerekir. Böyle bir
durumda genelde logaritmik dağılım sözkonusu olur.
Bir birikimli dağılımın oluşturulmasında birkaç parçadan oluşan bir kırık bir doğrunun ortaya
çıkması, çok tepelikli bir dağılıma, yani heterojen bir örnekleme, işarettir. Bu durumda her
anakütlenin ayrı ayrı çözülmesi ve incelenmesi ancak büyük örnek sayısı için bir anlam taşır. Bir
örneklemde birden fazla ve açıkça farklı dağılımların bulunması, bu değerlerin bir anakütleye ait
olmadığını ve bunun için de bir ortalama değerin hesaplanamıyacağı anlamına gelir.
40
41
Jeolojide matematik ve statistiksel yöntemler
3.4 Logaritmik normal dağılım (logND)
Asimetrik bir normal dağılım, özellikle örneklemin bir pozitif eğime sahip olması durumunda,
logaritmik normal dağılım şeklinde görülür. Logaritmik dağılıma Galton dağılımı da denir. Bu
dağılım, özellikle geniş yayılım aralıklarına sahip, birkaç on veya yüz kat değişen, dağılımlara
uygulanır. Ancak logaritmik dağılımla dağınık değerlerin göreceli değişimleri aynı derecede açıkça
gösterilebilir.
Bir normal dağılımın basıklık (e<0, platikurtik) ve sivrilik (e>0, leptokurtik) özellikleri bazen örnek
sayısının arttırılması ile giderilebilmesine karşın, kayma etkilenmemektedir. Bu, basıklığın sıkça
rastlantısal bir örneklem etkeni olduğunu, buna karşın kaymanın anlamlı bir etken olduğunu
gösterir. Bu durumlar uygulamada ancak logaritmik dağılım modelleri ile açıklanabilmektedir.
Logaritmik normal olasılık sıklık dağılımı ve sıklık dağılım fonksiyonu,
f(x) =
F(x)=
1
 2
e
x
1 ln x   2
 (
)
2

1 ln y   )
1 2(
.e

 2  y
1
3.6

)2
3.7
dy
şeklindedir (x>0). Logaritmik dağılımın en belirgin işareti, sınıflara ayrılmış birikimli bir
örneklemin yüzde değerlerinin olasılık kağıdında ortalama değerin üstündeki değerlerin
altındakilere oranla yatay durum göstermesidir. Absisleri logaritmik bölünmüş olasılık kağıtları
piyasada satılmaktadır. Buradaki logaritmik dağılımın, fonksiyonlardan da görüldüğü gibi, onlu
taban logaritması (log) olmadığı, doğal logaritma (ln) olduğu, unutulmamalıdır. Bazen onlu taban
logaritması doğal logaritmaya göre daha iyi yaklaşık değerler verebilir. Bu durumda yukarıdaki
denklemlerde sadece ln yerine log’un yazılması yeterlidir*. Buna ek olarak µ ve σ yerine z
yazılarak, yukarıda olduğu gibi, denklemler genelleştirilebilir. Logaritmik dağılım parametrelerinin
hesaplanması bir normal dağılımdakinden daha karışık ve zaman alıcıdır. Burada kullanılan
eşitlikler aşağıya çıkarılmıştır:
Parametre
Formül
Ortalama değer
Ortanca
µL= e
µoL= e 
Tepe değeri
µtL = e  
Değişke
Kayma
Basıklık


2
3.8
3.9
2
σ2 = e ( 2  
3.10
2
2
)( e
1)
3.11
γ = ( e  2) e  1
η=0
2
2
3.12
3.13
_________
*Aşağıdaki ilişkilerle 10 tabanına göre alınan logaritma ile doğal logaritmalar birbirlerine çevrilebilmektedir (Wellmer, 1989):
log a.ln 10 = ln a (ln 10 = 2,3026), ln a.log e = log a (log e = 0,4343) veya log10x = logex/loge10 = lnx/ln10 = lnx/2,3026’dır.
Prof. Dr. H. Çelebi
42
Uygulamada bir logaritmik dağılımın beklenmesi durumunda ölçüm veya analiz değerlerinin logaritmaları alınır. Ortalama değer ve standart sapma bu değerlerden hesaplanır, ilgili çizelgeler,
örneğin z dağılım çizelgesi, kullanır ve karşılaştırmalar gerçekleştirilir. Logaritmik normal
dağılımın standart sapması temel değerlerin geometrik ortalamaya oranıdır, normal dağılımdaki
gibi sapmaların ortalama değeri değildir.
Logaritmik dağılımın önemi bilim dallarına göre değişmektedir. Örneğin, yerbilimlerinde çok
önemlidir. Bu nedenle Ahrens (1954) magmatik kayaçlardaki logaritmik normal dağılımı
jeokimyanın temel yasası olarak tanımlamaktadır. Yukarıda da değinildiği gibi, düşük veri normal
dağılımları ağırlıkta olmaktadır. Jeolojide, örneğin, hafif şiddetteki depremler, kuvvetlilerden daha
sık meydana gelmektedir. Rüzgar hızı ve yağış dağılımı da buna benzer ve genellikle logaritmik
dağılım sunarlar. Aslında bu dağılımlar derişime de bağlıdır. Örneğin, minerallerin iz element
içerikleri kayaçlardaki iz element dağılımını da belirlemektedir.
Rodionov’a (1961) göre de magmatik kayaçlardaki element dağılımı kural olarak logaritmik
normal dağılımdır. Bunun dışındaki dağılımlar kuralının dışında kalan dağılımlar veya ikincil
etkenlerin sonucudur. Bilhassa minerallerdeki element dağılımı her zaman için logaritmiktir. Ancak
değişim geçirmiş ve farklı nesillerden (jenerasyondan) oluşan minerallerde, normal dağılım
görülebilir. Örneğin, limonit (FeOOH), hematitten (Fe2O3) meydana gelir. Hematitte logaritmik
dağılım varken, limonitte normal dağılım gözlenir.
Bir magmatik kayaçtaki bir elementin öncelikle bir minerale bağlılığı da logaritmik dağılım
şeklinde görülür. Buna karşın değişik minerallere yaklaşık eşit dağılımı, normal dağılım gösterir.
Örneğin, granitlerde Ca plajiyoklaslara (Ca[AlSi3O8]), Mg ise, biyotite (K[Fe, Mg]3, [Al, Fe3+])
bağlıdır. Bu nedenle Ca ve Mg’un kayaçtaki dağılımı logaritmik normal dağılım gösterirken
(Schroll, 1976), Na, Al ve Si normal dağılım gösterirler. Çünkü Na hem plajiyoklaslarda (Albit,
NaAlSi3O8), hem amfibollerde (Na, K, Ca2, [Fe, Mg/Al/Ti]5 Si8O22 [OH]2) ve hem de piroksenlerde
([Ca, Al, Fe]SiO3) derişir. Elementlerin dağılımında kimyasal denge durumu da kendini gösterebilir. İstatistiksel denge durumu bir normal dağılım sonucunu verirken, dinamik denge durumu
(difüzyonla elementlerin yayılışı) logaritmik normal dağılım sonucunu verir (Schroll, 1976).
Aynı şekilde logaritmik normal dağılım iz elementlerin dağılımında da gözlenmektedir. Örneğin,
arsenik (As), molibden (Mo) ve bakır (Cu) tercihen arsen sülfür (As2S3), molidenit (MoS) ve
kalkopirit (CuFeS2) gibi bir mineral fazına bağlanırlar. Eser elementler takip ettikleri benzer
(koherent) ana element gibi davranırlar. Örneğin, Tantal (Ta) biyotitte Alüminyuma (Al) uyduğu
için onun gibi dar bir yayılım alanı gösterir ve logaritmik dağılım sunar. Bunlara ek olarak bir
elementin dağılımı bir mineralde veya kayaçta ikincil işlevlerle, örneğin, metazomatik gelişmelerle,
kuvvetlenebilir veya aksine altersyonla zayıflıyabilir.
Aşağıda, Keban/Elazığ Simli Kurşun Yatağı’ndan bir örnek sunulmuştur. Burada kurşuna (Pb)
bağlı olarak galenitte derişen gümşün (Ag) bir log normal dağılım sunduğu görülmektedir. Aynı
dağılımla bir normal dağılımın ve log normal dağılıma dönüştürülmesi ve benzerlikleri
gösterilmiştir (Örnek 3.3 ve Şekil 3.5a-c).
Örnek 3.3:
42
43
Jeolojide matematik ve statistiksel yöntemler
Galenitte normal ve logaritmik normal (log normal) Ag dağılımı.
Veriler: ppm Ag : {11-13-14-2-15-17-50-35-6-24-12-25-18-3-7-40-9-4-5-4-1}
log ppm Ag:{1,04-1,08-1,15-0,30-1,15-1,23-1,70-1,54-0,78-1,38-1,081,40-1,26-0,48-0,78-1,60-0,95-0,60-0,70-0,60-0,00}
Çizelge 3.2:
Örnek 3.3’ün sıklık dağılım verileri.
Frekans (%)
f
<9
9-18
18-27
27-36
36-45
>45
Toplam
Normal dağılım
Sıklık
Birikimli sıklık (%)
fi
hi
∑hi
9
0,43
42,86
7
0,33
76,19
2
0,09
85,72
1
0,05
90,48
1
0,05
95,24
1
0,05
100,00
21
1,00
100,00
Logaritmik dağılım
Frekans (log%) Sıklık
Birikimli sıklık (%)
f
fi
hi
∑hi
<0,32
2
9,52
9,52
0,32-0,64
3
14,29
23,61
0,64-0,96
4
19,05
42,85
0,96-1,28
7
33,33
76,19
1,28-1,60
4
19,05
95,23
>1,60
1
4,76
100,00
21
100,00
100,00
Çözüm: Değerlerin dağılım sınırları k = xmax-xmin
= 50-1
= 49 ppm Ag’den
sınıf aralığı f =k /i , (i=1+1/log2.log n)
=k/1+3,322.log n
=49/(1+3,322 log 21)
=49/(1+3,322.1,32)
= 49/5,39
=9,09 ppm
9 ppm
bulunur (Çizelge 3.2). Aynı şekilde flog Ag = 0,32 elde edilir.
Sayısal dağılım kuvvetli pozitif eğimliyle sağa kaymakta ve bir fakir cevher tipi
göstermektedir (Şekil 3.5a). Aynı değerlerin birikimli log dağılımlar entegral ve doğru
şekilleri ile normal dağılımı pekiştirmektedir (Şekil 3.5b ve d). Birbirlerine çok yakın tepe
değeri (1,12), oratnca 1,08 ve ortalama değeri (1,00) de savı desteklemektedir.Yassılık
(kurtosis) e<3 (1,34) olduğundan, dağılım normal dağılımdan daha yassıdır. Buna göre Ag,
galenitten başka, örneğin, arsenat, antimonit ve sülfit gibi minerallerde de toplanmıştır.
Prof. Dr. H. Çelebi
35
Sıklık, %
100
xo
30
x
25
15
75
20
50
10
25
5
0
-5
9
18
27
36
45
Sınır değerleri, ppm Ag
Sıklık, %
30
20
10
0
0,32
c
0,64
0,96
1,28
1,60
1,92
d
Sınır değerleri, log ppm Ag
0,64 0,96 1,28
1,60 1,92
Sınır değerleri, log ppm Ag
b
Birikimli log sıklık, %
a
0
0,32
54
Birikimli sıklık, %
xt
Sıklık, %
45
44
100
10
1
0
0,4
0,8
1,2
1,6
2
2,4
Sınır değerleri, log ppm Ag
Şekil 3.5:
Göreceli sıklık, a ve logaritmik+birikimli logaritmik sıklık dağılımı, b, (bak. Örnek 3.3, Çizelge 3.2). xt=4,
xo=12 ve x =15 ppm Ag. Sıklık dağılımının çizgisel görünümü, c ve log birikimli dağılım (bak. Örnek 3.3 ve
Çizelge 3,2).
Alıştırma 3.1:
Aşağıdaki veri kümesinin sıklık dağılımını çizerek irdeleyiniz (Ergani-Maden/Elazığ Cu cevheri, n=15).
Değerler (ppm Cr): {100-92-22-75-65-110-80-40-13-30-55-95-50-60-70}.
Alıştırma 3.2:
{12-14-36-22-37-29-30-38-41-49-36-45-62-53-58-67-69-56-55-50} analiz sonuç-larının (n=20), a) Aritmetik (42,95),
geometrik ve harmonik ortalamalarını, b) Standart sapmasını (16,40), değişke, kayma ve basıklığını, c) Tepe değerini
(36) ve ortancasını (40), d) Sıklık dağılımını çiziniz ve d) Birikimli dağılımını olasılık kağıdında parametreleri ile
gösteriniz (parantezde sonuçlar).
Kaynakça
44
45
Jeolojide matematik ve statistiksel yöntemler
1. Ahrens, L.H, 1954: The lognormal distribution of the elements. Geochim. et Cosmochim.
Acta 49.
2. Arıcı, H., 2001. İstatistik. Metaksan basımevi, 13. baskı, 269 s., İstanbul.
3. Reinhardt, F. ve Heinrich, S., 1994: dtv-Atlas zur Mathematik. Cilt 1 ve 2., dtv Verlag,
498 s., München.
4. Perillo, G. M. E. Ve Marone, F., 1986: Determination of optimal numbers of class
intervalls using maximum entropy. Math. Geol. 18, 4, 401-407.
5. Rodionov, D. A, 1962: Bestimmung des Durchschnittsgehaltes und der Streuung einer
Lognormalverteilung von Komponenten in Gesteinen und Erzen (Rusça). Geokh. 624,
Geochem. 728.
6. Sachs, L., 1984: Angewandte Statistik. Springer Verl., 6. basım, 528 s., BerlinHeidelberg.
7. Schönwiese, Ch.-D., 1992: Praktische Statistik für Meteorologen und Geowissenschaftler.
Borntraeger, 2. basım, 231 s., Berlin, Stuttgart.
8. Schroll, E., 1976: Analytische Geochemie . Ferdinand Enke Verl, 374 S., Stuttgart.
9. Sinclair, A., 1976: Aplication of probality graphs in mineral exploration. The Association of
Exploration Geochemists (yayınlıyan). Richmond Printers Ltd., 95 s., Vencouver B. C.
10. Şeniş, F., 1996: İstatistik. Anadolu Üniversitesi yayını 175, 312 s., Eskişehir.
11. Wellmer, F.-W., 1989: Rechnen für Lagerstättenkundler und Rohstoffwirtschaftler. Ellen
Pilger, 462 S., Clausthaler-Zellerfeld.
12. Wessel, P., 2001: Geological data analysis. http://www.higp.hawaii.edu./cecily/courses, 325
s.
EKLER
Ek -3.1:
Prof. Dr. H. Çelebi
46
Normal dağılımda ortalama değer
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
F*
0,00
3,98
7,93
11,79
15,54
19,15
22,57
25,80
28,81
31,59
z
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
x ve belli z değerleri arasında bulunabilecek olayların oranı ( % F*).
F*(%)
34,13
36,43
38,49
40,32
41,92
43,32
44,52
45,54
46,41
47,13
z
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
F*(%)
47,72
48,21
48,61
48,93
49,18
49,38
49,53
49,65
49,74
48,81
z
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
F*(%)
49,865
49,903
49,931
49,952
49,966
49,977
49,984
49,989
49,993
49,997
z
4,0
5,0
6,0
F*(%)
49,997
49,99997
49,9999997
*z=(x- x )/ .F* değeri, z=0 ve z=(x- x )/ aralığında eğri altındaki toplam alana karşılık gelir.
Bu, x ve x sınırları arasında değişkenin % olarak gerçekleşme sıklığı demektir.
Örnek: x = 4,  = 1 ve x = 1 için z = 3  F* = % 49,865 ve F* = % 0,135. Tüm dağılım
eğrisi için F* = % 99,73 ve 0 F = 0,27 geçerlidir.
Ek-3.2
Standart normal dağılımın birikimli olasılık değerleri (z değerleri, Davis, 1973).
46
47
Jeolojide matematik ve statistiksel yöntemler
Ortalama değerin
standart sapmsı (z)
-3,0
-2,9
-2,8
-2,7
-2,6
-2,5
-2,4
-2,3
-2,2
-2,1
-2,0
-1,9
-1,8
-1,7
-1,6
-1,5
-1,4
-1,3
-1,2
-1,1
-1,0
Birikimli
olasılık
0,0014
0,0019
0,0026
0,0035
0,0047
0,0062
0,0082
0,0107
0,0139
0,0179
0,0228
0,0287
0,0359
0,0446
0,0548
0,0668
0,0808
0,0968
0,1151
0,1357
0,1587
Ortalama değerin
standart sapmsı (z)
-0,9
-0,8
-0,7
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
0,0
+0,1
+0,2
+0,3
+0,4
+0,5
+0,6
+0,7
+0,8
+0,9
+1,0
+1,1
Ek-3.3:
Önemli bazı parametreler için istatistiksel güvenirlik sınırları
Birikimli
olasılık
0,1841
0,2119
0,2420
0,2743
0,3085
0,3446
0,3821
0,4207
0,4602
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
Ortalama değerin
standart sapmsı (z)
+1,2
+1,3
+1,4
+1,5
+1,6
+1,7
+1,8
+1,9
+2,0
+2,1
+2,2
+2,3
+2,4
+2,5
+2,6
+2,7
+2,8
+2,9
+3,0
Birikimli
olasılık
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9773
0,9821
0,9861
0,9893
0,9416
0,9938
0,9953
0,9965
0,9974
0,9981
0,9987
Prof. Dr. H. Çelebi
Parametre
48
Güvenirlik sınırı (±ℓ)
n
P= % 95
P=  99
Ortalama değer ( x )
n  30
1,96 .s/
n 1
2,58 .s/
n 1
Ortanca (xo)
n  30
2,46 .s/
n 1
3,23 .s/
n 1
Değişke (s2)
n  100
2,77 .s/
n 1
3,65 .s/
n 1
Standart sapma (s)
n  100
1,39 .s/
n 1
1,82 .s/
n 1
Örnek: n=30 için x ± 1,96.s/ n  1 sınırları % 95 güvenirlikle/kesinlikle ortalama değeri kapsar.
Küçük örnek sayısı için ortalama değerin güven sınırları Student-t-değerleri vasıtası ile hesaplanabilir: Örneğin, х ± t.s/
n  1 gibi.
4 VARYANS ANALİZİ
4.1 Temel ilkeleri
48
49
Jeolojide matematik ve statistiksel yöntemler
Basit bir varyans analizi* (VA) bir anakütlenin standart sapmalarını karşılaştırır, yani
anakütlenin veya örneklemin örnekten örneğe değişen standart sapmasını inceler. Anakütlenin
saf olması durumunda örneklemler arasındaki farklılık karakteristik değildir. Aksine karışık
bir anakütlede örneklemler arası standart sapma (varyans) örneklemlerin standart
sapmasından anlamlı bir şekilde büyük olur. Bu farklılık, örnklemin birine veya tümüne farklı
olayların veya aynı şiddetteki bir olayın farklı etki etmesini gösterir.
Varyans analizinden birkaç anakütlenin karşılaştırılmasında yararlanılır. Saf anakütlelerin
sınanmasında, grup farklarının sınırlandırılmasında, örneğin, tıpta tedavi yöntemlerinin,
yerbilimlerinde kayaç türlerinin veya fasiyes tiplerinin ayırdedilmesinde, uygulanır. Varyans
analizi, önemli etkenleri önemsizlerden ayırmayı sağlar. Bu amaçla R. A. Fisher (18901962) tarafından deneyleri planlamak ve değerlendirmek için bulunmuş ve geliştirilmiştir. Bir
tek bağımsız özelliğin incelenmesine dayanan varyans analizine tek etkenli veya basit, 2
veya daha fazla bağımsız özelliğin incelenmesi durumunda ise, çok etkenli varyans analizi
denir. Yöntemin esasını toplam varyansla kısmi varyansların karşılaştırılması teşkil eder.
Buna göre inceleme 1 etkene indirgenir. Yani bir anakütlede bir özelliğin değişkenliği
bağımsız birkaç etkenden kaynaklanıp kaynaklanmadığı araştırılır. Bu durumda,
2
2
2
2
σ t = σ 1 + σ 2 +...+ σ n
4.1
eşitliği geçerli olur (t, toplam; n, örnek sayısı). Eşitliğin sağlanması, incelenen örneklemlerin
bir anakütleden oluştuğunu, aksi taktirde kümenin heterojen olduğunu, yani 1’den fazla
anakütleden geldiğini gösterir. Bu eşitlik standart sapma s için geçerli olamaz, yani st ≠ s1+ s2
+...+ sn‘dir.
Bulunan değişke farkları F sınamasına tabi tutulurlar. Karşılaştırmak için gerekli sınama
değerleri ilgili tablolardan okunarak farklılıkların karakteristik olup olmadıkları tesbit edilir.
Farklılığın tam belirlenemediği durumlarda derece veya rang yönteminden yararlanılır. Bu
yöntemde mevcut analiz değerleri k sınıflarına ayrılır (k=1+2+3+...+m). Her sınıfın derişimi
toplam yüzde ile çarpılarak dereceler elde edilir. Bu dereceler de çeşitli matematiksel
işlemlere tabi tutularak farkların ortaya çıkarılması sağlanır.
Varyans analizinde değişkenler anakütleler arasında araştırılır. Anlamlı olmıyan fark durumunda 1, aksi durumda en az 2 anakütlenin bulunduğu ortaya çıkar. Bunun nedenleri oldukça
farklı olmaktadır. Karar karşılaştırma sonunda verilir. İncelenen anakütlelerin örnek sayısı eşit
veya farklı sayıda olabilir.
___________
* Şimdiye kadar varyans yerine kullanılan “değişke” burada yerleşmiş “varyans analizi” ismi nedeniyle kullanılamaz.
Varyans analizinin geometrik anlamı Şekil 4.1.’de gösterilmiştir. Burada, bulunan bağımsız
ortalama değer y ' dir. Bir özelliğin etkin olması durumunda da ortalama değerler y j veya
y m ' dir. Bu beklenen ortalama değerlerden sapan (yij- y j ) farkları rastlantısal dış etkenlerden
Prof. Dr. H. Çelebi
50
kaynaklandıklarından, açıklanamazlar. Böylece 4.1’de gösterilen toplam sapma veya saçınım,
açıklanan sapma ile açıklanamıyan sapmanın toplamı olduğu veya toplam sapmanın açıklanan
ve açıklanamıyan sapma bileşenlerine (elemanlarına) ayrıldığı görülür (Backhaus ve diğ,
1990). Bunun ispatı aşağıda verilmiştir (bak. Ek-4.1).
y
yim x
ym
Açıklanamıyan sapma
0
Açıklanan sapma
y
Açıklanan sapma
yj 0
Açıklanamıyan sapma
y ij x
x
1. etken
2. etken
Açıklama: i, örnek sayısı; j, grup sayısıdır. Örneğin, yij, j grubunun i’ninci değeri y demektir.
Şekil 4.1
Varyans analizinin geometrik ilkesi, açıklanan ve açıklanamıyan sapmalar.
Varyans analizinin Şekil 4.1’deki geometrik anlamı Çizelge 4.1’de matematiksel olarak
özetlenmiştir.
Çizelge 4.1.
Sapma kareleri ve hesaplama eşitlikleri (ispat için bak ek 2).
Açıklanan sapma
Toplam sapma
= Açıklanan sapmaların
karelerinin toplamı
KTt(oplam)*
m
n
 
j 1
i 1
Açıklanamıyan sapma
= gruplar arası sapmaların
karelerinin toplamı
KTa(rası)
2
( y ij  y )
m
=
n
j (y j
2
-y )
j 1
= gruplar içi sapmaların
karelerinin toplamı
KTi(çi)
m
+
nj
 ( y
ij
 y j )2
j 1 i 1
* KT: Kareler toplamı; i, örnek sayısı (i=1,2,...,n); j, grup sayısı (j=1,2,...,m); y j , grup ortalaması; y , genel ortalama.
Örneklem ortalamaları y j ile toplam ortalama y arasındaki farklara ( y j - y = ei) etken
(effect) denir. Bu fark, dolayısı ile kareleri toplamı, ne kadar küçükse, grup veya örneklemler
birbirine o kadar benziyor demektir. Buradan “örneklemlerin aynı anakütleye ait olabilmeleri
50
51
Jeolojide matematik ve statistiksel yöntemler
için etkenlerin kareleri toplamının sıfıra yaklaşması gerektiği” sonucu ortaya çıkar. Bu da en
küçük kareler yönteminin geçerli olduğunu gösterir. Yani,
ei2
 min

i 1 n
n
4.2
olması gerekir. Bu, aynı zamanda hataların ve etkenlerin ortalama değerlerinin 0 olmasını
gerektirmektedir.
4. 2. Tek değişkenli varyans analizi
Tek değişkenli varyans analizinde 1 tek öezelliğin değerleri, örneğin, ağırlıklar g olarak,
karşılaştırılır. Varyans analizi ilke olarak F sınamasından başka bir şey değildir. Başka bir
deyişle varyans analizi, F sınamasını kullanan karmaşık bir varsayım yöntemidir. Bu
varsayımda, tek etkenli varyans analizinde (ANOVA=analysis of variance), sıfır ve karşıt
varsayımları,
Ho: y1 = y 2 =...... y n
4.3
H1: y1 ≠ y 2
şeklinde ifade edilirler. Bununla grupların homojen olduğu savunulmaktadır (H0, sıfır hipotezi
= ortalama değerler arasında fark yoktur). Tersine seçenek varsayımına (H1) göre belki de bir
anakütleye ait değildirler (= ortalama değerler arasında fark vardır). Ho’ın kabul veya
reddedilmesi için farkın anlamlılığı F sınaması ile denetlenir.
Varyans analizi ile bir örneklemde birçok etkenin etkisi birden araştırılır. Grup sayısı normal
koşullarda 10’u, örnek sayısı da 50’yı geçmez. j, örneklem (grup) sayısı olarak verilmiştir. Bu
durumda j örneklemlerinin örnek sayıları n1, n2, ...,nm olur. Buna göre,
xi değerlerinin genel sayısı n =n1+n2+...+nm,
xi değerlerinin genel toplamı Σxi = x1+x2+...+xn
4.4
4.5
x = Σxi/n,
Genel ortalama
Serbestlik derecesi
F = n-1,
Toplam karelerin ortalama değeri KOt = KTt /(n-1)
4.6
4.7
4.8
eder. Buradan,
bulunur (KOt, toplam kareler ortalaması; n-1, serbestlik derecesidir).
4.3 Sapmaların hesaplanması
Prof. Dr. H. Çelebi
52
Varyans analizinde sapmaların hesaplanması ve bunlarla ilgili işlemler yöntemin temelini
oluşturur. Bunun için işleme girecek ölçümler ve gruplar ilk önce adlandırılır veya
numaralandırılır. Örneğin, j gruplarının ortalama değerleri x 1, x 2,..., x m ise,
1. Tüm karelerin toplamı,
KTt = (x1- x )2+(x2- x )2+...+ (xn- x )2 ,
4.9
2. Kümeler arası kareler toplamı,
KTa = n1 ( x 1- x )2 + n2 ( x 2- x )2 +…+nj ( x j- x )2
4.10
ve
3. Kümeler içi kareler toplamı,
KTi = KTt – KTa
4.11
olarak bulunur.
Değişke, ortalama karelerin sapması olarak tanımlandığından,
KO =
KT
gözlem.sayisı  1
4.12
eşitliğinden hesaplanır (Çizelge 4.1). Paydadaki sayı, serbestlik derecesi, gözlem sayısının 1
eksiğidir. Sapmaların hesaplandığı değerlerden ortalama değerin kendisi de hesaplandığından,
değerlerin biri hiçbir zaman serbest olamaz ve toplam serbestlik derecesi,
Ft = n-1
4.13
değerini alır. Aynı şekilde her gruptaki örneklerin de biri hiçbir zaman serbest olamıyacağından,
gruplar arası serbestlik derecesi de,
Fa = m-1
4.14
olur. Genel kareler toplamı KTt, KTa ve KTi kısımlarına ayrıldığı gibi serbestlik dereceleri de
kısımlara ayrılabilir. Buna göre, m sayıdaki grupların her birinin içindeki örneklerden ancak n-1
tanesi serbest hareket edebileceğinden, gruplar içi serbestlik derecesi,
Fi = n-1-(m-1) = n-m
4.15
olur. Kareler toplamının (KTt, KTa ve KTi) ortalama sapma değerlerinin hesaplamasında
kullanılan formüller Çizelge 4.2’de toplanmıştır.
52
53
Jeolojide matematik ve statistiksel yöntemler
Çizelge 4.2.
Kareler toplamı ortalamalarıının hesaplanması.
KTt
n 1
KTa
Gruplar arasındaki ortalama değişke,
KOa =
m 1
KTi
Gruplar içi ortalama değişke
KOi=
nm
KOa ve KOi’ye F testi uygulanarak anlamlı farklar bulunur (bak. Örnek 4.1).
Toplam ortalama değişke,
KOt =
4.16
4.17
4.18
Örnek 4.1:
Verilenler: Veri grupları P, Q ve R (Marsal, 1990):
P : 2-3-1,
Q : 2-3-1-1-3 ve R : 2-4-8-6;
np = 3
nq = 5
nr = 4
x p = 6:3 =2
x q = 10:5=2
x r = 20:4=5
Toplam grup sayısı m = 3 ve örnek sayısı nt = 12
İstatistik yöntemlerinde hesaplamaları düzgün yürütmek ve sağlama olanağı vermek için örnekler kullanılacak formüllere göre düzenlenirler. Bir varyans analizinde verilerin hesap-lamaya
hazırlanmasına faktöryel dizayn (factorell desing) denir (bak. Çizelge 4.3.). Burada amaca
uygun bir çizelge yapılarak işlemler yapılır (bak. Örnek 4.1. ve Çizelge 4.3).
Çizelge 4.3.
Örnek 4.1’in çözümü: Devamı için bak. Çizelge 4.4.
Grup/
Örneklem
KTt
m
n
 
j 1
2
( y ij  y )
2
3
Toplam
n
j (y j
- y )2
j 1
i 1
2
1
KTa
m
(2-3) = 1
(3-3)2 = 0
(1-3)2 = 4
(2-3)2 = 1
(3-3)2 = 0
(1-3)2 = 4
(1-3)2 = 4
(3-3)2 = 0
(2-3)2 = 1
(4-3)2 = 1
(8-3)2 =25
(6-3)2 = 9
50
KTi
m
nj
 ( y
ij
 y j )2
j 1 i 1
2
(2-3) = 1
(2-3)2 = 1
(2-3)2 = 1
(2-3)2 = 1
(2-3)2 = 1
(2-3)2 = 1
(2-3)2 = 1
(2-3)2 = 1
(5-3)2 = 4
(5-3)2 = 4
(5-3)2 = 4
(5-3)2 = 4
24
(2-2)2 = 0
(3-2)2 = 1
(1-2)2 = 1
(2-2)2 = 0
(3-2)2 = 1
(1-2)2 = 1
(1-2)2 = 1
(3-2)2 = 1
(2-5)2 = 9
(4-5)2 = 1
(8-5)2 = 9
(6-5)2 = 1
26
Prof. Dr. H. Çelebi
54
Çizelge 4.4.
Varyans analizinde kullanılan eşitliklerin özeti. Sayılar Örnek 4.1’deki sonuçlardır.
Değişke
Kaynağı
Kareler
toplamı
KTt
Karelerin
ortalaması
n
m
Toplam
Serbeslik
derecesi
 
j 1
KTa
Ft = n-1 =11 KOT =
- y )2
= 24
Fa = m-1 = 2 KOa =
KTa
=12,
m 1
 y j ) 2 = 26
Fi= n-m = 9 KOi =
KTi
KOa
= 2,90 Fhes=
=12/2,9=4,1
KOi
nm
i 1
n
j (y j
j 1
m
Gruplar içi
KTi
nj
 ( y
KTt
= 4,54
n 1
( y ij  y )2 = 50
m
Gruplar arası
Fhesaplanan (Fhes)
(deney sonucu)
ij
j 1 i 1
2 grup veya küme ile 9 örnek serbestlik derecelerine göre teorik değişkeler oranı Fteo=Fhes(2; 9; 0,95)
sınaması çizelgesinden % 95 olasılıkla 4,3 olarak okunur (Ek-4.2a, b). Buna göre farklılık
anlamlı değildir. Çünkü 4,1 ile 4,3 aynı grup ve örnek serbestlik derecelerine aittir. Ho
hipotezinin rededilmesi için Fteo<Fhes olması lazımdır. Dolayısı ile buradaki örneklemler
homojendir ve bir anakütleye aittirler. Bu sonuç, ortalama değerlerin karşılaştırılmasından da
anlaşılmaktadır (xo=xp=2, xq=5). Bu sonuçla Ho hipotezi kabul, H1 reddedilmiştir. İşlemin
sağlanması: KTt= ?KTa + KTi → 50 = 24 + 26’dan çzümün doğruluğu saptanmıştır.
4.4. Çok değişkenli varyans analizi
İncelenen veri kümeleri birden fazla özellikleri bakımından incelenmek istendiğinde, çok
değişkenli varyans analizi uygulanır. Bunun uygulanışı ilke olarak tek değişkenli varyans analizi ile aynıdır. Ancak daha karmaşık hesaplama yöntemlerinin izlenmesi gerekir. Bu nedenle
örneğin çoğu yerde determinantlar kullanılarak satır, tabaka ve sütunlar (3 değişkenli) ayrı
ayrı ele alınır. Burada bu yöntemlerin işlenmesi bu notların kapsamını aşacağından, Backhaus
ve diğ. (1990), Sachs (1984) ve Schönwiese (1992) eserlerine başvurulması önerilir.
Alıştırma 4.1:
Aşağıdaki çizelgede verilen değerler için bir F sınaması hesaplayınız.
i
1
2
3
4
ni =
xi =
Σxi =
j
1
3
7
2
5
10
Örneklemler
2
3
4
8
2
4
7
6
3
4
3
4
6
16
18
54
ni = 9
Σ Σxi= 44
Yanıt: Ho kabul, Fhes=0,69<5,14=F(2; 6; 0,95)
55
Jeolojide matematik ve statistiksel yöntemler
Kaynakça
1. Backhaus, K., Erichson, E., Plinke, W. ve Weiber, R., 1990: Multivariate Analysenmethoden.
Springer Verl., 6. Basım, 411 s., Berlin-Heidelberg-New York
2. Davis, J. D., 1976: Statistics and data analysis in geology. John Villay and Sons, 550 s.,
New York
3. Leonhart, M., 2002: Statistik für Psychologen. www.psychologie.uni-freiburg.de, 750 s.
4. Marsal, D., 1990: Yerbilimciler için istatistik. Çeviren: Yavuz Erkan, Hacettepe Üniversitesi
yayını, 168 s., Ankara.
5. Sachs, L., 1984: Angewandte Statistik. Springer Verl., 6. basım, 528 s., Berlin-Heidelberg.
6. Schönwiese, Ch.-D., 1992: Praktische Statistik für Meteorologen und Geowissenschaftler.
Borntraeger, 2. basım, 231 s., Berlin, Stuttgart.
7. Schroll, E., 1976: Analytische Geochemie . Ferdinand Enke Verl, 374 S., Stuttgart.
8. Şeniş, F., 1996: İstatistik. Anadolu Üniversitesi yayını No.: 175, 312 s., Eskişehir.
9. Wessel, P., 2001: Geological data analysis. www.higp.hawaii.edu./cecily/courses, 325 s.
Prof. Dr. H. Çelebi
56
EKLER
Ek-4.1:
4.1 eşitliğinin ispatı:
m
n
j 1
i 1
 
m
n
j 1
i 1
m
n
j 1
i 1
m
n
j 1
i 1
m
n
j 1
i 1
m
n
j 1
i 1
m
n
 
2
( y ij  y ) =
2
( y ij  y j  y j  y )



0
4.19
( yij  y j  y j  y )2


 
4.20
basite indirgemek için,
 
KTt =
 
=
 
=
=
vij
4.21
(vij2  2vij z j  z 2j )
4.22
m
n

i 1
m
2vij z j  
n

z 2j
4.23
vij2  2 ( z j  vij )  n j  z 2j
4.24
j 1

j 1
(vij  z j )2
vij2  
 
=
zj
i 1
j 1
i 1
m
n
m
j 1
i 1
j 1
kij = yij- y j bireysel hata olduğundan ve hataların toplamının 0 olması koşulu bulunduğundan,
m

=
j 1
n
m
vij2  2 ( z j  vij )  n j  z 2j
j 1
i 1
j 1


n
m
i 1
4.25
0
Buna göre eşitlik,
m
=
j 1
n

i 1
m
v  n j  z 2j
2
ij
4.26
j 1
m
m
j 1
j 1
= n j  z 2j + 
n

vij2
4.27
i 1
kji ve lj’nin değerlerinin yerlerini konulması ile,
nj
m
m
j 1
j 1 i 1
KTt = nj  ( y j  y )2 +  ( y ij  y j ) 2
= KTa+KTi
4.28
4.29
bulunur.
56
57
Jeolojide matematik ve statistiksel yöntemler
Ek-4.2a:
F sınamsı çizelgesi (P= % 95 güvenirlikle, α=0,05).
j
i
1
2
3
4
1
161,40
18,51
10,13
7,71
2
199,50
19,00
9,55
6,94
3
215,70
19,16
9,28
6,59
4
224,60
19,25
9,12
6,39
5
230,20
19,30
9,01
6,26
6
234,00
19,33
8,94
6,16
7
236,80
19,35
8,89
6,09
8
238,90
19,37
8,85
6,04
9
240,50
19,38
8,81
6,00
10
241,90
19,40
8,79
5,56
5
6
7
8
9
6,61
5,99
5,59
5,32
5,12
5,79
5,14
4,74
4,46
4,26
5,41
4,76
4,35
4,07
3,86
5,19
4,53
4,12
3,84
3,63
5,05
4,39
3,97
3,69
3,48
4,95
4,28
3,87
3,58
3,37
4,88
4,21
3,79
3,50
3,29
4,82
4,15
3,73
3,44
3,23
4,77
4,10
3,68
3,39
3,18
4,74
4,06
3,64
3,35
3,14
10
11
12
13
14
4,96
4,84
4,75
4,67
4,60
4,10
3,98
3,89
3,81
3,74
3,71
3,59
3,49
3,41
3,34
3,48
3,36
3,26
3,18
3,11
3,33
3,20
3,11
3,03
2,96
3,22
3,09
3,00
2,92
2,85
3,14
3,01
2,91
2,83
2,76
3,07
2,95
2,85
2,77
2,70
3,02
2,90
2,80
2,71
2,65
2,98
2,85
2,75
2,67
2,60
15
16
17
18
19
4,54
4,49
4,45
4,41
4,38
3,68
3,63
3,59
3,55
3,52
3,29
3,24
3,20
3,16
3,13
3,06
3,01
2,96
2,93
2,90
2,90
2,85
2,81
2,77
2,74
2,79
2,74
2,70
2,66
1,63
2,71
2,66
2,61
2,58
2,54
2,64
2,59
2,55
2,51
2,48
2,59
2,54
2,49
2,46
2,42
2,54
2,49
2,45
2,41
2,38
20
21
22
23
24
4,35
4,32
4,30
4,28
4,26
3,49
3,47
3,44
3,42
3,40
3,10
3,07
3,05
3,03
3,01
2,87
2,84
2,82
2,80
2,78
2,71
2,68
2,66
2,64
2,62
2,60
2,57
2,55
2,53
2,51
2,51
2,49
2,46
2,44
2,42
2,45
2,42
2,40
2,37
2,36
2,39
2,37
2,34
2,32
2,30
2,35
2,32
2,30
2,27
2,25
25
26
27
28
29
4,24
4,23
4,21
4,20
4,18
3,39
3,37
3,35
3,34
3,33
2,99
2,98
2,96
2,95
2,93
2,76
2,74
2,73
2,71
2,70
2,60
2,59
2,57
2,56
2,55
2,49
2,47
2,46
2,45
2,43
2,40
2,39
2,37
2,36
2,35
2,34
2,32
2,31
2,29
2,28
2,28
2,27
2,25
2,24
2,22
2,24
2,22
2,20
2,19
2,18
30
40
60
120
∞
4,17
4,08
4,00
3,92
3,84
3,32
3,23
3,15
3,07
3,00
2,92
2,84
2,76
2,68
2,60
2,69
2,61
2,53
2,45
2,37
2,53
2,45
2,37
2,29
2,21
2,42
2,34
2,25
2,17
2,10
2,33
2,25
2,17
2,09
2,01
2,27
2,18
2,10
2,02
1,94
2,21
2,12
2,04
1,96
1,88
2,16
2,08
1,99
1,91
1,83
i: Açıklanabilen değişkenin serbestlik derecesi (n-1), j: Paydanın serbestlik derecesi (n-m). Backhaus ve diğ., 1990.
Prof. Dr. H. Çelebi
58
Ek-4.2b:
F sınamsı çizelgesi (P= % 99 güvenirlikle, α=0,01).
j
i
1
2
3
4
1
4052
98,50
34,12
21,20
2
4999,50
99,00
30,82
18,00
3
5403
99,17
29,46
16,69
4
5625
99,25
28,71
15,98
5
5764
99,30
28,24
15,52
6
5859
99,33
27,91
15,21
7
5928
99,36
27,67
14,98
8
5982
99,37
27,49
14,80
9
6022
99,39
27,35
14,66
10
6056
99,40
27,23
14,55
5
6
7
8
9
16,26
13,75
12,25
11,26
10,56
13,27
10,92
9,55
8,65
8,02
12,06
9,78
8,45
7,59
6,99
11,39
9,15
7,85
7,01
6,42
10,97
8,75
7,46
6,63
6,06
10,67
8,47
7,19
6,37
5,80
10,46
8,26
6,99
6,18
5,61
10,29
8,10
6,84
6,03
5,47
10,16
7,98
6,72
5,91
5,35
10,05
7,87
6,62
5,81
5,26
10
11
12
13
14
10,04
9,65
9,33
9,07
8,86
7,56
7,21
6,93
6,70
6,51
6,55
6,22
5,95
5,74
5,56
5,99
5,67
5,41
5,21
5,04
5,64
5,32
5,06
4,86
4,69
5,39
5,07
4,82
4,62
4,46
5,20
4,89
4,64
4,44
4,28
5,06
4,74
4,50
4,30
4,14
4,94
4,63
4,39
4,19
4,03
4,85
4,54
4,30
4,10
3,94
15
16
17
18
19
8,68
8,53
8,40
8,29
8,18
6,36
6,23
6,11
6,01
5,93
5,42
5,29
5,18
5,09
5,01
4,89
4,77
4,67
4,58
4,50
4,56
4,44
4,34
4,25
4,17
4,32
4,20
4,10
4,01
3,94
4,14
4,03
3,93
3,84
3,77
4,00
3,89
3,79
3,71
3,63
3,89
3,78
3,68
3,60
3,52
3,80
3,69
3,59
3,51
3,43
20
21
22
23
24
8,10
8,02
7,95
7,88
7,82
5,85
5,78
5,72
5,66
5,61
4,94
4,87
4,82
4,76
4,72
4,43
4,37
4,31
4,26
4,22
4,10
4,04
3,99
3,94
3,90
3,87
3,81
3,76
3,71
3,67
3,70
3,64
3,59
3,54
3,50
3,56
3,51
3,45
3,41
3,36
3,46
3,40
3,35
3,30
3,26
3,37
3,31
3,26
3,21
3,17
25
26
27
28
29
7,77
7,72
7,68
7,64
7,60
5,57
5,53
5,49
5,45
5,42
4,68
4,64
4,60
4,57
4,54
4,18
4,14
4,11
4,07
4,04
3,85
3,82
3,78
3,75
3,73
3,63
3,59
3,56
3,53
3,50
3,46
3,42
3,39
3,36
3,33
3,32
3,29
3,26
3,23
3,20
3,22
3,18
3,15
3,12
3,09
3,13
3,09
3,06
3,03
3,00
30
40
60
120
∞
7,56
7,31
7,08
6,85
6,63
5,39
5,18
4,98
4,79
4,61
4,51
4,31
4,13
3,95
3,78
4,02
3,83
3,65
3,48
3,32
3,70
3,51
3,34
3,17
3,02
3,47
3,29
3,12
2,96
2,80
3,30
3,12
2,95
2,79
2,64
3,17
2,99
2,82
2,66
2,51
3,07
2,89
2,72
2,56
2,41
2,98
2,80
2,63
2,47
2,32
i: Açıklanabilen değişkenin serbestlik derecesi (n-1), j: Paydanın serbestlik derecesi (n-m). Backhaus ve diğ., 1990.
58
59
Jeolojide matematik ve statistiksel yöntemler
5 BAĞINTI (KRELASYON) ANALİZİ
5.1 Genel bakış
Bir anakitlede veya örneklemde birden fazla özelliğin veya değişkenin incelenmesi ile
özelliklerden birinin diğerine bağlı olarak değişip değişmediği de araştırılabilir. Bu değişimi
örneğin, bir matriks şeklinde satır ve sütunlarla ifade edilebilir. Örneklemin bir insan çevresi
olması halinde, bu çevre bireylerinin xi buyları ile yi kilolarının karşılaştırılması gibi.
Bu şekilde yapılan karşılaştırmalara bağıntı (korelasyon), inceleme yöntemine de bağıntı
analiz yöntemi denir ve en çok kullanılan istatistiksel analiz yöntemlerindendir. Uygulanması
oldukça esnektir. Değişken arasındaki ilişkilerin saptanmasında, yorumlanmasında, değişken
değerlerinin tahmin edilmesinde ve beklenen gelişmelerin önceden kestirilmesinde önemli rol
oynar. Örneğin, bir malın fiyatının satışına etkisi veya bir kare alanının değişen a kenar
uzunluğu ile değişmesi (F = a2) v. s. gibi.
Varyans analizi ve χ2 (ki kare) yöntemleri ile de bağıntıların olup olmadığı araştırılır. Bu
yöntemler ancak birer fonksiyon değildir. Bunlara karşın bağıntı ve bağınım (regresyon)
analiz yöntemlerinde birkaç veri kümesi arasında bağıntıların varlığı gösterilebidiği gibi,
fonksiyon ilişkileri de araştırılabilir.
Doğada birçok değişken, örneğin, yoğunlukla hacim, ısı ile basınç veya element derişimleri,
birbirine bağımlıdır. Korelasyon, kelime anlamı olarak, ilişki, bağıntı demektir. Yöntem, bir x
değişkeninin (bağımsız değişken) alabildiği değerler dizisinin oluşturduğu dizi ile bir y
değişkeninin (bağlı değişken) alabildiği değerlerin oluşturduğu bir bağıntının olup olmadığını
araştırır ve bağıntı varsa, bunun derecesini saptar. Bağlı ve bağımsız değişkenler yer
değiştirebilir. Değişkenler arasındaki bağıntı, bağıntı katsayısı r ile gösterilir ve bağıntı
analiz yönteminde bağıntının derecesini belirler. Bağınım analizinde ise, sadece fonksiyonal
bağımlılık incelenir. Bağıntı ve bağınım birbirlerine sıkı sıkıya bağlıdırlar. Bağınım
analizinde hem bağımlı, hem de bağımsız değişkenin metrik ölçüde olması gerekir. Bunun
dışındaki ölçüler (biner veya nominal) istisnadır.
5.2 Bağıntı analizi (BA) ve çeşitleri
Bağıntı analizi, değişkenler arasındaki ilişkileri inceler. Değişkenler, anakütlelerin, öncelikle
derişim, çekim kuvveti, ısı ve basınç gibi özellikleri olmaktadır. Bu özellikler arasındaki
bağıntılar çok çeşitlidir. Bir tahmine işaret ederler ve değişkenler arasındaki neden ve sonuç
ilişkisine dayanırlar. Doğrusal bağıntı, yukarıda da belirtildiği gibi, en yaygın gözlenen
bağıntı şeklidir, doğada ve günlük yaşamda örneklerine sık rastlanır. Bunların bazıları aşağıya
çıkarılmıştır (Şekil 5.1). Bunun yanında üslü fonksiyonların da çeşitli tipleri sıkça görülür.
Gözlemler arasındaki ilişkinin tanımlanması için önce sıklık dağılımlarının homojenliğinin
bilinmesi gerekir. Çünkü bunlar değişik özelliklere sahip anakütlelere ait olabilirler.
Prof. Dr. H. Çelebi
60
Bir iki boyutlu bağıntı genelde aşağıdaki özellikleri taşır:
1.İki değişken istatistiksel olarak birbirine bağlı değildir (Şekil 5.1a). Bu durumda veriler birbirinden bağımsız veya ilişkisizdir (r = 0). Değişkenlerden birinin sabit, diğerinin değişmesi
durumunda da bağıntı olmaz.
2. İki değişken tamamen veya kısmen birbirine bağlıdır (Şekil 5.1 b ve c). Bağlılık doğrusaldır (doğrusal bağıntı). Bu bağıntıda değişkenler eşit oranlarda artarlar (Şekil 5.3), ancak
bağınım doğrusunun eğimi,
a) pozitif olabilir (r > 0). Bu durumda değişkenlerden biri artarken diğeri de artar demektir
(uyumlu veya pozitif bağıntı). r = +1 değeri en uyumlu bağıntıyı gösterir ve tüm noktalar 1 doğru üzerindedir.
b) negatif olabilir (r < 0). Bu durumda değişkenlerden biri artarken diğeri azalır demektir
(uyumsuz veya negatif bağıntı). r = -1 en uyumsuz bağıntıyı gösterir.
3. Bağınım doğrusal değildir (doğrusal olmayan bağıntı). Burada artan veya azalan bir üssel
bağıntı mevcuttur (Şekil 5.1 d). Bu tür bağıntılarda değişkenlerden biri bir ölçü birimi
artarken, diğeri değişik ölçülerde artar veya azalır.
Bağlı değişken
Ordinat
r=0
y
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x x
x
Bağımsız değişken
Absis
a
r>0
y
x
x
x
x
y
r<0
x x
x x x
x x x
x x
r>0
x
xx
x
x
x x Uyumlu
x x xx
artan
x
c
xx
x
x
x
x xx
b
y
x
xx
x
x
x
d
x
x
a, Bağıntı yok, r = 0; b, uyumlu doğrusal bağıntı, r > 0,
c, uyumsuz doğrusal bağıntı, r < 0
Şekil 5.1
Önemli bağıntı çeşitleri.
60
ve d, üssel uyumlu bağıntı, r > 0.
61
Jeolojide matematik ve statistiksel yöntemler
5.2.1 Bağıntı katsayısı (r, BK)
Bağıntı derecesini belirliyen bağıntı katsayısı r, ancak,
-1< r < +1
5.1
değerlerini alabilir. En iyi bağıntı değeri r = |1| olduğu zamandır (bak. yukarıya). Bunun
arasındaki değerler zayıf, ancak anlamlı olabilirler.
Bir bağıntı verilerinin bağımsız ve normal dağılmış olması lazımdır. Bu, bağıntının
önkoşuludur. İki değişken arasındaki doğrusal bağıntı derecesi r, matematiksel olarak,
rxy =
s xy
5.2
sx s y
n
(x
=
i 1
n
(x
i 1
i
i
 x )( yi  y )
 x)2
n
( y
i 1
i
 y )2
n

n
1 n
x
y

(
x
)(
yi )

 i 
i i
n i 1
i 1
i 1
n
n
1 n
1 n
[ x 2  ( x) 2 ][ y 2  ( y ) 2 ]
n i 1
n i 1
i 1
i 1
şeklinde ifade edilmektedir (n-1 terimleri kısaltılmıştır). Görüldüğü gibi r, katışık değişke
(kovaryans) sxy ile değişkenlerin standart sapmaları olan sx ve sy‘den veya bunların ham
değerlerinden hesaplanmaktadır. Öneminden dolayı katışık değişke aşağıda açık şekliyle
verilmesinde yarar vardır:
1 n
sxy =
 x. y 
n  1 i 1
n

n
n
i 1
i 1
n xi yi   xi . yi
i 1
n(n  1)
5.3
gibi.
Görüldüğü gibi katışık değişke, çarpanları eşit olmıyan değişkedir, yani (xi- x ) (xi-. x ) yerine
(xi- x ) (yi- y ) şeklidir.
Bağıntı analizinde az sayıdaki örnek için yüksek r istenirken, çok sayıdaki örnek için düşük r
değerleri de anlamlı sonuç verebilir. Yani r’nin anlamlılık sınırları artan örnek sayısı ile
azalır. Örnek sayısına veya serbestlik derecesine bağlı olarak hesaplanmış belli bir güvenirlik
derecesini, P=% 90, 95, 99 gibi, ifade eden r değerleri hazır çizelgelerden alınabilir (Ek-5.1).
Prof. Dr. H. Çelebi
62
Bağıntı katsayısı r bir örneklemin tüm örneklerine ait olduğundan, örneklerin sadece tümü
için geçerlidir. Ayrıca karşılaştırılacak veya ortalamaları alınacak iki örneklemin bağıntı
katsayısının yaklaşık aynı sayıdaki örneğe ait ve aynı birimde olmaları gerekir. Çünkü
anlamlılık örnek sayısına göre çabuk değişir. Ancak bu ve buna benzer durumlar gözönüne
alınarak bir bağıntı analizinin yapılacak yorumu, gerçekçi ve objektif olabilir.
5.2.2 Anlamlılık katsayısı (r2)
Bir veri kümesindeki toplam sapma veya değişke açıklanabilen ve açıklanamıyan değişkelerden
meydana gelir. Buna göre toplam değişke veya sapma,
n
n
n

2
2
(
y

y
)

(
y

y
)

 i

 ( yi  yˆ ) 2
i 1
i 1
5.4
i 1
Toplam sapma = Açıklanan sapma + açıklanamıyan sapma
terimlerinden oluşur (Şekil 5.2). Buradan anlamlılık katsayısı r2, açıklanabilen saçınımın, toplam
saçınıma oranı olarak,
Açiklanan.sapma
r2 =
Toplam.sapma
n
r2 =
 ( yˆ  y )
2
(y
2
i 1
n
i 1
5.5
i
 y)
ifade edilir. Açıklanan sapma oranı ne kadar yüksekse, r2 de o kadar büyük olur. Dolayısı ile r2 en
çok 1 değerini alır ve saçınımların tümünün açıklandığı anlamına gelir. Aksine r2=0’dir.
y

y1  y
y
y1  y

y2  y

y1  y1
y2  y

y2  y2
(x1, y1)
(x2, y2)
x
yi = Bağlı değişkenin i gözlem değeri, i = 1, 2,...,n
xi = Bağımsız değişkenin i gözlem değeri,

y i = Bağlı değişkenin okunan (kestirilen) değeri,
y = Bağlı değişkenin ortalama değeri
Şekil 5.2.
Sapmaların geometrik olarak elemanlarına ayrılması.
62
63
Jeolojide matematik ve statistiksel yöntemler
n
Anlamlılık katsayısı r2,
r2= 1-
(y
i 1
n
i
(y
i 1
 yˆ i ) 2
5.6
i
 y)
2
şeklinde, açıklanamıyan sapmanın toplam sapmaya oranının en yüksek değeri olan 1’den
çıkarılması ile de hesaplanabilir. Buradaki çevirme işlemi hesaplamayı kolaylaştırmaktadır. 1 ile
olan fark, toplam değişkenin açıklanan, yani bağınım doğrusu tarafından kapsanan, sistematik
etkenlerden kaynaklanan anlamlılık kısmını, geri kalan kısmı da açıklanamıyan, rastlantısal
etkenlerden kaynaklandığını gösterir.
r2, istatistiksel açıdan r’den daha anlamlıdır (% r2 = r2.100). Açıklanan saçınımın toplam
saçınıma oranını, yani gerçek değerden spma oranını, ifade eder. Logaritmik veya yüksek
dereceli fonksiyon özellikleri için daha önemlidir.
Hesaplanan bir r değeri çizelgelerdeki (Çizelge 5.2) veya grafikten (Wellmer, 1989) okunan
değerlerle karşılaştırılarak anlamlılığı saptanır. Bu en kolay yoldur. Bulunan bir bağıntı
katsayısının anlamlılıği t veya F sınaması ile de saptanabilir. Örnek sayısının 50’den az
(n<50) olması durumunda t sınamasında anlamlılık,
t=
ryx
(1  r 2 )
n2
5.7
eşitliği ile sağlanır (n-2, serbestlik derecesi). Burada verilen anlamlılık düzeyi için thes>tteo
olmsı gerekir (Ho= red, H1 = kabul, bak. Örnek 5.1).
Varyans analizinde olduğu gibi bağınım analizinde de anlamlılık derecesinin bulunmasında
kullanılacak parametreler kolay ve sistematik hesaplama amacı ile faktöriyel dizayn edililir
(Çizelge 5.5). Basit bir hesaplama için gerekli parametreler Çizelge 5.1’de derlenmiştir:
Örnek 5.1.
Ergani-Maden/Elazığ bakır cevherlerinde Cu-Co bağıntısı (bak Şekil 5.5).
Prof. Dr. H. Çelebi
64
Çizelge 5.1.
Örnek 5.1’e ait verilerin hazırlanması
1 Örnek No,
i
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
∑ n = 10
3 (xi- x )2
s2 x
82,81
16,81
0,01
16,81
98,01
24,01
98,01
15,21
37,21
26,01
414,90
2 Ölçümler
xi, ppm Cu yi, ppm Co
30
47
25
41
21
37
25
46
11
27
16
32
11
27
17
35
27
44
26
40
209,00
376,00
4 (yi- y )2
s2 y
88,36
11,56
0,36
70,56
112,56
31,36
112,36
6,76
40,96
5,76
480,40
5 (xi- x ) (yi- y )
sxy
85,54
13,94
-0,06
34,44
104,94
27,44
104,94
10,14
39,04
12,24
432,60
Çizelge 5.1’deki verilerin parametreleri,
x = 209:10
= 20,90 ppm Cu
y = 376:10
= 37,60 ppm Co
s2x = 414,90:(10-1)
= 46,10 ppm2 Cu
____
sx = √46,10
= 6,79 ppm Cu
s2y = 480,40:(10-1)
= 53,38 ppm2 Co
____
sy = √53,38
= 7,31 ppm Co
sxy = 432,60:9
= 48,07 ppm2
syx = sxy
rxy = sxy:(sx.sy)
= 48,07:6,79.7,31
= 48,07:49,63
= 0,969
bulunur. Buna göre anlamlılık katsayısı 0,9692 =0,939 eder. Buradan,
t=
r. n  2
1 r2
64
65
Jeolojide matematik ve statistiksel yöntemler
=
=
0,969. 10  2
1  0,939
0,969. 8
0,061
= 0,969.2,828:0,247
= 2,740:0,247
= 11,09
elde edilir. Ek 5.1’de, F=8 (n-m) satırı ve P99 sütunundan tteo = 3,36 okunur. thes (11,09)>tteo (8;
0,99) (3,36)’dir. Böylece Ho varsayımı reddedilmiştir (x1≠x2). Yani bu değer % 99 kesinlikle
(güvenirlikle) anlamlıdır. Sistematik ve rastlantısal hata oranlarının saptanması için regresyon
doğrusu denkleminin bulunması gerekir (bak. 5.3.2 ve Örnek 5.2). t hesaplamasına gerek
bırakmıyan anlamlı r değerleri Ek-5.2’de verilmiştir.
5.3. Bağınım (regresyon) analizi (BaA)
Bağıntı ve bağınım analiz yöntemleri çok önemli bir araştırma yöntemidir ve çok yararlı
sonuçlar elde edilebilir. Örneğin, benzer ilişkiler, çiftlerin değişim ve davranışları ile saklı bazı
özelliklerin keşfedilmesi hakkında önemli bilgiler sağlanabilir. Bağınım doğrusunun eğimi de
değişimin değerlendirilmesinde kullanılabilir ve bağıntılar incelenebilir.
5.3.1 Bağınım doğrusu (BD)
Bir bağıntı analizinde genelde bağlı değişkenle bağımsız değişken arasında bir doğrusal
ilişkinin bulunduğu kabul edilir. Doğrusal ilişki demek, değişkenlerin sabit oranda değişmesi
demektir (Şekil 5.3). Yani,
y
5.8
 sabit
x
ifadesi geçerlidir. Bu sabite, bağınım doğrusunun absisle yaptığı açının eğimidir.
Bağıntı analizi, bir örneklemde bağlı ve bağımsız değişken arasında bir ilişkiyi saptamak
mecburiyetindedir. Bu eşitlik,
y = b + ax
5.9
şeklinde bir doğru denklemidir. Burada y, bağlı değişken; x, bağımsız değişken; a, bağınım
doğrusunun eğimi (a = tg α) ve b, doğrunun y ekseni üzerinde kestiği parça, intersepttir.
a’ya bağınım katsayısı da denir.
y
x
y = b+ax
Prof. Dr. H. Çelebi
66
Δx
x
Δy
x
by
x
D
x
x: Bağımsız değişken
y: Bağlı değişken
b: D doğrusunun y ekseni üzerinde kestiği parça, intersept
Δy/ Δx : D bağınım (regresyon) doğrusunun eğimi, a = tg α
Şekil 5.3.
Bağınımın geometrik anlamı.
Bağınım analizinin amaçları,
1. Verilen eşitliğin katsayılarını bulmak,
2. Örneklemde saptanan bağıntının örnek evreni için de geçerli olup olmadığını incelemektir (Örnek 5.2).
Bağınım (regresyon), iki değişken arasındaki bağlılığın şeklini ifade eden bir terimdir. Yani
bir örneklemin 2 veri özelliği veya bağımsız değerleriyle çalışılır (bak. Şekil 5. 3). Burada
regresyonun öztürkçe karşılığı bağınım kavramı kullanılacaktır. Bu bağlılığı gösteren eğriye
de bağınım eğrisi denir. Bağınımlar geometrik bir ifadeye sahip olmaları nedeniyle özel önem
taşırlar.
5.3.2 Kalıntı değerler (ei)
Bağıntı analizi ile bağınım analizi birbirine sıkı sıkıya bağlıdır. Bağınım, bağıntı analizi ile
elde edilen nokta bulutuna en uygun doğrunun uyarlanmasıdır. Bu işlemde her nokta
uyarlanan doğruya belli mesafede olur. Ölçüm değerlerinin bağınım doğrusuna uzaklıklarına
kalıntı (residual) değerler denir. Bunlar Şekil 5.3’te ei ile gösterilmiştir. Değerlerin bağınım
doğrusuna olan uzaklıklarının karelerinin toplamı 0<Σei2<1 arasında değişir. Başka hiçbir
doğruya olan uzaklıklar bağınım doğrusuna olan uzaklıkların toplamından küçük olamaz. Bir
dağılım ne kadar uyumlu ise, kalıntı değerler o kadar küçük olur. Bunların büyüklüğünden
bağınım doğrusunun noktalara uyumu belirlenir. En iyi uyumda, yani noktaların doğru
üzerinde bulunması durumunda, ei2 değerlerinin toplamı min veya 0 olur. Bu duruma en
küçük kareler toplamı, yönteme de en küçük kareler yöntemi denir. Tüm hesaplamalarda ei2
değerlerinin toplamının mümkün olduğu kadar küçük olması istenir.
y
O1
O3 (x3, y3)
e1
66
67
Jeolojide matematik ve statistiksel yöntemler
e3
e2
O2
b
y3
D
yˆ 3
x3
x
0
e3 = Bağlı özellik kalıntı (residual) değeri, ei =yi- yˆ i
x3 = Bağımsız özellik büyüklüğü
y3 = Bağlı özellik büyükülüğü

y = Bağınım doğrusuna göre x3’ün okunan, kestirilen değeri
Şekil: 5.3.
Kalıntı değerlerinin geometrik açıklanması.
Bağınım analizinin hedef fonksiyonu,
n
e
i 1
i
2
n
2
   yi  (b  axi )  min
5.10
i 1
fonksiyonudur. Eşitlikte,
ei = i’ninci gözlemin kalıntı değeri, i = 1, 2, ..., n
yi = Bağlı değişken ( yˆ i , doğru üzerinde okunan, kestirilen değerdir)
b = Bağınım doğrusunun sabitesi, intersept
a = Bağınım sabitesi, D doğrusunun eğimi, a = tg α
xi = Bağımsız değişken
n = Gözlem sayısı
Bu koşulu Şekil 5.3 için sağlıyan doğru,
yˆ i = b – a xi
5.11
bağınım doğrusudur. Ancak bu doğru veya eşitlik vasıtası ile x’e bağlı ve D doğrusu
üzerindeki yˆ i değerleri kestirilebilir (bak. Örnek 5.2).
5.3.3 Bağınım doğrusunun parametrelerinin hesaplanması
Prof. Dr. H. Çelebi
68
Bağınım doğrularının çeşitli parametrelerinin hesaplanması için standart sapma, değişke ve
katışıksız değişke gibi temel verilere gereksinim vardır. Bunlar burada yinelenmiyecektir,
ancak ilişkileri üzerinde kısaca durulmasında yarar vardır.
Bağınım doğrusu değerlerin sapmaları konusunda bilgi vermezler. Ancak bir bağınım doğrusu
% 95 kesinlikle y = ±3sy aralığına düşer (s, standart sapma). Doğrunun eğiminden (a)
değişkenlerin birbirine ne kadar bağlı olduğu bulunabilir. Örneğin, a ile r arasında şu ilişkiler
bulunmaktadır:
a ≤ 0 için,
r ≤0,
a > 0 için,
r >0 ve
a = sy/sx için de r = 1
değerini alır.
Bağınım doğrusunun eğimi,
ayx = syx/s2x

5.12
n
n
i 1
i 1
n xi y i   xi  y i
5.13
n
n  y (  y i )
2
i
2
i 1
değerine sahiptir (syx=sxy’dir). Alt simgeler xy, bağlı değişkene göre yer değiştirir; bağlı
değişken önce gelir. Örneğin, y=b+ax eşitliği için ayx şeklinde verilir. Buna göre a’nın r
cinsindeki değeri,
sy
ayx = r
5.114
sx
şeklini alır.
Bunun gibi kesim noktası da r cinsinden hesaplanabilir. Örneğin,
byx= y  r
sy
sx
x
5.15
gibi.
Doğru denklemindeki sabiteleri bağlı ve bağımsız değişkenler cinsinden hesaplamak
mümkündür. Bağınım doğrusunun y ve x eksenlerine göre denklemleri,
y = f(x)
= b+ax
5.16
5.17
veya
x = f(y)
5.18
= b+ay
5.19
şeklindedir (bak. Şekil 5.4). Bu durumda bağıntı katsayısı r ve katışık değişke değişmez.
Değişkenlerin değerleri aynı olan 2 doğru çakışır. Bilindiği gibi koşut doğruların eğimleri eşit, dik
68
69
Jeolojide matematik ve statistiksel yöntemler
doğruların eğimleri ise, birbirinin negatif tersidir (ayx=-1/axy). Bu işlemlerde tüm formüller ordinata
uyarlanır (bak. Şekil 5.4). Buna göre,
ryx = rxy
5.20
ve
ayx .axy= r2
5.21
ayx ≤ 1/axy
olur. Yani,
5.22
değerinde olur.
D
y
x=f(y); rxy, axy, bxy
y=f(x); ryx, ayx, byx
E
byx
x
bxy
Şekil 5.4:
Bağlı değişkenin değişimi.
Analog olarak yukarıdaki y=b+ax doğrusunun (E) kesme noktası,
byx= y  a yx x
= y
x=b+ay doğrusunun (D) da,
s xy
s x2
x ve
bxy= x  a xy y
= x
s xy
s y2
y
5.23
5.24
5.25
5.26
şeklini alır (bxy, 5.15’e de analogtur).
Yukarıdaki doğruların eğimi, r cinsinden yinelenirse,
ayx = r.sy/sx
ve
axy = r.sx/sy
olduğu görülür.
5.27
5.28
Dolayısı ile y eşitliği,
5.29
y = b+(r.sy/sx)x
Prof. Dr. H. Çelebi
70
yˆ i = y  r.
ve
sy
sx
( xi  x )
5.30
genel bağınım doğrusuna çevrilebilir. Bu eşitlikteki xi değerleri vasıtası ile, örneğin E doğrusu
üzerindeki yˆ i değerleri, önceden yaklaşık kestirilebilir (bak. Şekil 5.5)
5.4 Sonuçların sağlanması
Bağıntı ve bağınım analizlerinde sonuçların sağlanması önemli bir yer tutar. Yapılan uzun ve
karmaşık işlemler sıkça hatalara neden olur. Bunları önlemek için bir çizelge hazırlanır
(faktöriyel dizayn) ve hesaplanan sonuçlar buraya aktarılarak,
n
n
KTb =
 ( yˆ  y ) 2
i 1
KTs =
 ( yˆ  yi ) 2
i 1
n
KTt =
(y
i 1
i
 y) 2
5.31
formülünün sağlanması gerçekleştirilir. Çizelge 5.2 buna bir örnek oluşturmaktadır.
Çizelge 5.2:
Örnek 5.1 değerleri için değişkelerin hesaplanması (ANOVA: analayses of variance) faktöriyel dizaynı.
1. Değişim
kaynağı
2. Toplam değişim
3. Doğrusal bağınım*
4. Toplam sapma
2. Kareler
toplamı
KTt
KTb
KTs
3. Serbestlik
dercesi
n-1
m-1
n-2
4. Kareler toplamı 5. t /F sınaması
ortalaması
KOt
KOb
thes=KOb/KOs
KOs
*KT, kareler toplamı, KO, kareler ortalaması; b, bağınım; s, sapma ve t, toplam demektir.
Doğrusal bağınımın ortalamasının toplam sapma ortalamasına oranı, KOb/KOs = thes sonucunu
verir. Bu değer t veya F dağılım çizelgesindeki teorik değerlerle karşılaştırılır (bak. Ek-5.1).
Bunun için önce bir kesinlik derecesi, örneğin, P=%99, seçilir. Bundan sonra F serbestlik
derecesinin (n-m) satırına karşı gelen P sütununun (kesinlik derecesi) teorik tteo değeri okunur
(tF; P). Bu değer,
tteo > thes olduğunda, sıfır (Ho) tezi kabul,
tteo ≤ thes olduğunda da red
edilmiş olur (bak Örnek 5.2). Aynı şey determinantlarla da yapılabilir.
Örnek 5.2:
Örnek 5.1’deki dağılımın bağınım katsayıları ve doğru denklemi (Çizelge 5.1, devam) :
a) Doğru denklemi,
70
71
Jeolojide matematik ve statistiksel yöntemler
y = b+a x ise,
s yx
ayx = 2
sx
=
byx = y  a yx x
48,07
(6,79) 2
=37,60-1,043.20,90
=1,043
= 15,80 ppm Cu
bulunur. Böylece, y = b+ax E doğrusunun denklemi,
y = 15,80+1,04 x
veya
Co = 15,80+1,04 Cu
bulunur (Şekil 5.5).
Eksenlerin değişmesi durumunda D doğrusu için,
x = -12,94+0,90 y
ve
Cu = -12,94+0,90Co
doğru eşitliği bulunur (axy=48,07/7,312)=0,90; bxy =20,90-0,90.37,60=20,90-33,84=-12,94).
s
Aynı şekilde r2 = rxy.ryx ve xˆ i  x  r x ( y i  y ) olduğu görülür ( xˆ , doğru üzerinde okunan
sy
değerdir).
Cu-Co bağıntısı
ppm Co
50
r=0,969
40
30
Co=15,80+1,04Cu
20
10
0
0
10
20
ppm Cu
Şekil 5.5:
Kalkopirtte bakır ve kobalt bağıntısı (Ergani-Maden, Elazığ).
b) Değişkelerin hesaplanması
30
40
Prof. Dr. H. Çelebi
72
Çizelge 5.3.
Çizelge 5.1 değerleri için bağınım değerlerinin hesaplanması (bak. Çizelge 5.1):
i
xi
1
30
2
25
3
21
4
25
5
11
6
16
7
11
8
17
9
27
10
26
Σn=10 382
yi
47
41
37
46
27
32
27
35
44
40
317
yˆ i =15,8+1,04x
47,15
41,94
37,77
41,94
27,34
32,55
27,34
33,60
44,03
42,98
376,63
n
n
yi
KTb =
 ( yˆ  y ) 2
KTs =
i 1
37,60
37,60
37,60
37,60
37,60
37,60
37,60
37,60
37,60
37,60
317,00
91,28
18,83
0,03
18,83
103,33
25,48
105,33
16,04
41,28
28,97
451,39
 ( yˆ  yi ) 2
i 1
0,02
0,88
0,59
16,49
0,11
0,30
0,11
1,97
0,00
8,89
29,38
n
KTt =
(y
i 1
i
 y) 2
88,36
11,56
0,36
70,56
112,36
31,36
112,36
6,76
40,96
5,76
480,40*
*KTt ile KTb+KTs arasındaki 0,37’lık fark sayıların tamlanmasından kaynaklanıyor.
Çizelge 5.4:
Örnek 5.1 değerleri için değişkelerin hesaplanması (ANOVA: analayses of variance) faktöriyel dizaynı (bak.
Çizelge 5.3).
1. Değişim
2. Kareler
3. Serbestlik
kaynağı
toplamı
derecesi
2. Toplam değişim
KTt
= 480 n-1
=9
3. Doğrusal bağınım* KTb
= 451 m-1
=1
4. Toplam sapma
KTs
= 39 n-2
=8
4. Kareler toplamı 5.t sınaması
ortalaması
KOt
= 53
-KOb
=451 thes=KOb/KOs
KOs
= 5
= 90
*KT, kareler toplamı, KO, kareler ortalaması; b, bağınım; s, sapma ve t, toplam demektir. m=2 element (Cu, Co).
c) Bağıntı katsayısı r’nin sağlanması
KOb/KOs = thes= 90 sonucu t dağılım çizelgesindeki değerlerle karşılaştırılır (bak. Ek-5.1).
Bunun için önce bir kesinlik derecesi, örneğin, P=%99, seçilir. tteo sınaması çizelgesinin F=8
satırı (n-m) ile P99 sütunundan t(8; 0,99) = 3,36 okunur. tteo < thes olduğundan, bağınım katsayısı %
99 kesinlikle anlamlıdır, yani bulunan r değeri incelenen örnek sayısına göre doğrudur. Bu da
yukarıdaki saptamayı kuvvetlendirir.
Bunun yanında,
r2=
Aciklanabi len. deg iske
Toplam. deg iske
72
73
Jeolojide matematik ve statistiksel yöntemler
=
=
=
( yˆ  y ) 2
sy
2
KTb
KTt
451,39
480,40
= ± 0,969
olarak örnek 5.1’deki değere eşit bir değer bulunur.
Toplam değişke ortalaması, KOt, yaklaşık 53; açıklanan değişke kısmı, KOb, 50 ve açıklanamıyan
değişke kısmı da, KOs, 4’tür (Çizelge 5.4; 3 parametre de n-1’e bölünür). Yuvarlak rakamlarla
toplam değişke 50+4 ≈ 53 alınabilir. Buna göre açıklanan değişke kısmı (50:53) açıklanamıyan
değişkeden (4:53) oldukça büyüktür ve toplam değişkenin % 94’üne karşılık gelmektedir. Bu,
bağınım modeli (doğrusu) tarafından kapsanan değişke kısmı demektir. Dolayısı ile bağınım
katsayısı r, oldukça güçlüdür. Buna karşın kalıntı değişke s2xy=39/8 ≈ 5 olduğu görülür ve
açıklanamıyan değişkeninin çok küçük olduğunu pekiştirmektedir.
5.5 Çok değişkenli bağıntılar
Doğrusal olmayan korelasyonların denklemi parabol formülleri ile hesaplanır. Her bağınım
gerçek olmayabilir. Bazen görünür vey saklı bir bağınım da mevcut olabilir. Bağıntı analizi;
element çiftleri, grupları ve mineraller arasındaki ilişkiler hakkında önemli ipuçları verebilir.
Bu sayede komşu örnekler, cevherleşmeler ve element grupları karşılaştırılabilir. Eğer çok
sayıda değişken varsa (birkaç element gibi) çoklu bağıntı (multiple correlation) ve bağınım
analizi de yapılabilir. Böylece bir örneğin elementlerin birine veya birkaçına bağlı olduğu
ortaya çıkarılabilir. Örneğin,
y = b0+b1x1+b2x2
5.32
doğrusal bağıntı eşitliği gibi.
Bağıntı ve bağınım, faktör, diskriminant ile cluster analizi gibi analiz yöntemleri ve diğer
çok değişkenli istatistik yöntemlerinin temelini teşkil eder. Ancak bunları bağıntı analizi
kadar detaylı incelemek, bu notların kapsamını aşar. Bunlara yeri geldikçe değinilecektir. İlgi
duyanların bu konularla ilgili kaynaklara başvurmaları önerilir. Sonuç olarak bağıntı ve
bağınım analizleri ile ancak olası sonuçlar belirlenir veya bunlara işaret edilir.
Alıştırma 5.1:
Bir şirketin ilk 5 yıllık karı aşağıda verilmiştir. Gelecek 3 yılın yaklaşık karını ve değişim fonksiyonunu bulunuz.
Verilenler:
Yıllar
1
2
6
Kar (10 $) 1,52 1,35
3
1,53
4
2,17
5 .
3,60
Prof. Dr. H. Çelebi
74
Yanıt: Yaklaşık % 15.50 ortalama yıllık artış.
Alıştırma 5.2:
Bir radyoaktif elementin miktarının aşağıda verildiği şekilde bozunduğu saptanmıştır. Yarılanma süresi t 1/2’yi ve
bozunma eşitliğini bulunuz.
Miktar [g, y] 1.0000
Süre [gün, x] 0
.9797
10
.8795
50
.7736
100
.2770
500
.0768
1000
Açıklama:
N0, başlangıç, N1/2 yarılanma anındaki miktardır. N, t=0 için N0=1’in değeridir. N0=1 ise, N1/2=0,5’tir.
Yanıt: N = N0 e-λt genel yarılanma eşitliğinden, ln N = ln N0 - λt eşitliğinden t1/2=270 gün bulunur.
Kaynakça
1. Arıcı, H., 2001. İstatistik. Metaksan basımevi, 13. baskı, 269 s., İstanbul.
2. Backhaus, K., Erichson, E., Plinke, W. ve Weiber, R., 1990: Multivariate Analysenmethoden.
Springer Verl., 6. Basım, 411 s., Berlin-Heidelberg-New York.
3. Barsch, H. ve Billwitz, K., 1990: Geowissenschaftliche Arbeitsmethoden. Verl. Harri
Deutsch, 256 s., Thun ve Frankfurt am Main.
4. Davis, J. D., 1976: Statistics and data analysis in geology. John Villay and Sons, 550 s.,
New York
5. Leonhart, M., 2002: Statistik für Psychologen. http://www.psychologie.uni-freiburg.de, 750
s.
6. Sachs, L., 1984: Angewandte Statistik. Springer Verl., 6. basım, 528 s., Berlin-Heidelberg.
7. Schönwiese, Ch.-D., 1992: Praktische Statistik für Meteorologen und Geowissenschaftler.
Borntraeger, 2. basım, 231 s., Berlin, Stuttgart.
8. Schroll, E., 1976: Analytische Geochemie . Ferdinand Enke Verl, 374 S., Stuttgart.
9. Şeniş, F., 1996: İstatistik. Anadolu Üniversitesi yayını No.: 175, 312 s., Eskişehir.
10. Wellmer, F.-W., 1989: Rechnen für Lagerstaettenkundler und Rohstoffwirtschaftler. Ellen
Pilger, 462 S., Clausthaler-Zellerfeld.
11. Wessel, P., 2001: Geological data analysis. http//www.higp.hawaii.edu./cecily/courses, 325 s.
EKLER
74
75
Jeolojide matematik ve statistiksel yöntemler
Ek-5-1.
t sınaması çizelgesi (F, serbestlik derecesi; P, kesinlik derecesi = 1-α. α, yanılma derecesi [%]).
F
1
2
3
4
5
P95
P99
12,71 63,66
4,30 9,92
3,18 5,84
2,78 4,60
2,57 4,03
F
P95
P99
F
P95
P99
13
14
15
16
17
2,16
2,14
2,13
2,12
2,11
3,01
2,98
2,95
2,92
2,90
30
40
50
60
70
2,04
2,02
2,01
2,00
2,00
2,75
2,70
2,67
2,66
2,65
6
7
8
9
10
2,45
2,36
2,31
2,26
2,23
3,71
3,50
3,36
3,25
3,17
18
19
20
22
24
2,10
2,09
2,09
2,07
2,06
2,88
2,86
2,84
2,82
2,80
80
90
100
150
200
1,99
1,99
1,99
1,98
1,97
2,64
2,64
2,63
2,61
2,60
11
12
2,20
2,18
3,11
3,06
26
28
2,06
2,05
2,78
2,76
300
400
1,97
1,96
2,60
2,58
EK 5-2:
Anlamlı en küçük r değerleri (Schroll, 1976).
Prof. Dr. H. Çelebi
Serbestlik
Derecesi F
76
Serbestlik
Derecesi F
Kesinlik derecesi P
(n-2)
p =95 %
p =99 %
1
2
3
4
5
0,997
0,950
0,878
0,811
0,754
6
7
8
9
10
Kesinlik derecesi P
(n-2)
p =95 %
p =99 %
1,000
0,990
0,959
0,917
0,874
21
22
23
24
25
0,413
0,404
0,396
0,388
0,381
0,526
0,515
0,505
0,496
0,487
0,707
0,666
0,632
0,602
0,576
0,834
0,798
0,765
0,735
0,708
26
27
28
29
30
0,374
0,367
0,361
0,355
0,349
0,478
0,470
0,463
0,456
0,449
11
12
13
14
15
0,553
0,532
0,514
0,497
0,482
0,684
0,661
0,641
0,623
0,606
35
40
45
50
60
0,325
0,304
0,288
0,273
0,250
0,418
0,393
0,372
0,354
0,325
16
17
18
19
20
0,468
0,456
0,444
0,433
0,423
0,590
0,575
0,561
0,549
0,537
70
80
90
100
125
150
200
300
0,232
0,217
0,205
0,195
0,174
0,159
0,138
0,113
0,302
0,283
0,267
0,254
0,228
0,208
0,181
0,148
Örnek: Örnek sayısı n=10 çift olan bir doğrusal bağıntının % 95güvenirlikle bağıntı katsayısı |r| > 0,632’dir.
6. JEOİSTATİSTİĞE GİRİŞ
6.1 Başlangıç
76
77
Jeolojide matematik ve statistiksel yöntemler
İstatistikte uygulanan yöntemler verilerin veya deney ve ölçümlerin birbirine bağlı
olmadığını, yani bunların bağımsızlığını esas alır. Bu koşul zar atma olayında mümkündür,
örneğin, 1. atışta 2 gelme olasılığı, 2. atıştaki 5 gelme olasılığına eşit ve 1/6’dır. Ancak
yerbilimlerinde bu çok zayıf bir olasılıktır. Her jeolog, zengin bir cevherleşmenin yakınından
alınan bir örneğin, zayıf bir cevherleşmenin yakınından alınan bir örneğe göre yüksek bir
analiz sonucu vermesinin daha muhtemel olduğunu bilir. Buna göre uzayda bir bağımsızlık
söz konusu değildir. Bu durumda yere bağlı veya bölgesel değişkenler ortaya çıkmaktadır.
Jeoistatistik, bir uzaydaki değişimi dikkate alan istatistik yönteminin adıdır.
Jeoistatistiğin öncüleri Güney Afrikalı Krige (1951), Hollandalı De Wijs (1951/53) ve Fransız
Mathéron (1971)’dir. Bu konuda Kanada, Amerika Birleşik Devletleri, İngiltere ve
Almanya’da çeşitli ekoller oluşmuştur. David (1977), Journel ve Huijbregts (1978) başta
olmak üzere çok sayıda kitap yazılmış ve Mathematical Geology ile Geomathematic gibi
birkaç periyodik çıkmaktadır. Türkiye’de jeoistatistik çalışmaları çok yenidir. Burada Tercan
ve Saraç (1998) ile Tüysüz ve Yaylalı (2005)’in anılmasında yarar vardır.
6.2 Jeoistatistik yöntemleri ve uygulama alanları
Jeoistatistiğin ilk adımı, alınmış az sayıdaki örneğin dağılımına ve bunların bir bütünlük
(örnek evreni/popülasyon) oluşturup oluşturmadığına bakılmasıdır. Bu da ancak sınama
yöntemleri ile ortaya çıkarılabilir. Buradan örneklemin dağılım fonksiyonu, merkezi ve
dağılım ölçütleri ile güven aralıkları tanımlanabilir.
Tüm jeoistatisk yöntemlerinin temeli deney sonuçlarına ve analiz değerlerine dayanır.
Bunlardan elde edilen verilerin amaca uygun değerlendirilmeleri şarttır. Verilerin matematiksel işlemlere tabi tutulabilmesi için ilk önce bunların uygun liste veya çizelgelerde toplanması
gerekir. Sınıf veya gruplara ayrılan verilerin sonuçları, çalışma ve yorumlamaları kolaylaştırır.
Jeoistatistiksel hesaplamalar çok zaman alıcı olabilirler. Bilgisayar programları olmadan bazı
hesaplamaları gerçekleştirmek mümkün olmıyabilir. Onun için bu notlar kapsamında basit,
yeni öğrenenler tarafından da kolay anlaşılabilecek ve sadece hesap makinesi ile
çözülebilecek örnek ele alınacaktır. Daha ayrıntılı bilgiler ve karmaşık çözümler için Akın ve
Siemes (1988) ve David (1977)’ye başvurulabilir.
Jeoistatistik, maden yatakları değerlendirmesinin ilk aşamaları için de önemli olabilmektedir.
Özellikle,
a) Hata ve rezerv hesaplamaları sırasında güvensizliklerin giderilmesi ile rezervlerin
sınıflandırılması,
b) Blokların tenör hesaplamalarında, özellikle en düşük tenör (cut off grade) değerlerinin
altında kalan bloklar ortaya çıkması durumunda önem kazanırlar.
Prof. Dr. H. Çelebi
78
İleri aşamalarda bunlara eniyileme (optimizasyon) işlemleri eklenir. Bunun için de, aşağıda
ele alınacak kriging kestirimlerine gereksinim vardır. Bu çerçevede jeoistatistiğin çalışma
yöntemleri ve uygulama alanları aşağıda özetlenmiştir.
↓
log normal dağılım
↓
De Vijs tipi
↓
Dağılım parametreleri
↓
İşletme çalışmalarının
eniyilenmesi
Örnek alma
↓
Analiz
↓
Bileşenlerin dağılımı
↓
Normal dağılım
↓
Değişke
↓
Varyogramlar
↓
Geçişli (transitif) tip
↓
Kriging
↓
Ağırlıklı ortalama tenör
↓
Rezerv hesapları
↓
Değişke analizi
↓
İşletme planlanması
↓
Diğer dağılımlar
↓
Diğer tipler
↓
Hata payı (külçe etkeni)
↓
Diğer kullanım alanları
6.3 Bölgesel değişkenler
Jeoistatistik, bugün artık jeolojinin vazgçilmez konusu haline gelmiştir. Jeoloji, madencilik,
tarım, ormancılık ve çevre gibi yerbilimleri dallarında elde edilen önemli verilerin
matematiksel yöntemlerle incelenebilmesi için geliştirilmiştir (Mathéron, 1963). Aynı
dönemde bu yöntemi L. S. Gandin de Sovyetler Birliği’nde meteorolojide uygulamak
amacıyla geliştirmiştir. Bu yöntemlerle veriler uzaydaki yerlerine bağlı olarak ele alınır.
Jeolojik oluşuklardaki mineral dağılımlarının geometrik ve bölgesel değişimleri de hesaba
katıldığı için uygulanması oldukça karışıktır ve ancak bilgisayar desteğiyle hesaplanabilmektedir.
Yere bağlı değişimlerin açıklanması amacı ile geliştirilen yere bağlı veya bölgesel
değişkenler teorisi, bir noktadan diğer bir noktaya kadar belirgin değişimlerin mevcut
olduğunu ifade etmektedir. Bu, bir rastlantısal z=z(x) fonksiyonun gerçekleşmesi olarak
yorumlanır. Ancak bu, değişimleri bir genel formülle ifade edememektedir. Bir maden
yatağındaki değişkenler, örneğin metal derişimleri, 3 yönde vektöriyel olarak uzayda 3
78
79
Jeolojide matematik ve statistiksel yöntemler
boyutlu bir varyogramla gösterilebilir. Bu yöntemin de uygulanabilirliği oldukça zor ve çoğu
zaman eksik veri nedeniyle yeterli olmamaktadır. Burada bu değişkenlerin bazı özellikleri
incelenecek, varyogramın ne olduğu ve neye yaradığı kısaca açıklanacaktır.
Başlangıç noktasındaki değer x olan bir bölgesel değişkenin h mesafedeki değeri x+h’dir.
Bunların fonksiyon değerleri de z(x) ve z(x+h) olur. Bunun geometrik anlamı aşağıda
gösterilmiştir:
h
x
x+h
x
z(x)
z(x+h)
Bir rastlantısal z fonksiyonu, rastlantısal z(xi) değişkenlerinin her x noktasındaki dağılımı ve
birbirine bağımlılıkları ile tanımlanır. Bununla tanımlanan olasılık dağılımına uzay dağılım
yasası denir. Yerbilimlerinde bu yasanın tümüne gerek duyulmamaktadır. Kabul edilebilir
çözümler için 1. ve 2. momentler yetmektedir.
a) Momentler
Bu dağılımın gerçekleşme beklentisi veya 1. momenti, yere bağlı olarak,
m(xi)= E[z(xi)]
6.1
olarak yazılabilir. Bu, Z’nin xi noktasındaki tüm gerçekleşme olasılıklarının ortalamasıdır
σ2(xi) =Var[z(xi)]
= E{z[(xi)-m(xi)]2}
6.2
şeklinde ifade edilebilir. Bu da beklentinin varlığını şart koşmaktadır.
Bu durum iki noktaya, yani h mesafesi ile x1 ve x2 = x1+h noktalarına, uygulandığında bu iki
nokta arasındaki katışıksız değişke (kovaryans) C,
C(xi, xi+h ) =σz(xi), z(xi+hi)
= E{z[(xi)-m(xi)] [z(xi+hi)-m(xi+h)]}
6.3
olarak tanımlanmaktadır.
z(xi) ve z(xi+hi) noktaları arasındaki değerlerin bağımlılığını ifade eden başka bir ölçüt de,
2γ(xi, xi+h ) =Var[z(xi)-z(xi+h)]
6.4
ile ifade edilen varyogram veya varyogram fonksiyonudur. Bu fonksiyon, artan değerlerin
değişkenliğini gösterir. Değişkelerin eşitliği veya bağımsızlığı durumunda
Prof. Dr. H. Çelebi
80
2γ(xi, xi+h ) =2Var[z(xi)]
olduğunu belirtmek gerekir. 2γ(xi, xi+h
gramın tanımından gelir).
)
6.5
terimine semi varyogram denir (2 katsayısı, varyo-
Varyogramlar bir inceleme bölgesinin veya bir maden yatağının belli kesimleri için ancak 2030 ölçümün bulunması ve tüm bölgeyi temsil edecek özelliklere sahibolması durumunda
anlamlı olabilir.
b) Rastlantı varsayımları
Rastlantısal her z(x) fonksiyonunun sadece 1 z(xi) değerinin gerçekleşme olasılığı
bulunmaktadır. Bu nedenle değişkenlerin yapısı hakkında bilgi edinmek oldukça zor olmakta
ve olasılık yapısı hakkında belli varsayımlara gitmek gerekmektedir. Burada en iyi varsayım
durağanlık varsayımıdır. Bu varsayım, seçilmiş her k grubu değişkeni
[z(xi), z(x2)], …, z(xk)],
6.6
[z(xi+hi), z(x2+hi),…, z(xk+h)]
6.7
h ve k=1, 2,…, k için,
değişkenleri ile aynı dağılımı gösterdiğini kabul eder. Jeoistatistikte genelde sadece ilk iki
momentle çalışıldığından, geniş anlamda durağanlık tanımıyla yetinilir.
Eğer E[z(xi)] beklentisi mevcut ve xi’den bağımsız, yani tüm xi’ler için,
ve
E[z(xi)]=m
6.8
C(hi)=E[z(xi+h).z(xi)-m2]
6.9
rastlantı çiftinin her xi değeri için katışıksız değişke mevcut ise, 2. derece durağanlık söz
konusudur. Katışıksız değişke durağanlığı, değişkenin ve varyogramın durağanlığını
kapsadığından,
tüm xi’ler için,
Var[z(xi)= E[z(xi)-m]2
= Co
6.10
ve
γ(hi) = γ(xi, xi+h)
= ½ E [z(xi+hi)-z(xi)]2
= ½ E[z(xi+hi)-m]2 +½ E[z(xi)-m]2 –
– [z(xi+hi)-m].[z(xi)-m]
= C(0) – C(hi)
80
6.11
6.12
81
Jeolojide matematik ve statistiksel yöntemler
olduğu bulunur. Son eşitlik, değişke ve varyogramın, 2. derece durağanlık varsayımı altında,
z(xi+h) ve z(xi) değişkenlerinin bağımlılığı, otokorelasyonu için eşdeğer 2 fonksiyon
olduğunu göstermektedir. Burada bağıntı büyüklüğü, veya bağıntı fonksiyonu korelogram,
da kullanılabilir. Örneğin,
C(h)
γ(hi) =
6.13
C(o)
=1-
 (h)
C(o)
6.14
gibi.
2. derece momentin gerçekleşmesi (varlığı), varyogramın gerçekleşmesinden (varlığından)
daha zordur. Uygulamada varyogramla çalışıldığından, esas (intrins) hipotez’le yetinmek
gerekir. Bu hipoteze göre,
1. E[z(xi)] beklentisi tüm xi değerleri için mevcuttur ve xi’ye bağlı değildir.
2. Tüm hi ve xi [z(xi+hi)-z(xi)] öğesi, xi’ye bağlı olmıyan sonlu bir değişkeye sahiptir.
Yani,
Var[z(xi)-z(xi+hi)] = E[z(xi)-z(xi+hi)]2
=2 γ(h)
6.15
6.16
olur. Böylece 2. derece durağanlığının durağan büyümeyi de kapsar. Bunun tersi geçersizdir.
Önemli hipotez sadece |h|<a için geçerli olur.
6.3.1 Varyogram
Bölgesel değişkenlerin diğer jeoistatistiksel yöntemlere karşın analiz veya örnek değerlerinin
bibirlerine bağımlılıklarını uzayda ele aldığı yukarıda belirtilmişti. Bunun temeli varyograma
dayanmaktadır. Bir varyogram, örnek değerleri arasındaki farkların kareleri ortalamasının
mesafe ile değişim fonksiyonudur (Şekil 6.1 ve 6.2). Bununla varyogram tüm jeoistatistiksel
hesaplamaların temel aracını oluşturur.
Bir tek boyutlu varyogram matematiksel olarak,
n
1
(h) =
[f(xi)-f(xi+hi)]2dx

2n 0
6.17
1 n
 [xi-(xi+hi)]2
2n i 1
6.18
=
formülü ile tanımlanmakta ve hesaplanmaktadır. Eşitlikteki n, örnek sayısını; xi, örnek
değerini ve h da örnekler arasındaki sabit mesafeyi, örneğin, bir kesit veya sondaj boyunca
alınan örneklerin aralığını, göstermektedir. Farklı örnek aralıkları için varyogram
Prof. Dr. H. Çelebi
82
hesaplamaları daha karmaşıktır (bak. Dutter, 1985; Akın ve Siemes, 1988). Burada veriler
gruplandırılır, düzeltilir veya çeşitli yönlerdeki açılar esas alınır.
Örnek 6.1:
Çizelge 6.1’de verilen Ag değerlerinin varyogramının çizimi ve yorumlanması.
Analiz değerleri (% Ti): 7-6-8-8-9-6-7-5
Örnek aralıği h=1,5 m
Çözüm: Hesaplamanın metodik olması ve kolaylığı için bir çizelgede verilenlerin
yerleştirilmesi ve adım adım hesaplamak büyük kolaylık sağlar (bak. Çizelge 6.1)
1. Adımda komşu değerler birbirinden çıkarılarak kareleri alınır ve toplamı işleme katılan
örnek çiftine (2n) bölünür. Sonuç varyogramın 1. değerini verir ((h), bak. aşağıdaki şema).
2. Adımda birer değer atlıyarak aynı işlem tekrarlanır ve 2. varyogram değeri elde edilir.
3. Adımda ikişer tane, 4. adımda üçer tane, daha sonrakiler de buna benzer şekilde atlıyarak
işlem tamamlanır. Önemli olan ilk 5-10 adımdır.
Kesit A-B A
Örnek No. 1
1. adım
B
2
3
4
5
6
2. Adım
3. Adım
.
.
.
Çizelge 6.1:
Örnek varyogram çözümünün hesaplanması (Örnek aralığı h=1,50 m).
Veriler, % Ti = xi:
7
1. h= 1,50 xi-(xi+hi): 1
xi-[(xi+hi)]2: 1
6
8
8
9
7
6
-2
4
0
0
-1
1
2
4
1
1
1
1
82
5

12
2n
(hi)
14 0,86
83
Jeolojide matematik ve statistiksel yöntemler
2. h=3,00 xi-(xi+hi): -1
xi-[(xi+hi)]2 : 1
3. h=4,50 xi-(xi+hi): -1
xi-[(xi+hi)]2 : 1
-2
4
-3
9
-1
1
1
1
1
1
2
4
4. h=6,00 xi-(xi+hi): -2
xi-[(xi+hi)]2 : 4
-1
1
2
4
3
9
5. h=7,50 xi-(xi+hi): 0
xi-[(xi+hi)]2 : 0
0
0
3
9
6. h=9,00 xi-(xi+hi): 1
xi-[(xi+hi)]2: 1
7. h=10,50 xi-(xi+hi): 2
xi-[(xi+hi)]2: 4
1
1
3
9
4
16
2
4
20
12 1,67
31
10 3,10
18
8 2,25
9
6 1,50
2
4 0,50
4
2
2,00
Yukarıda h=1,5 m örnek aralığı ile örneklerin çok sık alındığını göstermektedir. Görüldüğü
gibi varyogram ancak yaklaşık 5 m sonra yatay duruma geçebilmektedir. Bu mesafeye tesir
mesfesi (range) denir ve en iyi (optimal) örnek aralığını gösterir. Buna karşın külçe etkeni Co
(nugget effect) oldukça yüksektir (yakl. % 30=0,60/2,00). Ancak değişke C makul sınırlarda
bulunmaktadır. Bu varyogram küresel (geçişli/transitif) varyogram tipine girmektedir. Çünkü
örnekler yaklaşık 5 m’ye kadar birbirine bağlıdır (artarak C değerine varmaktadır, bak. Şekil
6.2a).
Örnek varyogram
4
(h)
3
Uyum (model)
2
1
Deneysel
0
0
5
10
15
Örnek aralığı h, m
_______________________________________________________________________________
Şekil 6.1:
Varyogram (deneysel) ve küresel uyumu (sferik model).
Prof. Dr. H. Çelebi
84
6.3.1.1 Varyogram çeşitleri (tipleri)
Hesaplanan bir varyogram ender durumlarda ideal şekillere uyum gösterir. Çünkü genellikle
örnekler yetersiz veya örnek aralıkları düzensiz olmaktadır. Bundan doğacak göreceli hata
oranı regresyon yoluyla gerçek hata oranı yerine, en azından yatağın veya bölgenin bir
bölümü için, bulunabilmektedir. Doğada rastlanan önemli varyogram çeşitleri Şekil 6.2’de
gösterilmiştir.
(h)
a
b
c
d
h m
Şekil 6.2:
Varyogram çeşitleri. a, sürekli; b, doğrusal; c, süreksiz; d, rastlantısal tip varyogram.
Varyogramlar başlangıç bölgesindeki durumlarına göre değişik tiplere ayrılırlar. Bunlar,
ölçüm değerlerinin inceleme alanındaki dağılımı hakkında bilgi verirler: Bunlardan Şekil
6.2a-d’de verilmiştir. Özellikle maden yataklarındaki dağılımları gösteren varyogramların 4
temel şekli bulunmaktadır.
a) Sürekli tip: Sedimanter yataklarda görülür, çok düzenlidir, ender rastlanır. h→0 için,
(|hi|) = C|hi|2
6.19
parabol değerini alır.
b) Doğrusal tip: Volkanosedimanter yataklara mahsus bir varyogram tipidir, düzenli tipten
düzensize kadar değişir. Varyogram başlangıç noktası civarında doğrusal bir şekil alır.
Vasat bir devamlılığı ifade eden bu varyogram tipine metal yataklarında rastlanır. h→0 için,
(|hi|) = C|hi|
6.20
değerini alır.
c) Süreksiz tip: Altın yataklarında yaygındır, büyük değişimler gösteren bir dağılım tipidir.
Başlangıç noktası civarında devamlılık görülmemektedir. Değişken devamlılığının çok
zayıf olduğunu ifade eder. (h)= 0 tanımlanmış olmasına karşın, h→0’a yaklaştığında, (h) 0’a
yaklaşmaz, yani fonksiyon 0 noktası yakınında süreksizdir ve birbirine yakın z(xi) ile
z(xi+hi) noktaları arasındaki değişkenliğin büyük olabileceğini ifade eder. Başlangıçtaki bu
84
85
Jeolojide matematik ve statistiksel yöntemler
süreksizlik külçe etkeni (hata payı/nugget effect) olarak bilinir ve fizikteki “beyaz
hışırtı”ya benzetilir. Örneğin, açık bir raduyonun hışırtısı gibi. Bu etken genelde hatalı
örnek alımına ve mikro mineralizasyon değişimi ile açıklanır.
c) Rastlantı tipi: Elmas yataklarında görülür, her yönde değişken dağılım gösterir.
Varyogram başta süreksizdir ve büyük mesafelerde sabit olup tamamen tesadüfi bir
dağılımı ve sınır durumunu ifade eder. Değişken son derece devamsızdır. h→0 için,
(hi) = C0
6.21
olur. Uygulamada a çok küçük alındığında ortaya çıkabilir.
Tüm bu varyogram tipleri ordinata göre simetriktir, (h) = (-h) ‘dır. |h|<a için a, bir örneğin
tesir mesafesi veya etki alanı olarak tanımlanmıştır. Bunun gibi, |h|=a için,
(hi) = C
6.22
olur ve “eşik değer” veya “doygunluk derecesi” (sill) olarak adlandırılır. Bu değer dışına
çıkıldığında artık z(xi) ve z(xi+hi) birbirinden bağımsızdırlar.
Tesir mesafesi a, çok boyutlu uzayda yarıçapı a olan basit bir küre gibi ele alınamaz. Etki alanı
yöne bağlı olarak değişir. Örneğin, yatay ve dikey veya değişik yönlerden alınan varyogramlar
farklı tesir mesafelerine sahibolabilirler (Şekil 6.6).
Varyogramların temel formülünün değiştirilmesi ile sondaj karelajı içinde kullanılmaları
mümkündür. Bu durumda h değerleri sondaj aralığı olarak alınır ve varyogram yönü açısal
olarak değişir. Bir yatağın iyi incelenmesi için 3 boyutta da incelenmesi gerekir. Örneğin, bir
sedimanter yatakta birinci yön boyuna, yani uzun eksene, paralel; ikinci yön, sedimantasyon
yüzeyine, uzun eksene, dik ve üçüncü yön de tabakalanmaya dik varyogramlar çizilerek
incelenebilir. Bu konu aşağıda daha ayrıntılı ele alınacaktır (bak. 6.3.3).
6.3.1.2 Varyogram modelleri
Varyogramların kullanılması için bazı standartlar geliştirilmiştir. Bir normal sıklık dağılımı
bir modelle gösterildiği gibi varyogram da bir modelle gösterilebilir ve hesaplamalar için
önemli kolaylıklar sağlar. Örneğin, yukarıda anlatılan küresel (sferik) veya De Wijs
varyogram modelleri diğer varyogramların yerine kullanılabilir hale getirilmişlerdir. Bir
varyogram modeli herhangi bir fonksiyon olarak ele alınamazlar. Aranan özellikler için bazı
önkoşulların yerine gelmesi gerektir. Örneğin,
a) Başlangıç noktasının ordinata göre interpolasyonla bulunması. Burada bir süreksizlik
veya külçe etkeni olabilir,
Prof. Dr. H. Çelebi
86
b) Küresel varyogram tipinde doygunluk derecesinin saptanması. Burada istatistiksel
değişke yaklaşık eşik değer olarak alınabilir,
c) Anizotropi ve saklı özelliklerin araştırılması.
Varyogram modelleri temelde 2 gruba ayrılır:
1. Eşik değeri olmıyan varyogramlar için modeller
a) Kuvvet (pot) modeli
Bu model,
(h)= p|h|λ
6.23
şeklinde tanımlanmaktadır. Burada 0<λ<2’dir. Ancak uygulamada bunun sadece doğrusal
modeli kullanılır (Şekil 6.3a).
b) Doğrusal model
Uygulamada kullanılan doğrusal model,
(h)= p|h|
6.24
olarak kullanılır. Bu varyogram sürekli veya deneysel varyogramların verileri ölçüsünde,
doğrusal artar. Bu model, sınırsız saçınım gösteren bölgesel dağılımlara karşılık gelir (Şekil
6.3a).
c) Logaritmik veya De Wijs modeli
Bu model,
(h)= log |h|
6.25
olarak tanımlanmıştır. Bu modelde h=0’a kadar uyum sağlanamaz, ancak önemli hesaplama
kolaylıkları sağlıyor. Bu modelde varyogram doygunluk derecesine varmamaktadır (Şekil
6.3b ve 6.4b).
(h)
(h)
a
0,60
0,30
0,40
0,20
b
p
3p
0,20
0,10
1
2
3
4h
86
1
2 5 10
20 30 h
87
Jeolojide matematik ve statistiksel yöntemler
Şekil 6.3:
Doygunluk derecesi olmıyan varyogram modelleri. a, kuvvet ve doğrusal ile b, logaritmik varyogram modelleri.
2. Eşik değeri olan varyogram modelleri
a) Küresel model
Bu modelde varyogramlar başlangıçta doğrusal gelişirler. Belli bir tesir mesafesinden sonra
(range, a) bir doygunluk derecesine (eşik değere, C) varırlar. Küresel model,
(h)= C0 + C (1,5 h/a - 0,5 h3/a3)
6.26
formülü ile h≤a için tanımlanmıştır. h>a için bu,
 (h)=C0+C
6.27
parametreleri ile bellidir. Buradaki varyogram modelleri Şekil 6.4’te gösterilmiştir. Bir
cevherleşmede a değerinden daha yakın mesafede bulunan örnek değerleri birbirleri ile
ilişkilidir. Bu matematiksel ilişki varyogram formülü ile tanımlanabilir ve cevherleşme için
karakteristiktir.
 (h)
2/3 a
a
b
2
σ
c
A
co
B
a
h m
h m
Şekil 6.4.
Varyogram modelleri. a, küresel (geçişli/sferik, transitif model) varyogram; C, değişke (eşik değer, ingilizce=sill);
Co , hata oranı (külçe etkeni/nugget effect); C+Co, toplam değişke; a, tesir mesafesi (en uygun = optimum örnek
aralığı, range) demektir. b, De Wijs modeli varyogram (A, doğrunun eğimi, B, kesim parçası = intersept).
Prof. Dr. H. Çelebi
88
Burada örnekler belli bir tesir mesafesine veya örnek aralığına kadar (range=a) bibirlerine
bağlıdır (Şekil 6.4a). Bu mesafeye en iyi (optimum) örnek aralığı denir. Hesaplama, analiz
ve örnek alma hatalarından dolayı eğri ordinatı ((h) eksenini) çok ender durumlarda sıfır
noktasında keser. Varyogramın başlangıç noktası ile sıfır arasındaki değer, hata payını
(Co=nugget effect) gösterir. Fonksiyonun yatay duruma geçtiği noktadan apsise çizilen
pararlel, ordinatı kestiği noktadan Co’a kadar olan kısım, C, örnek değerlerinin değişkesine
(eşik değer, sill) karşılık gelir. Bu varyogram modelinde birleştirilen ilk 2 noktadan geçen
doğru, varyogramın yatay duruma geçtiği noktadan absise çizilen paraleli, dönü noktası ile
ordinat arasında, 2/3 a noktasında keser.
De Wijs modelinde varyogram değerleri h aralıklarına göre logaritmik olarak artar. Küçük
mesafeler için değerler bir doğru meydana getirir ve varyogram değerlerinin farkları mesafe
ile büyür. Eğim açısı doğrunun mutlak dağılım katsayısıdır. A, gerçek örnek veya sondaj
aralıklarına karşılıktır. Gerçek sondaj aralığından büyük çıkması halinde, sondaj aralığının
uygun olmadığı ortaya çıkar ve uygun aralık bulunmaya çalışılır, örneğin küçültülür.
b) Üstel (exp) model
Bu model,
(h) = C[1-e-h/a]
6.28
şeklinde tanımlanmaktadır. Küresel modelden daha yassıdır ve C’ye ancak asimtot olarak
yaklaşır. Tesir mesafesi, eşik değerin % 95’ini kapsıyan 3a olarak alınır. Yani,
3a=C[1-e-3] =0,95 C
6.29
olur.
c) Gauss modeli
Bu model başlangıçta parabol özelliğini gösterir. Burada da eşik değer sadece asimtot olarak
oluşur ve
(h) = C[1-e(-h/a)2]
6.30
olarak tanımlanmıştır. Üstel modelde olduğu gibi burada da esas kullanım alanı,
3a = C[1-e-3)
=0,95C
değerindedir (Şekil 6.5).
1,00
(h) / C
0,95
88
6.31
89
Jeolojide matematik ve statistiksel yöntemler
Küresel
Üstel
Gauss
0,00
σk
σg
σü h
Şekil 6.5.
Eşik değeri olan varyogram modelleri.
6.3.1.3 Küresel modelin uyarlanması
Yukarıda verilen deneysel varyogramın C0, C ve a parametrelerine göre h değerlerine bağlı
olarak bir modelin (h) değerleri hesaplanabilir (bak. Örneğin, 6.26 ve 6.27). Zaman alıcı bu
işlemleri kolaylaştırmak için h/a oranlarına göre (h)‘nın geğerlerinin hesaplandığı çizelgeler
hazırlanmıştır (Çizelge 6.2). h/a’nın 0,000 ile 1,000 aralığı için (h) değerleri verilmiştir (bak.
Akın ve Siemes, 1988 ve David, 1977). Herhangi bir h/a oranı için okunan değer, C ile
çarpılarak Co eklenir. Böylece bulunan değerler uyumun ordinatlarını oluşturur. Absiste h
değerlerine karşılık gelen değerlerle uyum çizilir.
Örnek 6.2:
Örnek 6.1’de çizilen varyogramın, Co= 0,60 m2, C = 2,00-0,60 = 1,40 m2 ve a = 5 m için küresel model/uyum
varyogramının çizilmesi.
Çözüm: h = 1,5 m için aşağıdaki değerler elde edilir:
Adım
1.
2.
3.
4
h
1,50
3,00
4,50
6,00
h/a
0,300
0,600
0,900
1,200
(h/a)
0,437
0,792
0,986
2,000*
C. (h/a)
0,612
1,109
1,380
2,800
Co+C. (h/a)
1,212
1,709
1,980
3,400
*h>a için (h/a) = C’dir.
6.4 Varyogramların uygulanma alanları
Varyogramların esas uygulanma alanları yapısal analiz, rezerv hesaplaması, sınıflandırılması
ve minimum tenör sınırlarının (cut off) hesaplanması ile eniyilemedir. Bu amaç için ileri
jeoistatistik (kriging) uygulanır (bak. David, 1977). Bunlara zemin hazırlıyacak bazı temel
öğeler aşağıda incelenecektir.
Prof. Dr. H. Çelebi
90
Çizelge 6.2:
h/a < 1,00 için γ(h/a) değerleri (Akın ve Siemes, 1988).
h/a→
.000
.020
.040
.060
.080
.100
.120
.140
.160
.180
.200
.220
.240
.260
.280
.300
.320
.000
.000
.030
.060
.090
.120
.150
.179
.209
.238
.267
.296
.325
.353
.381
.409
.437
.464
.001
.001
.031
.061
.091
.121
.151
.181
.210
.239
.269
.297
.326
.355
.383
.410
.438
.465
.002
.003
.033
.063
.093
.123
.152
.182
.212
.241
.270
.299
.328
.356
.384
.412
.439
.466
.003
.004
.034
.064
.094
.124
.154
.184
.213
.242
.271
.300
.329
.357
.385
.413
.441
.468
.004
.006
.036
.066
.096
.126
.155
.185
.215
.244
.273
.302
.330
.359
.387
.415
.442
.469
.005
.007
.037
.067
.097
.127
.157
.187
.216
.245
.274
.303
.332
.360
.388
.416
.443
.470
.006
.009
.039
.069
.099
.129
.158
.188
.217
.247
.276
.305
.333
.362
.390
.417
.445
.472
.007
.010
.040
.070
.100
.130
.160
.189
.219
.248
.277
.306
.335
.363
.391
.419
.446
.473
.008
.012
.042
.072
.102
.132
.161
.191
.220
.250
.279
.308
.336
.364
.392
.420
.447
.474
.009
.013
.043
.073
.103
.133
.163
.192
.222
.251
.280
.309
.337
.366
.394
.421
.449
.476
90
.010
.015
.045
.075
.105
.135
.164
.194
.223
.253
.282
.310
.339
.367
.395
.423
.450
.477
.011
.016
.046
.076
.106
.136
.166
.195
.225
.254
.283
.312
.340
.369
.397
.424
.451
.478
.012
.018
.048
.078
.108
.138
.167
.197
.226
.255
.284
.313
.342
.370
.398
.426
.453
.480
.013
.019
.049
.079
.109
.139
.169
.198
.228
.257
.286
.315
.343
.371
.399
.427
.154
.481
.014
.021
.051
.081
.111
.141
.170
.200
.229
.258
.287
.316
.345
.373
.401
.428
.456
.482
.015
.022
.052
.082
.112
.142
.172
.201
.231
.260
289
.318
.346
.374
.402
.430
.457
.484
.016
.024
.054
.084
.114
.144
.173
.203
.232
.261
.290
.319
.347
.376
.403
.431
.458
.485
.017
.025
.055
.085
.115
.145
.175
.204
.234
.263
.292
.320
.349
.377
.405
.432
.460
.486
.018
.027
.057
.087
.117
.147
.176
.206
.2 35
.264
.293
.322
.350
.378
.406
.434
.461
.488
.019
.028
.058
.08 8
.118
.14 8
.178
.20 7
.236
.26 6
.295
.32 3
.352
.38 0
.408
.43 5
.46 2
.48 9
91
Jeolojide matematik ve statistiksel yöntemler
.340
.360
.380
.400
.420
.440
.460.
.480
.500
.520
.540
.560
.580
.600
.620
.640
.660
.680
.700
.720
.740
.760
.780
.800
.820
.840
.860
.880
.900
.920
.940
.960
.980
1.0
.490 .492 .493 .494 .496 .497 .498 .500 .501 .502 .504 .505 .506 .508 .509 .510 .511 .513 .514 .51 5
.517 .518 .519 .521 .522 .523 .524 .526 .527 .528 .530 .531 .532 .534 .535 .536 .537 .539 .540 .541
.543 .544 .545 .546 .548 .549 .550 .552 .553 .554 .555 .557 .558 .559 .560 .562 .563 .564 .565 .56 7
.568 .569 .571 .572 .573 .574 .576 .577 .578 .579 .581 .582 .583 .584 .586 .587 .588 .589 .590 .592
.593 .594 .595 .597 .598 .599 .600 .602 .603 .604 .605 .606 .608 .609 .610 .611 .613 .614 .615 .61 6
.617 .619 .620 .621 .622 .623 .625 .626 .627 .628 .629 .631 .632 .633 .634 .635 .637 .638 .639 .640
.641 .643 .644 .645 .646 .647 .648 .650 .651 .652 .653 .654 .655 .657 .658 .659 .660 .661 .662 .66 4
.665 .666 .667 .668 .669 .670 .672 .673 .674 .675 .676 .677 .678 .680 .681 .682 .683 .684 .685 .686
.688 .689 .690 .691 .692 .693 .694 .695 .696 .698 .699 .700 .701 .702 .703 .704 .705 .706 .708 .709
.710 .711 .712 .713 .714 .715 .716 .717 .718 .719 .721 .722 .723 .724 .725 .726 .727 .728 .729 .730
.731 .732 .733 .734 .736 .737 .738 .739 .740 .741 .742 .743 .744 .745 .746 .747 .748 .749 .750 .75 1
.752 .753 .754 .755 .756 .757 .758 .759 .760 .761 .762 .763 .764 .765 .766 .767 .768 .769 .770 .771
.772 .773 .774 .775 .776 .777 .778 .779 .780 .781 .782 .783 .784 .785 .786 .787 .788 .789 .790 .79 1
.792 .793 .794 .795 .796 .797 .798 .799 .800 .801 .802 .802 .803 .804 .805 .806 .807 .808 .809 .810
.811 .812 .813 .814 .815 .815 .816 .817 .818 .819 .820 .821 .822 .823 .824 .824 .825 .826 .827 .82 8
.829 .830 .831 .832 .832 .833 .834 .835 .836 .837 .838 .839 .839 .840 .841 .842 .843 .844 .845 .845
.846 .847 .848 .849 .850 .850 .851 .852 .853 .854 .855 .855 .856 .857 .858 .859 .860 .860 .861 .86 2
.863 .864 .864 .865 .866 .867 .868 .868 .869 .870 .871 .872 .872 .873 .874 .875 .875 .876 .877 .878
.879 .879 .880 .881 .882 .882 .883 .884 .885 .885 .886 .887 .888 .888 .889 .890 .890 .891 .892 .89 3
.893 .894 .895 .896 .896 .897 .898 .898 .899 .900 .900 .901 .902 .903 .903 .904 .905 .905 .906 .907
.907 .908 .909 .909 .910 .911 .911 .912 .913 .913 .914 .915 .915 .916 .917 .917 .918 .919 .919 .92 0
.921 .921 .922 .922 .923 .924 .924 .925 .926 .926 .927 .927 .928 .929 .929 .930 .930 .931 .932 .932
.933 .933 .934 .934 .935 .936 .936 .937 .937 .938 .938 .939 .940 .940 .941 .941 .942 .942 .943 .94 3
.944 .945 .945 .946 .946 .947 .947 .948 .948 .949 .949 .950 .950 .951 .951 .952 .952 .953 .953 .954
.954 .955 .955 .956 .956 .957 .957 .958 .958 .959 .959 .960 .960 .960 .961 .961 .962 .962 .963 .96 3
.964 .964 .965 .965 .965 .966 .966 .967 .967 .968 .968 .968 .969 .969 .970 .970 .970 .971 .971 .972
.972 .972 .973 .973 .974 .974 .974 .975 .975 .975 .976 .976 .976 .977 .977 .978 .978 .978 .979 .97 9
.979 .980 .980 .980 .981 .981 .981 .982 .982 .982 .983 .983 .983 .983 .984 .984 .984 .985 .985 .985
.986 .986 .986 .986 .987 .987 .987 .987 .988 .988 .988 .988 .989 .989 .989 .989 .990 .990 .990 .99 0
.991 .991 .991 .991 .992 .992 .992 .992 .992 .993 .993 .993 .993 .993 .994 .994 .994 .994 .994 .995
.995 .995 .995 .995 .995 .996 .996 .996 .996 .996 .996 .996 .997 .997 .997 .997 .997 .997 .997 .99 8
.998 .998 .998 .998 .998 .998 .998 .998 .998 .999 .999 .999 .999 .999 .999 .999 .999 .999 .999 .999
.999 .999 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00
1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00
Örnek: h/a=0,010 için γ(h/a) = 0,015; h/a=0,511 için de γ(h/a) =0,700’dür (koyu yazılı değerler).
6.4.1 Yapısal analiz
Yapı, değişkenlerin cevherleşme içindeki dağılım özelliği demektir. Aynı zamanda izotropi,
anizotropi veya üst üste birikme ile oluşan şekiller (yuvalanma) v.s. önemli yapısal
özelliklerdir. Bir varyogramda Co’ın olması, cevherleşmede çeşitli etkenlerin rol oynadığını
gösterir. Örneğin, cevherleşmede büyük boyutlu (değişimlerin) şekiller yanında küçük
boyutlu şekillerin de rol oynaması gibi. Hesaplanan varyogram değerlerine bir modelin
uyarlanması zor olabilir. Ancak çeşitli modellerdeki varyogramların bir araya getirilmesi ile
değişik bir tip ortaya çıkarılabilir. Bu değişim maden yatağındaki değişik etkenlerin sonucu
olabilir (örneğin, sedimanter yataklardaki oluk akıntıları gibi). Genelde büyük yapılar yanında
küçükleri ayırdedilemez. Bunlar Co olarak ortaya çıkar ve fizikteki “background”a benzetilir.
6.4.1.1 Anizotropi
İzotrop oluşukların değişik yönlerdeki C ve a değerleri aynıdır. Buna karşın anizotrop
bölgelerin veya maden yataklarının değişik yönlerde alınan varyogramları farklı özellikler
Prof. Dr. H. Çelebi
92
gösterir. Örneğin, c değerlerinin eşit, ancak a değerlerinin farklı olduğu durumlarda bir
geometrik anizotropi var demektir (Şekil 6.6b). Aksine c değerlerinin farklı, a değerlerinin
eşit olduğu oluşuklar yerel anizotropiye (belli yönlerde farklı C) sahiptir (Şekil 6.6c)
Örneğin, sedimanter yataklardaki kalınlık ve uzanım farkı gibi. Bu yatakların özellikleri yatay
boyutta uzun mesafelerde değişmezken (geometrik anizotropi), dikey boyutta sık sık
değişebilmektedir (yerel anizotropi).
N
b
b
W
a
W
O
a
S
b) Anizotropi: a≠b
a) İzotropi: a=b
(h)
c2
c1=c2
c1
a1
a1=a2
h, m
a2
b) Geometrik anizotropi: a1<a2
c) Yerel anizotropi: c1<c2
Şekil 6.6.
Küresel model kullanımında şematik anizotropi çeşitleri. Geometrik anizotropi, aynı eşik değerlerine karşın farklı
örnek aralığı (range, b), yerel anizotropi ise, farklı eşik değerlerine karşın aynı örnek aralığı şeklinde görülür, c.
Bazen hem eşik değer, hem de örnek aralıkları farklı olabilir. Bu durum yerel anizotropi
olarak değerlendirilir. De Wijs modelinde anizotropiler doğrunun eğiminden (yerel
anizotropi) ve pararlel doğrulardan (geometrik anizotropi) anlaşılır. Anizotropi ile
cevherleşmelerin asıl ekseni çıkarılabilir, boyutları incelenebilir ve buna göre araştırma
programları geliştirilebilir.
6.4.1.2 Ardalanma (boşluk etkeni, hole effect)
Bir maden yatağında veya bölgede zengin ve fakir cevher kısımları veya değerli hammadde
ile yankayaç değişmesi durumunda varyogram, bu özelliği bir dalgalanma olarak yansıtır. Bu
sinüs eğrisi şeklindeki periyodik durum boşluk etkeni veya ardalanma (hole effect) olarak
adlandırılır (Şekil: 6.7a). Buna kömür damarlarının çeşitli düzeylerde yer alması, cevher
merceklerinin yankayaçla tekrarlanması gibi jeolojik oluşuklar örnek verilebilir.
 (h)
 (h)
a
92
b
93
Jeolojide matematik ve statistiksel yöntemler
h, m
h, m
Şekil 6.7:
Varyogramlarla saptanabilecek yapısal özellikler: a, ardalanma (hole effect) özelliği; b, eğilim/yönelim (trend,
drift) gösteren varyogram.
6.4.1.3 Artan eğilim veya yönelim (trend, drift)
Bazı oluşuklarda mesafeye bağlı olarak varyogram değerleri sürekli artar, örneğin derinlikle
metal içeriğinin artması gibi (Şekil 6.7b). Bu özelliğe yönelim (trend) denir. Bu durum
temelde bir logaritmik dağılımın belirtisidir. Dolayısı ile rezerv hasapları için kriging
uygulanamaz. Bu nedenle böyle durumlarda rezerv ve tenör hesapları için değişik
varyogramlar kullanılır. Eğilim doğrusal veya parabolik de olabilir (Akın, 1983).
Varyogram şeklinden eğilimin ağırlıklı olarak hangi yönde olduğu da anlaşılabilmektedir.
Derine doğru artan element derişimi, şehre doğru artan göl kirlenmesi gibi. Bu durumda
varyogram doygunluk (eşik değer=sill) durumuna ulaşmaz, sürekli artar (Şekil 6.7b).
6.4.1.4 Diğer özellikler
Yukarıda sayılan özelliklerden başka varyogramlarla iç içe yapılar ve değişkelerin ortalama
değere bağlılığı, orantı etkeni (proportional effect), de açıklığa kavuşturulabilir. Bunların
birincisinin rastlantısal hata, petrografik düzey ve karışımlar, örneğin, tabakaların birbirine
geçmesi gibi, nedenleri vardır. Bu dağılımda a’lar ve C’ler her varyogram için farklıdır.
Orantı etkeninde ise, bir logaritmik dağılım neden olabilir. Ortalama değerle değişkenin veya
standart sapmanın paralel değişmesi, zengin cevherlerin, fakir cevherlerden daha düzensiz
veya saçınımlı olduğu anlamına gelir. Bunların değişimlerinin oranı ortalamalarının oranına
eşit ve sabittir. Bazı durumlarda bir varyogramdan başka bir varyogram hesaplanabilir (bak.
Dutter, 1985).
6.5 Değişkelerin hesaplanması
Prof. Dr. H. Çelebi
94
Örnek değerlerinden doğrudan hesaplanan küresel modelin C0+C değerine eşit istatistiksel
yayılım değişkesi yanında uygulamada özellikle,
-
saçınım veya dağılım (blok),
yayılım veya kestirim ve
kriging değişkeleri
kullanılmaktadır (Şekil 6.8). Aşağıda bu değişkelerin uygulamadaki hesaplama yöntemleri
kısaca gösterilecektir. Bunlarla ilgili teorik esaslar için bak. Matheron (1971), Dutter (1985) ve
Akın ve Siemes (1988). Kriging değişkesi, ileri jeoistatistikte ayrıntılı ele alınacaktır.
V
v
V, maden yatağı
v, blok
O, örnek
O
Şekil 6.8.
Değişkelerin geometrik gösterimi.
6.5.1. Saçınım (dağılım veya blok örnekler) değişkesi σ2 (O/ v )
Bu değişke, Krige (1951 ) tarafından bir maden yatağındaki örnek değişkesi ile blok değişkesi
arasındaki ilişki olarak tanımlanmaktadır. Hacim-değişke ilişkisi olarak bu değişke,
σ2 (O/V ) = σ2 (O/v) + σ2 (v/V)
6.32
Yatak değişkesi = Blokların değişkesi + Blok örneklerinin değişkesi
şeklinde tanımlanır. Yani (V) maden yatağının (O) nokta şeklindeki örneklerinin değişkesi, (v)
bloklarının yayılım değişkesi ile bu blokların (V) yatağındaki değişkelerinin toplamına eşittir.
6.34 eşitliğinin sol tarafı,
σ2 (O/V ), maden yatağındaki örneklerin istatistiksel değişkesini (=C0+C),
sağ tarafının 1. terimi,
σ2 (O/v), v hacmindeki blok örneklerinin değişkesini (=ortalama varyogram değerlerini) ve
2. terimi,
σ2 (v/V) de, V maden yatağındaki blokların değişkesini
ifade eder. Buna göre değişik bloklar içinde bulunan nokta şeklindeki örnek ve blokların
değişkelerinin toplamı maden yatağındaki örneklerin değişkesine eşittir. Uygulamada, örneğin,
94
95
Jeolojide matematik ve statistiksel yöntemler
örneklerin blok değişkesi σ2 (O/v), bloklara eşit dağıtılan örneklerin varyogramlarının ortalama
değerlerinden hesaplanır. Ancak en sağlıklı değişke hesaplama yolu yardımcı fonksiyonlarla (F
Chart diyagramı) hesaplamaktır. Bu diyagram Co=0 ve C=1 olarak standardize edilmiştir (Şekil
6.9). Blokların boy (l) ve enlerinin (h) tesir mesafesine (a) oranları ile diyagramdan okunan F
fonksiyon değerleri C ile çarpıldıktan sonra Co eklenerek örneklerin bloktaki değişkesi σ2 (O/v)
bulunur (bak. Örnek 6.3). Bu değişke rastlantısal karelaj yöntemi için gereken kestirim
değişkesinin bulunmasında, çeşitli maden işletmelerinde kriging yöntemi uygulamasında
kullanılır.
Örnek 6.3.
Hata payı Co=0,25; Eşik değeri C=0,50 ve tesir mesafesi a=80 m olan bir göreceli varyogramın h=25 m ve l= 50
m olan blok içindeki kestirim değişkesinin hesaplanması:
Çözüm:
h/a=20/80 = 0,25 ve l/a = 40/80 = 0,50’den F(l/a, h/a) = 0,30 bulunur (bak grafik).
Küresel model için,
σ2 (O/v) = Co+C[F(h/a, l/a)]
= 0,25+0,50.0,30
= 0,40
sonucuna varılır. Buradan,
σ (O/v) =
0,40
= ± 0,63
= % 63
elde edilir.
Prof. Dr. H. Çelebi
96
Şekil 6.9.
l ve h kenarlı bir dikdörtgen blok içindeki saçınım değişkesinin kestirimi için geliştirilen 2 boyutlu F diyagramı
(David, 1977; Akın, 1983’ten). Oklar için bak. Örnek 6.3.
6.5.2 Yayılım (kestirim veya blok) değişkesi σ2 (v/V)
Bu değişke hesaplanmasının temeli her örneğin bir tesir mesafesi olduğu esasına dayanır.
Dolayısı ile her örneğe bir doğru üzerinde, bir alanda veya bir hacim içinde belli bir tesir
mesafesi verilir. Tesir mesafesinin büyüklüğü örnek veya sondaj aralıklarına göre ayarlanır.
Yöntemin doğruluğu varyogramlarla denetlenir. Bulunan değişke bir doğru üzerindeki, bir
alandaki veya bir hacim içindeki (bloktaki) hatayı ifade eder.
Değişke hesaplaması özel yöntemler gerektirir, çeşitli grafik ve tablolardan yararlanılır.
Bulunan değerler doğrultusunda örnek veya sondaj aralıkları mükemmelleştirilir. Bunun için
kriging değişkesinden de yararlanılır.
Yayılım değişkesi, örnek yerine ve yayılıma göre çözümü mümkün kılan bir yardımcı
fonksiyonla hesaplanır. Boyut sayısı ile çözümün zorlaşır. Uygulamalarda çeşitli grafikler ve
çizelgeler kullanılır (Şekil 6.10). Burada da örnek durumuna göre 6.5.1’de yapılan işlemler
yapılır. Diyagramdan okunan l/a ve σ2(O/v) değerleri değişke C ile çarpılıp külçe etkeni C0
eklenir. Bu hesaplama için gerekli C0, C ve a küresel varyogram vasıtası ile bulunur.
Şekil 6.10:
96
97
Jeolojide matematik ve statistiksel yöntemler
Küresel model için yayılım değişkesinin hesaplanmasında kullanılan diyagram (David, 1977; Akın, 1983’ten).
Örneklerin bloktaki konumuna göre eğriler değişir.
Örnek 6.4:
Kenar uzunluğu l = 20 m olan kare şeklindeki bir blokun ortasında yer alan bir örneğin yayılım değişkesinin
parametreleri C0 = 0,10, C = 0,40 ve a = 60 m olan bir varyogram için hesaplanması.
Çözüm: Ordinatta l/a = 20/60=0,30 alınır (bak. Şekil 6.10). Buradan ordinata çıkılan dikin
σyayılım değişke eğrisini kestiği noktadan absise çizilen paralel, ordinatı yaklaşık
0,11 noktasında keser. Buna göre göreceli bir küresel modeli varyogram için,
 E2 =C0+C.σ 2E 2
=0,10+0,40.0,1
= 0,144
bulunur (σ 2E 2 , diyagramdan okunur). Buradan yayılım değişkesinin standart sapması,
σE= 0,144
= ± 0,38
= % 38
olarak bulunur.
Alıştırma:
Kenarları l=40 m olan kare şeklindeki blokun köşelerinde bulunan örneklerin varyogram parametreleri a=100 m,
C0=0,20 ve C=0,60 için yayılım değişkesini bulunuz.
Yayılım değişkesinin çeşitli blok büyüklüklerine göre hesaplanması ile örnek alımı
iyileştirilebilir. Bunun yardımı ile en iyi örnek ve sondaj aralığı bulunabilir ve sondaj karelajı
yerleştirilebilir. Bunun yanında örnek veya sondajların sıklaşması veya seyrelmesi ile artan
veya azalan bilgi oranı da bulunabilir, karşılaştırılabilir ve sondaj karelajının, örneğin,
anizotropi gibi değişik koşullara göre, ayarlanması da mümkün olabilmektedir. Sondaj sayısına
göre çizilen hipotetik eniyileme eğrisinin gidişinden en iyi sondaj aralığı ve sayısı da
hesaplanabilir. Bulunan sondaj sayısından örneğin, % kaç hata payı için kaç sondajın ve hangi
aralıkta gerektiği ortaya konulabilir. Bu da rezerv hesapları için önemli rol oynar (Şekil 6.11).
Eğri, çeşitli büyüklükteki bloklar için yayılım değişkeleri hesaplanarak toplam blok sayısına
bölünmesi ile elde edilmiştir. Yatak alanının belli olduğu kabul edilmiştir. Görüldüğü gibi hata
payını düşürmek için sondaj sayısının arttırılması gerekir. Bu araştırmalar yürümekte olan
inceleme çalışmaları sırasında sondaj karelajının eniyilemesini sağlar ve kısmen de gereksiz
masrafları önler. Buna bağlı olarak yapısal analizi ile elde edilen yeni ve daha uygun bir sondaj
Prof. Dr. H. Çelebi
98
karelaji kurulabilir. Bunun için çeşitli tablolardan yararlanmak mümkündür. Aynı yöntem en
iyi örnek aralığı için geçerlidir.
Göreceli hata payı, ± %
30
20
10
5
10
15
20
30
35
40
50 Sondaj sayısı
Şekil 6.11:
Hata payına göre yaklaşık sondaj aralığı ve sayısının bulunmasında yararlanılan hipotetik grafik örneği (Akın
1983).
6.5.3 Kriging değişkesi
Kriging değişkesini amacı, bir maden yatağında eldeki örnek değerleri ile kuramsal en iyi
doğrusal değişkeyi hesaplamaktır. Bunun için x1, x2,…, xn noktalardaki z(x1),…z(xn) bilinen
değerleri yardımı ile değeri bilinmiyen x0 noktasındaki z(x0) değeri kestirilir ve hata payı
bulunur. Gerekli değerler varyogram modelinden okunurlar.
Şekil 6.12 kriging değişkesini ilke olarak açıklamaktadır. Ortadaki blok için kestirilen değer
“kriging penceresi” içindeki tüm örnek değerler vasıtası ile kestirilir. Kriging penceresinin
boyutları temelde varyogram modeline bağlı olarak tesir mesafesine göre değişir.
Anizotropinin mevcut olması durumunda doğal olarak anizotropi oranına göre daire, elipse
dönüşebilir. Kriging penceresinin boyutları, tesir mesafesinden başka külçe etkenine de
bağlıdır. Çünkü bu, koruma etkeni (screen efect) ile de ilişkilidir (David, 1977).
Şekil 6.12’de pencere içindeki tüm örnekler ağırlıklı hesaplanır ve toplanırlar. Hem ağırlıklı
değerler, hem de kestirimler varyogram modeline dayanırlar. Dolayısı ile her λ değerinin yöne,
sondajın blok konumuna ve mesafesine bağlı olarak hesaplanması gerekmektedir.
Hesaplama için  E2 kestirim değişkesinden yararlanılır:
98
99
Jeolojide matematik ve statistiksel yöntemler
 E2 =VAR[z(v0)-z*(v0)]
6.33
6.34
=z(x0)-∑ λi z(xi)
z(v0), blokun gerçek değeri,
z*(v0), blokun kestirilen değeri.
S-9
S-1, z(xi)
S-5
S-10
S-2
S-11
S-6
S-3
S-4
Blok
S-7
S-8
Açıklamalar: S, sondaj
z(xi) , yere bağlı değişken
------ kriging penceresi
Şekil 6.12:
Kriging yöntemi yardımı ile blok değerinin hesaplanmasında kullanılan 2 boyutlu nokta ilişkisi.
Görüldüğü gibi kestirilen hata, gerçek değerle kestirilen değer arasında bulunmaktadır (x 0,
değeri bilinmiyen; xi, değeri bilinen noktadır). 6.34’ten kestirilen hatanın λ’ya bağlı olduğu
görülmektedir. Kriging hatası veya  E2 , en az (best), ortalama olarak doğru (unbiased) ve
ağırlıklı ortalaması doğrusal kestirildiğinden, BLUE (best linear unbiased estimator) diye
adlandırılır. Yukarıdaki eşitlik çeşitli matematiksel işlemlerle,
 E2 = 2 λi σvxi + λi λj σxixj
6.35
∑ λi =1
6.36
σ= min
6.37
şekline dönüştürülür. Burada,
ve
olması istenir. Bu eşitlik sistemine krige sistemi denir ve ancak Lagrange (“Lagranj” okunur)
yöntemi ile çözülebilir. Bu eşitlikte,
 E2 , blok değişkesi, örneğin blok tenörleri,
σvxi, blok değerleri ile örnek değerlerinin katışıksız değişkesi (kovaryansı) ve
σxixj örnek değerlerinin katışıksız değişkesini ifade ederler.
Prof. Dr. H. Çelebi
100
Bu değerlerin hepsi varyogramdan türetilebilir. Sonunda n+1 bilinmiyenli veya her sondaj ve
örnek için ağırlıklı parametreli n+1 doğrusal eşitlik sistemi elde edilir.
Kriging değişkesi veya hatası,
 2 = σ 2 - λi σvxi - µ
k
v
6.38
ile hesaplanır. Bu eşitlikte µ, önceden λi ağırlık etkenleri ile hesaplanan lagrange etkeni
demektir. Bu da örneğin, nokta kriging’de, aşağıdaki kriging matrissi K ile hesaplanır:
σ11
σ21
.
K= .
.
σn1
1
σ12……. σ1n 1
σ22……. σ2n 1
σn2…… σnn 1
1
1 0
K
λ1
λ2
.
.
.
λn
µ
=
λ
σ01
σ02
.
.
.
σ0n
1
6.39
D
σab = σba olduğundan, σ12 = σ21’dir ve matris simetriktir. Yani 1. noktadan 2.’ye veya 2.
noktadan 1.’ye bakmak aynıdır ve dolayısı ile katışıksız değişkeleri eşittir (ortalama değeri


olmıyan kriging). Burada  ve D birer vektördür. Kriging matrisi K ile bu iki vektör
arasında,
 
K.  = D
6.40

eşitliği bulunmaktadır. Görüldüğü gibi  , K’nın kaldırılması ile hemen hesaplanabilmektedir.
Yani,


6.41
 = K-1. D
ve
 2 = σ 2 – λT. D ’ye
6.42
k
v
dönüşerek sadeleşmiş olur. Böylece kriging kestirimi için xo noktasının bilinmiyen ağırlıklı
etkeni belli olmuştur. Matrisin çözümü ile,
σ11 λ1 + σ12 λ2 + µ = σ01
σ21 λ1 + σ22 λ2 + µ = σ02
λ1 + λ2 + µ = σ01 = 1
100
6.43
6.44
6.45
101
Jeolojide matematik ve statistiksel yöntemler
doğrusal eşitlikleri elde edilir. Bu 3 bilinmiyenli, λ1, λ2 ve µ, 3 eşitlik sistemidir. Sistemin
çözümü ile λ katsayıları ve lagrange etkeni µ bulunarak kriging değişkesi  2 hesaplanır (bak.
k
Örnek 6.5).
Bu yolla her blok ve değişken için bir kestirim değeri ve buna bağlı olarak bir kriging
değişkesi hesaplanır. Bulunan bu değerler her blok için bir inceleme derecesi olarak görülür.
Bununla eksik araştırma noktaları saptanabilir ve göreceli kriging standart sapması rezervlerin
sınıflandırılmasında bir ölçüt olarak kullanılabilir.
Kriging hesaplamaları için elektronik veri hesaplamaları (bilgisayar/program) gereklidir. Bazı
çizelge ve grafikler çözümü kolaylaştırsa da, yeterli değildir. Kriging yöntemi, blok değerleri
yerine nokta değerlerinin bulunmasında (point kriging) da kullanılabilir. Özellikle eşdeğer
eğrilerle sunumun yapılması veya varyogramın denenmesi durumlarında bu yöntem sıkça
uygulanmaktadır.
Örnek 6.5:
Örnek aralığı h=10 m, tesir mesafesi a=20 m olan bir varyogram için nokta kriging yöntemi ile kestirimi.
Çözüm. Kriging ile kestirimde ilk önce K matrisi (6.39) kullanılarak varyogram verileri
bulunur. Bu matriste köşegen değerler eşit olduğundan,
σ11 = σ22
= σnn
=0
olur. Simetriden dolayı,
σ12 = σ21
=C
=0
değerine sahiptir. Buradan küresel model için,
3 h 1 h3

σ10 = C[
]
2 a 2 a3
3 10 1 10 3

= 20[
]
2 20 2 20 3
= 20.0,69
= 13,76
bulunur.
Yukarıda belirtildiğine göre C=20, σ20=20’dir. Bu değerler,
Prof. Dr. H. Çelebi
102
σ11
σ21
1
σ12
σ22
1
1
1
0
λ1
σ10
λ2 = σ20
µ
1
K
λ
D
matris sisteminde yerine konularak,
0 20 1
20
0 1
1
1 0
λ1
13,76
λ2 = 20
µ
1
K
λ
D
matrisi sistemi elde edilir. Bunun çözümü ile λ1=0,656, λ2= 0,344 ve µ=6,88 olarak hesaplanır.
Buna göre kriging ile kestirilen değer,
n
Z*(x0)=  i z ( xi )
i 1
= 0,656.2+0,344.5
=3,03
bulunur (2 ve 5 varyogram değerleridir. Bak aşağıdaki Şekil).
z(x1)=2
+
z(x0)=?
z(x2)=5
+
10 m
30 m
Buna göre kriging değişkesi,
2
 2 =  λ1 σ0i+µ
k i 1
= 0,656.13,76+0,344.20+6,88
= 22,78
olarak elde edilir. Bunun standart sapması,
 =
k
22,78
= ± 4,77
değerindedir.
102
103
Jeolojide matematik ve statistiksel yöntemler
Blok krigingde de buna benzer şekilde hareket edilir. Şekil 6.12’deki Çizelgede yararlanarak
blok değişkesi kestirilir. Çeşitli değişkelerle ilgili örnekler çoğaltılabilir. Ancak bu konunun
kapsamını aşar. Bu nedenle ayrıntılı incelemeler lisansüstü eğitime bırakılmıştır.
6.6 İleri jeoistatistik yöntemleri
Jeoistatistikte çok sayıda uygulamada az denenmiş yeni yöntemler bulunmaktadır. Burada
bunları sadece adları verilmekle yetinilecektir. Bu yöntemlerin başında üniversal kriging gelir.
Bu yöntem durağanlık savının geçerli olmadığı yataklarda kullanılır. Varyogram yerine
varyogram kalıntılarının gerçek değerleri ile işlem yapılır. Önemli rastlantısal fonksiyon,
doğrusal olmıyan geoistatistik ve benzeşim buna eklenecek diğer önemli başlıklardır.
Sonuç olarak matematik ve istatistik ilkelerine dayanan, Krige (1951) ve Mathéron (1971)
tarafından geliştirilen “jeoistatistik”, özellikle maden yataklarının inceleme safhasında
kullanılmaktadır. Jeoistatistik sayesinde bu safhanın pahalı verileri daha iyi ve çabuk
kullanılabilir ve incelemeler esnasında önemli kararlar verilerek çalışmalar kolaylaştırılabilmektedir. Buna dayanarak işletmelerin optimum büyüklüğü, ona bağlı olarak da işletme
ömrü, açık veya kapalı işletme olacağı daha kesinlikle planlanabilmektedir (Akın, 1983) .
Bu yöntemler sayesinde, eskiden elle önce kesit ve haritalara işlenen kimyasal analiz değerleri,
mineralojik ve jeolojik sonuçları, bugün bilgisayarlar değerlendirip tenör ve rezervi
hesaplayabilmekte, çok kısa sürede maden yatağının 2 veya 3 boyutlu modelini, jeokimyasal
element dağılımını ve birlikteliğini ortaya çıkarabilmektedir.
Kaynakça
1. Akın, H., 1983. Anwendung der Geostatistichen Methoden in de Praxis. Klassifikation Von
Lagerstättenvorräten mit Hilfe der Geoistatistik. Verlag Chemie, S. 164 s., Weinheim
2. Akın, H. ve Siemes, H., 1988. Praktische Geostatistik. Springer, 303 s., Berlin-HeidelbergNew York-Tokyo
3. David, M., 1977. Geostatistical Ore Reserve Estimation, 3. Baskı, 364 s., Amsterdam
4. De Wijs, H. J., 1951/53. Statisitics of Ore Distribution. J. of the Royal Netherlands Geol.
and Min. Soc.
5. Dutter, R., 1985. Geostatistik. B. G. Teubner, 159 s., Stuttgart
6. Journal, A. G. and Huijbregts, Ch. J., 1978. Mining Geostatistics. Acad. Pres, 600 s.,
London.
7. Krige, D. G., 1951. A Statistical Approach to Same Mine Valuation an Allied Problems on
the Witwatersrand. M. Sc. Thesis, Univ. of the Witwatersrand.
8. Mathéron, G., 1963. Principles of Geostatistics. Economic Geology 58, 1246-1266.
Prof. Dr. H. Çelebi
104
9. Mathéron, G., 1971. The Theory of Regionalized Variables and Its Applications. Les
Cahiers du Centre de Morphologie Mathématique de Fontainebleua, Fransa.
10. Tercan, A. E. ve Saraç, C., 1998. Maden yataklarının değerlendirilmesinde jeoistatistiksel
yöntemler. TMMOB, JMO yayını 48, 137 s., Ankara
11. Tüysüz, N. ve Yaylalı, G., 2005: Jeoistatistik. KTÜ yayını 220, Trabzon, 382 s.
12. Wellmer, F.-W., 1989. Rechnen für Lagerstättenkundler und Rohstoffwirtschaftler. Teil 2,
Springer, 462 S., Clauthal-Zellerfeld.
EKLER
Ek 6-1:
Hole effect’e örnek varyogram (Avnik, Bingöl)
104
105
Jeolojide matematik ve statistiksel yöntemler