JEOLOJİDE MATEMATİK VE İSTATİSTİKSEL YÖNTEMLER Prof. Dr. Hüseyin Çelebi Ders Notları İstanbul 2014 1 Jeolojide matematik ve statistiksel yöntemler Önsöz “Jeolojide matematik ve istatistiksel yöntemler” ders notları kapsamında 2002/2003 öğretim yılında jeoloji öğrencileri için hazırlanmıştır. Sınırlı yarıyıl süresi içinde mümkün olduğu kadar uygulamaya yer vermek için derin teorik işlemlere yer verilmemiştir. Bu konuya ilgi duyulduğunda kaynakçadaki özel kaynaklara başvurulabilir. Bu ders notları yaklaşık 25 yıllık deneyimden ve jeoistatistikte mevcut çok sayıdaki eserin incelenmesinden sonra hazırlanmıştır. Bunlardan David (1978), Akın ve Siemes (1988), Wellmer (1989), Schönwiese (1992) ve Arıcı (2001) en önemlileridir. Örnekler, çoğunlukla Türkiye’deki özgün çalışmalardan ve yerbilimlerinden başka dallara da örnek oluşturacak şekilde seçilmiştir. Bu çalışmanın amacı istatistikteki güncel durumu ve yöntemleri tanıtmak, ileride yapılacak çalışmalar için temel kaynak yaratmak, özgün verilerle uygulama örneklerini oluşturarak matematiğin çeşitli yöntemlerini yerbilimlerine uygulamaktır. Bir jeoistatistiksel işlemde çok sayıda değişken ve parametre işleme katılır. Ancak bunların doğru tanımı ve hesaplanması sonunda doğru jeoistatistiksel çözüm bulunur ve yorumlanabilir. Burada bu amaçla kullanılacak temel kavram ve bunlara bağlı değişkenler tanıtılacaktır. Bu notların yazılmasını sağlayan asıl neden öğrencilerin derslerde gösterdikleri yakın ilgi ve eleştirileri olmuştur. Kendilerine çok teşekkür ederim. H. Çelebi İstanbul, Kasım 2014 Prof. Dr. H. Çelebi 2 Birkaç ünlü sözü İstatistik! Matematiğin yardımı olmadan doğa bilimlerini incelemek demek, gerçekleştirilmiyecek işe girişmek demektir. Galileo Galilei Her bilimin matematiğe gereksinimi vardır, ancak matematiğin hiçbirine. Jakob Bernoulli Matematik bilimleri, her şeyden önce, berraklığı nedeniyle hoşuma gider. René Descartes Hiçbir şey iyi bir teori kadar pratik olamaz. Hermann von Helmholtz 2 3 Jeolojide matematik ve statistiksel yöntemler İçindekiler 1 GİRİŞ Sayfa 1.1 Genel bakış 1.2 Tarihsel gelişim 1.3 Temel kavramlar ve tanımlar 1.4 Sıklık dağılımı 1.5 Olasılık Kaynakça 5 5 6 7 8 12 2 TEK BOYUTLU DAĞILIMLARIN TANIMLANMASI 2.1 Giriş 2.2 Merkezi değerler 2.2.1 Ortalama değerler 2.2.2.Ortanca (xo, medyan,) 2.2.3 Tepe değer (xt, mod) 2.3 Değişkenlik ölçüleri 2.3.1 Değişim aralığı (R) 2.3.2 Standart sapma (s) 2.3.3 Değişkenlik katsayısı (v) 2.3.4 Değişke (s2, σ2, varyans) 2.4 Momentler 2.4.1 Kayma (g, çarpıklık, asimetri, ing. skewness) 2.4.2 Basıklık (e, yassılık veya sivrilik, ing. exess, kurtosis) Kaynakça 13 13 13 20 22 22 23 24 25 26 27 27 28 33 3 KURAMSAL DAĞILIMLAR 3.1 Temel esaslar 3.2 Normal dağılım (ND) 3.2.1 Standart normal dağılım (çan eğrisi, SND) 3.3 Birikimli normal dağılım (BND) 3.4 Logaritmik normal dağılım (logND) Kaynakça Ekler 34 34 36 39 41 45 46 4 VARYANS ANALİZİ 4.1 Tanımlar 49 Prof. Dr. H. Çelebi 4 4.2 Tek değişkenli varyans analizi 4.3 Sapmaların hesaplanması 4.4 Çok değişkenli varyans analizi Kaynakça Ekler 51 52 54 55 56 5 BAĞINTI (KORELASYON) ANALİZİ 5.1 Genel bakış 5.2 Bağıntı analizi (BA) ve çeşitleri 5.2.1 Bağıntı katsayısı (r, BK) 5.2.2 Anlamlılık katsayısı (r2) 5.3. Bağınım (regresyon) analizi (BaA) 5.3.1 Bağınım doğrusu (BD) 5.3.2 Kalıntı değerler (ei) 5.3.3 Bağınım doğrusunun parametrelerinin hesaplanması 5.4 Sonuçların sağlanması 5.5 Çok değişkenli bağıntılar Kaynakça Ekler 59 59 61 62 65 65 66 68 70 73 74 75 6. JEOİSTATİSTİĞE GİRİŞ 6.1 Başlangıç 6.2 Jeoistatistik yöntemleri ve uygulama alanları 6.3 Bölgesel değişkenler 6.3.1 Varyogram 6.3.1.1 Varyogram çeşitleri (tipleri) 6.3.1.2 Varyogram modelleri 6.3.1.3 Küresel modelin uyarlanması 6.4 Varyogramların uygulanma alanları 6.4.1 Yapısal analiz 6.4.1.1 Anizotropi 6.4.1.2 Ardalanma (boşluk etkeni, hole effect) 6.4.1.3 Artan eğilim veya yönelim (trend, drift) 6.4.1.4 Diğer özellikler 6.5 Değişkelerin hesaplanması 6.5.1. Saçınım (dağılım veya blok örnekler) değişkesi σ2 (O/v) 6.5.2 Yayılım (kestirim veya blok) değişkesi σ2 (v/V) 6.5.3 Kriging değişkesi 6.6 İleri jeoistatistik yöntemleri Kaynakça Ekler 4 77 77 78 81 84 86 89 90 92 92 93 93 94 94 94 96 99 103 104 105 5 Jeolojide matematik ve statistiksel yöntemler 1 GİRİŞ 1.1 Genel bakış İstatistik, belirsizlik durumundan en iyi sonucu çıkarmaya veya kararı vermeye yarayan yöntemlerin özetidir. Amaç, yanıltıcı yorumlardan kaçınmak ve ileriyi doğru kestirmektir. İstatistik, gözlemler sonucu elde edilen sayısal verileri inceler ve bunlar arasındaki bağıntıları ortaya çıkararak sonuçların grafik veya çizelgeler halinde sunulmasını sağlayan bir inceleme yöntemidir. Özet olarak istatistik, rasgele/tesadüfi ve tesadüf şeklindeki olayları inceleyen bir yöntemsel (metodik) bilimdir ve birçok bilim dalında uygulanabilmektedir. Elde edilen sonuçlardan çeşitli yorumların yapılması ile sorunlara çözüm aranır. Sonuca varmak için bazen kısıtlı bilgi ile yetinmek gerekebilir. İstatistiğin çalışma yöntemleri, a) Tanımlamak veya örneklemek (deskriptiv), b) Dağılım şekillerini incelemek (anakütle/popülasyon veya küme özelliklerini incelemek), c) Tahmin etmek ve kestirmek (olasılıkları araştırmak), d) Teste tabi tutmak (hipotezler, karar teorileri uygulamak), e) Analiz etmek (bağıntıları ortaya çıkarmak) ve f) Özel yöntemler uygulamaktır. İstatistikte veri, 1. Saymak, 2. Ölçmek, 3. Gözlemek, 4. Anket yapmak, 5. Haritalamak ve 6. Tahmin etmek yöntemleri ile derlenir. Bunlardan gözlemler, istatistiğin temelini oluşturur. Planlama ve karşılaştırma istatistiğin en yaygın kullanıldığı alanlardır. 1.2 Tarihsel gelişim Eski çağlardan beri insanlar geleceği bilmek isterler. Gelecekte ne olacağını şimdiden bilmek başarı ve üstünlük sağlamanın önkoşulu olarak kabul edilmiştir. Ancak geleceği bilmek mümkün değildir. Çünkü gelecek bilindiği zaman, gelecek şimdi olur ve geleceğin kendisi ortadan kalkar. Bu da doğa yasalarına, öncelikle zaman kavramına, ters düşer. Bu engeli aşmak için insanlar büyü ve fal gibi dayanaksız yöntemlere yönelerek geleceği kestirme yollarını aramışlardır. Bu uygulamalar, güvensizliklerinden dolayı, zamanla inandırıcılıklarını kaybetmiştir. Bunların yerini gözlem ve ölçümlere dayanan basit istatistiksel hesaplamalar almıştır. Örneğin İ.Ö. Mısır’da ve Çin’de planlama, nüfus sayımı, asker ve vergi toplama işlemlerinde temel istatistiksel işlemlerden yararlanılmıştır. Günümüz istatistiğinin kökleri ancak 15. yy’a kadar uzanmaktadır. Metafiziğe karşı pozitif düşüncenin üstünlük sağlaması, modern istatistiğin gelişmesine de ivme kazandırmıştır. Bunun da esas kaynağı sohbet matematiği, şans oyunları (kumar), yani insanın yine ileriyi kestirme Prof. Dr. H. Çelebi 6 veya önceden bilme merakı, olmuştur. Bugün de istatistik bu alanların temel dayanağı olmaya devam etmektedir (loto ve toto gibi). Tarihte istatistiği bilimsel olarak ilk irdeleyen ve kuramlara bağlamaya çalışan matematikçi İtalyan Pacioli (1445-1514) ve Cardano’dur (1501-1576). Bunlar zar atma üzerine çalışmışlardır. Ancak bugünkü istatistiğin kuramlarının temelleri İsviçreli Bernoulli (16541705) tarafından atılmıştır. Geliştirdiği yöntemler, olasılık, şans ve risk oranlarının hesaplanmasını kolaylaştırmıştır. Bernoulli’yi Fransız Laplace (1749-1827, Laplace teoremi), Poisson (1781-1840, Poisson dağılımı) ve Alman Gauss (1774-1855, Çan eğrisi) tarafından daha ileriye götürülmüştür. 20. yy istatistikçileri arasında Galton (1822-1911, log dağılımı), Pearson (1857-1936) ve Fisher (1890-1962, çeşitli testler) önemli yer tutmaktadırlar. İstatistik sürekli geliştirilmekte ve yaygın kullanım alanı bulmaktadır. Örneğin, istatistiğin yerbilimlerdeki adı jeoistatistiktir. 20. yy’ın ikinci yarısından itibaren bu alanda kullanılmaya başlamıştır. Jeoloji, madencilik, coğrafya, çevre, tarım ve ormancılık bu alanların sadece birkaçıdır. Jeoistatistik bugün güvenilen ve kendine özgü bölgesel veya yere bağlı değişkenler teorisine dayanmakta ve Varyogram gibi araçlara sahip bulunmaktadır. 1.3 Temel kavramlar ve tanımlar Bir araştırmada incelenecek bireyler veya malzemenin tümünün incelenmesi mümkün değil. Bu hem ekonomik değil, hem de yeterli örnekle elde edilen sonucu değiştirmez (bak. büyük sayı teorisi). Bu nedenle incelenecek anakütlenin ancak bir kısmı temsilen incelenir. Anakütleye popülasyon veya örnek evreni (sample space), temsilen incelenecek kısmına da örneklem denir. Bir anakütlede verilerin tüm özellikleri ortaktır. Bulundukları yeri, ana maddeyi veya kaynağı tüm özellikleri ile temsil eder. Dolayısı ile bir örnek evreninin ancak bir temsili parçası veya örneklemi olabilir. Aynı şekilde bir örneklemin de sadece 1 ortalama değeri bulunur. Bu değer, tüm gözlemleri aynı oranda temsil eder. Aşağıdaki şekil örnek evreni, örneklem ve ortalama değeri açıklamaktadır: Örnek evreni o ooo ooooo oooooo Örneklem xi Ortalama değer o ooo o x İstatistiksel değerlendirmenin ilk adımı, seçilmiş az sayıdaki örneklerin dağılımı ve bunların bir örneklem (bir bütünlük) oluşturup oluşturmadığı özelliğinin araştırılmasıdır. Analiz aygıtlarının son 40 - 50 yılda güvenilebilir geniş kapsamlı veri üretebilmesi ve bilgi-sayarın uzun matematiksel işlemleri kolaylaştırması ile jeoistatistik, yerbilimlrinin vazgeçilmez unsuru haline gelmiştir. Jeolojik veya bölgesel değişimler, matematiksel olarak tanımlanmakta, örnek 6 7 Jeolojide matematik ve statistiksel yöntemler ve sondajlardın optimal aralıkları, rezerv hesaplarının kesinlik dereceleri ile tenör dağılımları, izotropi, anizotropi ve tabakalanma gibi özellikler ayrıntılı incelenebilmektedir. Mühendislikte kullanılan bu yöntemler yanında, sıkça bağıntı (korelasyon), bağınım (regresyon), cluster, faktör ve diskriminant analiz yöntemleri de kullanılmaktadır. Tüm yöntemlerin temeli analizlere dayanmaktadır. Bir örneklemin güvenirliği içerdiği gözlem veya veri sayısına bağlıdır. Ancak çok farklı yöntemleri bulunan örnek alma başlı başına bir konudur (sistematik ve rastlantısal örnek alma gibi). En az veya en iyi örnek sayısı ve miktarı hakkında da objektif ilkeler ve yöntemler bulunmamaktadır. En az gözlem sayısı amaca göre değişir (normalde n > 20). Bu nedenle ilgili özel kaynaklara başvurmakta yarar vardır. Analizler sonucu elde edilen verilerin amaca uygun ve doğru olarak değerlendirilmeleri şarttır. Bunun için, a) Veri çeşidinin seçilen değerlendirme yöntemine uygun olması, b) Bağıntıların ortaya çıkarılabilmesi için yeterli ve uygun örneğin alınması, c) Eksik veya gereksiz verinin toplanmaması ve d) İstatistiksel homojenliğin korunması esastır. Çoğu kez aynı maddeden birçok özellik araştırılır. Bunları mümkün olduğu kadar azaltmak gerekir. Bunu yaparken özellikler arası bağıntıların bozulmamasına veya ona göre inceleme yöntemi seçilmesine dikkat edilmelidir. Bu amaçla oranlar, tanımlayıcı katsayılar v.s. alınmalıdır. Veriler matematiksel işlemlere tabi tutulabilmeleri için listelerde derlenir. Bunlara şema, grafik ve diyagramlarla yeni veriler eklenebilir. 1.4 Sıklık dağılımı Sıklık dağılımı bir örneklemin dağılım şeklidir ve sadece bir veri grubunun veya örneklemin özelliklerini inceleyen yöntemdir. Varılan sonuçlar teorik esaslara göre yorumlanarak çözümler aranır. Sıklık dağılımının başlıca araştırma sonuçları normal, logaritmik ve binom dağılımı ile bunların ortalama değer, standart sapma v.s. parametreleridir. Aynı koşullar altında n kez yinelenen bir deneyde meydana gelen A olay sayısına A’nın H (A) H ( A) mutlak sıklık dağılımı, bunun oranına da A’nın h(A) göreceli sıklık dağılımı denir. n Görüldüğü gibi sıklık dağılımı klasik olasılık tanımına benzemektedir: Çünkü h(A) artan n ile P(A) olasılığına yaklaşmaktadır. Büyük sapmaların meydana gelme olasılığı giderek azalır (büyük sayı teorisi). Bir zar atmada atılan göz sayısı rastlantısal x1 büyüklüğünü ifade ederken para atmada olası yazı (y) veya tura (t) sayılarının rastlantısal büyüklüğü x2’dir. Örneğin,12 kez zar atmada elde edilen sayılar {1, 2, 6, 2, 5, 4, 5, 4, 2, 3, 2, 5} ise, bunların dağılımına sıklık dağılımı denir. Buna ilişkin dağılım fonksiyonuna da olasılık veya dağılım fonksiyonu denir. Uygulamada her zar yüzünün gelen rastlantısal değeri bir dikdörtgen ile birbirini örtmeyecek şekilde apsis üzerinde gösterilir. Sınıf sayısının bulunması için birçok yöntem bulunmaktadır. Ancak burada her zar yüzü doğrudan 1’den 6’ya kadar gelebilecek sayıların bir sınıfını temsil etmektedir. Bu nedenle zar atma iyi bir örnektir. Sıklık dağılımları aynı zamanda bir sunum Prof. Dr. H. Çelebi 8 veya gösterim şeklidir. Çizelge 1.1 ile Şekil 1.1 buradaki zar atmanın sıklık dağılımını göstermektedir. Çizelge 1.1. 12 kez atılan bir zarın gelen yüzlerinin sıklık dağılımı (her zar yüzü bir sınıftır [= xi]). Zar yüzü Sıklık dağılımı (h (A)/n) Listeler H(A) Çizgi Sayısal Göreceli Göreceli birikimli Mutlak birikimli 1 2 3 4 5 6 / //// / // /// / 1 4 1 2 3 1 0,0833 0,3333 0,0833 0,1667 0,2500 0,0833 0,0833 0,4167 0,5000 0,6667 0,9167 1,0000 1 5 6 8 11 12 8,33 41,67 50,00 66,67 91,67 100,00 12 1,0000 1,0000 12 100,00 n= 12 Gelen zar yüzünün oranı, % 30 20 10 0 1 a 2 3 4 % Birikimli Birkimli soklık dağılım Sıklık dağılımı Gelen zar yüzünün oranı, % . xi 5 6 100 75 50 25 0 1 Zarın gelen yüzü b 2 3 4 5 6 Zarın gelen yüzü Şekil 1.1: Atılan bir zarın gelen yüzlerinin sıklık dağılımı (sütun diyagram, histogram). 1.5 Olasılık Yukarıda verilen zar atma örneği para atma (yazı/tura) örneği ile değiştirilebilir. İki oyun arasındaki fark sadece olasılıkların azalmasıdır. Para atmada iki seçenek varken, zar atmada bu seçenekler zarın 6 yüzünden dolayı altıya çıkmaktadır. Bu nedenle zarda bir yüzün gelme olasılığı 1:6, para atmada ise 1:2’dir. Bu iki oyunla olasılık kavramı kısmen açıklanmaktadır. Burada olasılık tanımından amaç, olasılığı bir norma bağlamaktır. 8 9 Jeolojide matematik ve statistiksel yöntemler Doğa yasalarına uyan olaylara determinist (belirlenimci), hiçbir kurala uymayan olaylara da kaotik olaylar denir. İstatistikte rastlantısal (stokastik) olaylar incelenir. Rastlantısal olaylar için her zaman, lim P(O) = c n = sabit 1.1 eşitliği geçerlidir. Yinelenen bir deneyde, örneğin para atmada, n atış sayısı arttıkça sonuç sabit bir c değerine yaklaşır. Bununla ilgili teoriye büyük sayı teorisi denir. Yazı y ve tura t ise, n yaklaştığında, H(y) = H(t) = 0,5 1.2 olduğu görülür. Örneğin, 1. atışta yazı geldiğinde, y=1/2, 2. atışta tura geldiğinde, t=1/2, 3. atışta yazı veya tura geldiğinde, y veya t=1/2.1/2=1/4 v. s. olur. Bu, uygulamada lim P(O) = c 1.3 n olarak sınırlanabilir demektir. Olasılık, P(O) = O/Ω Gözlenen olaylar = Olası olaylarin toplamı 1.4 olarak tanımlanır (O, olay; Ω, olay evreni). Bir değerin [α, β] aralığına düşme olasılığı (Şekil 1.2a, beklenen sıklık dağılımı = alan ), β P{O| α } = P(α≤x≤β) 1.5 β = ∫ f(x)dx α = F(β) – F(α) şeklinde ifade edilir. Buna, yukarıda da belirtildiği gibi, normal dağılım denir ve entegrali alındığında, +∞ ∫ f(x)dx =1 1.6 -∞ olduğu görülür. Bunun gibi, F(g)max = 1 1.7 Prof. Dr. H. Çelebi 10 de bir normal dağılımdır. Ancak bu önceki dağılımın bir birikimli (kümülatif) dağılımıdır ve f(x) = F́ (g) şekli ile normlanmıştır (Şekil 1.2b). Normal dağılım, sonlu, eşit olasılıklara sahip özellikleri içeren ve istatistiksel dağılım koşullarını sağlıyan bir dağılımdır. En sık rastlanır. f(x) a F(g) b 50 F(g) = dağılım fonksiyonu f(x) = olasılık fonksiyonu x g f(x) = F́ (g) Şekil 1.2. Olasılık tanımı. a, sıklık dağılımı, b, birikimli sıklık dağılımı. x ve g argümanları farklıdır. x, sürekli özellik koordinatlarını (sınıf ortalarını), g ise, sınıf üst sınırlarını (özellik üst sınır değerlerini) gösterir (bak Şekil 1.1; a’da olasılık alan şeklinde gösterilmiştir). Olasılık, P(O) = % 100 veya 1/1 olabilir ve mümkün veya olasıdır. Ancak P(O) = 0, yani 0/1, olması mümkün değildir. Çünkü olasılık, 0<P(O)<1 arasında yer alır (istatistiksel olasılık). Buna hafif bir yağmurun 2 taştan birine 1 damlasının zamanla düşmesi (bireysel olay) örnek verilebilir. Buna karşın yoğun yağmur damlası kesinlikle hemen çarpar (kolektif olay). Örnek 1.1: 1 zarla 1 defada, a) 6, b) 5 veya 6 atma olasılığının hesaplanması: Çözüm: a) P(O1) = 1:6 ≈ % 17 ve b) P(O2) = (1:6)+(1:6) = 2/6 = 0,33 = % 33 bulunur (bağımsız olaylar, ancak biri diğerini dışlar). 10 11 Jeolojide matematik ve statistiksel yöntemler Örnek 1.2: 2 zarla 1 atışta düşeş atma olasılığının hesaplanması: Çözüm: P(x1)=1/6 ve P(x2) = (1/6)’dan, P(x1, x2) = (1/6).(1/6) (çarpım yasası) = (1/6)2 =1/36 = 0,02778 = % 2,78 elde edilir. Deney, zarların arka arkaya atılması ile, 2 kısma ayrılır. Örnek 1.3: 2 zarla 1 atışta her birinde 4 veya 2 atma olasılığının hesaplanması: Çözüm: P(O1): 1. zar P(O2): 2. zar. P(O)=0 olanaksız. P(O1)=1, P(O2)=1 → 1 1 P(O)= . 6 6 1 36 P(O1)=1, P(O2)=2 ve davamı sonucu, 1 1 1 1 . . 6 6 6 6 1 1 = 36 36 2 = 36 1 = 18 P(O)= =0,0555 Prof. Dr. H. Çelebi 12 = % 5,55 sonucuna varılır. Örnek 1.4: Bir zarla 1 defada 3’e bölünebilen bir çift sayıyı atma olasılığı. Çözüm: P(O) = 3/6.2/6 = 6/36 = 1/6 = % 17 bulunur. Bu durumda olayların bağımsızlığı verildiğinden, birbirlerini dışlamıyor ve 3/6 ile 2/6 da olasılık teorisine uygundur. 1 4 2 5 3| 6| 3’e bölünebilen sayılar Alıştırma 1.1: 2 zarla 5, 6 veya 7 atma olasılığını hesaplayınız. Yanıt: P(O) = 15/36 ≈ % 42. 12’nin nasıl 1/36 ettiğini düşünün. Alıştırma 1.2: Bir iş yerinde çalışan 25 kişinin doğum günleri aşağıdaki şekilde aylara dağılmış bulunmaktadır. Sıklık dağılımını çizerek irdeleyiniz. Aylar 1 Doğum günü s. 2 2 3 3 2 4 4 5 1 6 3 7 0 8 1 9 1 10 4 11 2 Kaynakça 1. Barsch, H. ve Billwitz, K., 1990: Geowissenschaftliche Arbeitsmethoden. Verl. Harri Deutsch, 256 s., Thun ve Frankfurt am Main. 2. Reinhardt, F. ve Heinrich, S., 1994: dtv-Atlas zur Mathematik. Cilt 1 ve 2., dtv Verlag, 498 s., München. 3. Wessel, P., 2001: Geological data analysis. www.higp.hawaii.edu./cecily/courses, 325 s. 12 12 2 13 Jeolojide matematik ve statistiksel yöntemler 2 TEK BOYUTLU DAĞILIMLARIN TANIMLANMASI 2. 1 Giriş Bir örnek dizisi ancak yeteri kadar kapsamlı ve kesinlikle tanımlandıktan sonra istatistiksel verilerin ait olduğu örneklem özellikleri ve gelecekte beklenen olasılıklar hakkında bir düşünce yürütülebilir. Tek boyutlu dağılım demek, tek bir değişkenle tanımlanan ana kitle/ popülasyon demektir. Bu ana kitledeki parametrelerin kesinlik derecesi ve birimlerinin aynı olması istenir. Örnek çeşidi olaylara bağlıdır. Genelde f(x, y) ve f(t) şeklinde ifade edilirler. Alınmış ve alınacak örnekleri ayırmak lazım. Alınacak örnekler açıklık kazanacak, benzeştirilebilir (simüle edilebilir) ve hazırlanabilir olmalıdır. Örnek tanımlanması, verilerin değişken ve etken şeklinde özetlenmesi demektir. Bunun için: 1. Ortalama ve en sık değer, 2. Saçınım, sapma değerleri (değişkeler), 3. Sıklık oranları (kısımları, yüzdelikler), 4. Dağılım şekillerini gösteren değişkenler (simetri, yassılık) 5. Eğilim/eğim yön, gösteren değişkenler ve 6. Dağılım fonksiyonları, uyum ve sınıflandırma bakımından örnekler karşılaştırılmalı ve incelenmelidir. 2.2 Merkezi değerler Bir veri dizisinde bulunan parametrelerin bazıları bu dizinin orta kısımlarında yer alırlar ve merkezi değer* olarak anılırlar. Bir örneklemin merkezi değerleri, ortalama değer, tepe değeri (modal değer) ve ortancadır (medyan). 1. konuda tanımlanan kavramlar bu ve bundan sonraki konuda veri kümelerinin parametrelerinin ve sıklık dağılımlarının tanımlanmasında kullanılacaklar. Veriler çizelge, şema ve diyagram şeklinde düzenlenerek çeşitli ölçü sayıları bulunur (bak. Çizelge 2.1). 2.2.1 Ortalama değerler Bir rastlantısal veri hem dağılım fonksiyonu, hem de sıklık dağılımı ile kesinlikle tanımlanır. Ancak istatistikte rastlantısal bir büyüklüğü yeteri kesinlikle tanımlayan bazı parametrelerle de yetinilir. Bu değerlerin en önemlisi istatistikte en çok kullanılan beklenti değeri veya ortalama değerdir. Ortalama değer, rastlantısal saklı x değerlerinin, _____________ * Merkezi değer demek, ortalama değeri x 0 olan değer demektir. Bir transformasyon yoluyla, örneğin, x1, ...,xn değerleri, yi = xi- x (i = 1,..,n) şeklinde merkezileştirilirler. Bu arada değişke σ 2 değişmez. Merkezileştirilmiş ve standart sapması s = 1 olan veriler standardize edilmiş demektir. Standardizasyon ui = xi x (i = 1,...,n) gibi bir transformasyonla mümkündür (Standardize veriler birimlere bağlı değil. Dolayısı s ile değişik birimli verilerin matematiksel işlenmesi mümkün olur. Prof. Dr. H. Çelebi 14 x P( x ) i i 2.1 i sonlu veya sonsuz i üzerinden toplamı veya, xf ( x)dx 2.2 fonksiyonunun değeridir ( f , sıklık fonksiyonudur). Çok çeşitli olan ortalama değerlerin en yaygın kullanılanları aşağıya çıkarılmıştır. A) Aritmetik ortalama ( x ) Aritmetik ortalama verilerin, çan eğrisinin altında kalan alanın ağırlık merkezini oluşturur. Gauss çan eğrisi için önemli olan aritmetik ortalama değeridir. Bu, bir örnekleme ait değerlerin toplamının örnek sayısına bölümü ile elde edinilir. Çizelge 2. 1: Isı ölçümleri (˚C, Antalya, Temmuz/2004). Ölçüm Ölçüm değerleri Ortalama sapma Sapmanın karesi Sabit değer farkı numarası xi |xi- x | (xi- x )2 (xi-D, D=33) 1 34 0,429 0,184 1 2 36 1,571 2,468 3 3 40 5,571 31,04 7 4 35 0,571 0,326 2 5 33 1,429 2,042 0 6 32 2,429 5,900 -1 7 31 3,429 11,758 -2 Σ n=7 241 15,429 53, 714 10 a) Sınıflandırılmamış verilerin aritmetik ortalama değeri x , x= = 1 n n x i 1 i 1 (x1+x2+...+xn) n 2.3 2.4 şeklinde tanımlanmaktadır. xi, veri veya özelliktir (i =1,2,..., n). Toplam i üzerinden n’ye kadar sürer. Buna göre Çizelge 2.1’deki ölçümlerin aritmetik ortalaması x , x = 1 .241 7 14 15 Jeolojide matematik ve statistiksel yöntemler = 34,429 ˚C bulunur. b) Sınıflandırılmış verilerin aritmetik ortalama değeri için, n fx x= i 1 n i f i 1 i 2.5 i formülü kullanılır. Burada n, sınıf (frekans, aralık) sayısı, fi, i sınıfına düşen veri sayısı ve xi, sınıf orta noktasıdır (Çizelge 2.2). Çizelge 2.2. Çizelge 2.1’deki verilerin sınıflandırılması (bak. 2.3.1 d, Sturge Kuralı). Sınıf aralığı, Sınıf ortası frekans f (˚C) xi 31,00-33,39 33,40-35,79 35,80-38,19 38,20-40,59 Σ n= Örnek sayısı 32,20 34,60 37,00 39,40 5 Sınıf ort. x örnek s. Birikimli toplam, % fi xi.fi ∑fi 3 2 1 1 7 96,60 69,20 37,00 39,40 242,20 3 5 6 7 ∑(xi.fi .100/∑xi.fi) 39,88 68,45 83,73 100,00 Örnek 2.1: Çizelge 2.2‘deki sınıflandırılmış değerlerin ortalaması x , x = 1 7 n (x . f ) i 1 i i 1 .242,20 7 = 34,600 ˚C = bulunur (değerlerin kısaltılması nedeniyle sonuç az yüksek çıkmıştır). c) Sabit bir değer yardımı ile hesaplama. Burada x , 1 n 2.6 ( D) n i 1 xi şeklinde ifade edilir. (D, gelişigüzel bir değerdir). D = 33 ˚C alındığında, yukarıdaki çizelgeye göre x , x=D+ Prof. Dr. H. Çelebi 16 10 7 = 33+1,429 = 34,429 ˚C x = 33+ bulunur (Çizelge 2.1). Aritmetik ortalama çok kullanışlıdır, analiz değerlerinin irdelenmesinde en sık kullanılan parametredir. İrdelemeden kabul etmek doğru değildir. Örneğin, uç değerlerden çok etkilenir. En önemli üstünlükleri, 1. Kolay hesaplanması, 2. Tüm değerleri kapsaması ve 3. Başka değerlere, örneğin, ağırlıklı ortalamaya, çevrilmesinin kolay olmasıdır. Aritmetik ortalamanın sakıncaları, 1. En büyük ve en küçük değerlerin çok etkilemesi, 2. Gerçek bir değerin bulunmadığı bir noktada bir değer verebilmesi ve 3. Metrik sistemin şart olması. Diğer ortalama değer çeşitleri aşağıda kısaca tanıtılmıştır: B) Ağırlıklı ortalama değeri (xa) Çeşitli hesaplamalarda süre ve mesafe gibi etkenlerin önemini de hesaplamalara katmak için ağırlıklı ortalama değeri hesaplanır. Örneğin, yer ve çevre bilimlerinde örnek değerleri, örneğin derişimler, örneklerin arasındaki mesafe ile çarpılır, toplanır ve toplam mesafeye bölünür. Bu ortalama değerle, uç değerlerin, örneğin kalınlıkların da hesaplamada etkin olması ile, aritmetik ortalamaya oranla etkisi azaltılmış oluyor ve daha gerçekçi bir değer elde edilmiş olur. n m x Ağırlıklı ortalama xa = i 1 n m i 1 formülü ile hesaplanır. n m i 1 i i i 2.7 i = 1 durumunda sadece genel formül geçerlidir. Burada i, örnek sayısı (i=1, 2,...,n), mi, örnekler arasındaki mesafe, tenör veya zaman gibi bir faktördür ve xi’ye veya mesafeye göre değişen değerler alır. xi, ölçüm değerlerini gösterir. Ağırlıklı ortalamaya en iyi örnek, ara ve bitirme sınavı notlarının farklı ağırlıkla (örneğin, % 40 ve % 60) geçme notuna katılmasıdır. Örnek 2.2: 16 17 Jeolojide matematik ve statistiksel yöntemler Bir sondajdaki ağırlıklı P2O5 değerinin hesaplanması (SP-9, Pınarbaşı/Adıyaman). Çizelge 2.3: Verilerin düzenlenmesi (Örnek 2.2) Derinlik, m 29,35-33,60 33,60-35,35 35,35-37,05 Σ n=3 Ölçüm xi, % 1,78 2,35 1,62 5,75 Mesafe, mi 4,25 1,75 1,70 7,70 Faktör, fi xi. mi 0,55 (4,25/7,70) 7,57 0,23 4,11 0,22 2,75 1,00 14,43 xi.fi 0,98 0,54 0,36 1,88 Buna göre, x a= 1,78.4,25 2,35.1,75 1,62.1,70 4,25 1,75 1,70 14,43 1,88 (≈ ) 7,70 1,00 = % 1,87 P2O5 = bulunur. Bu değerlerin aritmetik ortalaması esasında, x = 5,75/3 = % 1,92 P2O5 çıkmaktadır. Aradaki % 0,05’lik fark burada önemli değildir. Ancak altın veya gümüş gibi değerleri hammaddeler için çok önemlidir ((1,92-1,87).100/1,92= % 2,60’lık bir fark eder). C) Geometrik ortalama (xg) Bunlardan başka mühendislik bilimlerinde yaygın bir şekilde kullanılan geometrik ortalama bulunmaktadır. Bu ortalama değer öncelikle log dağılımlarında kullanılır. Burada değer çarpımının çarpılan tüm değerlerin sayısına eşit dereceden kökü alınır. Yani, xg = n .x i 2.8 n x1.x2 ...xn şeklinde bulunur (n, örnek sayısı; Π, büyük pi = çarpım). xg, aritmetik ortalamadan küçüktür. Geometrik ortalamanın üstünlükleri, a) Tüm değerlerin kullanılması, b) Çok açıktır ve Prof. Dr. H. Çelebi 18 c) Uç değerlerin etkisini azaltır. Buna karşın sakıncaları, a) Bir değerin dizide sıfır olması durumunda kullanılamaması ve b) Elde edilen değerin dizide bulunmayan bir yere karşılık gelmesidir. Örnek 2.3: Ölçülen çeşitli deneylerdeki yoğunluk ortalaması. Ölçüm numarası Yoğunluk (g/cm3) 1 5,41 2 5,63 3 5,35 4 5,70 5 . 5,58 verileri verilmiş ise, geometrik ortalama, xg = n x1 .x2 ...xn = 5 5,41.5,63.5,35.5,70.5,58 = 5182,85 1 / 5 = 5,53 g/cm3 sonucuna varılır. Geometrik ortalama hesaplamada kök yerine logaritma alınması, çok veri çarpımının kökünü alma işlemindeki zorluktan kaynaklanır. Bu nedenle kök alma yerine logaritma alınır. Örneğin, 1 log( x1 x2 ... xn ) n 1 = (log x1 log x2 ... log xn ) n log xg = 2.9 logaritma kuralına göre logaritmaları alınan değer toplamının anti logaritması alınarak geometrik ortalama bulunur. Örnek 2.3’teki değerlerin log toplamı 3,69, örnek sayısı da 5 olduğuna göre, xg = antilog (3,715/5) = antilog 0,743 =100,743 = 5,53 bulunur. D) Harmonik ortalama (xh) 18 19 Jeolojide matematik ve statistiksel yöntemler Özellikle doğa bilimlerinde, örneğin fizikte, kullanılan bir ortalama değer de harmonik değerdir. Ölçüm değerlerinin tersi (1/a) aritmetik ortalamasının tersi olarak hesaplanır ve 1 1 n 1 x h n i 1 x i 2.10 şeklinde formüle edilir. Burada da geometrik ortalamada olduğu gibi değerlerin hepsinin sıfırdan büyük olması gerekir. Harmonik ortalama öncelikle zaman oranlarının (hız, yol ve zaman) ortalamasının hesaplanmasında kullanılır. Örnek. 2.4: 80 soruluk test sınavında 60 soruya 50, 20 soruya da 30 dakikada yanıt veren bir öğrencinin yanıt başına ortalama yanıt süresinin bulunması. Sınav başında ortalama olarak her soruya 1 dakika süre verilmiştir. Ancak öğrenci sınavın ilk 50 dakikasında soru başına 50/60 = 5/6 dakika, geri kalan 20 dakikasında da 30/20 = 3/2 dakika kullanmıştır. Buna göre harmonik ortalama, 1 n 1 1/xh= 2 i 1 xi =1/2(5/6+3/2) =1/2(5/6+9/6) =1/2.14/6 =14/12 =7/6 =1,17 min. elde edilir (1/2, sorunun 2 etaptan oluşmasından gelir). Alıştırma 2.1: Verilen {4-5-8-7-11-4-3}dizisinin harmonik ortalamasını bulunuz. Yanıt: xh=5,03 E) Değişim aralığı ortası (Ro, uç değer ortası): Bu ortalama değerlere ek olara değişim aralığı ortası da bir ortalama değer olarak görülürler. Yayılım aralığı R (range), R = xmax-xmin 2.11 formülü ile tanımlanır. Bunun ortalaması veya ortası Ro, Ro = x max x min 2 2.12 Prof. Dr. H. Çelebi 20 formülü ile bulunur ve yayılım alanın ortasını verir. Bu aralık frekans veya sınıf sayısının bulunmasında kullanılır (Sturge Kuralı* ve Örnek 2.6). 2.2.2. Ortanca (xo, medyan,) Ortanca, bir diziyi ortalıyan veya çan eğrisinin altındaki alanı eşit iki kısma ayıran değerdir. Örneklemdeki değerlerin yarısı ortancadan küçük, yarısı da büyüktür. Matematiksel olarak ortanca xo, xo xo = f ( x)dx 2.13 F ( x) xo F ( xo ) F () xo 0 = 0,5 veya xo= f ( x)dx xo xo = f (x ) i i 1 2.14 = 0,5 olarak tanımlanmaktadır (Schönwiese, 1992 ve Arıcı, 2001). Bu değer toplam için ortanca = F(0,5) = % 50 anlamına gelir. Bu da tek sayılı dizilerde orta değere, çift sayılı dizilerde ise, xo = xn/2 +1 2.15 şeklinde belirlenmektedir (xn/2, ilk yarının son değeridir). Dolayısı ile çift sayılarda ortanca, ikinci yarının ilk değeri olur. Örnek 2.5: Bir akarsuyun debi değerleri (m3/s, Peri Suyu, Tunceli): Sıra no. 1 2 3 4 5 6 7 Ölçümler: 32,20 39,10 47,40 103,20 157,30 207,90 270,40 Büyüklük sırasına göre dizilen Örnek 2.5’teki değerlerin 4. değeri, yani 103,20, veri dizisinin tam ortasına düşmektedir. Burada ortanca 103,20’dir. Ortanca çarpık dağılımlar için ortalama değere göre daha uygundur ve az örnek sayısı için de önemlidir. Metrik ve sıralama ölçü birimleri de kullanılabilir ve aşırı değerlerden çok etkilenir. 20 21 Jeolojide matematik ve statistiksel yöntemler Ortancanın üstünlükleri, a) b) c) d) Hesap yapmadan bulunabilmesi Gerçek bir değeri temsil etmesi, Uc değerleri dışlaması ve Başka benzer büyüklükler yerine kullanılmamasıdır. Buna karşın, a) Bazen zor saptanabilmesi ve b) Çevirmelere uygun olmayışı gibi sakıncaları bulunmaktadır. f(x) = Frekans f (örnek/aralık) F1 = a F2 F F 1 b 2 x x xo xt c Aralık, % xt d α α xt<xo< x x <xo<xt Şekil 2.1. Çan eğrisi ve merkezi parametrelerinin dağılıma göre konumları: a, Çan eğrisi ve ortalama değer x , ortanca xo ve tepe değeri xt’nin bir normal dağılımda çakışması. F1 ve F2 ortanca tarafından 2’ye bölünen alanın eşit parçalarıdır. b, Histogram, eğrinin yerleşimi ve ortanca xo. c, Sağa çarpık (sağ asimetrik) dağılımda tepe değeriortanca-ortalama değerin konumu ve d, Sola çarpık (sağ asimetrik) dağılımda tepe değeri-ortanca-ortalama değerin konumu. α, teğet-absis açısı. tg α > 0: düşük değer dağılım tipi (c) ve tg α < 0, yüksek değer dağılım tipi (d) dağılım grafikleri. 2.2.3 Tepe değer (xt, mod) Prof. Dr. H. Çelebi 22 Tepe değeri veya modal değer, dağılım fonksiyonunun sahip olduğu en yüksek frekans değeridir. Yani en çok örneğin bulunduğu, başka hiçbir sınıf tarafından aşılamayan sınıftır. Teorik olarak xt, xt (mod) = f(x)max 2.16 olarak tanımlanmaktadır. Bir normal dağılımda, simetriden dolayı, tepe değeri (xt) = ortalama değer ( x ) = Ortancadır (xo) 2.17 bağıntısı mevcuttur. Bu durumda eğri altındaki alan ortanca tarafından 2 eşit parçaya yarılır (F1 = F2, Şekil 2.1.). Sağa kayan (kuyruk sağda) veya pozitif eğimli (tg α >0) dağılımlarda ortalama değer, ortanca ve tepe değerinden büyüktür (xt < xo < x ), sola kayan (kuyruk solda) veya negatif eğimli (tg α < 0) dağılımlarda ise, ortanca ve tepe değer’den küçüktür ( x < xo<xt). 1. durumun zayıf değerlerin dağılıma hakim olduğu anlamına gelir. Buna bir toplumdaki genç nüfusun çoğunlukta olması örnek verilebilir. 2. durumda ise, yaşlı nüfusun etkin olduğu anlaşılır. Bu özellik, yerbilimlerinde örneğin, maden yataklarının oluşmasını sağlar ve yüksek değerlerin hakim olduğu bir dağılımı yansıtır (zengin cevher tipi). Çevre bilimlerinde bu, örneğin, aşırı kirliliği veya bir etkenin ortalamanın üstünde artışını gösterir. Şekil 2.1 c-d çarpıklık ve eğri-teğet ilişkisini göstermektedir. Birçok tepelikli dağılımlarda, 1., 2. ve 3. tepe değeri diye sıralanır. Çok tepelikli dağılıma Şekil 1 örnek verilebilir. Çizelge 2.2’deki en yüksek frekans değeri, yani tepe değeri, 3’tür ve 3.100:7= % 45,86’ya karşılık gelir. Dağılımda bu değerden daha yüksek değer bulunmamaktadır. Bu aralıklara düşen değerler gibi bir dizide yinelenen değer tepe değerini oluşturur. Bu değerlerin hepsi de gözlem sayısına bağlıdır. Ne kadar çok gözlem kapsama alınırsa, o kadar güvenilir ve gözlem kümesi için o kadar tanımlayıcı olurlar. Tepe değerinin Üstünlükleri, a) 2 veya daha çok tepelikli dağılım için de önemlidir, b) Uç değerlerden etkilenmez, c) Her ölçü birimi için kullanılabilir. Sakıncası ise, her zaman kesin ölçülememesidir. 2.3 Değişkenlik ölçüleri Verilerin istatistiksel tanımlanmasında sadece ortalama değerler yeterli olmamaktadır. Ortalama değerlerle elde edilen sonuçların yanılma oranları yüksek olur. Örneğin, bir kiracı ev sahibinin verdiği 1,40 m’lik çocuklarının yüzdüğü havuzun ortalama derinliğine ne kadar inanır? Bu gibi durumlar için ortalama değerler tarafından kapsanmayan parametreleri de incelemek gerekir. Yani bir veri kümesi veya anakütle, çeşitli dağılım parametreleriyle de tanımlanabilir. Bu parametreler öncelikle aşağıda tanıtılan değişim aralığı, standart sapma, değişke (varyans) ve momentlerdir. 22 23 Jeolojide matematik ve statistiksel yöntemler 2.3.1 Değişim aralığı (R) Bir veri kümesindeki veya popülasyondaki en yüksek ve en düşük değerlerinin arasındaki fark, değişim veya yayılım aralığı R, R = xmax - xmin 2.18 ile tanımlanarak belirtilir. Burada sadece 2 değer, en düşük ve en yüksek değer, hesaba katılmak-tadır. Dolayısı ile uç değerlerin bulunması durumunda sonuç yanıltıcı olabilmektedir. Örneğin, bir kayaç veya bir mineral çeşidinin içerdiği bir elementin, bu uç değerleri arasındaki farkı değişik olabilir. Ana elementlerde bu fark nispeten küçüktür (homojen dağılım). İz elementlerde ise, büyük olabilmektedir (heterojen dağılım). Uc değerlere göre çan eğrisinin değişimini Şekil 2.2 göstermektedir. Örneğin, yukarıdaki debi ölçümleri için değişim aralığı, R = 270,40-32,20 = 238,20 m3/s’dir. Sadece metrik ölçü birimlerinde yararlanılan değişim aralığının hesaplanması kolaydır ve verilerin dağınıklığı hakkında bilgi verir. Sadece 2 değerden hesaplandığından, içerikle ilgili yorum yapılamaz. Ancak değişim aralığı R, sıklık dağılımının oluşturulması ve incelenmesi için çok önemlidir. Çünkü dağılım R tarafından sınırlanır. Bu neden burada R üzerinde durmakta yarar vardır: Sıklık dağılımlarında bir örneklemin bir özelliği incelenir. Bunun için özelliklerden oluşan verilerin düzenlenip sıkıştırılması gerekir. Böylece dağılımın gözlenmesi ve başka verilerle karşılaştırılması için iyi bir temel sağlanmış olur. Sonuç grafik olarak gösterilir (Bak. Şekil 2.5) Bir sıklık dağılımında sınıflama, sıralama ve metrik sayılar kullanılabilmektedir. Eşit koşullar altında n kez yinelenen bir deneyde rastlanan i olay sayısına i’nin mutlak sıklığı denir ve burada fi ile gösterilir. fi/n = hi de i’nın göreceli sıklığıdır. Bu, P(O) olasılık tanımı ile uyumludur. n arttıkça, göreceli sıklıktaki büyük sapmalar olanaksızlaşmaktadır (büyük sayı teorisi). Sıklık dağılımını oluşturmak için: Sayılar büyüklük sırasına göre dizilir (x1 < x2...<xk). Dizi her eşit i aralığı için fi özellik değer sınıflarına ayrılır (fi, mutlak sıklık). Buradan hi = fi:n ile göreceli sıklık dağılımı değerleri hesaplanır (n, toplam örnek sayısı). Sonuçlar bir x-y koordinat sisteminin absisinde özelliklerin aralıkları (xi = eşit aralıklar), ordinatında da bunların göreceli sıklıkları (hi=f=hi:i) gösterilerek çizim tamamlanır (bak. aşağıdaki Örnek 2.6 ve Şekil 2.5). Çan eğrisinin veya sıklık dağılımının uygulanması ve çizimi için çeşitli yöntemler bulunmaktadır. Yöntemlerin hepsinin ortak özelliği, verilerin bilgi kaybı yaratmadan, kolay çizim için sınıflara ayrılmasıdır. Bunun için örneğin, sınıf sayısının örnek sayısına göre değişmesi ve örnek sayısının a) b) c) d) Prof. Dr. H. Çelebi 24 kare kökünden az olması istenir. Bu sınıfların 10’dan fazla olmaması tavsiye edilir. Ancak 8 ve 19 sınıfın en iyi olduğu da belirtilmektedir (Perillo ve Marone, 1986). Aralık (sınıf üst sınır aralıkları) veya frekanslar eşit aralıklar olabileceği gibi, örneğin, s, veya √n gibi, artan veya azalan aralık olarak da alınabilmektedir. Frekans hesaplamada en sık uygulanan Sturge Kuralı log esasına dayanmaktadır (bak. Örnek 2.6). Buna göre sınıf sayısı k, k = 1+log n/log 2 =1+3,32.log n 2.19 eşitliği ile bulunur. Aralıklar da R değişim aralığının k’ya bölünmesi ile, R= (xmax-xmin)/k 2.20 elde edilir. Buna göre sınıf üst sınırları sıralanır (x1 < x2 ....< xk gibi). Sınıf sınırları kesin olmalı ve sınıfa ait tüm verileri kapsamalıdır (xi-1< x <xi gibi). Enformasyon kaybı olmaksızın sınıflar birleştirilebilir veya bölünebilir (hi/3 yerine hi/5 gibi). Sınıf sınırları rasgele seçilemezler. Bunların özelliklerine ve dağılım şekillerine uymaları ve bir hesaplama ilkesine dayanması gerekir. Bunun için birkaç yöntem denenebilir ve en uygunu seçilir. Sınıf aralıkları tamamlanmış tam sayı olarak alınır. Dağılımın başlangıç noktası değişim aralığının başlangıç noktasıdır. Böylece en küçük değerin bulunduğu sınıf, grafiğin başlangıç noktası olur. Daha sade bir şekilde Stem-and-Leaf (sap ve yaprak) yöntemi ile de sıklık dağılımı yapılabilir. Burada sadece bir örnekle yetinilecektir. Bu amaçla Çizelge 2.4’teki Fe değerlerinin bu yöntemle sınıflandırılması ve sıklık dağılım grafiği aşağıda verilmiştir. Bu yöntemin en iyi yönü, hem ham verileri, hem de veri sınıflarını bir histogram şeklinde göstermesidir. % Fe 10 | 20 | 30 | 40 | Örnek sayısı/aralık 1 1 2 9 1 2 5 7 0 1 3 2.3.2 Standart sapma (s) Verilerin ortalama değer etrafında ne kadar yoğunlaştıklarını gösterir. geometrik olarak, standart sapma, aritmetik ortalama değerinin üstünde ve altında kalan veri sapmalarının ortalamasıdır. Bu nedenle bir (+), bir de (-) değeri bulunur. Şekil: 2.2b standart sapmayı geometrik olarak göstermektedir. 24 25 Jeolojide matematik ve statistiksel yöntemler %dB 80 a b dB +s 60 x -s 40 20 25 50 75 100 Ses şiddeti, dB 1 2 3 4 5 6 7 8 Ölçümler Şekil 2.2: Verilerin değişim aralıkları a ve standart sapmanın geometrik anlamı b. Ortalama mutlak sapmaya aynı zamanda standart sapma da denir. s ile gösterilir ve genel olarak, 1 n s= xi n 1 i 1 = 2 2.21 1 n ( xi x ) 2 n 1 i 1 n 2.22 n n xi2 ( xi ) 2 = i 1 i 1 n(n 1) 2.23 formülleri ile hesaplanır ( xi xi x ’dir). Ortalama değerle olan farkların toplamı 0 ettiğinden, kareleri alınır, toplanır ve karekökünün pozitif değeri standart sapma olarak kullanılır. Ortalama değer hesaplanmadan da standart sapma bulunabilir (bak. formül 2.21). 2.21’daki n yerine alınan n-1 teriminin sadece genel bir teorik anlamı vardır. Değerin anakütleye değil, örneklem’e ait olduğunu ifade eder ve serbestlik derecesi sayısını veriyor. Bu terim aslında Sınıflandırılmış verilerin standart sapması 2.21 eşitliğinin 2.5 eşitliği şekline benzetilmesi ile hesaplanabilir (bak. 2.5, xi = fi.xi ve n(n-1)=Σfi). Örnek sayısı arttıkça, n, n-1’e yaklaşır. Standart sapma s, n >1 ve s2 >0 durumları için bir anlam taşır.1 örnek için s2 = + ∞’dur (belirsiz). Sadece metrik ölçü birimlerinde kullanılan standart sapmadan, sonuçların yorumlanmasından nadiren yararlanılır. 2.3.3 Değişkenlik katsayısı (v) Standart sapmanın aritmetik ortalamanın yüzdesi olarak ifade edilmesine değişkenlik katsayısı denir. Göreceli standart sapma olarak da bilinen bu parametre, s v = .100 2.24 x Prof. Dr. H. Çelebi 26 olarak bilinir (%). Bu orana göre veriler, - düzenli (v < % 40), - düzensiz (% 40 < v < % 80) ve - çok düzensiz (v > % 80) olarak sınıflandırılırlar (Wilke, 1975). Özellikle yerbilimlerinde yaklaşık örnek sayısının, örneğin, milyon t rezerv başına, saptanmasında bu parametre önemli bir ölçüt olarak kabul edilir. Ayrıca dağılımların saçınım farkını saptamada, ortalama değere bağlı değişiminden (orantı etkeni=oransallık) normal ve log dağılımlarının ayırt edilmesinde yararlanılır. 2.3.4 Değişke (s2, σ2, varyans) Standart sapmanın karesine değişke (varyans) denir. s2 veya sıkça σ2 (sigma) ile gösterilir. Bir istatistiksel dağılımın esas parametresi değişkedir ve σ2 = ( x x ) 2 f ( x)dx 2.25 olarak tanımlanır (σ2, anakütlenin değişkesidir). Buradan bir örneklemin değişkesi, s2 = 1 n ( xi x ) 2 n 1 i 1 2.26 formülü ile hesaplanır. Verilerin ortalama değerden sapma derecesini, değişkenliğini, gösterir. Değişke, a = x için minimum değer alır (a, ortalama değerden farklı bir değerdir). Bu, saçınımların ortalama değer yakınında en az olduğunu gösterir. Değişke ile standart sapmanın istatistikte çok büyük önemi vardır. İstatistiksel hipotezlerin doğruluğunda ve testlerde kullanılırlar. Varyans, korelasyon ve regresyon analizi ile bunlara dayanan yüksek derecedeki istatistiksel değerlendirmelerde (örneğin, varyogram hesaplamalarında) vazgeçilmez bir ölçüttür. Ayrıca standart program yapımında temel teşkil ederler. Uygulamada varyansla standart sapmayı birbirinden ayırt etmek gerekir. Aralarındaki fark, değişkenin gözlemleri tüm, standart sapmanın ise, tek tek göstermesidir. Bu yüzden değişkede bazen Σxi toplam değerleri tüm örnek sayısına bölünürken, standart sapmada örnek sayısının 1 eksiğine bölünür. Bu nedenle σ’nın karekökü, standart sapmadan daima küçüktür. σ ve s değerleri bir güvenirlik derecesi içerirler. Bu da örneğin, t-student testi ile kontrol edilebilir. Değişke, kısımlarına ayrılabilir. Çünkü bir örneklemin varyansı, örneklemdeki grupların varyanslarının toplamına eşittir. Örneğin, s2 = I J K 1 ( xi2 x 2j ... xk2 ) n 1 i 1 j 1 k nk 26 2.27 27 Jeolojide matematik ve statistiksel yöntemler gibi. Bu özellikten, varyans analizinde ve jeoistatistikte yayılım değişkesi gibi çeşitli değişkelerin hesaplanmasında yararlanılır. 2.4 Momentler İstatistikte dağılımların çoğu simetrik değildir. Bazen değerler ortancanın sağında veya solunda yoğunlaşır (Şekil 2.1 c ve d). Bu dağılım özellikleri yukarıda açıklanan teğet açısı ve parametre sıralaması gibi yöntemler yanında 3. momentle, dağılımın standart çan eğrisinden yüksek veya basık (yassı) olduğu da 4. momentle saptanabilmektedir. Bir moment genel olarak 1 n ( xi ) k n i 1 mk = 2.28 denklemiyle ifade edilmektedir. Bir dağılımda 4 büyüklüğün, merkezi momentlerin*, yani ortalama değer ( x ), standart sapma (s), kayma (m3, kayma, çarpıklık) ve basıklığın (yassılık, m4) incelenmesi yararlı olur. 2.4.1 Kayma (g, çarpıklık, asimetri, ing. skewness) Bir normal dağılımda ortalama değer, ortanca ve tepe değerin eşit oldukları yukarıda belirtilmişti. Bu değerlerin karşılaştırılması ile ortalama değere göre kayma saptanabilir. Ancak kayma durumunda bunların oranı değişir. Kesin bir kayma değeri ancak 3. moment m3’ün hesaplanması ile elde edilebilir. Bu, m3 = n 1 n (x i 1 i x)3 2.29 olarak tanımlanmaktadır. Buradan kayma, standart sapmaya bölünerek standartlaştırılır. Yani, m3 s3 1 n x x 3 = ( i ) n i 1 s g= n (x = i 1 i x)3 n.s 3 2.30 eşitliği ile birimsiz hale getirilir. g = 0 için normal dağılım, g > 0 için pozitif ve g < 0 için de negatif eğimli bir dağılım mevcut demektir (Şekil 2.3). Kayma, esasında bir logaritmik dağılımın belirtisidir. Prof. Dr. H. Çelebi 28 g=0 g<0 g>0 Şekil: 2.3. Farklı kaymalara örnek dağılım çeşitleri. 2.4.2 Basıklık (e, yassılık veya sivrilik, ing. exess, kurtosis) Basıklık veya sivrilik tanımı için de 4. moment m4 (exess, kurtosis) kullanılır. Bu moment tepelik durumunu belirtmeye yarar ve 1 n m4 = ( x i x ) 4 2.31 n i 1 şeklinde tanımlanmaktadır. m Buradan basıklık, e = 44 3 s = 1 n xi x 4 ( s ) 3 n i 1 n (x = i 1 i x) 4 n.s 4 3 2.32 formülünden çıkarılır. Bir normal dağılımda e = 3’tür (eşitlikte 0 alınmıştır). Bu durumda normal çan eğrisinden basık olan dağılımlarda e < 0, sivri olanlarda ise, e > 0’dır (Şekil 2.4). Bu dağılımların ortalama değeri eşit, ancak standart sapmaları farklıdır. e>0 e=0 e<0 Şekil 2.4: Farklı basıklığa örnek dağılım çeşitleri. Standart sapmaları aynı olan bu dağılımların e < 0 olanlarına platokurtik, e > 0 olanlarına da leptokurtik denir. 28 29 Jeolojide matematik ve statistiksel yöntemler Basık dağılım, denelde granit gibi çeşitli minerallerden oluşan ve değişik derişimde örneğin element içeren kayaçların element dağılımında görülür. Sivri dağılım tiplerine ise, bunun tersine, örneğin, krom gibi sadece kromitte (FeO.Cr2O3), yani bir tek mineralde, derişen element dağılımlarında rastlanır. Logaritmik dağılımların incelenmesi, metrik değerlerin logaritması alınarak aynı yöntemlerle gerçekleştirilir. Örnek 2.6. Bir sondajdaki demir tenörünün (% Fe) sıklık dağılımı parametrelerinin hesaplan-ması ve dağılım grafiğinin çizilmesi (SP-5, Pınarbaşı/Adıyaman, Şekil 2.5). Çizelge 2.4: Verilerin düzenlenmesi (Örnek 2.6). Sıra No. Derinlik, m Mesafe, mi xi (% Fe) mi.xi xi - x (xi - x )2 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Σ n = 11 137,64 50,25 78,21 47,09 19,68 42,42 146,07 165,88 21,42 2,25 67,02 -9,34 8,65 11,91 9,41 87,24 -814,78 7.610,05 75,00 649,46 5.624,34 141,85 1.689,41 20.120,88 88,55 833,24 7.840,77 93,51 -904,23 8.743,91 14,52 55,31 210,72 2,99 -5,18 8,96 37,95 233,74 1.439,87 1,99 2,80 3,95 411,68 -8.353,07 169.483,80 0,14 -0,05 0,02 955,40 -6.613,35 228.621,22 40,60 46,80 48,05 49,85 50,20 51,10 52,30 57,20 61,60 62,25 62,45 6,20 1,25 1,80 1,15 0,90 1,20 4,90 4,40 0,65 0,20 2,15 24,80 22,20 40,20 43,45 40,95 21,87 35,35 29,81 37,70 32,95 11,25 31,17 346,90 777,93 -9,67 3,81 -1,73 6,16 1,41 -20,28 0,37 0,00 (xi - x )3 (xi - x )4 1. Parametrelerin bulunması 11 örnekten oluşan ve Çizelge 2.4’te düzenlenen örneklemin en küçük değeri % 11,25, en yüksek değeri de % 43,45 Fe’dir. Yinelenen değer bulunmadığından, tepe değeri saptanamamaktadır. Ancak % 32,95 Fe değeri ortancayı göstermektedir. Bu değer aritmetik ortalama yerine de kullanılabilir. xi- x ’nın mutlak değerlerinin ortalamasına mutlak sapma denir. 11 Aritmetik ortalama, x xi / n i 1 =346,90/11 = % 31,54 Fe Prof. Dr. H. Çelebi 30 n Ağırlıklı ortalama, m x xa = i 1 n i m i 1 i i 777,93 24,80 = % 31,37 Fe = Geometrik ortalama, xg = 11 22,20.40,20...31,17 = 1115940758615313011,23 = 28,72 Hem ağırlıklı, hem de geometrik ortalama değerleri aritmetik ortalamanın altında çıkmıştır. Dolayısı ile daha gerçekçi veya güvenli kabul edilecekler. n (x Standart sapma, i 1 s= = i x) 2 n 1 955,40 11 1 = 95,54 = ± % 9,77 Fe Buna göre aritmetik ortalama değeri x x s = 31,54 ± 9,77 aralığı için geçerlidir. Bu aralık, % 21,77<x<41,31 Fe şeklinde ifade edilir. n Değişke, σ2 = Kayma, g= (x i 1 i x) 2 n 1 955,40 = 11 1 = %2 95,54 Fe m3 s3 n (x = i 1 i x)3 n.s 3 30 31 Jeolojide matematik ve statistiksel yöntemler 6613,35 11.9,77 3 6613,35 = 11.932,57 = 6613,35 10258,32 = - 0,64 = Dağılım negatif eğimlidir (sola kayan, zengin cevher tipi). Basıklık, e= m4 3 s4 n (x i 1 = i x) 4 -3 n.s 4 228621,227 = 3 11.9,77 4 = 228621,22 3 11.9111,26 228621,22 3 100223,82 =2,28-3 = - 0,72 = bulunur. Buna göre negatif eğimli (sola kayan), standart çan eğrisinden basık bir eğri veya dağılım bulunmaktadır. Değişkenlik katsayısı, v = s.100 / x = 9,77.100/31,54 = 977/31,54 = % 30,97 bulunur. Bu oranla veriler çok düzenli bir dağılıma sahiptir. 2. Dağılım grafiğinin çizimi: 1. Adım: Değişim aralığının bulunması: Değişim aralığı R = xmax-xmin = 43,45- 11,25 = % 32,20 Fe Prof. Dr. H. Çelebi 32 2. Adım: Sınıf sayısının hesaplanması (Sturge Kutralı, bak. 2.3.1): k = 1+3,32 log n = 1+3,32.log 11 = 1+3,32.1,04 = 1+3,46 = 4,46 ≈ 4,50 sınıf veya grup bulunur. Burada çıkan sayı tama tamlanabilir, örneğin, 4,46 ≈ 4,50 alınacağı gibi, ≈ 4,0 de alınabilir. 3. Adım: Frekans veya sınıf sınır değerlerinin bulunması: Frekans f = R/k = 32,20/4,50 = 7,16 ≈ % 7,20 Fe elde edilir (7,00 da alınabilir). 4.Adım: Sıklık dağılım çizelgesi: Açıklama: Frekans f = xmin = 11,25 ile başlar. Ancak sürekliliği sağlamak için 11,25+7,20=18,45 yerine 18,44 ile bitirilir ve 2. aralık 18.45 ile başlatılır. Çizelge 2.5. Örnek 2.6’nın sıklık dağılım verileri Frekans (% Fe) Mutlak sıklık f 11,25-18,44 18,45-25,64 25,65-32,84 32,85-40,04 > 40,04 Σ= Göreceli sıklık (%) fi hi 1 2 2 3 3 11 9,10 18,18 18,18 27,27 27,27 100,00 32 Birikimli sıklık Σ fi Σ hi (%) 1 3 5 8 11 9,10 27,28 45,46 72,73 100,00 33 Jeolojide matematik ve statistiksel yöntemler Birikimli sıklık, % Fe Sıklık dağılımı, Fe 100 Birikimli sıklık, % Sıklık, % 30 20 10 0 75 50 25 0 11,25 18,45 25,65 32,85 40,04 Sınır değerleri, % Fe 11,25 18,45 25,65 32,85 40,04 Sınır değerleri, % Fe Şekil 2.5: Örnek 2.6’daki değerlerin sıklık dağılımı Alıştırma 2.2. Çan eğrisinin uygulanması. Konu: Bir ana caddede ölçülen gürültünün günlük dağılım ölçüleri (dB, n = 15): Ölçümler: {100-92-22-75-65-110-80-40-13-30-55-95-50-60-70} (= 957 dB). Soru: Dağılım özelliklerinin bulunması ve irdelenmesi Yanıtlar: x = 63,80 dB, s= ±29,23 dB, s2 = 854,31dB2, g= -0,15, e= 1,24 ve f= 20 dB. Kaynakça 1. Arıcı, H., 2001. İstatistik. Metaksan basımevi, 13. baskı, 269 s., İstanbul. 2. Barsch, H. ve Billwitz, K., 1990: Geowissenschaftliche Arbeitsmethoden. Verl. Harri Deutsch, 256 s., Thun ve Frankfurt am Main. 3. David, M., 1979. Geostatistical Ore Reserve Estimation II,Elsevier Sc. Publ. Comp., 3. Baskı, 364 s., Amsterdam. 4. Reinhardt, F. ve Heinrich, S., 1994: dtv-Atlas zur Mathematik. Cilt 1 ve 2., dtv Verlag, 498 s., München. 5. Schönwiese, Ch.-D., 1992: Praktische Statistik für Meteorologen und Geowissenschaftler. Borntraeger, 2. basım, 231 s., Berlin, Stuttgart. 6. Schroll, E., 1976: Analytische Geochemie . Ferdinand Enke Verl, 374 S., Stuttgart. 7. Şeniş, F., 1996: İstatistik. Anadolu Üniversitesi yayını No.: 175, 312 s., Eskişehir. 8. Tüysüz, N. ve Yaylalı, G., 2005: Jeoistatistik. KTÜ yayını 220, Trabzon, 382 s. 9. Wellmer, f.-W., 1989: Rechnen für Lagerstaettenkundler und Rohstoffwirtschaftler. Ellen Pilger, 462 S., Clausthal-Zellerfeld. 10. Wessel, P., 2001: Geological data analysis. http//www.higp.hawaii.edu./cecily/courses, 325 s. 11. Wilke, A., 1975: Verfahren zur Probenahme von Erzen (Konzentraten) und ähnlichen Rohstoffen . In Analyse der Metalle. 3, 3. Aufl., Berlin-Heidelberg. Prof. Dr. H. Çelebi 34 3. KURAMSAL DAĞILIMLAR 3.1 Temel esaslar İlk 2 konuda işlenen örnek tanımlamaları sonuçları bakımından rastlantılar (belirsizlikler) taşımaktadır. Çünkü bu örneklemler sonlu bir veri dizisini kapsıyor. Bu nedenle incelenen olaylar (işlev veya mekanizma) sadece kısmen işlemlere tabi tutulabilmektedir. Dolayısı ile deneysel sıklık dağılımlarının görünümleri örnek kapsamının genişlemesi ile değişir. Sözkonusu olay genel olarak, yani örneklem rastlantılarının etkisi dışında, istatistiksel olarak incelenmek istenirse, örneklemin geldiği anakütlenin özelliklerinin incelenmesi gerekir. Ancak bunlar genelde bilinmedikleri için istatistikte çeşitli kuramsal anakütle dağılımlarının bulunması için değişik yollar bulunarak deneysel dağılımlara uyarlanırlar. Uygulamda birçok teorik dağılım şekli bulunmaktadır. Burada bunların ancak önemli olanları üzerinde durulacaktır. Herhangi bir veriyi inceliyebilmek maksadiyle teorik dağılımların sadece normlu şekli, yani olasılık sıklık dağılımı f(x) yardımıyla, tanımlanacaktır. Bir görsel dağılımın bir kuramsal dağılıma uyarlanması demek, görsel dağılıma en yakın kuramsal dağılımın bulunması demektir. Görsel dağılımın kuramsal dağılıma uyumu için çevirme işlemlerinin yapılması, uyum derecesinin (anlamlılığının) saptanması ve sınanması şarttır. İşlenecek kuramsal yöntemler ilk önce sadece tek boyutlu durumlar için uygulanır. Bunların çok boyutlu durumlar için uygulanması sıkça sorunlar doğurur. Hesaplanacak parametrelerin örneklem ve anakütle (popülasyon) ilişkisinin ayırdedilmesi için kullanılan değişik karakterler aşağıya çıkarılmıştır: Parametre Örneklem Anakütle Ortalama değer Ortanca Tepe değeri Standart sapma Değişke Kayma Basıklık Kapsam x xo xt s s2 g e n µ µo µt σ σ2 γ η ν 3.2 Normal dağılım (ND) Doğadaki dağılımların büyük çoğunluğu normal dağılım (ND)göstermektedir. Buradaki normal dağılımın anlamı sadece çok sayıdaki işleve uygulanabilirliğini ifade eder. Tüm dağılım çeşitleri oluştukları yerin mevcut koşullarına göre gelişirler. Örneğin, bakkal ve manavların bir şehrin her tarafına yaklaşık aynı sıklıkta dağılmalarına karşın, fotoğraf dükkanlarının sadece şehir merkezinde 34 35 Jeolojide matematik ve statistiksel yöntemler yoğunlaştıkları görülür. Bu gözlem sonucunun, yani hipotezin, genelleşmesi için açıklanması ve teorik bir toplu sistemde ya doğrulanması, ya da reddilmesi gerekir. Normal dağılımın en önemli özelliği, verilerin ortalama değer etrafında yoğunlaşmasıdır. Uclara, yani ortalama değereden uzaklaştıkça veriler seyrelir. Örneğin, dünyanın yaklaşık 7,3 milyar (2014) nüfusunun ancak yaklaşık 4,1 milyarı normal kilolu, 1,1 milyarı kötü beslenmeden dolayı zayıf ve 1,1 milyarı da şişmandır. Bu durum, azalarak sonsuza yaklaşır. Aynı şey çalışanların aylıkları ve yumurta ağırlığı için de geçerlidir. Böyle bir dağılımda örneklerin tek tek incelenmesi oldukça zordur. Dağılım üzerinde denetimi sağlamak amacıyla ve bilgi kaybına neden olmadan, yukarıda da anlatıldığı gibi, veriler veya ölçümler gruplara (sınıflara) ayrılır (bak. Örnek.2.6.). Bu sınıflardan bir dağılımın eğilimini gösteren sütun diyagramlar elde edilir. Elde edilen sütun dağılımına uyarlanan bir eğri dağılım fonksiyonunu meydana getirir (Şekil 2.1b ve 2.6). Bu dağılım fonksiyonu sürekli ve simetrik normal sıklık dağılımını* gösterir ve f(x) = 1 2 e 1 x 2 ( ) 2 3.1 eşitliği ile tanımlanmaktadır (-∞<x<+∞; -∞<µ<+∞; σ>0). Eşitlikten birbirine benziyen (maksimum µ, simetrik dönü noktaları µ-σ ve µ+σ) çok sayıda sıklık dağılımı fonksiyonunun bulunduğu anlaşılmaktadır. Şekil 3.1. Standart sapma ile eğrinin alan içeriği arasındaki ilişki (Wellmer, 1989). Normal dağılım, ortalama değerlerin en sık ve en olası oldukları her yerde dağılım modeli olarak beklenebilir. Ortalama değerin üstündeki ve altındaki sapmalar eşit olasılığa sahiptir. Artan sapma değeri ile azalarak daha az olası duruma giderler. Bu özelliği ile normal dağılım istatistiğin temelini oluşturan bir öneme sahiptir. Hata hesaplamaları, standart sapma gibi formüller ve yöntemler normal dağılımın esaslarına dayanmaktadır. Bu nedenle incelenen her dağılımın normal dağılımı Prof. Dr. H. Çelebi 36 gerektirip gerektirmediği araştırılır (parametrik, dağılıma bağlı veya non parametrik, dağılıma bağlı olmıyan, yöntemler). Bütün istatistiksel analizlerdeki ilk ana kural, örneklemdeki normal dağılımın gerekliliğidir. Bu kural iyi ve güvenilir sonuçlar için kaçınılmaz bir zorunluluktur. Bir veri kümesindeki normal dağılımın varlığı ise, histogramlarda görülebilir. Bu durumda dağılım eğrisi bir çan şeklindedir. Normal dağılım fonksiyon değerleri Ek-3.1’de verilmiştir. Bir normal dağılıma sahip f(x) eğrisinin dönü noktaları absise yansıtıldığında bu eksen üzerinde anakütlenin µ ortalama değerinden itibaren örneklemin tam σ değerine karşılık gelen değerleri elde edilir. Bir örneklemin standart sapması bu oluşuma bağlıdır (dağılıma bağlı formül, Şekil 3.1). Buna karşın diğer değişkenler ve yüzdelikler dağılıma bağlı değildir. f(x) fonksiyonunun dönü noktalarındaki teğetler x eksenini μ’den itibaren 2σ’da keserler. Bir örneğin dağılım fonksiyonunun μ±σ aralığına (1. dönü noktaları) düşme olasılığı % 68,27, μ±2σ aralığına (2. dönü noktaları) % 95,45 ve μ±3σ aralığına (3. dönü noktaları) da % 99,73’tür. Bu oranlar aynı zamanda verilen sınırlar arasındaki alanın eğri altında kalan toplam alana oranına karşılık gelir (Şekil 3.1). 3.2.1 Standart normal dağılım (çan eğrisi, SND) μ = 0 ve σ =1 durumu için f(x) dağılım fonksiyonu, f(x) = 1 2 e 1 x2 2 şeklini alır. Böylece dağılım fonksiyonu parametrelerden bağımsız hale gelir ve z = formasyonu ile f(z) = 1 2 e 3.2 x trans- 1 z2 2 3.3 şekline dönüştürülmüş olur. Bu durumdaki bir dağılım fonksiyonuna standardize normal dağılım denir. Bu şekildeki fonksiyonlar (z dağılımı) birimsiz hale geldikleri için değişik yöntemlerle daha kolay hesaplanırlar. İstatistikteki sınama (test) ve tahmin için oldukça önemlidir. Yüzdeliklerin hesaplanması entegral gerektirdiğinden, zordur. Ancak bu, çizelgelerden yararlanarak, aşılabilir. z dağılımı değerleri Ek 3.1’de verilmiştir. z’ye standart değer denir. Bir dağılımda her Xi değerine karşılık bir xi sapma değeri belirlendiği gibi, bir zi değeri de belirlenebilir. Standart değer, zi = xi/s 3.4 eşitliği ile tanımlanır ve bununla sapma değerleri standart değerlere çevrilir. Örneğin, x i = Xi - x değeri için zi= xi/s standart değeri bulunur. ________ * Gauss dağılımı veya çana benzediği için çan eğrisi de denir. Carl-Friedrich Gauss (1777-1855), sıklık dağılımını Göttingen Üniversitesi’nde çalışırken ilk formüle eden alman matematikç, fizikçi ve astronomdur. 36 37 Jeolojide matematik ve statistiksel yöntemler Örnek 3.1. Ortalama değeri gelir? x = 5 ve stanadart sapması s = ± 2 olan bir dağılımdaki Xi =7 ölçümü hangi standart değere karşılık Çözüm: zi = xi /s = (Xi - x ) / 2 = (7 – 5) / 2 = 2 / 2 = +1 bulunur. Burada xi = x +s değerine karşılık geldiği için +1 değeri, tolerans ölçüsü, elde edilmiştir. Yani ortalama değerden bir standart sapma kadar büyük değerlerin standart değeri 1’dir. Bunun gibi 2s kadar büyük olan değerlerin standart değerleri 2, 3s kadar büyük olanların da 3’tür. Aynı sonuçlar standart sapmadan küçük değerler için de geçerlidir ve -1, -2, ile -3 bulunur. Ortalama değere eşit (Xi = x ) bir değerin standart değeri ise, 0’dır (zi = xi/s = [ x - xi]/s = [ x - x ]/s = 0/s = 0). Bu nedenle standart çan eğrisi 0’a (y ekseni) göre simetrik verilir (bak Şekil 3.2). Örnek 3.2. Bir çakıl örnekleminin tane boyu ortalaması tanesini bulma olasılığı % kaçtır? x = 14,2, standart sapması s=4,3 mm’dir. 3 mm’den küçük çaplı bir kum Çözüm: Aranan 3 mm’lik değeri çizelgeden okuyacak değere çevrilmesi ve z değerinin bulunması lazım. z değeri, 3,00 14,2 z= 4,7 = - 2,4 formülünden -2,4 bulunur. z Çizelgesinde (Ek-3.2) bu değere karşılık gelen standart değer 0,0082 gibi çok küçük bir sayı olduğundan, zayıf bir olasılıktir. Görüldüğü gibi standart çan eğrisinin parametreleri normal çan eğrisinin parametrelerinden farklı olmaktadır. Standardize edilmemiş çan eğrisinin dönü noktaları μ±σ, μ±2σ ve μ±3σ iken, standart çan eğrisinde ±1, ±2 ve ±3 olmaktadır. Ortalama değerin standart değeri 0’dır. Bu nedenle standart çan eğrisi ölçümler yerine bu değerlerle tanımlanır ve bu sayede normal çan eğrisinden ayırt edilir (Ek-3.1-3.3). Sıklık dağılımı fonksiyonu, F(x)= 1 2 x e 1 y 2 ( ) 2 dy 3.5 şekliyle doğrusal ve entegrale benziyen dağılım toplamını verir (birikimli toplam, Şekil 3.2). Bu dağılım olasılık kağıdında özel bir dağılımla bir doğruya çevrilir ve hesaplamaların denetiminde kullanılır. Olasılık kağıdının absisi doğrusal, ordinatı ise, 3.5 eşitliğine göre düzenlenmiştir. Bu yaklaşık doğrunun başka özelliklerinden biri de F(-1) = 0,84 ve F(+1) = 0,16 olmasıdır. Buradan 0,84-0,16 = 0,68 elde edilir. Bu, eğrinin altındaki alanın µ-σ ve µ+σ sınırları arasında kalan alanıdır. Prof. Dr. H. Çelebi 38 Şekil 3.2. Standart normal dağılım (çan eğrisi, μ=0, s=1) ve olasılık kağıdına dönüştürülmesi (Wellmer, 1989). Yukarıda da belirtildiği gibi normal dağılım simetrik olduğundan, birçok özel duruma sahiptir. Örneğin, Ortalama değer = ortanca = tepe değeri = μ’dür (1. moment). Değişke = σ/ n (2. moment) ve Kayma (g) ile basıklık (e) = 0 y z x Şekil 3.3. İdeal simetrik 2 boyutlu sıklık dağılım yüzeyi perspektifi. (Sachs, 1984, değiştirilmiştir). 38 39 Jeolojide matematik ve statistiksel yöntemler değerlerine sahiptir. μ parametresi olasılık sıklık dağılımında değerlerin absis üzerinde sağa veya sola kayarak kaymayı (g, kayma), σ da ordinat boyunca ortalama değer μ etrafında yoğunlaşıp seyrelerek basıklığı (e, basıklık/sivrilik) meydana getirir. 3.3 Birikimli normal dağılım (BND) Bir dağılımın kesin sağlanması ancak matematiksel sınamalarla (testlerle), örneğin χ2 (ki kare, bak. örneğin, Arıcı, 2001) sınaması ile, sağlanabilir. Burada bu konulara geniş yer ayırmak bu notların kapsamını aşacağından, uygulamadaki yaklaşık grafik denetimi ile yetinilecektir. Ordinatın doğrusal bölünmesi durumunda fonksiyon entegral işareti veya S şeklinde bir eğri verdiği yukarıda belirtilmişti (Şekil 3.2). Bu eğrinin kıvrım derecesi standart sapmanın büyüklüğüne bağlıdır. Doğru, ortanca (% 50) noktasına göre simetriktir. 0 ve % 100 noktaları, y eksenine asimtot olarak yaklaştıklarından, sonsuza yönelirler ( ). Uygulamada bu uc değerler önemli görülmez ve çok ender durumlarda, örneğin, uc değerlerin elimine dilmesi durumunda, yararlanılır. Grafikle çözüm piyasada satılan olasılık kağıdı ile yapılır (Şekil 3.4). Olasılık ağı veya kağıdı çan eğrisinin veya bir normal dağılımın bir doğru şeklini alacağı bir x-y diyagramıdır. y ekseni buna göre bölünmüştür. Ancak x ekseni doğrusaldır. Gerektiğinde logaritmik de yapılabilir. Bu ağla normal dağılımların doğruluğu sınanır. Bu nedenle birikimli sıklık dağılımı ölçüm sonuçlarının düzenlenmesinden sonra hesaplanır. Bunun için bu ağın absisine özellik sınıfı üst sınırları x i, ordinatına da bunların birikimli sıklığı hi kaydedilir (Örnek 2.6 ve Şekil 2.5). Sınıfların göreceli değerleri, en küçük değerden başlamak üzere, her sınıf için ayrı ayrı toplanır. Buna göre birikimli sıklık, özellik sınıflarının üst sınır değerlerinden küçük veya bunlara eşit değerlerin toplamıdır. Bunun dağılım fonksiyonuna birikimli sıklık dağılım fonksiyonu denir (bak. Eşitlik 3.5). Bu dağılımın fonksiyonu normal dağılım halinde bir doğru verir (Hazan Doğrusu). Aksi durumlarda fonksiyon kırık çizgi şeklinde görülür. Doğrunun çizimi sırasında başlangıç ve bitiş kısımları büyük önem taşımaz. Ancak % 50 civarının bir doğru çıkması belirleyicidir. Grafikten ayrıca şu değerler okunabilir: a) Ordinatın % 50 değerinden absise çizilen paralelin doğruyu kestiği noktadan absise inilen dik, absisi ortalama değerde veya ortanca noktasında keser, b) % 16 ve % 84 noktalarından aynı şekilde absise çizilen paralellerin doğruyu kestiği noktadan absise inilen dikler de absisi µ±σ noktalarından, yani standart sapma veya tolerans ölçüsü 1’de keser. Bu iki sınır arasında kalan alan tüm analiz değerlerinin % 68,26’sına tekabül eder (84, 68 ile 100’ün; 16 da 0 ile 32’nin ortasıdır). x sadece bu aralık için geçerlidir. Prof. Dr. H. Çelebi 40 Böylece elde edilen bir birikimli sıklık dağılım doğrusuna ortanca noktasından bakıldığında, standart sapmanın, veya s’nin, birkaç kat dilimlerinden oluştuğu görülür. Doğrunun eğimi artan standart sapma ile azalır ve uc kısımlar çoğu kez uyumda sorun yaratır. Ancak bu araçla gerçek dağılımların grafiklerle karşılaştırılması mümkün olmakta ve önemli parametreleri doğrudan okunabilmektedir. Şekil 3.4. Olasılık kağıdı ve birikimli sıklık dağılımında kullanılması (veriler için bak. Çelebi, 2003: İstatistik ders notları, Örnek 3.2.). Dağılımın doğru vermemesi durumunda heterojen bir örneklemin, başka dağılımların mevcut olabileceği veya değerlerin belli ölçüde kaydırılması gerektiği üzerinde durmak gerekir. Böyle bir durumda genelde logaritmik dağılım sözkonusu olur. Bir birikimli dağılımın oluşturulmasında birkaç parçadan oluşan bir kırık bir doğrunun ortaya çıkması, çok tepelikli bir dağılıma, yani heterojen bir örnekleme, işarettir. Bu durumda her anakütlenin ayrı ayrı çözülmesi ve incelenmesi ancak büyük örnek sayısı için bir anlam taşır. Bir örneklemde birden fazla ve açıkça farklı dağılımların bulunması, bu değerlerin bir anakütleye ait olmadığını ve bunun için de bir ortalama değerin hesaplanamıyacağı anlamına gelir. 40 41 Jeolojide matematik ve statistiksel yöntemler 3.4 Logaritmik normal dağılım (logND) Asimetrik bir normal dağılım, özellikle örneklemin bir pozitif eğime sahip olması durumunda, logaritmik normal dağılım şeklinde görülür. Logaritmik dağılıma Galton dağılımı da denir. Bu dağılım, özellikle geniş yayılım aralıklarına sahip, birkaç on veya yüz kat değişen, dağılımlara uygulanır. Ancak logaritmik dağılımla dağınık değerlerin göreceli değişimleri aynı derecede açıkça gösterilebilir. Bir normal dağılımın basıklık (e<0, platikurtik) ve sivrilik (e>0, leptokurtik) özellikleri bazen örnek sayısının arttırılması ile giderilebilmesine karşın, kayma etkilenmemektedir. Bu, basıklığın sıkça rastlantısal bir örneklem etkeni olduğunu, buna karşın kaymanın anlamlı bir etken olduğunu gösterir. Bu durumlar uygulamada ancak logaritmik dağılım modelleri ile açıklanabilmektedir. Logaritmik normal olasılık sıklık dağılımı ve sıklık dağılım fonksiyonu, f(x) = F(x)= 1 2 e x 1 ln x 2 ( ) 2 1 ln y ) 1 2( .e 2 y 1 3.6 )2 3.7 dy şeklindedir (x>0). Logaritmik dağılımın en belirgin işareti, sınıflara ayrılmış birikimli bir örneklemin yüzde değerlerinin olasılık kağıdında ortalama değerin üstündeki değerlerin altındakilere oranla yatay durum göstermesidir. Absisleri logaritmik bölünmüş olasılık kağıtları piyasada satılmaktadır. Buradaki logaritmik dağılımın, fonksiyonlardan da görüldüğü gibi, onlu taban logaritması (log) olmadığı, doğal logaritma (ln) olduğu, unutulmamalıdır. Bazen onlu taban logaritması doğal logaritmaya göre daha iyi yaklaşık değerler verebilir. Bu durumda yukarıdaki denklemlerde sadece ln yerine log’un yazılması yeterlidir*. Buna ek olarak µ ve σ yerine z yazılarak, yukarıda olduğu gibi, denklemler genelleştirilebilir. Logaritmik dağılım parametrelerinin hesaplanması bir normal dağılımdakinden daha karışık ve zaman alıcıdır. Burada kullanılan eşitlikler aşağıya çıkarılmıştır: Parametre Formül Ortalama değer Ortanca µL= e µoL= e Tepe değeri µtL = e Değişke Kayma Basıklık 2 3.8 3.9 2 σ2 = e ( 2 3.10 2 2 )( e 1) 3.11 γ = ( e 2) e 1 η=0 2 2 3.12 3.13 _________ *Aşağıdaki ilişkilerle 10 tabanına göre alınan logaritma ile doğal logaritmalar birbirlerine çevrilebilmektedir (Wellmer, 1989): log a.ln 10 = ln a (ln 10 = 2,3026), ln a.log e = log a (log e = 0,4343) veya log10x = logex/loge10 = lnx/ln10 = lnx/2,3026’dır. Prof. Dr. H. Çelebi 42 Uygulamada bir logaritmik dağılımın beklenmesi durumunda ölçüm veya analiz değerlerinin logaritmaları alınır. Ortalama değer ve standart sapma bu değerlerden hesaplanır, ilgili çizelgeler, örneğin z dağılım çizelgesi, kullanır ve karşılaştırmalar gerçekleştirilir. Logaritmik normal dağılımın standart sapması temel değerlerin geometrik ortalamaya oranıdır, normal dağılımdaki gibi sapmaların ortalama değeri değildir. Logaritmik dağılımın önemi bilim dallarına göre değişmektedir. Örneğin, yerbilimlerinde çok önemlidir. Bu nedenle Ahrens (1954) magmatik kayaçlardaki logaritmik normal dağılımı jeokimyanın temel yasası olarak tanımlamaktadır. Yukarıda da değinildiği gibi, düşük veri normal dağılımları ağırlıkta olmaktadır. Jeolojide, örneğin, hafif şiddetteki depremler, kuvvetlilerden daha sık meydana gelmektedir. Rüzgar hızı ve yağış dağılımı da buna benzer ve genellikle logaritmik dağılım sunarlar. Aslında bu dağılımlar derişime de bağlıdır. Örneğin, minerallerin iz element içerikleri kayaçlardaki iz element dağılımını da belirlemektedir. Rodionov’a (1961) göre de magmatik kayaçlardaki element dağılımı kural olarak logaritmik normal dağılımdır. Bunun dışındaki dağılımlar kuralının dışında kalan dağılımlar veya ikincil etkenlerin sonucudur. Bilhassa minerallerdeki element dağılımı her zaman için logaritmiktir. Ancak değişim geçirmiş ve farklı nesillerden (jenerasyondan) oluşan minerallerde, normal dağılım görülebilir. Örneğin, limonit (FeOOH), hematitten (Fe2O3) meydana gelir. Hematitte logaritmik dağılım varken, limonitte normal dağılım gözlenir. Bir magmatik kayaçtaki bir elementin öncelikle bir minerale bağlılığı da logaritmik dağılım şeklinde görülür. Buna karşın değişik minerallere yaklaşık eşit dağılımı, normal dağılım gösterir. Örneğin, granitlerde Ca plajiyoklaslara (Ca[AlSi3O8]), Mg ise, biyotite (K[Fe, Mg]3, [Al, Fe3+]) bağlıdır. Bu nedenle Ca ve Mg’un kayaçtaki dağılımı logaritmik normal dağılım gösterirken (Schroll, 1976), Na, Al ve Si normal dağılım gösterirler. Çünkü Na hem plajiyoklaslarda (Albit, NaAlSi3O8), hem amfibollerde (Na, K, Ca2, [Fe, Mg/Al/Ti]5 Si8O22 [OH]2) ve hem de piroksenlerde ([Ca, Al, Fe]SiO3) derişir. Elementlerin dağılımında kimyasal denge durumu da kendini gösterebilir. İstatistiksel denge durumu bir normal dağılım sonucunu verirken, dinamik denge durumu (difüzyonla elementlerin yayılışı) logaritmik normal dağılım sonucunu verir (Schroll, 1976). Aynı şekilde logaritmik normal dağılım iz elementlerin dağılımında da gözlenmektedir. Örneğin, arsenik (As), molibden (Mo) ve bakır (Cu) tercihen arsen sülfür (As2S3), molidenit (MoS) ve kalkopirit (CuFeS2) gibi bir mineral fazına bağlanırlar. Eser elementler takip ettikleri benzer (koherent) ana element gibi davranırlar. Örneğin, Tantal (Ta) biyotitte Alüminyuma (Al) uyduğu için onun gibi dar bir yayılım alanı gösterir ve logaritmik dağılım sunar. Bunlara ek olarak bir elementin dağılımı bir mineralde veya kayaçta ikincil işlevlerle, örneğin, metazomatik gelişmelerle, kuvvetlenebilir veya aksine altersyonla zayıflıyabilir. Aşağıda, Keban/Elazığ Simli Kurşun Yatağı’ndan bir örnek sunulmuştur. Burada kurşuna (Pb) bağlı olarak galenitte derişen gümşün (Ag) bir log normal dağılım sunduğu görülmektedir. Aynı dağılımla bir normal dağılımın ve log normal dağılıma dönüştürülmesi ve benzerlikleri gösterilmiştir (Örnek 3.3 ve Şekil 3.5a-c). Örnek 3.3: 42 43 Jeolojide matematik ve statistiksel yöntemler Galenitte normal ve logaritmik normal (log normal) Ag dağılımı. Veriler: ppm Ag : {11-13-14-2-15-17-50-35-6-24-12-25-18-3-7-40-9-4-5-4-1} log ppm Ag:{1,04-1,08-1,15-0,30-1,15-1,23-1,70-1,54-0,78-1,38-1,081,40-1,26-0,48-0,78-1,60-0,95-0,60-0,70-0,60-0,00} Çizelge 3.2: Örnek 3.3’ün sıklık dağılım verileri. Frekans (%) f <9 9-18 18-27 27-36 36-45 >45 Toplam Normal dağılım Sıklık Birikimli sıklık (%) fi hi ∑hi 9 0,43 42,86 7 0,33 76,19 2 0,09 85,72 1 0,05 90,48 1 0,05 95,24 1 0,05 100,00 21 1,00 100,00 Logaritmik dağılım Frekans (log%) Sıklık Birikimli sıklık (%) f fi hi ∑hi <0,32 2 9,52 9,52 0,32-0,64 3 14,29 23,61 0,64-0,96 4 19,05 42,85 0,96-1,28 7 33,33 76,19 1,28-1,60 4 19,05 95,23 >1,60 1 4,76 100,00 21 100,00 100,00 Çözüm: Değerlerin dağılım sınırları k = xmax-xmin = 50-1 = 49 ppm Ag’den sınıf aralığı f =k /i , (i=1+1/log2.log n) =k/1+3,322.log n =49/(1+3,322 log 21) =49/(1+3,322.1,32) = 49/5,39 =9,09 ppm 9 ppm bulunur (Çizelge 3.2). Aynı şekilde flog Ag = 0,32 elde edilir. Sayısal dağılım kuvvetli pozitif eğimliyle sağa kaymakta ve bir fakir cevher tipi göstermektedir (Şekil 3.5a). Aynı değerlerin birikimli log dağılımlar entegral ve doğru şekilleri ile normal dağılımı pekiştirmektedir (Şekil 3.5b ve d). Birbirlerine çok yakın tepe değeri (1,12), oratnca 1,08 ve ortalama değeri (1,00) de savı desteklemektedir.Yassılık (kurtosis) e<3 (1,34) olduğundan, dağılım normal dağılımdan daha yassıdır. Buna göre Ag, galenitten başka, örneğin, arsenat, antimonit ve sülfit gibi minerallerde de toplanmıştır. Prof. Dr. H. Çelebi 35 Sıklık, % 100 xo 30 x 25 15 75 20 50 10 25 5 0 -5 9 18 27 36 45 Sınır değerleri, ppm Ag Sıklık, % 30 20 10 0 0,32 c 0,64 0,96 1,28 1,60 1,92 d Sınır değerleri, log ppm Ag 0,64 0,96 1,28 1,60 1,92 Sınır değerleri, log ppm Ag b Birikimli log sıklık, % a 0 0,32 54 Birikimli sıklık, % xt Sıklık, % 45 44 100 10 1 0 0,4 0,8 1,2 1,6 2 2,4 Sınır değerleri, log ppm Ag Şekil 3.5: Göreceli sıklık, a ve logaritmik+birikimli logaritmik sıklık dağılımı, b, (bak. Örnek 3.3, Çizelge 3.2). xt=4, xo=12 ve x =15 ppm Ag. Sıklık dağılımının çizgisel görünümü, c ve log birikimli dağılım (bak. Örnek 3.3 ve Çizelge 3,2). Alıştırma 3.1: Aşağıdaki veri kümesinin sıklık dağılımını çizerek irdeleyiniz (Ergani-Maden/Elazığ Cu cevheri, n=15). Değerler (ppm Cr): {100-92-22-75-65-110-80-40-13-30-55-95-50-60-70}. Alıştırma 3.2: {12-14-36-22-37-29-30-38-41-49-36-45-62-53-58-67-69-56-55-50} analiz sonuç-larının (n=20), a) Aritmetik (42,95), geometrik ve harmonik ortalamalarını, b) Standart sapmasını (16,40), değişke, kayma ve basıklığını, c) Tepe değerini (36) ve ortancasını (40), d) Sıklık dağılımını çiziniz ve d) Birikimli dağılımını olasılık kağıdında parametreleri ile gösteriniz (parantezde sonuçlar). Kaynakça 44 45 Jeolojide matematik ve statistiksel yöntemler 1. Ahrens, L.H, 1954: The lognormal distribution of the elements. Geochim. et Cosmochim. Acta 49. 2. Arıcı, H., 2001. İstatistik. Metaksan basımevi, 13. baskı, 269 s., İstanbul. 3. Reinhardt, F. ve Heinrich, S., 1994: dtv-Atlas zur Mathematik. Cilt 1 ve 2., dtv Verlag, 498 s., München. 4. Perillo, G. M. E. Ve Marone, F., 1986: Determination of optimal numbers of class intervalls using maximum entropy. Math. Geol. 18, 4, 401-407. 5. Rodionov, D. A, 1962: Bestimmung des Durchschnittsgehaltes und der Streuung einer Lognormalverteilung von Komponenten in Gesteinen und Erzen (Rusça). Geokh. 624, Geochem. 728. 6. Sachs, L., 1984: Angewandte Statistik. Springer Verl., 6. basım, 528 s., BerlinHeidelberg. 7. Schönwiese, Ch.-D., 1992: Praktische Statistik für Meteorologen und Geowissenschaftler. Borntraeger, 2. basım, 231 s., Berlin, Stuttgart. 8. Schroll, E., 1976: Analytische Geochemie . Ferdinand Enke Verl, 374 S., Stuttgart. 9. Sinclair, A., 1976: Aplication of probality graphs in mineral exploration. The Association of Exploration Geochemists (yayınlıyan). Richmond Printers Ltd., 95 s., Vencouver B. C. 10. Şeniş, F., 1996: İstatistik. Anadolu Üniversitesi yayını 175, 312 s., Eskişehir. 11. Wellmer, F.-W., 1989: Rechnen für Lagerstättenkundler und Rohstoffwirtschaftler. Ellen Pilger, 462 S., Clausthaler-Zellerfeld. 12. Wessel, P., 2001: Geological data analysis. http://www.higp.hawaii.edu./cecily/courses, 325 s. EKLER Ek -3.1: Prof. Dr. H. Çelebi 46 Normal dağılımda ortalama değer z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 F* 0,00 3,98 7,93 11,79 15,54 19,15 22,57 25,80 28,81 31,59 z 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 x ve belli z değerleri arasında bulunabilecek olayların oranı ( % F*). F*(%) 34,13 36,43 38,49 40,32 41,92 43,32 44,52 45,54 46,41 47,13 z 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 F*(%) 47,72 48,21 48,61 48,93 49,18 49,38 49,53 49,65 49,74 48,81 z 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 F*(%) 49,865 49,903 49,931 49,952 49,966 49,977 49,984 49,989 49,993 49,997 z 4,0 5,0 6,0 F*(%) 49,997 49,99997 49,9999997 *z=(x- x )/ .F* değeri, z=0 ve z=(x- x )/ aralığında eğri altındaki toplam alana karşılık gelir. Bu, x ve x sınırları arasında değişkenin % olarak gerçekleşme sıklığı demektir. Örnek: x = 4, = 1 ve x = 1 için z = 3 F* = % 49,865 ve F* = % 0,135. Tüm dağılım eğrisi için F* = % 99,73 ve 0 F = 0,27 geçerlidir. Ek-3.2 Standart normal dağılımın birikimli olasılık değerleri (z değerleri, Davis, 1973). 46 47 Jeolojide matematik ve statistiksel yöntemler Ortalama değerin standart sapmsı (z) -3,0 -2,9 -2,8 -2,7 -2,6 -2,5 -2,4 -2,3 -2,2 -2,1 -2,0 -1,9 -1,8 -1,7 -1,6 -1,5 -1,4 -1,3 -1,2 -1,1 -1,0 Birikimli olasılık 0,0014 0,0019 0,0026 0,0035 0,0047 0,0062 0,0082 0,0107 0,0139 0,0179 0,0228 0,0287 0,0359 0,0446 0,0548 0,0668 0,0808 0,0968 0,1151 0,1357 0,1587 Ortalama değerin standart sapmsı (z) -0,9 -0,8 -0,7 -0,6 -0,5 -0,4 -0,3 -0,2 -0,1 0,0 +0,1 +0,2 +0,3 +0,4 +0,5 +0,6 +0,7 +0,8 +0,9 +1,0 +1,1 Ek-3.3: Önemli bazı parametreler için istatistiksel güvenirlik sınırları Birikimli olasılık 0,1841 0,2119 0,2420 0,2743 0,3085 0,3446 0,3821 0,4207 0,4602 0,5000 0,5398 0,5793 0,6179 0,6554 0,6915 0,7257 0,7580 0,7881 0,8159 0,8413 0,8643 Ortalama değerin standart sapmsı (z) +1,2 +1,3 +1,4 +1,5 +1,6 +1,7 +1,8 +1,9 +2,0 +2,1 +2,2 +2,3 +2,4 +2,5 +2,6 +2,7 +2,8 +2,9 +3,0 Birikimli olasılık 0,8849 0,9032 0,9192 0,9332 0,9452 0,9554 0,9641 0,9713 0,9773 0,9821 0,9861 0,9893 0,9416 0,9938 0,9953 0,9965 0,9974 0,9981 0,9987 Prof. Dr. H. Çelebi Parametre 48 Güvenirlik sınırı (±ℓ) n P= % 95 P= 99 Ortalama değer ( x ) n 30 1,96 .s/ n 1 2,58 .s/ n 1 Ortanca (xo) n 30 2,46 .s/ n 1 3,23 .s/ n 1 Değişke (s2) n 100 2,77 .s/ n 1 3,65 .s/ n 1 Standart sapma (s) n 100 1,39 .s/ n 1 1,82 .s/ n 1 Örnek: n=30 için x ± 1,96.s/ n 1 sınırları % 95 güvenirlikle/kesinlikle ortalama değeri kapsar. Küçük örnek sayısı için ortalama değerin güven sınırları Student-t-değerleri vasıtası ile hesaplanabilir: Örneğin, х ± t.s/ n 1 gibi. 4 VARYANS ANALİZİ 4.1 Temel ilkeleri 48 49 Jeolojide matematik ve statistiksel yöntemler Basit bir varyans analizi* (VA) bir anakütlenin standart sapmalarını karşılaştırır, yani anakütlenin veya örneklemin örnekten örneğe değişen standart sapmasını inceler. Anakütlenin saf olması durumunda örneklemler arasındaki farklılık karakteristik değildir. Aksine karışık bir anakütlede örneklemler arası standart sapma (varyans) örneklemlerin standart sapmasından anlamlı bir şekilde büyük olur. Bu farklılık, örnklemin birine veya tümüne farklı olayların veya aynı şiddetteki bir olayın farklı etki etmesini gösterir. Varyans analizinden birkaç anakütlenin karşılaştırılmasında yararlanılır. Saf anakütlelerin sınanmasında, grup farklarının sınırlandırılmasında, örneğin, tıpta tedavi yöntemlerinin, yerbilimlerinde kayaç türlerinin veya fasiyes tiplerinin ayırdedilmesinde, uygulanır. Varyans analizi, önemli etkenleri önemsizlerden ayırmayı sağlar. Bu amaçla R. A. Fisher (18901962) tarafından deneyleri planlamak ve değerlendirmek için bulunmuş ve geliştirilmiştir. Bir tek bağımsız özelliğin incelenmesine dayanan varyans analizine tek etkenli veya basit, 2 veya daha fazla bağımsız özelliğin incelenmesi durumunda ise, çok etkenli varyans analizi denir. Yöntemin esasını toplam varyansla kısmi varyansların karşılaştırılması teşkil eder. Buna göre inceleme 1 etkene indirgenir. Yani bir anakütlede bir özelliğin değişkenliği bağımsız birkaç etkenden kaynaklanıp kaynaklanmadığı araştırılır. Bu durumda, 2 2 2 2 σ t = σ 1 + σ 2 +...+ σ n 4.1 eşitliği geçerli olur (t, toplam; n, örnek sayısı). Eşitliğin sağlanması, incelenen örneklemlerin bir anakütleden oluştuğunu, aksi taktirde kümenin heterojen olduğunu, yani 1’den fazla anakütleden geldiğini gösterir. Bu eşitlik standart sapma s için geçerli olamaz, yani st ≠ s1+ s2 +...+ sn‘dir. Bulunan değişke farkları F sınamasına tabi tutulurlar. Karşılaştırmak için gerekli sınama değerleri ilgili tablolardan okunarak farklılıkların karakteristik olup olmadıkları tesbit edilir. Farklılığın tam belirlenemediği durumlarda derece veya rang yönteminden yararlanılır. Bu yöntemde mevcut analiz değerleri k sınıflarına ayrılır (k=1+2+3+...+m). Her sınıfın derişimi toplam yüzde ile çarpılarak dereceler elde edilir. Bu dereceler de çeşitli matematiksel işlemlere tabi tutularak farkların ortaya çıkarılması sağlanır. Varyans analizinde değişkenler anakütleler arasında araştırılır. Anlamlı olmıyan fark durumunda 1, aksi durumda en az 2 anakütlenin bulunduğu ortaya çıkar. Bunun nedenleri oldukça farklı olmaktadır. Karar karşılaştırma sonunda verilir. İncelenen anakütlelerin örnek sayısı eşit veya farklı sayıda olabilir. ___________ * Şimdiye kadar varyans yerine kullanılan “değişke” burada yerleşmiş “varyans analizi” ismi nedeniyle kullanılamaz. Varyans analizinin geometrik anlamı Şekil 4.1.’de gösterilmiştir. Burada, bulunan bağımsız ortalama değer y ' dir. Bir özelliğin etkin olması durumunda da ortalama değerler y j veya y m ' dir. Bu beklenen ortalama değerlerden sapan (yij- y j ) farkları rastlantısal dış etkenlerden Prof. Dr. H. Çelebi 50 kaynaklandıklarından, açıklanamazlar. Böylece 4.1’de gösterilen toplam sapma veya saçınım, açıklanan sapma ile açıklanamıyan sapmanın toplamı olduğu veya toplam sapmanın açıklanan ve açıklanamıyan sapma bileşenlerine (elemanlarına) ayrıldığı görülür (Backhaus ve diğ, 1990). Bunun ispatı aşağıda verilmiştir (bak. Ek-4.1). y yim x ym Açıklanamıyan sapma 0 Açıklanan sapma y Açıklanan sapma yj 0 Açıklanamıyan sapma y ij x x 1. etken 2. etken Açıklama: i, örnek sayısı; j, grup sayısıdır. Örneğin, yij, j grubunun i’ninci değeri y demektir. Şekil 4.1 Varyans analizinin geometrik ilkesi, açıklanan ve açıklanamıyan sapmalar. Varyans analizinin Şekil 4.1’deki geometrik anlamı Çizelge 4.1’de matematiksel olarak özetlenmiştir. Çizelge 4.1. Sapma kareleri ve hesaplama eşitlikleri (ispat için bak ek 2). Açıklanan sapma Toplam sapma = Açıklanan sapmaların karelerinin toplamı KTt(oplam)* m n j 1 i 1 Açıklanamıyan sapma = gruplar arası sapmaların karelerinin toplamı KTa(rası) 2 ( y ij y ) m = n j (y j 2 -y ) j 1 = gruplar içi sapmaların karelerinin toplamı KTi(çi) m + nj ( y ij y j )2 j 1 i 1 * KT: Kareler toplamı; i, örnek sayısı (i=1,2,...,n); j, grup sayısı (j=1,2,...,m); y j , grup ortalaması; y , genel ortalama. Örneklem ortalamaları y j ile toplam ortalama y arasındaki farklara ( y j - y = ei) etken (effect) denir. Bu fark, dolayısı ile kareleri toplamı, ne kadar küçükse, grup veya örneklemler birbirine o kadar benziyor demektir. Buradan “örneklemlerin aynı anakütleye ait olabilmeleri 50 51 Jeolojide matematik ve statistiksel yöntemler için etkenlerin kareleri toplamının sıfıra yaklaşması gerektiği” sonucu ortaya çıkar. Bu da en küçük kareler yönteminin geçerli olduğunu gösterir. Yani, ei2 min i 1 n n 4.2 olması gerekir. Bu, aynı zamanda hataların ve etkenlerin ortalama değerlerinin 0 olmasını gerektirmektedir. 4. 2. Tek değişkenli varyans analizi Tek değişkenli varyans analizinde 1 tek öezelliğin değerleri, örneğin, ağırlıklar g olarak, karşılaştırılır. Varyans analizi ilke olarak F sınamasından başka bir şey değildir. Başka bir deyişle varyans analizi, F sınamasını kullanan karmaşık bir varsayım yöntemidir. Bu varsayımda, tek etkenli varyans analizinde (ANOVA=analysis of variance), sıfır ve karşıt varsayımları, Ho: y1 = y 2 =...... y n 4.3 H1: y1 ≠ y 2 şeklinde ifade edilirler. Bununla grupların homojen olduğu savunulmaktadır (H0, sıfır hipotezi = ortalama değerler arasında fark yoktur). Tersine seçenek varsayımına (H1) göre belki de bir anakütleye ait değildirler (= ortalama değerler arasında fark vardır). Ho’ın kabul veya reddedilmesi için farkın anlamlılığı F sınaması ile denetlenir. Varyans analizi ile bir örneklemde birçok etkenin etkisi birden araştırılır. Grup sayısı normal koşullarda 10’u, örnek sayısı da 50’yı geçmez. j, örneklem (grup) sayısı olarak verilmiştir. Bu durumda j örneklemlerinin örnek sayıları n1, n2, ...,nm olur. Buna göre, xi değerlerinin genel sayısı n =n1+n2+...+nm, xi değerlerinin genel toplamı Σxi = x1+x2+...+xn 4.4 4.5 x = Σxi/n, Genel ortalama Serbestlik derecesi F = n-1, Toplam karelerin ortalama değeri KOt = KTt /(n-1) 4.6 4.7 4.8 eder. Buradan, bulunur (KOt, toplam kareler ortalaması; n-1, serbestlik derecesidir). 4.3 Sapmaların hesaplanması Prof. Dr. H. Çelebi 52 Varyans analizinde sapmaların hesaplanması ve bunlarla ilgili işlemler yöntemin temelini oluşturur. Bunun için işleme girecek ölçümler ve gruplar ilk önce adlandırılır veya numaralandırılır. Örneğin, j gruplarının ortalama değerleri x 1, x 2,..., x m ise, 1. Tüm karelerin toplamı, KTt = (x1- x )2+(x2- x )2+...+ (xn- x )2 , 4.9 2. Kümeler arası kareler toplamı, KTa = n1 ( x 1- x )2 + n2 ( x 2- x )2 +…+nj ( x j- x )2 4.10 ve 3. Kümeler içi kareler toplamı, KTi = KTt – KTa 4.11 olarak bulunur. Değişke, ortalama karelerin sapması olarak tanımlandığından, KO = KT gözlem.sayisı 1 4.12 eşitliğinden hesaplanır (Çizelge 4.1). Paydadaki sayı, serbestlik derecesi, gözlem sayısının 1 eksiğidir. Sapmaların hesaplandığı değerlerden ortalama değerin kendisi de hesaplandığından, değerlerin biri hiçbir zaman serbest olamaz ve toplam serbestlik derecesi, Ft = n-1 4.13 değerini alır. Aynı şekilde her gruptaki örneklerin de biri hiçbir zaman serbest olamıyacağından, gruplar arası serbestlik derecesi de, Fa = m-1 4.14 olur. Genel kareler toplamı KTt, KTa ve KTi kısımlarına ayrıldığı gibi serbestlik dereceleri de kısımlara ayrılabilir. Buna göre, m sayıdaki grupların her birinin içindeki örneklerden ancak n-1 tanesi serbest hareket edebileceğinden, gruplar içi serbestlik derecesi, Fi = n-1-(m-1) = n-m 4.15 olur. Kareler toplamının (KTt, KTa ve KTi) ortalama sapma değerlerinin hesaplamasında kullanılan formüller Çizelge 4.2’de toplanmıştır. 52 53 Jeolojide matematik ve statistiksel yöntemler Çizelge 4.2. Kareler toplamı ortalamalarıının hesaplanması. KTt n 1 KTa Gruplar arasındaki ortalama değişke, KOa = m 1 KTi Gruplar içi ortalama değişke KOi= nm KOa ve KOi’ye F testi uygulanarak anlamlı farklar bulunur (bak. Örnek 4.1). Toplam ortalama değişke, KOt = 4.16 4.17 4.18 Örnek 4.1: Verilenler: Veri grupları P, Q ve R (Marsal, 1990): P : 2-3-1, Q : 2-3-1-1-3 ve R : 2-4-8-6; np = 3 nq = 5 nr = 4 x p = 6:3 =2 x q = 10:5=2 x r = 20:4=5 Toplam grup sayısı m = 3 ve örnek sayısı nt = 12 İstatistik yöntemlerinde hesaplamaları düzgün yürütmek ve sağlama olanağı vermek için örnekler kullanılacak formüllere göre düzenlenirler. Bir varyans analizinde verilerin hesap-lamaya hazırlanmasına faktöryel dizayn (factorell desing) denir (bak. Çizelge 4.3.). Burada amaca uygun bir çizelge yapılarak işlemler yapılır (bak. Örnek 4.1. ve Çizelge 4.3). Çizelge 4.3. Örnek 4.1’in çözümü: Devamı için bak. Çizelge 4.4. Grup/ Örneklem KTt m n j 1 2 ( y ij y ) 2 3 Toplam n j (y j - y )2 j 1 i 1 2 1 KTa m (2-3) = 1 (3-3)2 = 0 (1-3)2 = 4 (2-3)2 = 1 (3-3)2 = 0 (1-3)2 = 4 (1-3)2 = 4 (3-3)2 = 0 (2-3)2 = 1 (4-3)2 = 1 (8-3)2 =25 (6-3)2 = 9 50 KTi m nj ( y ij y j )2 j 1 i 1 2 (2-3) = 1 (2-3)2 = 1 (2-3)2 = 1 (2-3)2 = 1 (2-3)2 = 1 (2-3)2 = 1 (2-3)2 = 1 (2-3)2 = 1 (5-3)2 = 4 (5-3)2 = 4 (5-3)2 = 4 (5-3)2 = 4 24 (2-2)2 = 0 (3-2)2 = 1 (1-2)2 = 1 (2-2)2 = 0 (3-2)2 = 1 (1-2)2 = 1 (1-2)2 = 1 (3-2)2 = 1 (2-5)2 = 9 (4-5)2 = 1 (8-5)2 = 9 (6-5)2 = 1 26 Prof. Dr. H. Çelebi 54 Çizelge 4.4. Varyans analizinde kullanılan eşitliklerin özeti. Sayılar Örnek 4.1’deki sonuçlardır. Değişke Kaynağı Kareler toplamı KTt Karelerin ortalaması n m Toplam Serbeslik derecesi j 1 KTa Ft = n-1 =11 KOT = - y )2 = 24 Fa = m-1 = 2 KOa = KTa =12, m 1 y j ) 2 = 26 Fi= n-m = 9 KOi = KTi KOa = 2,90 Fhes= =12/2,9=4,1 KOi nm i 1 n j (y j j 1 m Gruplar içi KTi nj ( y KTt = 4,54 n 1 ( y ij y )2 = 50 m Gruplar arası Fhesaplanan (Fhes) (deney sonucu) ij j 1 i 1 2 grup veya küme ile 9 örnek serbestlik derecelerine göre teorik değişkeler oranı Fteo=Fhes(2; 9; 0,95) sınaması çizelgesinden % 95 olasılıkla 4,3 olarak okunur (Ek-4.2a, b). Buna göre farklılık anlamlı değildir. Çünkü 4,1 ile 4,3 aynı grup ve örnek serbestlik derecelerine aittir. Ho hipotezinin rededilmesi için Fteo<Fhes olması lazımdır. Dolayısı ile buradaki örneklemler homojendir ve bir anakütleye aittirler. Bu sonuç, ortalama değerlerin karşılaştırılmasından da anlaşılmaktadır (xo=xp=2, xq=5). Bu sonuçla Ho hipotezi kabul, H1 reddedilmiştir. İşlemin sağlanması: KTt= ?KTa + KTi → 50 = 24 + 26’dan çzümün doğruluğu saptanmıştır. 4.4. Çok değişkenli varyans analizi İncelenen veri kümeleri birden fazla özellikleri bakımından incelenmek istendiğinde, çok değişkenli varyans analizi uygulanır. Bunun uygulanışı ilke olarak tek değişkenli varyans analizi ile aynıdır. Ancak daha karmaşık hesaplama yöntemlerinin izlenmesi gerekir. Bu nedenle örneğin çoğu yerde determinantlar kullanılarak satır, tabaka ve sütunlar (3 değişkenli) ayrı ayrı ele alınır. Burada bu yöntemlerin işlenmesi bu notların kapsamını aşacağından, Backhaus ve diğ. (1990), Sachs (1984) ve Schönwiese (1992) eserlerine başvurulması önerilir. Alıştırma 4.1: Aşağıdaki çizelgede verilen değerler için bir F sınaması hesaplayınız. i 1 2 3 4 ni = xi = Σxi = j 1 3 7 2 5 10 Örneklemler 2 3 4 8 2 4 7 6 3 4 3 4 6 16 18 54 ni = 9 Σ Σxi= 44 Yanıt: Ho kabul, Fhes=0,69<5,14=F(2; 6; 0,95) 55 Jeolojide matematik ve statistiksel yöntemler Kaynakça 1. Backhaus, K., Erichson, E., Plinke, W. ve Weiber, R., 1990: Multivariate Analysenmethoden. Springer Verl., 6. Basım, 411 s., Berlin-Heidelberg-New York 2. Davis, J. D., 1976: Statistics and data analysis in geology. John Villay and Sons, 550 s., New York 3. Leonhart, M., 2002: Statistik für Psychologen. www.psychologie.uni-freiburg.de, 750 s. 4. Marsal, D., 1990: Yerbilimciler için istatistik. Çeviren: Yavuz Erkan, Hacettepe Üniversitesi yayını, 168 s., Ankara. 5. Sachs, L., 1984: Angewandte Statistik. Springer Verl., 6. basım, 528 s., Berlin-Heidelberg. 6. Schönwiese, Ch.-D., 1992: Praktische Statistik für Meteorologen und Geowissenschaftler. Borntraeger, 2. basım, 231 s., Berlin, Stuttgart. 7. Schroll, E., 1976: Analytische Geochemie . Ferdinand Enke Verl, 374 S., Stuttgart. 8. Şeniş, F., 1996: İstatistik. Anadolu Üniversitesi yayını No.: 175, 312 s., Eskişehir. 9. Wessel, P., 2001: Geological data analysis. www.higp.hawaii.edu./cecily/courses, 325 s. Prof. Dr. H. Çelebi 56 EKLER Ek-4.1: 4.1 eşitliğinin ispatı: m n j 1 i 1 m n j 1 i 1 m n j 1 i 1 m n j 1 i 1 m n j 1 i 1 m n j 1 i 1 m n 2 ( y ij y ) = 2 ( y ij y j y j y ) 0 4.19 ( yij y j y j y )2 4.20 basite indirgemek için, KTt = = = = vij 4.21 (vij2 2vij z j z 2j ) 4.22 m n i 1 m 2vij z j n z 2j 4.23 vij2 2 ( z j vij ) n j z 2j 4.24 j 1 j 1 (vij z j )2 vij2 = zj i 1 j 1 i 1 m n m j 1 i 1 j 1 kij = yij- y j bireysel hata olduğundan ve hataların toplamının 0 olması koşulu bulunduğundan, m = j 1 n m vij2 2 ( z j vij ) n j z 2j j 1 i 1 j 1 n m i 1 4.25 0 Buna göre eşitlik, m = j 1 n i 1 m v n j z 2j 2 ij 4.26 j 1 m m j 1 j 1 = n j z 2j + n vij2 4.27 i 1 kji ve lj’nin değerlerinin yerlerini konulması ile, nj m m j 1 j 1 i 1 KTt = nj ( y j y )2 + ( y ij y j ) 2 = KTa+KTi 4.28 4.29 bulunur. 56 57 Jeolojide matematik ve statistiksel yöntemler Ek-4.2a: F sınamsı çizelgesi (P= % 95 güvenirlikle, α=0,05). j i 1 2 3 4 1 161,40 18,51 10,13 7,71 2 199,50 19,00 9,55 6,94 3 215,70 19,16 9,28 6,59 4 224,60 19,25 9,12 6,39 5 230,20 19,30 9,01 6,26 6 234,00 19,33 8,94 6,16 7 236,80 19,35 8,89 6,09 8 238,90 19,37 8,85 6,04 9 240,50 19,38 8,81 6,00 10 241,90 19,40 8,79 5,56 5 6 7 8 9 6,61 5,99 5,59 5,32 5,12 5,79 5,14 4,74 4,46 4,26 5,41 4,76 4,35 4,07 3,86 5,19 4,53 4,12 3,84 3,63 5,05 4,39 3,97 3,69 3,48 4,95 4,28 3,87 3,58 3,37 4,88 4,21 3,79 3,50 3,29 4,82 4,15 3,73 3,44 3,23 4,77 4,10 3,68 3,39 3,18 4,74 4,06 3,64 3,35 3,14 10 11 12 13 14 4,96 4,84 4,75 4,67 4,60 4,10 3,98 3,89 3,81 3,74 3,71 3,59 3,49 3,41 3,34 3,48 3,36 3,26 3,18 3,11 3,33 3,20 3,11 3,03 2,96 3,22 3,09 3,00 2,92 2,85 3,14 3,01 2,91 2,83 2,76 3,07 2,95 2,85 2,77 2,70 3,02 2,90 2,80 2,71 2,65 2,98 2,85 2,75 2,67 2,60 15 16 17 18 19 4,54 4,49 4,45 4,41 4,38 3,68 3,63 3,59 3,55 3,52 3,29 3,24 3,20 3,16 3,13 3,06 3,01 2,96 2,93 2,90 2,90 2,85 2,81 2,77 2,74 2,79 2,74 2,70 2,66 1,63 2,71 2,66 2,61 2,58 2,54 2,64 2,59 2,55 2,51 2,48 2,59 2,54 2,49 2,46 2,42 2,54 2,49 2,45 2,41 2,38 20 21 22 23 24 4,35 4,32 4,30 4,28 4,26 3,49 3,47 3,44 3,42 3,40 3,10 3,07 3,05 3,03 3,01 2,87 2,84 2,82 2,80 2,78 2,71 2,68 2,66 2,64 2,62 2,60 2,57 2,55 2,53 2,51 2,51 2,49 2,46 2,44 2,42 2,45 2,42 2,40 2,37 2,36 2,39 2,37 2,34 2,32 2,30 2,35 2,32 2,30 2,27 2,25 25 26 27 28 29 4,24 4,23 4,21 4,20 4,18 3,39 3,37 3,35 3,34 3,33 2,99 2,98 2,96 2,95 2,93 2,76 2,74 2,73 2,71 2,70 2,60 2,59 2,57 2,56 2,55 2,49 2,47 2,46 2,45 2,43 2,40 2,39 2,37 2,36 2,35 2,34 2,32 2,31 2,29 2,28 2,28 2,27 2,25 2,24 2,22 2,24 2,22 2,20 2,19 2,18 30 40 60 120 ∞ 4,17 4,08 4,00 3,92 3,84 3,32 3,23 3,15 3,07 3,00 2,92 2,84 2,76 2,68 2,60 2,69 2,61 2,53 2,45 2,37 2,53 2,45 2,37 2,29 2,21 2,42 2,34 2,25 2,17 2,10 2,33 2,25 2,17 2,09 2,01 2,27 2,18 2,10 2,02 1,94 2,21 2,12 2,04 1,96 1,88 2,16 2,08 1,99 1,91 1,83 i: Açıklanabilen değişkenin serbestlik derecesi (n-1), j: Paydanın serbestlik derecesi (n-m). Backhaus ve diğ., 1990. Prof. Dr. H. Çelebi 58 Ek-4.2b: F sınamsı çizelgesi (P= % 99 güvenirlikle, α=0,01). j i 1 2 3 4 1 4052 98,50 34,12 21,20 2 4999,50 99,00 30,82 18,00 3 5403 99,17 29,46 16,69 4 5625 99,25 28,71 15,98 5 5764 99,30 28,24 15,52 6 5859 99,33 27,91 15,21 7 5928 99,36 27,67 14,98 8 5982 99,37 27,49 14,80 9 6022 99,39 27,35 14,66 10 6056 99,40 27,23 14,55 5 6 7 8 9 16,26 13,75 12,25 11,26 10,56 13,27 10,92 9,55 8,65 8,02 12,06 9,78 8,45 7,59 6,99 11,39 9,15 7,85 7,01 6,42 10,97 8,75 7,46 6,63 6,06 10,67 8,47 7,19 6,37 5,80 10,46 8,26 6,99 6,18 5,61 10,29 8,10 6,84 6,03 5,47 10,16 7,98 6,72 5,91 5,35 10,05 7,87 6,62 5,81 5,26 10 11 12 13 14 10,04 9,65 9,33 9,07 8,86 7,56 7,21 6,93 6,70 6,51 6,55 6,22 5,95 5,74 5,56 5,99 5,67 5,41 5,21 5,04 5,64 5,32 5,06 4,86 4,69 5,39 5,07 4,82 4,62 4,46 5,20 4,89 4,64 4,44 4,28 5,06 4,74 4,50 4,30 4,14 4,94 4,63 4,39 4,19 4,03 4,85 4,54 4,30 4,10 3,94 15 16 17 18 19 8,68 8,53 8,40 8,29 8,18 6,36 6,23 6,11 6,01 5,93 5,42 5,29 5,18 5,09 5,01 4,89 4,77 4,67 4,58 4,50 4,56 4,44 4,34 4,25 4,17 4,32 4,20 4,10 4,01 3,94 4,14 4,03 3,93 3,84 3,77 4,00 3,89 3,79 3,71 3,63 3,89 3,78 3,68 3,60 3,52 3,80 3,69 3,59 3,51 3,43 20 21 22 23 24 8,10 8,02 7,95 7,88 7,82 5,85 5,78 5,72 5,66 5,61 4,94 4,87 4,82 4,76 4,72 4,43 4,37 4,31 4,26 4,22 4,10 4,04 3,99 3,94 3,90 3,87 3,81 3,76 3,71 3,67 3,70 3,64 3,59 3,54 3,50 3,56 3,51 3,45 3,41 3,36 3,46 3,40 3,35 3,30 3,26 3,37 3,31 3,26 3,21 3,17 25 26 27 28 29 7,77 7,72 7,68 7,64 7,60 5,57 5,53 5,49 5,45 5,42 4,68 4,64 4,60 4,57 4,54 4,18 4,14 4,11 4,07 4,04 3,85 3,82 3,78 3,75 3,73 3,63 3,59 3,56 3,53 3,50 3,46 3,42 3,39 3,36 3,33 3,32 3,29 3,26 3,23 3,20 3,22 3,18 3,15 3,12 3,09 3,13 3,09 3,06 3,03 3,00 30 40 60 120 ∞ 7,56 7,31 7,08 6,85 6,63 5,39 5,18 4,98 4,79 4,61 4,51 4,31 4,13 3,95 3,78 4,02 3,83 3,65 3,48 3,32 3,70 3,51 3,34 3,17 3,02 3,47 3,29 3,12 2,96 2,80 3,30 3,12 2,95 2,79 2,64 3,17 2,99 2,82 2,66 2,51 3,07 2,89 2,72 2,56 2,41 2,98 2,80 2,63 2,47 2,32 i: Açıklanabilen değişkenin serbestlik derecesi (n-1), j: Paydanın serbestlik derecesi (n-m). Backhaus ve diğ., 1990. 58 59 Jeolojide matematik ve statistiksel yöntemler 5 BAĞINTI (KRELASYON) ANALİZİ 5.1 Genel bakış Bir anakitlede veya örneklemde birden fazla özelliğin veya değişkenin incelenmesi ile özelliklerden birinin diğerine bağlı olarak değişip değişmediği de araştırılabilir. Bu değişimi örneğin, bir matriks şeklinde satır ve sütunlarla ifade edilebilir. Örneklemin bir insan çevresi olması halinde, bu çevre bireylerinin xi buyları ile yi kilolarının karşılaştırılması gibi. Bu şekilde yapılan karşılaştırmalara bağıntı (korelasyon), inceleme yöntemine de bağıntı analiz yöntemi denir ve en çok kullanılan istatistiksel analiz yöntemlerindendir. Uygulanması oldukça esnektir. Değişken arasındaki ilişkilerin saptanmasında, yorumlanmasında, değişken değerlerinin tahmin edilmesinde ve beklenen gelişmelerin önceden kestirilmesinde önemli rol oynar. Örneğin, bir malın fiyatının satışına etkisi veya bir kare alanının değişen a kenar uzunluğu ile değişmesi (F = a2) v. s. gibi. Varyans analizi ve χ2 (ki kare) yöntemleri ile de bağıntıların olup olmadığı araştırılır. Bu yöntemler ancak birer fonksiyon değildir. Bunlara karşın bağıntı ve bağınım (regresyon) analiz yöntemlerinde birkaç veri kümesi arasında bağıntıların varlığı gösterilebidiği gibi, fonksiyon ilişkileri de araştırılabilir. Doğada birçok değişken, örneğin, yoğunlukla hacim, ısı ile basınç veya element derişimleri, birbirine bağımlıdır. Korelasyon, kelime anlamı olarak, ilişki, bağıntı demektir. Yöntem, bir x değişkeninin (bağımsız değişken) alabildiği değerler dizisinin oluşturduğu dizi ile bir y değişkeninin (bağlı değişken) alabildiği değerlerin oluşturduğu bir bağıntının olup olmadığını araştırır ve bağıntı varsa, bunun derecesini saptar. Bağlı ve bağımsız değişkenler yer değiştirebilir. Değişkenler arasındaki bağıntı, bağıntı katsayısı r ile gösterilir ve bağıntı analiz yönteminde bağıntının derecesini belirler. Bağınım analizinde ise, sadece fonksiyonal bağımlılık incelenir. Bağıntı ve bağınım birbirlerine sıkı sıkıya bağlıdırlar. Bağınım analizinde hem bağımlı, hem de bağımsız değişkenin metrik ölçüde olması gerekir. Bunun dışındaki ölçüler (biner veya nominal) istisnadır. 5.2 Bağıntı analizi (BA) ve çeşitleri Bağıntı analizi, değişkenler arasındaki ilişkileri inceler. Değişkenler, anakütlelerin, öncelikle derişim, çekim kuvveti, ısı ve basınç gibi özellikleri olmaktadır. Bu özellikler arasındaki bağıntılar çok çeşitlidir. Bir tahmine işaret ederler ve değişkenler arasındaki neden ve sonuç ilişkisine dayanırlar. Doğrusal bağıntı, yukarıda da belirtildiği gibi, en yaygın gözlenen bağıntı şeklidir, doğada ve günlük yaşamda örneklerine sık rastlanır. Bunların bazıları aşağıya çıkarılmıştır (Şekil 5.1). Bunun yanında üslü fonksiyonların da çeşitli tipleri sıkça görülür. Gözlemler arasındaki ilişkinin tanımlanması için önce sıklık dağılımlarının homojenliğinin bilinmesi gerekir. Çünkü bunlar değişik özelliklere sahip anakütlelere ait olabilirler. Prof. Dr. H. Çelebi 60 Bir iki boyutlu bağıntı genelde aşağıdaki özellikleri taşır: 1.İki değişken istatistiksel olarak birbirine bağlı değildir (Şekil 5.1a). Bu durumda veriler birbirinden bağımsız veya ilişkisizdir (r = 0). Değişkenlerden birinin sabit, diğerinin değişmesi durumunda da bağıntı olmaz. 2. İki değişken tamamen veya kısmen birbirine bağlıdır (Şekil 5.1 b ve c). Bağlılık doğrusaldır (doğrusal bağıntı). Bu bağıntıda değişkenler eşit oranlarda artarlar (Şekil 5.3), ancak bağınım doğrusunun eğimi, a) pozitif olabilir (r > 0). Bu durumda değişkenlerden biri artarken diğeri de artar demektir (uyumlu veya pozitif bağıntı). r = +1 değeri en uyumlu bağıntıyı gösterir ve tüm noktalar 1 doğru üzerindedir. b) negatif olabilir (r < 0). Bu durumda değişkenlerden biri artarken diğeri azalır demektir (uyumsuz veya negatif bağıntı). r = -1 en uyumsuz bağıntıyı gösterir. 3. Bağınım doğrusal değildir (doğrusal olmayan bağıntı). Burada artan veya azalan bir üssel bağıntı mevcuttur (Şekil 5.1 d). Bu tür bağıntılarda değişkenlerden biri bir ölçü birimi artarken, diğeri değişik ölçülerde artar veya azalır. Bağlı değişken Ordinat r=0 y x x x x x x x x x x x x x x x x x x Bağımsız değişken Absis a r>0 y x x x x y r<0 x x x x x x x x x x r>0 x xx x x x x Uyumlu x x xx artan x c xx x x x x xx b y x xx x x x d x x a, Bağıntı yok, r = 0; b, uyumlu doğrusal bağıntı, r > 0, c, uyumsuz doğrusal bağıntı, r < 0 Şekil 5.1 Önemli bağıntı çeşitleri. 60 ve d, üssel uyumlu bağıntı, r > 0. 61 Jeolojide matematik ve statistiksel yöntemler 5.2.1 Bağıntı katsayısı (r, BK) Bağıntı derecesini belirliyen bağıntı katsayısı r, ancak, -1< r < +1 5.1 değerlerini alabilir. En iyi bağıntı değeri r = |1| olduğu zamandır (bak. yukarıya). Bunun arasındaki değerler zayıf, ancak anlamlı olabilirler. Bir bağıntı verilerinin bağımsız ve normal dağılmış olması lazımdır. Bu, bağıntının önkoşuludur. İki değişken arasındaki doğrusal bağıntı derecesi r, matematiksel olarak, rxy = s xy 5.2 sx s y n (x = i 1 n (x i 1 i i x )( yi y ) x)2 n ( y i 1 i y )2 n n 1 n x y ( x )( yi ) i i i n i 1 i 1 i 1 n n 1 n 1 n [ x 2 ( x) 2 ][ y 2 ( y ) 2 ] n i 1 n i 1 i 1 i 1 şeklinde ifade edilmektedir (n-1 terimleri kısaltılmıştır). Görüldüğü gibi r, katışık değişke (kovaryans) sxy ile değişkenlerin standart sapmaları olan sx ve sy‘den veya bunların ham değerlerinden hesaplanmaktadır. Öneminden dolayı katışık değişke aşağıda açık şekliyle verilmesinde yarar vardır: 1 n sxy = x. y n 1 i 1 n n n i 1 i 1 n xi yi xi . yi i 1 n(n 1) 5.3 gibi. Görüldüğü gibi katışık değişke, çarpanları eşit olmıyan değişkedir, yani (xi- x ) (xi-. x ) yerine (xi- x ) (yi- y ) şeklidir. Bağıntı analizinde az sayıdaki örnek için yüksek r istenirken, çok sayıdaki örnek için düşük r değerleri de anlamlı sonuç verebilir. Yani r’nin anlamlılık sınırları artan örnek sayısı ile azalır. Örnek sayısına veya serbestlik derecesine bağlı olarak hesaplanmış belli bir güvenirlik derecesini, P=% 90, 95, 99 gibi, ifade eden r değerleri hazır çizelgelerden alınabilir (Ek-5.1). Prof. Dr. H. Çelebi 62 Bağıntı katsayısı r bir örneklemin tüm örneklerine ait olduğundan, örneklerin sadece tümü için geçerlidir. Ayrıca karşılaştırılacak veya ortalamaları alınacak iki örneklemin bağıntı katsayısının yaklaşık aynı sayıdaki örneğe ait ve aynı birimde olmaları gerekir. Çünkü anlamlılık örnek sayısına göre çabuk değişir. Ancak bu ve buna benzer durumlar gözönüne alınarak bir bağıntı analizinin yapılacak yorumu, gerçekçi ve objektif olabilir. 5.2.2 Anlamlılık katsayısı (r2) Bir veri kümesindeki toplam sapma veya değişke açıklanabilen ve açıklanamıyan değişkelerden meydana gelir. Buna göre toplam değişke veya sapma, n n n 2 2 ( y y ) ( y y ) i ( yi yˆ ) 2 i 1 i 1 5.4 i 1 Toplam sapma = Açıklanan sapma + açıklanamıyan sapma terimlerinden oluşur (Şekil 5.2). Buradan anlamlılık katsayısı r2, açıklanabilen saçınımın, toplam saçınıma oranı olarak, Açiklanan.sapma r2 = Toplam.sapma n r2 = ( yˆ y ) 2 (y 2 i 1 n i 1 5.5 i y) ifade edilir. Açıklanan sapma oranı ne kadar yüksekse, r2 de o kadar büyük olur. Dolayısı ile r2 en çok 1 değerini alır ve saçınımların tümünün açıklandığı anlamına gelir. Aksine r2=0’dir. y y1 y y y1 y y2 y y1 y1 y2 y y2 y2 (x1, y1) (x2, y2) x yi = Bağlı değişkenin i gözlem değeri, i = 1, 2,...,n xi = Bağımsız değişkenin i gözlem değeri, y i = Bağlı değişkenin okunan (kestirilen) değeri, y = Bağlı değişkenin ortalama değeri Şekil 5.2. Sapmaların geometrik olarak elemanlarına ayrılması. 62 63 Jeolojide matematik ve statistiksel yöntemler n Anlamlılık katsayısı r2, r2= 1- (y i 1 n i (y i 1 yˆ i ) 2 5.6 i y) 2 şeklinde, açıklanamıyan sapmanın toplam sapmaya oranının en yüksek değeri olan 1’den çıkarılması ile de hesaplanabilir. Buradaki çevirme işlemi hesaplamayı kolaylaştırmaktadır. 1 ile olan fark, toplam değişkenin açıklanan, yani bağınım doğrusu tarafından kapsanan, sistematik etkenlerden kaynaklanan anlamlılık kısmını, geri kalan kısmı da açıklanamıyan, rastlantısal etkenlerden kaynaklandığını gösterir. r2, istatistiksel açıdan r’den daha anlamlıdır (% r2 = r2.100). Açıklanan saçınımın toplam saçınıma oranını, yani gerçek değerden spma oranını, ifade eder. Logaritmik veya yüksek dereceli fonksiyon özellikleri için daha önemlidir. Hesaplanan bir r değeri çizelgelerdeki (Çizelge 5.2) veya grafikten (Wellmer, 1989) okunan değerlerle karşılaştırılarak anlamlılığı saptanır. Bu en kolay yoldur. Bulunan bir bağıntı katsayısının anlamlılıği t veya F sınaması ile de saptanabilir. Örnek sayısının 50’den az (n<50) olması durumunda t sınamasında anlamlılık, t= ryx (1 r 2 ) n2 5.7 eşitliği ile sağlanır (n-2, serbestlik derecesi). Burada verilen anlamlılık düzeyi için thes>tteo olmsı gerekir (Ho= red, H1 = kabul, bak. Örnek 5.1). Varyans analizinde olduğu gibi bağınım analizinde de anlamlılık derecesinin bulunmasında kullanılacak parametreler kolay ve sistematik hesaplama amacı ile faktöriyel dizayn edililir (Çizelge 5.5). Basit bir hesaplama için gerekli parametreler Çizelge 5.1’de derlenmiştir: Örnek 5.1. Ergani-Maden/Elazığ bakır cevherlerinde Cu-Co bağıntısı (bak Şekil 5.5). Prof. Dr. H. Çelebi 64 Çizelge 5.1. Örnek 5.1’e ait verilerin hazırlanması 1 Örnek No, i 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. ∑ n = 10 3 (xi- x )2 s2 x 82,81 16,81 0,01 16,81 98,01 24,01 98,01 15,21 37,21 26,01 414,90 2 Ölçümler xi, ppm Cu yi, ppm Co 30 47 25 41 21 37 25 46 11 27 16 32 11 27 17 35 27 44 26 40 209,00 376,00 4 (yi- y )2 s2 y 88,36 11,56 0,36 70,56 112,56 31,36 112,36 6,76 40,96 5,76 480,40 5 (xi- x ) (yi- y ) sxy 85,54 13,94 -0,06 34,44 104,94 27,44 104,94 10,14 39,04 12,24 432,60 Çizelge 5.1’deki verilerin parametreleri, x = 209:10 = 20,90 ppm Cu y = 376:10 = 37,60 ppm Co s2x = 414,90:(10-1) = 46,10 ppm2 Cu ____ sx = √46,10 = 6,79 ppm Cu s2y = 480,40:(10-1) = 53,38 ppm2 Co ____ sy = √53,38 = 7,31 ppm Co sxy = 432,60:9 = 48,07 ppm2 syx = sxy rxy = sxy:(sx.sy) = 48,07:6,79.7,31 = 48,07:49,63 = 0,969 bulunur. Buna göre anlamlılık katsayısı 0,9692 =0,939 eder. Buradan, t= r. n 2 1 r2 64 65 Jeolojide matematik ve statistiksel yöntemler = = 0,969. 10 2 1 0,939 0,969. 8 0,061 = 0,969.2,828:0,247 = 2,740:0,247 = 11,09 elde edilir. Ek 5.1’de, F=8 (n-m) satırı ve P99 sütunundan tteo = 3,36 okunur. thes (11,09)>tteo (8; 0,99) (3,36)’dir. Böylece Ho varsayımı reddedilmiştir (x1≠x2). Yani bu değer % 99 kesinlikle (güvenirlikle) anlamlıdır. Sistematik ve rastlantısal hata oranlarının saptanması için regresyon doğrusu denkleminin bulunması gerekir (bak. 5.3.2 ve Örnek 5.2). t hesaplamasına gerek bırakmıyan anlamlı r değerleri Ek-5.2’de verilmiştir. 5.3. Bağınım (regresyon) analizi (BaA) Bağıntı ve bağınım analiz yöntemleri çok önemli bir araştırma yöntemidir ve çok yararlı sonuçlar elde edilebilir. Örneğin, benzer ilişkiler, çiftlerin değişim ve davranışları ile saklı bazı özelliklerin keşfedilmesi hakkında önemli bilgiler sağlanabilir. Bağınım doğrusunun eğimi de değişimin değerlendirilmesinde kullanılabilir ve bağıntılar incelenebilir. 5.3.1 Bağınım doğrusu (BD) Bir bağıntı analizinde genelde bağlı değişkenle bağımsız değişken arasında bir doğrusal ilişkinin bulunduğu kabul edilir. Doğrusal ilişki demek, değişkenlerin sabit oranda değişmesi demektir (Şekil 5.3). Yani, y 5.8 sabit x ifadesi geçerlidir. Bu sabite, bağınım doğrusunun absisle yaptığı açının eğimidir. Bağıntı analizi, bir örneklemde bağlı ve bağımsız değişken arasında bir ilişkiyi saptamak mecburiyetindedir. Bu eşitlik, y = b + ax 5.9 şeklinde bir doğru denklemidir. Burada y, bağlı değişken; x, bağımsız değişken; a, bağınım doğrusunun eğimi (a = tg α) ve b, doğrunun y ekseni üzerinde kestiği parça, intersepttir. a’ya bağınım katsayısı da denir. y x y = b+ax Prof. Dr. H. Çelebi 66 Δx x Δy x by x D x x: Bağımsız değişken y: Bağlı değişken b: D doğrusunun y ekseni üzerinde kestiği parça, intersept Δy/ Δx : D bağınım (regresyon) doğrusunun eğimi, a = tg α Şekil 5.3. Bağınımın geometrik anlamı. Bağınım analizinin amaçları, 1. Verilen eşitliğin katsayılarını bulmak, 2. Örneklemde saptanan bağıntının örnek evreni için de geçerli olup olmadığını incelemektir (Örnek 5.2). Bağınım (regresyon), iki değişken arasındaki bağlılığın şeklini ifade eden bir terimdir. Yani bir örneklemin 2 veri özelliği veya bağımsız değerleriyle çalışılır (bak. Şekil 5. 3). Burada regresyonun öztürkçe karşılığı bağınım kavramı kullanılacaktır. Bu bağlılığı gösteren eğriye de bağınım eğrisi denir. Bağınımlar geometrik bir ifadeye sahip olmaları nedeniyle özel önem taşırlar. 5.3.2 Kalıntı değerler (ei) Bağıntı analizi ile bağınım analizi birbirine sıkı sıkıya bağlıdır. Bağınım, bağıntı analizi ile elde edilen nokta bulutuna en uygun doğrunun uyarlanmasıdır. Bu işlemde her nokta uyarlanan doğruya belli mesafede olur. Ölçüm değerlerinin bağınım doğrusuna uzaklıklarına kalıntı (residual) değerler denir. Bunlar Şekil 5.3’te ei ile gösterilmiştir. Değerlerin bağınım doğrusuna olan uzaklıklarının karelerinin toplamı 0<Σei2<1 arasında değişir. Başka hiçbir doğruya olan uzaklıklar bağınım doğrusuna olan uzaklıkların toplamından küçük olamaz. Bir dağılım ne kadar uyumlu ise, kalıntı değerler o kadar küçük olur. Bunların büyüklüğünden bağınım doğrusunun noktalara uyumu belirlenir. En iyi uyumda, yani noktaların doğru üzerinde bulunması durumunda, ei2 değerlerinin toplamı min veya 0 olur. Bu duruma en küçük kareler toplamı, yönteme de en küçük kareler yöntemi denir. Tüm hesaplamalarda ei2 değerlerinin toplamının mümkün olduğu kadar küçük olması istenir. y O1 O3 (x3, y3) e1 66 67 Jeolojide matematik ve statistiksel yöntemler e3 e2 O2 b y3 D yˆ 3 x3 x 0 e3 = Bağlı özellik kalıntı (residual) değeri, ei =yi- yˆ i x3 = Bağımsız özellik büyüklüğü y3 = Bağlı özellik büyükülüğü y = Bağınım doğrusuna göre x3’ün okunan, kestirilen değeri Şekil: 5.3. Kalıntı değerlerinin geometrik açıklanması. Bağınım analizinin hedef fonksiyonu, n e i 1 i 2 n 2 yi (b axi ) min 5.10 i 1 fonksiyonudur. Eşitlikte, ei = i’ninci gözlemin kalıntı değeri, i = 1, 2, ..., n yi = Bağlı değişken ( yˆ i , doğru üzerinde okunan, kestirilen değerdir) b = Bağınım doğrusunun sabitesi, intersept a = Bağınım sabitesi, D doğrusunun eğimi, a = tg α xi = Bağımsız değişken n = Gözlem sayısı Bu koşulu Şekil 5.3 için sağlıyan doğru, yˆ i = b – a xi 5.11 bağınım doğrusudur. Ancak bu doğru veya eşitlik vasıtası ile x’e bağlı ve D doğrusu üzerindeki yˆ i değerleri kestirilebilir (bak. Örnek 5.2). 5.3.3 Bağınım doğrusunun parametrelerinin hesaplanması Prof. Dr. H. Çelebi 68 Bağınım doğrularının çeşitli parametrelerinin hesaplanması için standart sapma, değişke ve katışıksız değişke gibi temel verilere gereksinim vardır. Bunlar burada yinelenmiyecektir, ancak ilişkileri üzerinde kısaca durulmasında yarar vardır. Bağınım doğrusu değerlerin sapmaları konusunda bilgi vermezler. Ancak bir bağınım doğrusu % 95 kesinlikle y = ±3sy aralığına düşer (s, standart sapma). Doğrunun eğiminden (a) değişkenlerin birbirine ne kadar bağlı olduğu bulunabilir. Örneğin, a ile r arasında şu ilişkiler bulunmaktadır: a ≤ 0 için, r ≤0, a > 0 için, r >0 ve a = sy/sx için de r = 1 değerini alır. Bağınım doğrusunun eğimi, ayx = syx/s2x 5.12 n n i 1 i 1 n xi y i xi y i 5.13 n n y ( y i ) 2 i 2 i 1 değerine sahiptir (syx=sxy’dir). Alt simgeler xy, bağlı değişkene göre yer değiştirir; bağlı değişken önce gelir. Örneğin, y=b+ax eşitliği için ayx şeklinde verilir. Buna göre a’nın r cinsindeki değeri, sy ayx = r 5.114 sx şeklini alır. Bunun gibi kesim noktası da r cinsinden hesaplanabilir. Örneğin, byx= y r sy sx x 5.15 gibi. Doğru denklemindeki sabiteleri bağlı ve bağımsız değişkenler cinsinden hesaplamak mümkündür. Bağınım doğrusunun y ve x eksenlerine göre denklemleri, y = f(x) = b+ax 5.16 5.17 veya x = f(y) 5.18 = b+ay 5.19 şeklindedir (bak. Şekil 5.4). Bu durumda bağıntı katsayısı r ve katışık değişke değişmez. Değişkenlerin değerleri aynı olan 2 doğru çakışır. Bilindiği gibi koşut doğruların eğimleri eşit, dik 68 69 Jeolojide matematik ve statistiksel yöntemler doğruların eğimleri ise, birbirinin negatif tersidir (ayx=-1/axy). Bu işlemlerde tüm formüller ordinata uyarlanır (bak. Şekil 5.4). Buna göre, ryx = rxy 5.20 ve ayx .axy= r2 5.21 ayx ≤ 1/axy olur. Yani, 5.22 değerinde olur. D y x=f(y); rxy, axy, bxy y=f(x); ryx, ayx, byx E byx x bxy Şekil 5.4: Bağlı değişkenin değişimi. Analog olarak yukarıdaki y=b+ax doğrusunun (E) kesme noktası, byx= y a yx x = y x=b+ay doğrusunun (D) da, s xy s x2 x ve bxy= x a xy y = x s xy s y2 y 5.23 5.24 5.25 5.26 şeklini alır (bxy, 5.15’e de analogtur). Yukarıdaki doğruların eğimi, r cinsinden yinelenirse, ayx = r.sy/sx ve axy = r.sx/sy olduğu görülür. 5.27 5.28 Dolayısı ile y eşitliği, 5.29 y = b+(r.sy/sx)x Prof. Dr. H. Çelebi 70 yˆ i = y r. ve sy sx ( xi x ) 5.30 genel bağınım doğrusuna çevrilebilir. Bu eşitlikteki xi değerleri vasıtası ile, örneğin E doğrusu üzerindeki yˆ i değerleri, önceden yaklaşık kestirilebilir (bak. Şekil 5.5) 5.4 Sonuçların sağlanması Bağıntı ve bağınım analizlerinde sonuçların sağlanması önemli bir yer tutar. Yapılan uzun ve karmaşık işlemler sıkça hatalara neden olur. Bunları önlemek için bir çizelge hazırlanır (faktöriyel dizayn) ve hesaplanan sonuçlar buraya aktarılarak, n n KTb = ( yˆ y ) 2 i 1 KTs = ( yˆ yi ) 2 i 1 n KTt = (y i 1 i y) 2 5.31 formülünün sağlanması gerçekleştirilir. Çizelge 5.2 buna bir örnek oluşturmaktadır. Çizelge 5.2: Örnek 5.1 değerleri için değişkelerin hesaplanması (ANOVA: analayses of variance) faktöriyel dizaynı. 1. Değişim kaynağı 2. Toplam değişim 3. Doğrusal bağınım* 4. Toplam sapma 2. Kareler toplamı KTt KTb KTs 3. Serbestlik dercesi n-1 m-1 n-2 4. Kareler toplamı 5. t /F sınaması ortalaması KOt KOb thes=KOb/KOs KOs *KT, kareler toplamı, KO, kareler ortalaması; b, bağınım; s, sapma ve t, toplam demektir. Doğrusal bağınımın ortalamasının toplam sapma ortalamasına oranı, KOb/KOs = thes sonucunu verir. Bu değer t veya F dağılım çizelgesindeki teorik değerlerle karşılaştırılır (bak. Ek-5.1). Bunun için önce bir kesinlik derecesi, örneğin, P=%99, seçilir. Bundan sonra F serbestlik derecesinin (n-m) satırına karşı gelen P sütununun (kesinlik derecesi) teorik tteo değeri okunur (tF; P). Bu değer, tteo > thes olduğunda, sıfır (Ho) tezi kabul, tteo ≤ thes olduğunda da red edilmiş olur (bak Örnek 5.2). Aynı şey determinantlarla da yapılabilir. Örnek 5.2: Örnek 5.1’deki dağılımın bağınım katsayıları ve doğru denklemi (Çizelge 5.1, devam) : a) Doğru denklemi, 70 71 Jeolojide matematik ve statistiksel yöntemler y = b+a x ise, s yx ayx = 2 sx = byx = y a yx x 48,07 (6,79) 2 =37,60-1,043.20,90 =1,043 = 15,80 ppm Cu bulunur. Böylece, y = b+ax E doğrusunun denklemi, y = 15,80+1,04 x veya Co = 15,80+1,04 Cu bulunur (Şekil 5.5). Eksenlerin değişmesi durumunda D doğrusu için, x = -12,94+0,90 y ve Cu = -12,94+0,90Co doğru eşitliği bulunur (axy=48,07/7,312)=0,90; bxy =20,90-0,90.37,60=20,90-33,84=-12,94). s Aynı şekilde r2 = rxy.ryx ve xˆ i x r x ( y i y ) olduğu görülür ( xˆ , doğru üzerinde okunan sy değerdir). Cu-Co bağıntısı ppm Co 50 r=0,969 40 30 Co=15,80+1,04Cu 20 10 0 0 10 20 ppm Cu Şekil 5.5: Kalkopirtte bakır ve kobalt bağıntısı (Ergani-Maden, Elazığ). b) Değişkelerin hesaplanması 30 40 Prof. Dr. H. Çelebi 72 Çizelge 5.3. Çizelge 5.1 değerleri için bağınım değerlerinin hesaplanması (bak. Çizelge 5.1): i xi 1 30 2 25 3 21 4 25 5 11 6 16 7 11 8 17 9 27 10 26 Σn=10 382 yi 47 41 37 46 27 32 27 35 44 40 317 yˆ i =15,8+1,04x 47,15 41,94 37,77 41,94 27,34 32,55 27,34 33,60 44,03 42,98 376,63 n n yi KTb = ( yˆ y ) 2 KTs = i 1 37,60 37,60 37,60 37,60 37,60 37,60 37,60 37,60 37,60 37,60 317,00 91,28 18,83 0,03 18,83 103,33 25,48 105,33 16,04 41,28 28,97 451,39 ( yˆ yi ) 2 i 1 0,02 0,88 0,59 16,49 0,11 0,30 0,11 1,97 0,00 8,89 29,38 n KTt = (y i 1 i y) 2 88,36 11,56 0,36 70,56 112,36 31,36 112,36 6,76 40,96 5,76 480,40* *KTt ile KTb+KTs arasındaki 0,37’lık fark sayıların tamlanmasından kaynaklanıyor. Çizelge 5.4: Örnek 5.1 değerleri için değişkelerin hesaplanması (ANOVA: analayses of variance) faktöriyel dizaynı (bak. Çizelge 5.3). 1. Değişim 2. Kareler 3. Serbestlik kaynağı toplamı derecesi 2. Toplam değişim KTt = 480 n-1 =9 3. Doğrusal bağınım* KTb = 451 m-1 =1 4. Toplam sapma KTs = 39 n-2 =8 4. Kareler toplamı 5.t sınaması ortalaması KOt = 53 -KOb =451 thes=KOb/KOs KOs = 5 = 90 *KT, kareler toplamı, KO, kareler ortalaması; b, bağınım; s, sapma ve t, toplam demektir. m=2 element (Cu, Co). c) Bağıntı katsayısı r’nin sağlanması KOb/KOs = thes= 90 sonucu t dağılım çizelgesindeki değerlerle karşılaştırılır (bak. Ek-5.1). Bunun için önce bir kesinlik derecesi, örneğin, P=%99, seçilir. tteo sınaması çizelgesinin F=8 satırı (n-m) ile P99 sütunundan t(8; 0,99) = 3,36 okunur. tteo < thes olduğundan, bağınım katsayısı % 99 kesinlikle anlamlıdır, yani bulunan r değeri incelenen örnek sayısına göre doğrudur. Bu da yukarıdaki saptamayı kuvvetlendirir. Bunun yanında, r2= Aciklanabi len. deg iske Toplam. deg iske 72 73 Jeolojide matematik ve statistiksel yöntemler = = = ( yˆ y ) 2 sy 2 KTb KTt 451,39 480,40 = ± 0,969 olarak örnek 5.1’deki değere eşit bir değer bulunur. Toplam değişke ortalaması, KOt, yaklaşık 53; açıklanan değişke kısmı, KOb, 50 ve açıklanamıyan değişke kısmı da, KOs, 4’tür (Çizelge 5.4; 3 parametre de n-1’e bölünür). Yuvarlak rakamlarla toplam değişke 50+4 ≈ 53 alınabilir. Buna göre açıklanan değişke kısmı (50:53) açıklanamıyan değişkeden (4:53) oldukça büyüktür ve toplam değişkenin % 94’üne karşılık gelmektedir. Bu, bağınım modeli (doğrusu) tarafından kapsanan değişke kısmı demektir. Dolayısı ile bağınım katsayısı r, oldukça güçlüdür. Buna karşın kalıntı değişke s2xy=39/8 ≈ 5 olduğu görülür ve açıklanamıyan değişkeninin çok küçük olduğunu pekiştirmektedir. 5.5 Çok değişkenli bağıntılar Doğrusal olmayan korelasyonların denklemi parabol formülleri ile hesaplanır. Her bağınım gerçek olmayabilir. Bazen görünür vey saklı bir bağınım da mevcut olabilir. Bağıntı analizi; element çiftleri, grupları ve mineraller arasındaki ilişkiler hakkında önemli ipuçları verebilir. Bu sayede komşu örnekler, cevherleşmeler ve element grupları karşılaştırılabilir. Eğer çok sayıda değişken varsa (birkaç element gibi) çoklu bağıntı (multiple correlation) ve bağınım analizi de yapılabilir. Böylece bir örneğin elementlerin birine veya birkaçına bağlı olduğu ortaya çıkarılabilir. Örneğin, y = b0+b1x1+b2x2 5.32 doğrusal bağıntı eşitliği gibi. Bağıntı ve bağınım, faktör, diskriminant ile cluster analizi gibi analiz yöntemleri ve diğer çok değişkenli istatistik yöntemlerinin temelini teşkil eder. Ancak bunları bağıntı analizi kadar detaylı incelemek, bu notların kapsamını aşar. Bunlara yeri geldikçe değinilecektir. İlgi duyanların bu konularla ilgili kaynaklara başvurmaları önerilir. Sonuç olarak bağıntı ve bağınım analizleri ile ancak olası sonuçlar belirlenir veya bunlara işaret edilir. Alıştırma 5.1: Bir şirketin ilk 5 yıllık karı aşağıda verilmiştir. Gelecek 3 yılın yaklaşık karını ve değişim fonksiyonunu bulunuz. Verilenler: Yıllar 1 2 6 Kar (10 $) 1,52 1,35 3 1,53 4 2,17 5 . 3,60 Prof. Dr. H. Çelebi 74 Yanıt: Yaklaşık % 15.50 ortalama yıllık artış. Alıştırma 5.2: Bir radyoaktif elementin miktarının aşağıda verildiği şekilde bozunduğu saptanmıştır. Yarılanma süresi t 1/2’yi ve bozunma eşitliğini bulunuz. Miktar [g, y] 1.0000 Süre [gün, x] 0 .9797 10 .8795 50 .7736 100 .2770 500 .0768 1000 Açıklama: N0, başlangıç, N1/2 yarılanma anındaki miktardır. N, t=0 için N0=1’in değeridir. N0=1 ise, N1/2=0,5’tir. Yanıt: N = N0 e-λt genel yarılanma eşitliğinden, ln N = ln N0 - λt eşitliğinden t1/2=270 gün bulunur. Kaynakça 1. Arıcı, H., 2001. İstatistik. Metaksan basımevi, 13. baskı, 269 s., İstanbul. 2. Backhaus, K., Erichson, E., Plinke, W. ve Weiber, R., 1990: Multivariate Analysenmethoden. Springer Verl., 6. Basım, 411 s., Berlin-Heidelberg-New York. 3. Barsch, H. ve Billwitz, K., 1990: Geowissenschaftliche Arbeitsmethoden. Verl. Harri Deutsch, 256 s., Thun ve Frankfurt am Main. 4. Davis, J. D., 1976: Statistics and data analysis in geology. John Villay and Sons, 550 s., New York 5. Leonhart, M., 2002: Statistik für Psychologen. http://www.psychologie.uni-freiburg.de, 750 s. 6. Sachs, L., 1984: Angewandte Statistik. Springer Verl., 6. basım, 528 s., Berlin-Heidelberg. 7. Schönwiese, Ch.-D., 1992: Praktische Statistik für Meteorologen und Geowissenschaftler. Borntraeger, 2. basım, 231 s., Berlin, Stuttgart. 8. Schroll, E., 1976: Analytische Geochemie . Ferdinand Enke Verl, 374 S., Stuttgart. 9. Şeniş, F., 1996: İstatistik. Anadolu Üniversitesi yayını No.: 175, 312 s., Eskişehir. 10. Wellmer, F.-W., 1989: Rechnen für Lagerstaettenkundler und Rohstoffwirtschaftler. Ellen Pilger, 462 S., Clausthaler-Zellerfeld. 11. Wessel, P., 2001: Geological data analysis. http//www.higp.hawaii.edu./cecily/courses, 325 s. EKLER 74 75 Jeolojide matematik ve statistiksel yöntemler Ek-5-1. t sınaması çizelgesi (F, serbestlik derecesi; P, kesinlik derecesi = 1-α. α, yanılma derecesi [%]). F 1 2 3 4 5 P95 P99 12,71 63,66 4,30 9,92 3,18 5,84 2,78 4,60 2,57 4,03 F P95 P99 F P95 P99 13 14 15 16 17 2,16 2,14 2,13 2,12 2,11 3,01 2,98 2,95 2,92 2,90 30 40 50 60 70 2,04 2,02 2,01 2,00 2,00 2,75 2,70 2,67 2,66 2,65 6 7 8 9 10 2,45 2,36 2,31 2,26 2,23 3,71 3,50 3,36 3,25 3,17 18 19 20 22 24 2,10 2,09 2,09 2,07 2,06 2,88 2,86 2,84 2,82 2,80 80 90 100 150 200 1,99 1,99 1,99 1,98 1,97 2,64 2,64 2,63 2,61 2,60 11 12 2,20 2,18 3,11 3,06 26 28 2,06 2,05 2,78 2,76 300 400 1,97 1,96 2,60 2,58 EK 5-2: Anlamlı en küçük r değerleri (Schroll, 1976). Prof. Dr. H. Çelebi Serbestlik Derecesi F 76 Serbestlik Derecesi F Kesinlik derecesi P (n-2) p =95 % p =99 % 1 2 3 4 5 0,997 0,950 0,878 0,811 0,754 6 7 8 9 10 Kesinlik derecesi P (n-2) p =95 % p =99 % 1,000 0,990 0,959 0,917 0,874 21 22 23 24 25 0,413 0,404 0,396 0,388 0,381 0,526 0,515 0,505 0,496 0,487 0,707 0,666 0,632 0,602 0,576 0,834 0,798 0,765 0,735 0,708 26 27 28 29 30 0,374 0,367 0,361 0,355 0,349 0,478 0,470 0,463 0,456 0,449 11 12 13 14 15 0,553 0,532 0,514 0,497 0,482 0,684 0,661 0,641 0,623 0,606 35 40 45 50 60 0,325 0,304 0,288 0,273 0,250 0,418 0,393 0,372 0,354 0,325 16 17 18 19 20 0,468 0,456 0,444 0,433 0,423 0,590 0,575 0,561 0,549 0,537 70 80 90 100 125 150 200 300 0,232 0,217 0,205 0,195 0,174 0,159 0,138 0,113 0,302 0,283 0,267 0,254 0,228 0,208 0,181 0,148 Örnek: Örnek sayısı n=10 çift olan bir doğrusal bağıntının % 95güvenirlikle bağıntı katsayısı |r| > 0,632’dir. 6. JEOİSTATİSTİĞE GİRİŞ 6.1 Başlangıç 76 77 Jeolojide matematik ve statistiksel yöntemler İstatistikte uygulanan yöntemler verilerin veya deney ve ölçümlerin birbirine bağlı olmadığını, yani bunların bağımsızlığını esas alır. Bu koşul zar atma olayında mümkündür, örneğin, 1. atışta 2 gelme olasılığı, 2. atıştaki 5 gelme olasılığına eşit ve 1/6’dır. Ancak yerbilimlerinde bu çok zayıf bir olasılıktır. Her jeolog, zengin bir cevherleşmenin yakınından alınan bir örneğin, zayıf bir cevherleşmenin yakınından alınan bir örneğe göre yüksek bir analiz sonucu vermesinin daha muhtemel olduğunu bilir. Buna göre uzayda bir bağımsızlık söz konusu değildir. Bu durumda yere bağlı veya bölgesel değişkenler ortaya çıkmaktadır. Jeoistatistik, bir uzaydaki değişimi dikkate alan istatistik yönteminin adıdır. Jeoistatistiğin öncüleri Güney Afrikalı Krige (1951), Hollandalı De Wijs (1951/53) ve Fransız Mathéron (1971)’dir. Bu konuda Kanada, Amerika Birleşik Devletleri, İngiltere ve Almanya’da çeşitli ekoller oluşmuştur. David (1977), Journel ve Huijbregts (1978) başta olmak üzere çok sayıda kitap yazılmış ve Mathematical Geology ile Geomathematic gibi birkaç periyodik çıkmaktadır. Türkiye’de jeoistatistik çalışmaları çok yenidir. Burada Tercan ve Saraç (1998) ile Tüysüz ve Yaylalı (2005)’in anılmasında yarar vardır. 6.2 Jeoistatistik yöntemleri ve uygulama alanları Jeoistatistiğin ilk adımı, alınmış az sayıdaki örneğin dağılımına ve bunların bir bütünlük (örnek evreni/popülasyon) oluşturup oluşturmadığına bakılmasıdır. Bu da ancak sınama yöntemleri ile ortaya çıkarılabilir. Buradan örneklemin dağılım fonksiyonu, merkezi ve dağılım ölçütleri ile güven aralıkları tanımlanabilir. Tüm jeoistatisk yöntemlerinin temeli deney sonuçlarına ve analiz değerlerine dayanır. Bunlardan elde edilen verilerin amaca uygun değerlendirilmeleri şarttır. Verilerin matematiksel işlemlere tabi tutulabilmesi için ilk önce bunların uygun liste veya çizelgelerde toplanması gerekir. Sınıf veya gruplara ayrılan verilerin sonuçları, çalışma ve yorumlamaları kolaylaştırır. Jeoistatistiksel hesaplamalar çok zaman alıcı olabilirler. Bilgisayar programları olmadan bazı hesaplamaları gerçekleştirmek mümkün olmıyabilir. Onun için bu notlar kapsamında basit, yeni öğrenenler tarafından da kolay anlaşılabilecek ve sadece hesap makinesi ile çözülebilecek örnek ele alınacaktır. Daha ayrıntılı bilgiler ve karmaşık çözümler için Akın ve Siemes (1988) ve David (1977)’ye başvurulabilir. Jeoistatistik, maden yatakları değerlendirmesinin ilk aşamaları için de önemli olabilmektedir. Özellikle, a) Hata ve rezerv hesaplamaları sırasında güvensizliklerin giderilmesi ile rezervlerin sınıflandırılması, b) Blokların tenör hesaplamalarında, özellikle en düşük tenör (cut off grade) değerlerinin altında kalan bloklar ortaya çıkması durumunda önem kazanırlar. Prof. Dr. H. Çelebi 78 İleri aşamalarda bunlara eniyileme (optimizasyon) işlemleri eklenir. Bunun için de, aşağıda ele alınacak kriging kestirimlerine gereksinim vardır. Bu çerçevede jeoistatistiğin çalışma yöntemleri ve uygulama alanları aşağıda özetlenmiştir. ↓ log normal dağılım ↓ De Vijs tipi ↓ Dağılım parametreleri ↓ İşletme çalışmalarının eniyilenmesi Örnek alma ↓ Analiz ↓ Bileşenlerin dağılımı ↓ Normal dağılım ↓ Değişke ↓ Varyogramlar ↓ Geçişli (transitif) tip ↓ Kriging ↓ Ağırlıklı ortalama tenör ↓ Rezerv hesapları ↓ Değişke analizi ↓ İşletme planlanması ↓ Diğer dağılımlar ↓ Diğer tipler ↓ Hata payı (külçe etkeni) ↓ Diğer kullanım alanları 6.3 Bölgesel değişkenler Jeoistatistik, bugün artık jeolojinin vazgçilmez konusu haline gelmiştir. Jeoloji, madencilik, tarım, ormancılık ve çevre gibi yerbilimleri dallarında elde edilen önemli verilerin matematiksel yöntemlerle incelenebilmesi için geliştirilmiştir (Mathéron, 1963). Aynı dönemde bu yöntemi L. S. Gandin de Sovyetler Birliği’nde meteorolojide uygulamak amacıyla geliştirmiştir. Bu yöntemlerle veriler uzaydaki yerlerine bağlı olarak ele alınır. Jeolojik oluşuklardaki mineral dağılımlarının geometrik ve bölgesel değişimleri de hesaba katıldığı için uygulanması oldukça karışıktır ve ancak bilgisayar desteğiyle hesaplanabilmektedir. Yere bağlı değişimlerin açıklanması amacı ile geliştirilen yere bağlı veya bölgesel değişkenler teorisi, bir noktadan diğer bir noktaya kadar belirgin değişimlerin mevcut olduğunu ifade etmektedir. Bu, bir rastlantısal z=z(x) fonksiyonun gerçekleşmesi olarak yorumlanır. Ancak bu, değişimleri bir genel formülle ifade edememektedir. Bir maden yatağındaki değişkenler, örneğin metal derişimleri, 3 yönde vektöriyel olarak uzayda 3 78 79 Jeolojide matematik ve statistiksel yöntemler boyutlu bir varyogramla gösterilebilir. Bu yöntemin de uygulanabilirliği oldukça zor ve çoğu zaman eksik veri nedeniyle yeterli olmamaktadır. Burada bu değişkenlerin bazı özellikleri incelenecek, varyogramın ne olduğu ve neye yaradığı kısaca açıklanacaktır. Başlangıç noktasındaki değer x olan bir bölgesel değişkenin h mesafedeki değeri x+h’dir. Bunların fonksiyon değerleri de z(x) ve z(x+h) olur. Bunun geometrik anlamı aşağıda gösterilmiştir: h x x+h x z(x) z(x+h) Bir rastlantısal z fonksiyonu, rastlantısal z(xi) değişkenlerinin her x noktasındaki dağılımı ve birbirine bağımlılıkları ile tanımlanır. Bununla tanımlanan olasılık dağılımına uzay dağılım yasası denir. Yerbilimlerinde bu yasanın tümüne gerek duyulmamaktadır. Kabul edilebilir çözümler için 1. ve 2. momentler yetmektedir. a) Momentler Bu dağılımın gerçekleşme beklentisi veya 1. momenti, yere bağlı olarak, m(xi)= E[z(xi)] 6.1 olarak yazılabilir. Bu, Z’nin xi noktasındaki tüm gerçekleşme olasılıklarının ortalamasıdır σ2(xi) =Var[z(xi)] = E{z[(xi)-m(xi)]2} 6.2 şeklinde ifade edilebilir. Bu da beklentinin varlığını şart koşmaktadır. Bu durum iki noktaya, yani h mesafesi ile x1 ve x2 = x1+h noktalarına, uygulandığında bu iki nokta arasındaki katışıksız değişke (kovaryans) C, C(xi, xi+h ) =σz(xi), z(xi+hi) = E{z[(xi)-m(xi)] [z(xi+hi)-m(xi+h)]} 6.3 olarak tanımlanmaktadır. z(xi) ve z(xi+hi) noktaları arasındaki değerlerin bağımlılığını ifade eden başka bir ölçüt de, 2γ(xi, xi+h ) =Var[z(xi)-z(xi+h)] 6.4 ile ifade edilen varyogram veya varyogram fonksiyonudur. Bu fonksiyon, artan değerlerin değişkenliğini gösterir. Değişkelerin eşitliği veya bağımsızlığı durumunda Prof. Dr. H. Çelebi 80 2γ(xi, xi+h ) =2Var[z(xi)] olduğunu belirtmek gerekir. 2γ(xi, xi+h gramın tanımından gelir). ) 6.5 terimine semi varyogram denir (2 katsayısı, varyo- Varyogramlar bir inceleme bölgesinin veya bir maden yatağının belli kesimleri için ancak 2030 ölçümün bulunması ve tüm bölgeyi temsil edecek özelliklere sahibolması durumunda anlamlı olabilir. b) Rastlantı varsayımları Rastlantısal her z(x) fonksiyonunun sadece 1 z(xi) değerinin gerçekleşme olasılığı bulunmaktadır. Bu nedenle değişkenlerin yapısı hakkında bilgi edinmek oldukça zor olmakta ve olasılık yapısı hakkında belli varsayımlara gitmek gerekmektedir. Burada en iyi varsayım durağanlık varsayımıdır. Bu varsayım, seçilmiş her k grubu değişkeni [z(xi), z(x2)], …, z(xk)], 6.6 [z(xi+hi), z(x2+hi),…, z(xk+h)] 6.7 h ve k=1, 2,…, k için, değişkenleri ile aynı dağılımı gösterdiğini kabul eder. Jeoistatistikte genelde sadece ilk iki momentle çalışıldığından, geniş anlamda durağanlık tanımıyla yetinilir. Eğer E[z(xi)] beklentisi mevcut ve xi’den bağımsız, yani tüm xi’ler için, ve E[z(xi)]=m 6.8 C(hi)=E[z(xi+h).z(xi)-m2] 6.9 rastlantı çiftinin her xi değeri için katışıksız değişke mevcut ise, 2. derece durağanlık söz konusudur. Katışıksız değişke durağanlığı, değişkenin ve varyogramın durağanlığını kapsadığından, tüm xi’ler için, Var[z(xi)= E[z(xi)-m]2 = Co 6.10 ve γ(hi) = γ(xi, xi+h) = ½ E [z(xi+hi)-z(xi)]2 = ½ E[z(xi+hi)-m]2 +½ E[z(xi)-m]2 – – [z(xi+hi)-m].[z(xi)-m] = C(0) – C(hi) 80 6.11 6.12 81 Jeolojide matematik ve statistiksel yöntemler olduğu bulunur. Son eşitlik, değişke ve varyogramın, 2. derece durağanlık varsayımı altında, z(xi+h) ve z(xi) değişkenlerinin bağımlılığı, otokorelasyonu için eşdeğer 2 fonksiyon olduğunu göstermektedir. Burada bağıntı büyüklüğü, veya bağıntı fonksiyonu korelogram, da kullanılabilir. Örneğin, C(h) γ(hi) = 6.13 C(o) =1- (h) C(o) 6.14 gibi. 2. derece momentin gerçekleşmesi (varlığı), varyogramın gerçekleşmesinden (varlığından) daha zordur. Uygulamada varyogramla çalışıldığından, esas (intrins) hipotez’le yetinmek gerekir. Bu hipoteze göre, 1. E[z(xi)] beklentisi tüm xi değerleri için mevcuttur ve xi’ye bağlı değildir. 2. Tüm hi ve xi [z(xi+hi)-z(xi)] öğesi, xi’ye bağlı olmıyan sonlu bir değişkeye sahiptir. Yani, Var[z(xi)-z(xi+hi)] = E[z(xi)-z(xi+hi)]2 =2 γ(h) 6.15 6.16 olur. Böylece 2. derece durağanlığının durağan büyümeyi de kapsar. Bunun tersi geçersizdir. Önemli hipotez sadece |h|<a için geçerli olur. 6.3.1 Varyogram Bölgesel değişkenlerin diğer jeoistatistiksel yöntemlere karşın analiz veya örnek değerlerinin bibirlerine bağımlılıklarını uzayda ele aldığı yukarıda belirtilmişti. Bunun temeli varyograma dayanmaktadır. Bir varyogram, örnek değerleri arasındaki farkların kareleri ortalamasının mesafe ile değişim fonksiyonudur (Şekil 6.1 ve 6.2). Bununla varyogram tüm jeoistatistiksel hesaplamaların temel aracını oluşturur. Bir tek boyutlu varyogram matematiksel olarak, n 1 (h) = [f(xi)-f(xi+hi)]2dx 2n 0 6.17 1 n [xi-(xi+hi)]2 2n i 1 6.18 = formülü ile tanımlanmakta ve hesaplanmaktadır. Eşitlikteki n, örnek sayısını; xi, örnek değerini ve h da örnekler arasındaki sabit mesafeyi, örneğin, bir kesit veya sondaj boyunca alınan örneklerin aralığını, göstermektedir. Farklı örnek aralıkları için varyogram Prof. Dr. H. Çelebi 82 hesaplamaları daha karmaşıktır (bak. Dutter, 1985; Akın ve Siemes, 1988). Burada veriler gruplandırılır, düzeltilir veya çeşitli yönlerdeki açılar esas alınır. Örnek 6.1: Çizelge 6.1’de verilen Ag değerlerinin varyogramının çizimi ve yorumlanması. Analiz değerleri (% Ti): 7-6-8-8-9-6-7-5 Örnek aralıği h=1,5 m Çözüm: Hesaplamanın metodik olması ve kolaylığı için bir çizelgede verilenlerin yerleştirilmesi ve adım adım hesaplamak büyük kolaylık sağlar (bak. Çizelge 6.1) 1. Adımda komşu değerler birbirinden çıkarılarak kareleri alınır ve toplamı işleme katılan örnek çiftine (2n) bölünür. Sonuç varyogramın 1. değerini verir ((h), bak. aşağıdaki şema). 2. Adımda birer değer atlıyarak aynı işlem tekrarlanır ve 2. varyogram değeri elde edilir. 3. Adımda ikişer tane, 4. adımda üçer tane, daha sonrakiler de buna benzer şekilde atlıyarak işlem tamamlanır. Önemli olan ilk 5-10 adımdır. Kesit A-B A Örnek No. 1 1. adım B 2 3 4 5 6 2. Adım 3. Adım . . . Çizelge 6.1: Örnek varyogram çözümünün hesaplanması (Örnek aralığı h=1,50 m). Veriler, % Ti = xi: 7 1. h= 1,50 xi-(xi+hi): 1 xi-[(xi+hi)]2: 1 6 8 8 9 7 6 -2 4 0 0 -1 1 2 4 1 1 1 1 82 5 12 2n (hi) 14 0,86 83 Jeolojide matematik ve statistiksel yöntemler 2. h=3,00 xi-(xi+hi): -1 xi-[(xi+hi)]2 : 1 3. h=4,50 xi-(xi+hi): -1 xi-[(xi+hi)]2 : 1 -2 4 -3 9 -1 1 1 1 1 1 2 4 4. h=6,00 xi-(xi+hi): -2 xi-[(xi+hi)]2 : 4 -1 1 2 4 3 9 5. h=7,50 xi-(xi+hi): 0 xi-[(xi+hi)]2 : 0 0 0 3 9 6. h=9,00 xi-(xi+hi): 1 xi-[(xi+hi)]2: 1 7. h=10,50 xi-(xi+hi): 2 xi-[(xi+hi)]2: 4 1 1 3 9 4 16 2 4 20 12 1,67 31 10 3,10 18 8 2,25 9 6 1,50 2 4 0,50 4 2 2,00 Yukarıda h=1,5 m örnek aralığı ile örneklerin çok sık alındığını göstermektedir. Görüldüğü gibi varyogram ancak yaklaşık 5 m sonra yatay duruma geçebilmektedir. Bu mesafeye tesir mesfesi (range) denir ve en iyi (optimal) örnek aralığını gösterir. Buna karşın külçe etkeni Co (nugget effect) oldukça yüksektir (yakl. % 30=0,60/2,00). Ancak değişke C makul sınırlarda bulunmaktadır. Bu varyogram küresel (geçişli/transitif) varyogram tipine girmektedir. Çünkü örnekler yaklaşık 5 m’ye kadar birbirine bağlıdır (artarak C değerine varmaktadır, bak. Şekil 6.2a). Örnek varyogram 4 (h) 3 Uyum (model) 2 1 Deneysel 0 0 5 10 15 Örnek aralığı h, m _______________________________________________________________________________ Şekil 6.1: Varyogram (deneysel) ve küresel uyumu (sferik model). Prof. Dr. H. Çelebi 84 6.3.1.1 Varyogram çeşitleri (tipleri) Hesaplanan bir varyogram ender durumlarda ideal şekillere uyum gösterir. Çünkü genellikle örnekler yetersiz veya örnek aralıkları düzensiz olmaktadır. Bundan doğacak göreceli hata oranı regresyon yoluyla gerçek hata oranı yerine, en azından yatağın veya bölgenin bir bölümü için, bulunabilmektedir. Doğada rastlanan önemli varyogram çeşitleri Şekil 6.2’de gösterilmiştir. (h) a b c d h m Şekil 6.2: Varyogram çeşitleri. a, sürekli; b, doğrusal; c, süreksiz; d, rastlantısal tip varyogram. Varyogramlar başlangıç bölgesindeki durumlarına göre değişik tiplere ayrılırlar. Bunlar, ölçüm değerlerinin inceleme alanındaki dağılımı hakkında bilgi verirler: Bunlardan Şekil 6.2a-d’de verilmiştir. Özellikle maden yataklarındaki dağılımları gösteren varyogramların 4 temel şekli bulunmaktadır. a) Sürekli tip: Sedimanter yataklarda görülür, çok düzenlidir, ender rastlanır. h→0 için, (|hi|) = C|hi|2 6.19 parabol değerini alır. b) Doğrusal tip: Volkanosedimanter yataklara mahsus bir varyogram tipidir, düzenli tipten düzensize kadar değişir. Varyogram başlangıç noktası civarında doğrusal bir şekil alır. Vasat bir devamlılığı ifade eden bu varyogram tipine metal yataklarında rastlanır. h→0 için, (|hi|) = C|hi| 6.20 değerini alır. c) Süreksiz tip: Altın yataklarında yaygındır, büyük değişimler gösteren bir dağılım tipidir. Başlangıç noktası civarında devamlılık görülmemektedir. Değişken devamlılığının çok zayıf olduğunu ifade eder. (h)= 0 tanımlanmış olmasına karşın, h→0’a yaklaştığında, (h) 0’a yaklaşmaz, yani fonksiyon 0 noktası yakınında süreksizdir ve birbirine yakın z(xi) ile z(xi+hi) noktaları arasındaki değişkenliğin büyük olabileceğini ifade eder. Başlangıçtaki bu 84 85 Jeolojide matematik ve statistiksel yöntemler süreksizlik külçe etkeni (hata payı/nugget effect) olarak bilinir ve fizikteki “beyaz hışırtı”ya benzetilir. Örneğin, açık bir raduyonun hışırtısı gibi. Bu etken genelde hatalı örnek alımına ve mikro mineralizasyon değişimi ile açıklanır. c) Rastlantı tipi: Elmas yataklarında görülür, her yönde değişken dağılım gösterir. Varyogram başta süreksizdir ve büyük mesafelerde sabit olup tamamen tesadüfi bir dağılımı ve sınır durumunu ifade eder. Değişken son derece devamsızdır. h→0 için, (hi) = C0 6.21 olur. Uygulamada a çok küçük alındığında ortaya çıkabilir. Tüm bu varyogram tipleri ordinata göre simetriktir, (h) = (-h) ‘dır. |h|<a için a, bir örneğin tesir mesafesi veya etki alanı olarak tanımlanmıştır. Bunun gibi, |h|=a için, (hi) = C 6.22 olur ve “eşik değer” veya “doygunluk derecesi” (sill) olarak adlandırılır. Bu değer dışına çıkıldığında artık z(xi) ve z(xi+hi) birbirinden bağımsızdırlar. Tesir mesafesi a, çok boyutlu uzayda yarıçapı a olan basit bir küre gibi ele alınamaz. Etki alanı yöne bağlı olarak değişir. Örneğin, yatay ve dikey veya değişik yönlerden alınan varyogramlar farklı tesir mesafelerine sahibolabilirler (Şekil 6.6). Varyogramların temel formülünün değiştirilmesi ile sondaj karelajı içinde kullanılmaları mümkündür. Bu durumda h değerleri sondaj aralığı olarak alınır ve varyogram yönü açısal olarak değişir. Bir yatağın iyi incelenmesi için 3 boyutta da incelenmesi gerekir. Örneğin, bir sedimanter yatakta birinci yön boyuna, yani uzun eksene, paralel; ikinci yön, sedimantasyon yüzeyine, uzun eksene, dik ve üçüncü yön de tabakalanmaya dik varyogramlar çizilerek incelenebilir. Bu konu aşağıda daha ayrıntılı ele alınacaktır (bak. 6.3.3). 6.3.1.2 Varyogram modelleri Varyogramların kullanılması için bazı standartlar geliştirilmiştir. Bir normal sıklık dağılımı bir modelle gösterildiği gibi varyogram da bir modelle gösterilebilir ve hesaplamalar için önemli kolaylıklar sağlar. Örneğin, yukarıda anlatılan küresel (sferik) veya De Wijs varyogram modelleri diğer varyogramların yerine kullanılabilir hale getirilmişlerdir. Bir varyogram modeli herhangi bir fonksiyon olarak ele alınamazlar. Aranan özellikler için bazı önkoşulların yerine gelmesi gerektir. Örneğin, a) Başlangıç noktasının ordinata göre interpolasyonla bulunması. Burada bir süreksizlik veya külçe etkeni olabilir, Prof. Dr. H. Çelebi 86 b) Küresel varyogram tipinde doygunluk derecesinin saptanması. Burada istatistiksel değişke yaklaşık eşik değer olarak alınabilir, c) Anizotropi ve saklı özelliklerin araştırılması. Varyogram modelleri temelde 2 gruba ayrılır: 1. Eşik değeri olmıyan varyogramlar için modeller a) Kuvvet (pot) modeli Bu model, (h)= p|h|λ 6.23 şeklinde tanımlanmaktadır. Burada 0<λ<2’dir. Ancak uygulamada bunun sadece doğrusal modeli kullanılır (Şekil 6.3a). b) Doğrusal model Uygulamada kullanılan doğrusal model, (h)= p|h| 6.24 olarak kullanılır. Bu varyogram sürekli veya deneysel varyogramların verileri ölçüsünde, doğrusal artar. Bu model, sınırsız saçınım gösteren bölgesel dağılımlara karşılık gelir (Şekil 6.3a). c) Logaritmik veya De Wijs modeli Bu model, (h)= log |h| 6.25 olarak tanımlanmıştır. Bu modelde h=0’a kadar uyum sağlanamaz, ancak önemli hesaplama kolaylıkları sağlıyor. Bu modelde varyogram doygunluk derecesine varmamaktadır (Şekil 6.3b ve 6.4b). (h) (h) a 0,60 0,30 0,40 0,20 b p 3p 0,20 0,10 1 2 3 4h 86 1 2 5 10 20 30 h 87 Jeolojide matematik ve statistiksel yöntemler Şekil 6.3: Doygunluk derecesi olmıyan varyogram modelleri. a, kuvvet ve doğrusal ile b, logaritmik varyogram modelleri. 2. Eşik değeri olan varyogram modelleri a) Küresel model Bu modelde varyogramlar başlangıçta doğrusal gelişirler. Belli bir tesir mesafesinden sonra (range, a) bir doygunluk derecesine (eşik değere, C) varırlar. Küresel model, (h)= C0 + C (1,5 h/a - 0,5 h3/a3) 6.26 formülü ile h≤a için tanımlanmıştır. h>a için bu, (h)=C0+C 6.27 parametreleri ile bellidir. Buradaki varyogram modelleri Şekil 6.4’te gösterilmiştir. Bir cevherleşmede a değerinden daha yakın mesafede bulunan örnek değerleri birbirleri ile ilişkilidir. Bu matematiksel ilişki varyogram formülü ile tanımlanabilir ve cevherleşme için karakteristiktir. (h) 2/3 a a b 2 σ c A co B a h m h m Şekil 6.4. Varyogram modelleri. a, küresel (geçişli/sferik, transitif model) varyogram; C, değişke (eşik değer, ingilizce=sill); Co , hata oranı (külçe etkeni/nugget effect); C+Co, toplam değişke; a, tesir mesafesi (en uygun = optimum örnek aralığı, range) demektir. b, De Wijs modeli varyogram (A, doğrunun eğimi, B, kesim parçası = intersept). Prof. Dr. H. Çelebi 88 Burada örnekler belli bir tesir mesafesine veya örnek aralığına kadar (range=a) bibirlerine bağlıdır (Şekil 6.4a). Bu mesafeye en iyi (optimum) örnek aralığı denir. Hesaplama, analiz ve örnek alma hatalarından dolayı eğri ordinatı ((h) eksenini) çok ender durumlarda sıfır noktasında keser. Varyogramın başlangıç noktası ile sıfır arasındaki değer, hata payını (Co=nugget effect) gösterir. Fonksiyonun yatay duruma geçtiği noktadan apsise çizilen pararlel, ordinatı kestiği noktadan Co’a kadar olan kısım, C, örnek değerlerinin değişkesine (eşik değer, sill) karşılık gelir. Bu varyogram modelinde birleştirilen ilk 2 noktadan geçen doğru, varyogramın yatay duruma geçtiği noktadan absise çizilen paraleli, dönü noktası ile ordinat arasında, 2/3 a noktasında keser. De Wijs modelinde varyogram değerleri h aralıklarına göre logaritmik olarak artar. Küçük mesafeler için değerler bir doğru meydana getirir ve varyogram değerlerinin farkları mesafe ile büyür. Eğim açısı doğrunun mutlak dağılım katsayısıdır. A, gerçek örnek veya sondaj aralıklarına karşılıktır. Gerçek sondaj aralığından büyük çıkması halinde, sondaj aralığının uygun olmadığı ortaya çıkar ve uygun aralık bulunmaya çalışılır, örneğin küçültülür. b) Üstel (exp) model Bu model, (h) = C[1-e-h/a] 6.28 şeklinde tanımlanmaktadır. Küresel modelden daha yassıdır ve C’ye ancak asimtot olarak yaklaşır. Tesir mesafesi, eşik değerin % 95’ini kapsıyan 3a olarak alınır. Yani, 3a=C[1-e-3] =0,95 C 6.29 olur. c) Gauss modeli Bu model başlangıçta parabol özelliğini gösterir. Burada da eşik değer sadece asimtot olarak oluşur ve (h) = C[1-e(-h/a)2] 6.30 olarak tanımlanmıştır. Üstel modelde olduğu gibi burada da esas kullanım alanı, 3a = C[1-e-3) =0,95C değerindedir (Şekil 6.5). 1,00 (h) / C 0,95 88 6.31 89 Jeolojide matematik ve statistiksel yöntemler Küresel Üstel Gauss 0,00 σk σg σü h Şekil 6.5. Eşik değeri olan varyogram modelleri. 6.3.1.3 Küresel modelin uyarlanması Yukarıda verilen deneysel varyogramın C0, C ve a parametrelerine göre h değerlerine bağlı olarak bir modelin (h) değerleri hesaplanabilir (bak. Örneğin, 6.26 ve 6.27). Zaman alıcı bu işlemleri kolaylaştırmak için h/a oranlarına göre (h)‘nın geğerlerinin hesaplandığı çizelgeler hazırlanmıştır (Çizelge 6.2). h/a’nın 0,000 ile 1,000 aralığı için (h) değerleri verilmiştir (bak. Akın ve Siemes, 1988 ve David, 1977). Herhangi bir h/a oranı için okunan değer, C ile çarpılarak Co eklenir. Böylece bulunan değerler uyumun ordinatlarını oluşturur. Absiste h değerlerine karşılık gelen değerlerle uyum çizilir. Örnek 6.2: Örnek 6.1’de çizilen varyogramın, Co= 0,60 m2, C = 2,00-0,60 = 1,40 m2 ve a = 5 m için küresel model/uyum varyogramının çizilmesi. Çözüm: h = 1,5 m için aşağıdaki değerler elde edilir: Adım 1. 2. 3. 4 h 1,50 3,00 4,50 6,00 h/a 0,300 0,600 0,900 1,200 (h/a) 0,437 0,792 0,986 2,000* C. (h/a) 0,612 1,109 1,380 2,800 Co+C. (h/a) 1,212 1,709 1,980 3,400 *h>a için (h/a) = C’dir. 6.4 Varyogramların uygulanma alanları Varyogramların esas uygulanma alanları yapısal analiz, rezerv hesaplaması, sınıflandırılması ve minimum tenör sınırlarının (cut off) hesaplanması ile eniyilemedir. Bu amaç için ileri jeoistatistik (kriging) uygulanır (bak. David, 1977). Bunlara zemin hazırlıyacak bazı temel öğeler aşağıda incelenecektir. Prof. Dr. H. Çelebi 90 Çizelge 6.2: h/a < 1,00 için γ(h/a) değerleri (Akın ve Siemes, 1988). h/a→ .000 .020 .040 .060 .080 .100 .120 .140 .160 .180 .200 .220 .240 .260 .280 .300 .320 .000 .000 .030 .060 .090 .120 .150 .179 .209 .238 .267 .296 .325 .353 .381 .409 .437 .464 .001 .001 .031 .061 .091 .121 .151 .181 .210 .239 .269 .297 .326 .355 .383 .410 .438 .465 .002 .003 .033 .063 .093 .123 .152 .182 .212 .241 .270 .299 .328 .356 .384 .412 .439 .466 .003 .004 .034 .064 .094 .124 .154 .184 .213 .242 .271 .300 .329 .357 .385 .413 .441 .468 .004 .006 .036 .066 .096 .126 .155 .185 .215 .244 .273 .302 .330 .359 .387 .415 .442 .469 .005 .007 .037 .067 .097 .127 .157 .187 .216 .245 .274 .303 .332 .360 .388 .416 .443 .470 .006 .009 .039 .069 .099 .129 .158 .188 .217 .247 .276 .305 .333 .362 .390 .417 .445 .472 .007 .010 .040 .070 .100 .130 .160 .189 .219 .248 .277 .306 .335 .363 .391 .419 .446 .473 .008 .012 .042 .072 .102 .132 .161 .191 .220 .250 .279 .308 .336 .364 .392 .420 .447 .474 .009 .013 .043 .073 .103 .133 .163 .192 .222 .251 .280 .309 .337 .366 .394 .421 .449 .476 90 .010 .015 .045 .075 .105 .135 .164 .194 .223 .253 .282 .310 .339 .367 .395 .423 .450 .477 .011 .016 .046 .076 .106 .136 .166 .195 .225 .254 .283 .312 .340 .369 .397 .424 .451 .478 .012 .018 .048 .078 .108 .138 .167 .197 .226 .255 .284 .313 .342 .370 .398 .426 .453 .480 .013 .019 .049 .079 .109 .139 .169 .198 .228 .257 .286 .315 .343 .371 .399 .427 .154 .481 .014 .021 .051 .081 .111 .141 .170 .200 .229 .258 .287 .316 .345 .373 .401 .428 .456 .482 .015 .022 .052 .082 .112 .142 .172 .201 .231 .260 289 .318 .346 .374 .402 .430 .457 .484 .016 .024 .054 .084 .114 .144 .173 .203 .232 .261 .290 .319 .347 .376 .403 .431 .458 .485 .017 .025 .055 .085 .115 .145 .175 .204 .234 .263 .292 .320 .349 .377 .405 .432 .460 .486 .018 .027 .057 .087 .117 .147 .176 .206 .2 35 .264 .293 .322 .350 .378 .406 .434 .461 .488 .019 .028 .058 .08 8 .118 .14 8 .178 .20 7 .236 .26 6 .295 .32 3 .352 .38 0 .408 .43 5 .46 2 .48 9 91 Jeolojide matematik ve statistiksel yöntemler .340 .360 .380 .400 .420 .440 .460. .480 .500 .520 .540 .560 .580 .600 .620 .640 .660 .680 .700 .720 .740 .760 .780 .800 .820 .840 .860 .880 .900 .920 .940 .960 .980 1.0 .490 .492 .493 .494 .496 .497 .498 .500 .501 .502 .504 .505 .506 .508 .509 .510 .511 .513 .514 .51 5 .517 .518 .519 .521 .522 .523 .524 .526 .527 .528 .530 .531 .532 .534 .535 .536 .537 .539 .540 .541 .543 .544 .545 .546 .548 .549 .550 .552 .553 .554 .555 .557 .558 .559 .560 .562 .563 .564 .565 .56 7 .568 .569 .571 .572 .573 .574 .576 .577 .578 .579 .581 .582 .583 .584 .586 .587 .588 .589 .590 .592 .593 .594 .595 .597 .598 .599 .600 .602 .603 .604 .605 .606 .608 .609 .610 .611 .613 .614 .615 .61 6 .617 .619 .620 .621 .622 .623 .625 .626 .627 .628 .629 .631 .632 .633 .634 .635 .637 .638 .639 .640 .641 .643 .644 .645 .646 .647 .648 .650 .651 .652 .653 .654 .655 .657 .658 .659 .660 .661 .662 .66 4 .665 .666 .667 .668 .669 .670 .672 .673 .674 .675 .676 .677 .678 .680 .681 .682 .683 .684 .685 .686 .688 .689 .690 .691 .692 .693 .694 .695 .696 .698 .699 .700 .701 .702 .703 .704 .705 .706 .708 .709 .710 .711 .712 .713 .714 .715 .716 .717 .718 .719 .721 .722 .723 .724 .725 .726 .727 .728 .729 .730 .731 .732 .733 .734 .736 .737 .738 .739 .740 .741 .742 .743 .744 .745 .746 .747 .748 .749 .750 .75 1 .752 .753 .754 .755 .756 .757 .758 .759 .760 .761 .762 .763 .764 .765 .766 .767 .768 .769 .770 .771 .772 .773 .774 .775 .776 .777 .778 .779 .780 .781 .782 .783 .784 .785 .786 .787 .788 .789 .790 .79 1 .792 .793 .794 .795 .796 .797 .798 .799 .800 .801 .802 .802 .803 .804 .805 .806 .807 .808 .809 .810 .811 .812 .813 .814 .815 .815 .816 .817 .818 .819 .820 .821 .822 .823 .824 .824 .825 .826 .827 .82 8 .829 .830 .831 .832 .832 .833 .834 .835 .836 .837 .838 .839 .839 .840 .841 .842 .843 .844 .845 .845 .846 .847 .848 .849 .850 .850 .851 .852 .853 .854 .855 .855 .856 .857 .858 .859 .860 .860 .861 .86 2 .863 .864 .864 .865 .866 .867 .868 .868 .869 .870 .871 .872 .872 .873 .874 .875 .875 .876 .877 .878 .879 .879 .880 .881 .882 .882 .883 .884 .885 .885 .886 .887 .888 .888 .889 .890 .890 .891 .892 .89 3 .893 .894 .895 .896 .896 .897 .898 .898 .899 .900 .900 .901 .902 .903 .903 .904 .905 .905 .906 .907 .907 .908 .909 .909 .910 .911 .911 .912 .913 .913 .914 .915 .915 .916 .917 .917 .918 .919 .919 .92 0 .921 .921 .922 .922 .923 .924 .924 .925 .926 .926 .927 .927 .928 .929 .929 .930 .930 .931 .932 .932 .933 .933 .934 .934 .935 .936 .936 .937 .937 .938 .938 .939 .940 .940 .941 .941 .942 .942 .943 .94 3 .944 .945 .945 .946 .946 .947 .947 .948 .948 .949 .949 .950 .950 .951 .951 .952 .952 .953 .953 .954 .954 .955 .955 .956 .956 .957 .957 .958 .958 .959 .959 .960 .960 .960 .961 .961 .962 .962 .963 .96 3 .964 .964 .965 .965 .965 .966 .966 .967 .967 .968 .968 .968 .969 .969 .970 .970 .970 .971 .971 .972 .972 .972 .973 .973 .974 .974 .974 .975 .975 .975 .976 .976 .976 .977 .977 .978 .978 .978 .979 .97 9 .979 .980 .980 .980 .981 .981 .981 .982 .982 .982 .983 .983 .983 .983 .984 .984 .984 .985 .985 .985 .986 .986 .986 .986 .987 .987 .987 .987 .988 .988 .988 .988 .989 .989 .989 .989 .990 .990 .990 .99 0 .991 .991 .991 .991 .992 .992 .992 .992 .992 .993 .993 .993 .993 .993 .994 .994 .994 .994 .994 .995 .995 .995 .995 .995 .995 .996 .996 .996 .996 .996 .996 .996 .997 .997 .997 .997 .997 .997 .997 .99 8 .998 .998 .998 .998 .998 .998 .998 .998 .998 .999 .999 .999 .999 .999 .999 .999 .999 .999 .999 .999 .999 .999 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 Örnek: h/a=0,010 için γ(h/a) = 0,015; h/a=0,511 için de γ(h/a) =0,700’dür (koyu yazılı değerler). 6.4.1 Yapısal analiz Yapı, değişkenlerin cevherleşme içindeki dağılım özelliği demektir. Aynı zamanda izotropi, anizotropi veya üst üste birikme ile oluşan şekiller (yuvalanma) v.s. önemli yapısal özelliklerdir. Bir varyogramda Co’ın olması, cevherleşmede çeşitli etkenlerin rol oynadığını gösterir. Örneğin, cevherleşmede büyük boyutlu (değişimlerin) şekiller yanında küçük boyutlu şekillerin de rol oynaması gibi. Hesaplanan varyogram değerlerine bir modelin uyarlanması zor olabilir. Ancak çeşitli modellerdeki varyogramların bir araya getirilmesi ile değişik bir tip ortaya çıkarılabilir. Bu değişim maden yatağındaki değişik etkenlerin sonucu olabilir (örneğin, sedimanter yataklardaki oluk akıntıları gibi). Genelde büyük yapılar yanında küçükleri ayırdedilemez. Bunlar Co olarak ortaya çıkar ve fizikteki “background”a benzetilir. 6.4.1.1 Anizotropi İzotrop oluşukların değişik yönlerdeki C ve a değerleri aynıdır. Buna karşın anizotrop bölgelerin veya maden yataklarının değişik yönlerde alınan varyogramları farklı özellikler Prof. Dr. H. Çelebi 92 gösterir. Örneğin, c değerlerinin eşit, ancak a değerlerinin farklı olduğu durumlarda bir geometrik anizotropi var demektir (Şekil 6.6b). Aksine c değerlerinin farklı, a değerlerinin eşit olduğu oluşuklar yerel anizotropiye (belli yönlerde farklı C) sahiptir (Şekil 6.6c) Örneğin, sedimanter yataklardaki kalınlık ve uzanım farkı gibi. Bu yatakların özellikleri yatay boyutta uzun mesafelerde değişmezken (geometrik anizotropi), dikey boyutta sık sık değişebilmektedir (yerel anizotropi). N b b W a W O a S b) Anizotropi: a≠b a) İzotropi: a=b (h) c2 c1=c2 c1 a1 a1=a2 h, m a2 b) Geometrik anizotropi: a1<a2 c) Yerel anizotropi: c1<c2 Şekil 6.6. Küresel model kullanımında şematik anizotropi çeşitleri. Geometrik anizotropi, aynı eşik değerlerine karşın farklı örnek aralığı (range, b), yerel anizotropi ise, farklı eşik değerlerine karşın aynı örnek aralığı şeklinde görülür, c. Bazen hem eşik değer, hem de örnek aralıkları farklı olabilir. Bu durum yerel anizotropi olarak değerlendirilir. De Wijs modelinde anizotropiler doğrunun eğiminden (yerel anizotropi) ve pararlel doğrulardan (geometrik anizotropi) anlaşılır. Anizotropi ile cevherleşmelerin asıl ekseni çıkarılabilir, boyutları incelenebilir ve buna göre araştırma programları geliştirilebilir. 6.4.1.2 Ardalanma (boşluk etkeni, hole effect) Bir maden yatağında veya bölgede zengin ve fakir cevher kısımları veya değerli hammadde ile yankayaç değişmesi durumunda varyogram, bu özelliği bir dalgalanma olarak yansıtır. Bu sinüs eğrisi şeklindeki periyodik durum boşluk etkeni veya ardalanma (hole effect) olarak adlandırılır (Şekil: 6.7a). Buna kömür damarlarının çeşitli düzeylerde yer alması, cevher merceklerinin yankayaçla tekrarlanması gibi jeolojik oluşuklar örnek verilebilir. (h) (h) a 92 b 93 Jeolojide matematik ve statistiksel yöntemler h, m h, m Şekil 6.7: Varyogramlarla saptanabilecek yapısal özellikler: a, ardalanma (hole effect) özelliği; b, eğilim/yönelim (trend, drift) gösteren varyogram. 6.4.1.3 Artan eğilim veya yönelim (trend, drift) Bazı oluşuklarda mesafeye bağlı olarak varyogram değerleri sürekli artar, örneğin derinlikle metal içeriğinin artması gibi (Şekil 6.7b). Bu özelliğe yönelim (trend) denir. Bu durum temelde bir logaritmik dağılımın belirtisidir. Dolayısı ile rezerv hasapları için kriging uygulanamaz. Bu nedenle böyle durumlarda rezerv ve tenör hesapları için değişik varyogramlar kullanılır. Eğilim doğrusal veya parabolik de olabilir (Akın, 1983). Varyogram şeklinden eğilimin ağırlıklı olarak hangi yönde olduğu da anlaşılabilmektedir. Derine doğru artan element derişimi, şehre doğru artan göl kirlenmesi gibi. Bu durumda varyogram doygunluk (eşik değer=sill) durumuna ulaşmaz, sürekli artar (Şekil 6.7b). 6.4.1.4 Diğer özellikler Yukarıda sayılan özelliklerden başka varyogramlarla iç içe yapılar ve değişkelerin ortalama değere bağlılığı, orantı etkeni (proportional effect), de açıklığa kavuşturulabilir. Bunların birincisinin rastlantısal hata, petrografik düzey ve karışımlar, örneğin, tabakaların birbirine geçmesi gibi, nedenleri vardır. Bu dağılımda a’lar ve C’ler her varyogram için farklıdır. Orantı etkeninde ise, bir logaritmik dağılım neden olabilir. Ortalama değerle değişkenin veya standart sapmanın paralel değişmesi, zengin cevherlerin, fakir cevherlerden daha düzensiz veya saçınımlı olduğu anlamına gelir. Bunların değişimlerinin oranı ortalamalarının oranına eşit ve sabittir. Bazı durumlarda bir varyogramdan başka bir varyogram hesaplanabilir (bak. Dutter, 1985). 6.5 Değişkelerin hesaplanması Prof. Dr. H. Çelebi 94 Örnek değerlerinden doğrudan hesaplanan küresel modelin C0+C değerine eşit istatistiksel yayılım değişkesi yanında uygulamada özellikle, - saçınım veya dağılım (blok), yayılım veya kestirim ve kriging değişkeleri kullanılmaktadır (Şekil 6.8). Aşağıda bu değişkelerin uygulamadaki hesaplama yöntemleri kısaca gösterilecektir. Bunlarla ilgili teorik esaslar için bak. Matheron (1971), Dutter (1985) ve Akın ve Siemes (1988). Kriging değişkesi, ileri jeoistatistikte ayrıntılı ele alınacaktır. V v V, maden yatağı v, blok O, örnek O Şekil 6.8. Değişkelerin geometrik gösterimi. 6.5.1. Saçınım (dağılım veya blok örnekler) değişkesi σ2 (O/ v ) Bu değişke, Krige (1951 ) tarafından bir maden yatağındaki örnek değişkesi ile blok değişkesi arasındaki ilişki olarak tanımlanmaktadır. Hacim-değişke ilişkisi olarak bu değişke, σ2 (O/V ) = σ2 (O/v) + σ2 (v/V) 6.32 Yatak değişkesi = Blokların değişkesi + Blok örneklerinin değişkesi şeklinde tanımlanır. Yani (V) maden yatağının (O) nokta şeklindeki örneklerinin değişkesi, (v) bloklarının yayılım değişkesi ile bu blokların (V) yatağındaki değişkelerinin toplamına eşittir. 6.34 eşitliğinin sol tarafı, σ2 (O/V ), maden yatağındaki örneklerin istatistiksel değişkesini (=C0+C), sağ tarafının 1. terimi, σ2 (O/v), v hacmindeki blok örneklerinin değişkesini (=ortalama varyogram değerlerini) ve 2. terimi, σ2 (v/V) de, V maden yatağındaki blokların değişkesini ifade eder. Buna göre değişik bloklar içinde bulunan nokta şeklindeki örnek ve blokların değişkelerinin toplamı maden yatağındaki örneklerin değişkesine eşittir. Uygulamada, örneğin, 94 95 Jeolojide matematik ve statistiksel yöntemler örneklerin blok değişkesi σ2 (O/v), bloklara eşit dağıtılan örneklerin varyogramlarının ortalama değerlerinden hesaplanır. Ancak en sağlıklı değişke hesaplama yolu yardımcı fonksiyonlarla (F Chart diyagramı) hesaplamaktır. Bu diyagram Co=0 ve C=1 olarak standardize edilmiştir (Şekil 6.9). Blokların boy (l) ve enlerinin (h) tesir mesafesine (a) oranları ile diyagramdan okunan F fonksiyon değerleri C ile çarpıldıktan sonra Co eklenerek örneklerin bloktaki değişkesi σ2 (O/v) bulunur (bak. Örnek 6.3). Bu değişke rastlantısal karelaj yöntemi için gereken kestirim değişkesinin bulunmasında, çeşitli maden işletmelerinde kriging yöntemi uygulamasında kullanılır. Örnek 6.3. Hata payı Co=0,25; Eşik değeri C=0,50 ve tesir mesafesi a=80 m olan bir göreceli varyogramın h=25 m ve l= 50 m olan blok içindeki kestirim değişkesinin hesaplanması: Çözüm: h/a=20/80 = 0,25 ve l/a = 40/80 = 0,50’den F(l/a, h/a) = 0,30 bulunur (bak grafik). Küresel model için, σ2 (O/v) = Co+C[F(h/a, l/a)] = 0,25+0,50.0,30 = 0,40 sonucuna varılır. Buradan, σ (O/v) = 0,40 = ± 0,63 = % 63 elde edilir. Prof. Dr. H. Çelebi 96 Şekil 6.9. l ve h kenarlı bir dikdörtgen blok içindeki saçınım değişkesinin kestirimi için geliştirilen 2 boyutlu F diyagramı (David, 1977; Akın, 1983’ten). Oklar için bak. Örnek 6.3. 6.5.2 Yayılım (kestirim veya blok) değişkesi σ2 (v/V) Bu değişke hesaplanmasının temeli her örneğin bir tesir mesafesi olduğu esasına dayanır. Dolayısı ile her örneğe bir doğru üzerinde, bir alanda veya bir hacim içinde belli bir tesir mesafesi verilir. Tesir mesafesinin büyüklüğü örnek veya sondaj aralıklarına göre ayarlanır. Yöntemin doğruluğu varyogramlarla denetlenir. Bulunan değişke bir doğru üzerindeki, bir alandaki veya bir hacim içindeki (bloktaki) hatayı ifade eder. Değişke hesaplaması özel yöntemler gerektirir, çeşitli grafik ve tablolardan yararlanılır. Bulunan değerler doğrultusunda örnek veya sondaj aralıkları mükemmelleştirilir. Bunun için kriging değişkesinden de yararlanılır. Yayılım değişkesi, örnek yerine ve yayılıma göre çözümü mümkün kılan bir yardımcı fonksiyonla hesaplanır. Boyut sayısı ile çözümün zorlaşır. Uygulamalarda çeşitli grafikler ve çizelgeler kullanılır (Şekil 6.10). Burada da örnek durumuna göre 6.5.1’de yapılan işlemler yapılır. Diyagramdan okunan l/a ve σ2(O/v) değerleri değişke C ile çarpılıp külçe etkeni C0 eklenir. Bu hesaplama için gerekli C0, C ve a küresel varyogram vasıtası ile bulunur. Şekil 6.10: 96 97 Jeolojide matematik ve statistiksel yöntemler Küresel model için yayılım değişkesinin hesaplanmasında kullanılan diyagram (David, 1977; Akın, 1983’ten). Örneklerin bloktaki konumuna göre eğriler değişir. Örnek 6.4: Kenar uzunluğu l = 20 m olan kare şeklindeki bir blokun ortasında yer alan bir örneğin yayılım değişkesinin parametreleri C0 = 0,10, C = 0,40 ve a = 60 m olan bir varyogram için hesaplanması. Çözüm: Ordinatta l/a = 20/60=0,30 alınır (bak. Şekil 6.10). Buradan ordinata çıkılan dikin σyayılım değişke eğrisini kestiği noktadan absise çizilen paralel, ordinatı yaklaşık 0,11 noktasında keser. Buna göre göreceli bir küresel modeli varyogram için, E2 =C0+C.σ 2E 2 =0,10+0,40.0,1 = 0,144 bulunur (σ 2E 2 , diyagramdan okunur). Buradan yayılım değişkesinin standart sapması, σE= 0,144 = ± 0,38 = % 38 olarak bulunur. Alıştırma: Kenarları l=40 m olan kare şeklindeki blokun köşelerinde bulunan örneklerin varyogram parametreleri a=100 m, C0=0,20 ve C=0,60 için yayılım değişkesini bulunuz. Yayılım değişkesinin çeşitli blok büyüklüklerine göre hesaplanması ile örnek alımı iyileştirilebilir. Bunun yardımı ile en iyi örnek ve sondaj aralığı bulunabilir ve sondaj karelajı yerleştirilebilir. Bunun yanında örnek veya sondajların sıklaşması veya seyrelmesi ile artan veya azalan bilgi oranı da bulunabilir, karşılaştırılabilir ve sondaj karelajının, örneğin, anizotropi gibi değişik koşullara göre, ayarlanması da mümkün olabilmektedir. Sondaj sayısına göre çizilen hipotetik eniyileme eğrisinin gidişinden en iyi sondaj aralığı ve sayısı da hesaplanabilir. Bulunan sondaj sayısından örneğin, % kaç hata payı için kaç sondajın ve hangi aralıkta gerektiği ortaya konulabilir. Bu da rezerv hesapları için önemli rol oynar (Şekil 6.11). Eğri, çeşitli büyüklükteki bloklar için yayılım değişkeleri hesaplanarak toplam blok sayısına bölünmesi ile elde edilmiştir. Yatak alanının belli olduğu kabul edilmiştir. Görüldüğü gibi hata payını düşürmek için sondaj sayısının arttırılması gerekir. Bu araştırmalar yürümekte olan inceleme çalışmaları sırasında sondaj karelajının eniyilemesini sağlar ve kısmen de gereksiz masrafları önler. Buna bağlı olarak yapısal analizi ile elde edilen yeni ve daha uygun bir sondaj Prof. Dr. H. Çelebi 98 karelaji kurulabilir. Bunun için çeşitli tablolardan yararlanmak mümkündür. Aynı yöntem en iyi örnek aralığı için geçerlidir. Göreceli hata payı, ± % 30 20 10 5 10 15 20 30 35 40 50 Sondaj sayısı Şekil 6.11: Hata payına göre yaklaşık sondaj aralığı ve sayısının bulunmasında yararlanılan hipotetik grafik örneği (Akın 1983). 6.5.3 Kriging değişkesi Kriging değişkesini amacı, bir maden yatağında eldeki örnek değerleri ile kuramsal en iyi doğrusal değişkeyi hesaplamaktır. Bunun için x1, x2,…, xn noktalardaki z(x1),…z(xn) bilinen değerleri yardımı ile değeri bilinmiyen x0 noktasındaki z(x0) değeri kestirilir ve hata payı bulunur. Gerekli değerler varyogram modelinden okunurlar. Şekil 6.12 kriging değişkesini ilke olarak açıklamaktadır. Ortadaki blok için kestirilen değer “kriging penceresi” içindeki tüm örnek değerler vasıtası ile kestirilir. Kriging penceresinin boyutları temelde varyogram modeline bağlı olarak tesir mesafesine göre değişir. Anizotropinin mevcut olması durumunda doğal olarak anizotropi oranına göre daire, elipse dönüşebilir. Kriging penceresinin boyutları, tesir mesafesinden başka külçe etkenine de bağlıdır. Çünkü bu, koruma etkeni (screen efect) ile de ilişkilidir (David, 1977). Şekil 6.12’de pencere içindeki tüm örnekler ağırlıklı hesaplanır ve toplanırlar. Hem ağırlıklı değerler, hem de kestirimler varyogram modeline dayanırlar. Dolayısı ile her λ değerinin yöne, sondajın blok konumuna ve mesafesine bağlı olarak hesaplanması gerekmektedir. Hesaplama için E2 kestirim değişkesinden yararlanılır: 98 99 Jeolojide matematik ve statistiksel yöntemler E2 =VAR[z(v0)-z*(v0)] 6.33 6.34 =z(x0)-∑ λi z(xi) z(v0), blokun gerçek değeri, z*(v0), blokun kestirilen değeri. S-9 S-1, z(xi) S-5 S-10 S-2 S-11 S-6 S-3 S-4 Blok S-7 S-8 Açıklamalar: S, sondaj z(xi) , yere bağlı değişken ------ kriging penceresi Şekil 6.12: Kriging yöntemi yardımı ile blok değerinin hesaplanmasında kullanılan 2 boyutlu nokta ilişkisi. Görüldüğü gibi kestirilen hata, gerçek değerle kestirilen değer arasında bulunmaktadır (x 0, değeri bilinmiyen; xi, değeri bilinen noktadır). 6.34’ten kestirilen hatanın λ’ya bağlı olduğu görülmektedir. Kriging hatası veya E2 , en az (best), ortalama olarak doğru (unbiased) ve ağırlıklı ortalaması doğrusal kestirildiğinden, BLUE (best linear unbiased estimator) diye adlandırılır. Yukarıdaki eşitlik çeşitli matematiksel işlemlerle, E2 = 2 λi σvxi + λi λj σxixj 6.35 ∑ λi =1 6.36 σ= min 6.37 şekline dönüştürülür. Burada, ve olması istenir. Bu eşitlik sistemine krige sistemi denir ve ancak Lagrange (“Lagranj” okunur) yöntemi ile çözülebilir. Bu eşitlikte, E2 , blok değişkesi, örneğin blok tenörleri, σvxi, blok değerleri ile örnek değerlerinin katışıksız değişkesi (kovaryansı) ve σxixj örnek değerlerinin katışıksız değişkesini ifade ederler. Prof. Dr. H. Çelebi 100 Bu değerlerin hepsi varyogramdan türetilebilir. Sonunda n+1 bilinmiyenli veya her sondaj ve örnek için ağırlıklı parametreli n+1 doğrusal eşitlik sistemi elde edilir. Kriging değişkesi veya hatası, 2 = σ 2 - λi σvxi - µ k v 6.38 ile hesaplanır. Bu eşitlikte µ, önceden λi ağırlık etkenleri ile hesaplanan lagrange etkeni demektir. Bu da örneğin, nokta kriging’de, aşağıdaki kriging matrissi K ile hesaplanır: σ11 σ21 . K= . . σn1 1 σ12……. σ1n 1 σ22……. σ2n 1 σn2…… σnn 1 1 1 0 K λ1 λ2 . . . λn µ = λ σ01 σ02 . . . σ0n 1 6.39 D σab = σba olduğundan, σ12 = σ21’dir ve matris simetriktir. Yani 1. noktadan 2.’ye veya 2. noktadan 1.’ye bakmak aynıdır ve dolayısı ile katışıksız değişkeleri eşittir (ortalama değeri olmıyan kriging). Burada ve D birer vektördür. Kriging matrisi K ile bu iki vektör arasında, K. = D 6.40 eşitliği bulunmaktadır. Görüldüğü gibi , K’nın kaldırılması ile hemen hesaplanabilmektedir. Yani, 6.41 = K-1. D ve 2 = σ 2 – λT. D ’ye 6.42 k v dönüşerek sadeleşmiş olur. Böylece kriging kestirimi için xo noktasının bilinmiyen ağırlıklı etkeni belli olmuştur. Matrisin çözümü ile, σ11 λ1 + σ12 λ2 + µ = σ01 σ21 λ1 + σ22 λ2 + µ = σ02 λ1 + λ2 + µ = σ01 = 1 100 6.43 6.44 6.45 101 Jeolojide matematik ve statistiksel yöntemler doğrusal eşitlikleri elde edilir. Bu 3 bilinmiyenli, λ1, λ2 ve µ, 3 eşitlik sistemidir. Sistemin çözümü ile λ katsayıları ve lagrange etkeni µ bulunarak kriging değişkesi 2 hesaplanır (bak. k Örnek 6.5). Bu yolla her blok ve değişken için bir kestirim değeri ve buna bağlı olarak bir kriging değişkesi hesaplanır. Bulunan bu değerler her blok için bir inceleme derecesi olarak görülür. Bununla eksik araştırma noktaları saptanabilir ve göreceli kriging standart sapması rezervlerin sınıflandırılmasında bir ölçüt olarak kullanılabilir. Kriging hesaplamaları için elektronik veri hesaplamaları (bilgisayar/program) gereklidir. Bazı çizelge ve grafikler çözümü kolaylaştırsa da, yeterli değildir. Kriging yöntemi, blok değerleri yerine nokta değerlerinin bulunmasında (point kriging) da kullanılabilir. Özellikle eşdeğer eğrilerle sunumun yapılması veya varyogramın denenmesi durumlarında bu yöntem sıkça uygulanmaktadır. Örnek 6.5: Örnek aralığı h=10 m, tesir mesafesi a=20 m olan bir varyogram için nokta kriging yöntemi ile kestirimi. Çözüm. Kriging ile kestirimde ilk önce K matrisi (6.39) kullanılarak varyogram verileri bulunur. Bu matriste köşegen değerler eşit olduğundan, σ11 = σ22 = σnn =0 olur. Simetriden dolayı, σ12 = σ21 =C =0 değerine sahiptir. Buradan küresel model için, 3 h 1 h3 σ10 = C[ ] 2 a 2 a3 3 10 1 10 3 = 20[ ] 2 20 2 20 3 = 20.0,69 = 13,76 bulunur. Yukarıda belirtildiğine göre C=20, σ20=20’dir. Bu değerler, Prof. Dr. H. Çelebi 102 σ11 σ21 1 σ12 σ22 1 1 1 0 λ1 σ10 λ2 = σ20 µ 1 K λ D matris sisteminde yerine konularak, 0 20 1 20 0 1 1 1 0 λ1 13,76 λ2 = 20 µ 1 K λ D matrisi sistemi elde edilir. Bunun çözümü ile λ1=0,656, λ2= 0,344 ve µ=6,88 olarak hesaplanır. Buna göre kriging ile kestirilen değer, n Z*(x0)= i z ( xi ) i 1 = 0,656.2+0,344.5 =3,03 bulunur (2 ve 5 varyogram değerleridir. Bak aşağıdaki Şekil). z(x1)=2 + z(x0)=? z(x2)=5 + 10 m 30 m Buna göre kriging değişkesi, 2 2 = λ1 σ0i+µ k i 1 = 0,656.13,76+0,344.20+6,88 = 22,78 olarak elde edilir. Bunun standart sapması, = k 22,78 = ± 4,77 değerindedir. 102 103 Jeolojide matematik ve statistiksel yöntemler Blok krigingde de buna benzer şekilde hareket edilir. Şekil 6.12’deki Çizelgede yararlanarak blok değişkesi kestirilir. Çeşitli değişkelerle ilgili örnekler çoğaltılabilir. Ancak bu konunun kapsamını aşar. Bu nedenle ayrıntılı incelemeler lisansüstü eğitime bırakılmıştır. 6.6 İleri jeoistatistik yöntemleri Jeoistatistikte çok sayıda uygulamada az denenmiş yeni yöntemler bulunmaktadır. Burada bunları sadece adları verilmekle yetinilecektir. Bu yöntemlerin başında üniversal kriging gelir. Bu yöntem durağanlık savının geçerli olmadığı yataklarda kullanılır. Varyogram yerine varyogram kalıntılarının gerçek değerleri ile işlem yapılır. Önemli rastlantısal fonksiyon, doğrusal olmıyan geoistatistik ve benzeşim buna eklenecek diğer önemli başlıklardır. Sonuç olarak matematik ve istatistik ilkelerine dayanan, Krige (1951) ve Mathéron (1971) tarafından geliştirilen “jeoistatistik”, özellikle maden yataklarının inceleme safhasında kullanılmaktadır. Jeoistatistik sayesinde bu safhanın pahalı verileri daha iyi ve çabuk kullanılabilir ve incelemeler esnasında önemli kararlar verilerek çalışmalar kolaylaştırılabilmektedir. Buna dayanarak işletmelerin optimum büyüklüğü, ona bağlı olarak da işletme ömrü, açık veya kapalı işletme olacağı daha kesinlikle planlanabilmektedir (Akın, 1983) . Bu yöntemler sayesinde, eskiden elle önce kesit ve haritalara işlenen kimyasal analiz değerleri, mineralojik ve jeolojik sonuçları, bugün bilgisayarlar değerlendirip tenör ve rezervi hesaplayabilmekte, çok kısa sürede maden yatağının 2 veya 3 boyutlu modelini, jeokimyasal element dağılımını ve birlikteliğini ortaya çıkarabilmektedir. Kaynakça 1. Akın, H., 1983. Anwendung der Geostatistichen Methoden in de Praxis. Klassifikation Von Lagerstättenvorräten mit Hilfe der Geoistatistik. Verlag Chemie, S. 164 s., Weinheim 2. Akın, H. ve Siemes, H., 1988. Praktische Geostatistik. Springer, 303 s., Berlin-HeidelbergNew York-Tokyo 3. David, M., 1977. Geostatistical Ore Reserve Estimation, 3. Baskı, 364 s., Amsterdam 4. De Wijs, H. J., 1951/53. Statisitics of Ore Distribution. J. of the Royal Netherlands Geol. and Min. Soc. 5. Dutter, R., 1985. Geostatistik. B. G. Teubner, 159 s., Stuttgart 6. Journal, A. G. and Huijbregts, Ch. J., 1978. Mining Geostatistics. Acad. Pres, 600 s., London. 7. Krige, D. G., 1951. A Statistical Approach to Same Mine Valuation an Allied Problems on the Witwatersrand. M. Sc. Thesis, Univ. of the Witwatersrand. 8. Mathéron, G., 1963. Principles of Geostatistics. Economic Geology 58, 1246-1266. Prof. Dr. H. Çelebi 104 9. Mathéron, G., 1971. The Theory of Regionalized Variables and Its Applications. Les Cahiers du Centre de Morphologie Mathématique de Fontainebleua, Fransa. 10. Tercan, A. E. ve Saraç, C., 1998. Maden yataklarının değerlendirilmesinde jeoistatistiksel yöntemler. TMMOB, JMO yayını 48, 137 s., Ankara 11. Tüysüz, N. ve Yaylalı, G., 2005: Jeoistatistik. KTÜ yayını 220, Trabzon, 382 s. 12. Wellmer, F.-W., 1989. Rechnen für Lagerstättenkundler und Rohstoffwirtschaftler. Teil 2, Springer, 462 S., Clauthal-Zellerfeld. EKLER Ek 6-1: Hole effect’e örnek varyogram (Avnik, Bingöl) 104 105 Jeolojide matematik ve statistiksel yöntemler
© Copyright 2024 Paperzz