URSI-TÜRKİYE’2014 VII. Bilimsel Kongresi, 28-30 Ağustos 2014, ELAZIĞ
Rasgele Sayı Üretiminde Güneş Işınımı Kaynaklı Eşit Aralıklı Örnekleme
Yönteminin Başarı Ölçümü
Süleyman Gökhun Tanyer1, Kumru Didem Atalay2, Sıtkı Çağdaş İnam1
(1) Elektrik – Elektronik Mühendisliği Bölümü, Başkent Üniversitesi, Bağlıca, 06810, Ankara
(2) Tıp Eğitimi Anabilim Dalı, Tıp Fakültesi, Başkent Üniversitesi, Bahçelievler, Ankara
[email protected], {gokhuntanyer, katalay, inam}@baskent.edu.tr
Özet: Kriptografi, bilimsel çalışmalardaki benzetim çalışmaları ile çekilişler ve benzeri ticari uygulamalar
gibi bir çok alanda güvenilir rasgele sayı üreteçlerine ihtiyaç duyulmaktadır. Rasgele sayı üreteçlerin
kullanıldığı bilimsel incelemelerde sıklıkla; bilgisayar hafızası, koşu adedi ve süresi gibi bazı pratik
sınırlamalardan dolayı düşük sayılı koşulardan elde edilen sonuçlar yeterli görülebilmekte ve en temel akademik
kriter olan ‘tekrar edilebilirlik’ konusunda eksiklikler yaşanabilmektedir. Bu çalışmada, Güneş’in RF
ışınımlarından elde edilen sayılar üzerinde, Eşit Aralıklı Örnekleme Yöntemi (EŞARÖY) uygulanarak elde edilen
doğru rasgele sayılar test edilmiştir. Güneş kaynaklı doğru rasgele sayı üreteci sistemi (G-DRÜS)’nin düşük
sayılı veri kümelerinde dahi rasgelelik ve dağılıma uyum bakımından başarılı sonuçlar verdiği gösterilmiştir.
Abstract: Random number generators (RNGs) are often utilized in various fields of science such as cryptology,
system simulations and even some commercial applications including lotteries. Probability distribution and
density functions are regarded as the fundamental tools for any statistical analysis. Unfortunately, those
functions are only asymptotically valid when the number of observations converges infinity. In most of the cases,
CPU time and memory are limited, and so the number of observed samples. The mandatory quality of any
academic work –repeatability– is often under question. RNGs are often highly random but their goodness-of-fit
suffers when there are less observed samples. In this work, the Sun’s RF emissions are used to obtain a trueRNG which is tested for randomness and its goodness-of-fit qualities.
1. Giriş
Bilimin bir çok dalında, doğal bir sürecin gözlenerek incelenmesi ve gelecekteki davranışının tahmin
edilebilmesine ihtiyaç duyulmaktadır. Matematiksel modellerden faydalanılarak bazı öngörülerde bulunmak
mümkün olabilmektedir. Modelin geliştirilmesinde, gözlemlerin yeterli olması, matematiksel modelleme
çözümümün üretilebilmesi ve sürecin herhangi bir belirsizlik içermemesi halinde, olası gözlemler hakkında
oldukça kesin tahminler yapılabilmektedir. Ancak, incelenen sürecin belirsizlikler içermesi halinde, modelleme
sonuçlarından elde edilen tahminler de aynı şekilde belirsizlik içerecektir. Belirsizliklerin giderilemediği koşullar
altında, sonuçlardaki hata miktarlarının en aza indirilebilmesi ve daha doğru karar verilebilmesi amacıyla,
modellerin rasgele değişkenler içermesi ve sonuçların istatistiksel olarak incelenmesi gerekebilmektedir. Girdi
değişkenlerine ilişkin çok sayıda olası örnekler sağlandığında, olası çok sayıda çıktı örnekleri çoklu koşu
hesaplamaları ile elde edilebilmektedir. Böylelikle, çok karmaşık olabilecek zor problemler için çözüm
üretilebilmektedir.
İhtiyaç duyulan rasgele gözlem örneklerinin elde edilebilmesi için farklı yöntemler bulunmaktadır. Sözde
Rasgele Sayı Üreteçleri (SRSÜ) gibi insan etkilerinden uzak doğal kaynaklardan faydalanılarak üretilen Doğru
Rasgele Sayı Üreteçleri (DRSÜ) kullanılmaktadır. Günümüzde rasgelelik özellikleri bakımından oldukça yeterli
olarak kabul edilen bir çok RSÜ bulunmaktadır. Üretilen örnek sayısının sonsuza yaklaştığında istenilen
dağılıma yakınsayan bu örneklerin, düşük sayılı örneklerde oldukça hatalı olduğu gösterilmiştir [1] Bilgisayarlı
benzetim çalışmalarının yaygın olduğu günümüzde, bilgisayar koşu zamanı, hafıza miktarı gibi kısıtlardan dolayı
yetersiz koşu sayıları ile elde edilen sonuçların kuramsal sınır değerlerine yakın olduğu kabul edilmektedir.
Herhangi bir nicel ölçüt ile test edilmemiş rasgele sayı örnekleri girdi olarak kullanılmakta ve sonuçların
güvenilirlikleri tartışılmamaktadır. Bilimsel çalışmalardan beklenen en temel ‘tekrar edebilirlik’ nitelikleri
bakımından yetersiz çalışmaların yayınlanabildiği görülmektedir. Matlab yazılımının rand ve benzeri komutları
ile kolaylıkla elde edilebilen DRSÜ sayıları gibi [2] benzeri kaynaklardan elde edilebilen D-RSÜ sayılarının
rasgelelik özelliklerinin oldukça yeterli olmasına rağmen, düşük sayılı örneklerde istenilen dağılımlara
yakınlığında önemli hataların bulunduğu gösterilmiştir [1].
Günümüzde, rasgelelik özelliği bakımından yeterli ve düşük sayılı veri kümelerinde dağılıma uygun rasgele
sayı üreteçlerine ihtiyaç duyulmaktadır. Böylelikle, kuramsal tahminlerin geçerli olmadığı, düşük sayılı örnek
URSI-TÜRKİYE’2014 VII. Bilimsel Kongresi, 28-30 Ağustos 2014, ELAZIĞ
kümelerinin düşük sayılı koşularda kullanıldığı ortamlarda dahi güvenilir sonuçlar veren hesaplamaların
yapılabilmesi mümkün olacaktır. Bu maksatla yakın dönemde yeni bir Y-RSÜ yöntemi önerilmiştir [1]. Bu
çalışmada, bahse konu Y-RSÜ yöntemi, güneşin RF ışınımlarından faydalanılarak, D-RSÜ yöntemi haline
getirilmiştir. Rasgelelik özelliği ile dağılıma uyum özellikleri bakımından düşük sayılı örnek kümelerinde dahi
başarılı olacak ilk D-RSÜ yöntemi olarak önerilmekte ve rasgelelik ve dağılıma uyum başarımı bakımından
oldukça başarılı sonuçlar elde edilmiştir [1, 3]. Farklı tür rasgele sayı üreteçleri hakkında bilgi [4]’te verilmiştir.
3. Kullanılan Veriler ve Rasgele Sayıların Elde Edilmesi
Anakol yıldızı olarak sınıflandırılan Güneş, ağırlıklı olarak görünür ışıkta ışıma yapsa da RF bantları dahil olmak
üzere elektromanyetik tayfın diğer kısımlarında ışımaya sahiptir. Gökbilimsel olarak zayıf bir radyo kaynağı
olarak sınıflandırılabilecek Güneş, yine de yakınlığı sebebiyle geniş bant ışıma yapan en güçlü Dünya dışı ışıma
kaynağı olma özelliğine sahiptir. Bu çalışmamızda, Radyo Güneş Teleskopu Ağı (Radio Solar Telescope
Network; RSTN) teleskoplarından biri olan ve İtalya'da San Vito Amerikan Hava Üssü'nde yer alan San Vito
Güneş Teleskopu'nun verileri kullanılmıştır [5]. Örnek olarak kullanılan veriler, 1 saniye örnekleme periyodu ile
8 ayrı frekans bandından 1990 Ocak ayı içinde toplam 31 günlük gözlemden elde edilen radyo akılarıdır. Bu
veriler Amerikan Ulusal Jeofizik Veri Merkezi (National Geophysical Data Center; NGDC) arşivinden İnternet
yoluyla indirilmiştir. Gözlenen bantlar ve bu bantlara karşılık gelen ortalama akı değerleri Tablo I'de
listelenmiştir.
Her gün için bütün 8 bandın verisi ayrı ayrı işlenenerek rasgele sayı içeren toplam 248 dosya elde edilmiştir.
İşlenme sürecinde 1 saniye örneklenmiş 7 anlamlı rakama sahip her bir akı değerinin en az anlamlı ikişer
basamağı sıralı olarak yanyana getirilip altışarlı gruplar halinde birleştirilerek 0 – 999999 arasında tamsayılar
elde edilmiştir. Elde edilen sayıların birlenerek 0 ile 1 arası ile sınırlandırıldığında, sayıların beklendiği gibi eşit
dağılımlı olduğu gözlenmiştir. Daha sonra Eşit Aralıklı Örnekleme Yöntemi (EŞARÖY) kullanılarak dağılıma
uygunluğu ile rasgeleliği Tablo II ve III’de incelenmektedir.
TABLO I. San Vito Radyo Teleskopu Radyo Bantları ile 1990 Ocak Ayı Ortalama Akı Değerleri
Frekans Bandı
(MHz)
Ortalama Akı
(10-22 W/m2.Hz-1)
245
396
628
1,415
2,696
4,996
8,840
15,400
42.41
36.34
103.0
149.9
266.2
305.7
267.5
252.3
4. Eşit Aralıklı Örnekleme Yöntemi (EŞARÖY)
N örnekli bir sıralı gözlem kümesinde, = { : , = 1,2, … , } ve < ,1 ≤ p < r ≤ N için N örnekli sürekli
uydurulmuş (ampirik) olasılık dağılım fonksiyonu (UODF) aşağıdaki gibi tanımlanabilmektedir [1].
,
( )=
( −
0
( − 1)(
)+
( − 1)(
1
<
)
)
−
−



,
(1  
− 1)
(1)
Burada xn, X rasgele değişkenine ait örnek değerleri, n sıra numarası, xn, X rasgele değişkenine ait örnek
değerleri, n sıra numarası, N toplam örnek sayısı (uzunluğu) ve X   ifadesini göstermektedir. Örnek sayısının
sonsuza yakınsadığında geçerli olan ODF ile sonlu uzunluktaki örnek kümesi için tanımlanmış UODF’nin
karşılaştırılması ile Dağılıma-Uyum-Başarımı tanımlanabilmektedir. Bu tür başarım ölçütleri genellikle
aşağıdaki şekilde ifade edilebilmektedir [1].
=
( )−
,
( )
(2)
Burada A ve B, FX (A) ile FX (B) değerlerinin yaklaşık olarak aynı sırayla 0 ve 1 olacağı şekilde seçilmektedir.
Böylelikle, (2)’nin [A, B] aralığı dışındaki değeri ihmal edilebilmektedir. Eşitlik (2), gözlem kümesinin
(örneklerin) tanımlanmış olan bir istatistiksel dağılıma yakınlığını, dağılıma uyumluluğunu belirlemektedir.
Eğer , ( ) gözlem örneklerin tam olarak ( ) üzerine denk gelmesi halinde (2) ile belirlenen hatanın sıfır
olması gerekmektedir. Dolayısıyla rasgele sayı üretimi amacıyla, bir dizinin doğrudan ( ) grafiği üzerinden
elde edilmesi halinde, Dağılıma-uyum testlerinde yüksek başarı sağlanacaktır. Eşit Aralıklı Örnekleme Yöntemi
( ) üzerinde eşit
olarak adlandırılan bu örnekleme kullanıldığında, eşit aralıklı
dizisi kullanılarak =
örnekleme ile sayı dizisi elde edilmektedir. EŞARÖY özetlenecek olursa [1]
URSI-TÜRKİYE’2014 VII. Bilimsel Kongresi, 28-30 Ağustos 2014, ELAZIĞ
pn    (n  1)(1  2 ) / N
(3)
(4)
zn  FX1 ( pn )
(5)
p  (1  2 ) / N
eşitlikleri kullanılarak, ihmal edilen sınır örnekleri dahil olmak üzere y ekseninde N eşit aralık kullanılarak N+1
örnek elde edilmektedir. En-iyileme değişkeni  = 1⁄(2 ) olarak seçildiği takdirde, eşit aralıkların tam orta
noktalarından örnek elde edilmektedir. Dikkat edilecek olursa, N → ∞ için δo → 0 olmaktadır. Olasılık
dağılımına tam uyum sağlayan bu dizinin, daha sonra güneş kaynaklı rasgele sayı dizisinden faydalanılarak
karıştırılması ile Güneş kaynaklı Doğru Rasgele sayı Üreteci Sistemi (G-DRÜS) geliştirilmektedir.
5. Başarı Ölçümleri ve Sonuçlar
Güneşin RF frekans bantlarındaki ışınımının uygun anten yapısı ile algılanarak temel bantta örneklenmesi ile
sayısal ham işaret elde edilmektedir. Her bir örneğin fiziksel anlam taşımayan en son bitleri birleştirilerek ham
rasgele sayılar elde edilerek, EŞARÖY örneklerinin karıştırılmasında kullanılmaktadır. Ham veriler ile aynı
sıralama özelliklerine sahip olan EŞARÖY verileri Doğru Rasgele Sayı olarak test edilmiş ve aşağıdaki
sonuçlardan beklenen başarı elde edilmiştir.
TABLO II. Farklı Doğru Rasgele Sayı Üreteçleri Verilerine İlişkin Başarım Testleri
Koşum (Run) Testi*
(Bağımsızlık)
n
Kolmogorov Simirnov Testi*
(Düzgün dağılıma uyum)
Ortalama ± SD**
(En düşük)
(En büyük)
Random.org verileri
10
50
100
500
1000
29/30
27/30
27/30
25/30
30/30
30/30
30/30
29/30
30/30
29/30
0.329±0.313
0.404±0.267
0.460±0.307
0.483±0.289
0.490±0.297
0.688±0.314
0.584±0.309
0.589±0.279
0.527±0.290
0.521±0.288
30/30
29/30
29/30
29/30
25/30
0.275±0.230
0.416±0.281
0.452±0.303
0.460±0.307
0.478±0.278
0.782±0.248
0.630±0.267
0.571±0.292
0.517±0.293
0.521±0.291
Güneş ışınım verileri
10
50
100
500
1000
29/30
29/30
27/30
26/30
26/30
TABLO III. Güneş ışınımı kaynaklı EŞARÖY-RSÜ Verilerine İlişkin Başarım Testleri***
Koşum (Run) Testi*
Kolmogorov Simirnov Testi*
Ortalama ± SD**
(Bağımsızlık)
(Düzgün dağılıma uyum)
10
30/30
30/30
0.550 ± 0.303
50
29/30
30/30
0.510 ± 0.291
100
27/30
30/30
0.505 ± 0.290
500
27/30
30/30
0.501 ± 0.289
1000
30/30
30/30
0.501 ± 0.289
(*)
a/b; a:Teste cevap verenlerin sayısı, b:30 adet veri setini temsil etmektedir.
(**) SD; Standart sapma değeri.
(***) Güneş–DRSÜ sisteminin geliştirilmesi çalışmaları, Başkent Üniversitesi BA14/FM-13 (BAP)
projesi kapsamında desteklenmektedir.
n
Kaynaklar
[1] S. G. Tanyer, ‘Tam istatistiksel özelliklere sahip yarı rasgele sayı üretimi’, 22. Sinyal İşleme ve İletişim
Uygulamaları Kurultayı (SİU 2014), 23-25 Nisan, 2014.
[2] True Random Number Service, www.random.org.
[3] K. D. Atalay, S. G. Tanyer, ‘Eşit aralıklı örnekleme yöntemiyle üretilen rasgele sayı dizilerinde başarım
ölçümü’, 22. Sinyal İşleme ve İletişim Uygulamaları Kurultayı (SİU 2014), 23-25 Nisan, 2014.
[4] G. Marsaglia, ‘Random number generators’, Journal of Modern Applied Statistical Methods, Vol. 2, No. 1,
May, 2003, syf. 2–13.
[5] D.A. Guidice, E.W. Cliver, W.R. Barron, S. Kahler, 'The Air Force RSTN System', Bulletin of the American
Astronomical Society, Vol. 13, March, 1981, p.553, http://adsabs.harvard.edu/abs/1981BAAS...13Q.553G.