امنیت پایگاه داده های آماری رسول جلیلی [email protected] 1 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 مقدمه • پایگاه داده های آماری عموما ً برای تولید آمار بروی داده های مختلف به کار می روند. • رویکرد های امنیتی پایگاه داده های آماری باید از لو دادن هر داده منفرد خود داری کنند. • امنیت پایگاه داده های آماری به دوشکل می تواند کنترل شود: – خودداری از پرس و جوهایی که مقادیر صفات مختلف را برمیگرداند – صرفا با اجازه دادن به پرس و جوهایی که توابع تجمعی آماری مانند COUNT،MIN ،MAX ،SUMو AVERAGEرا به کار میبرند Q1: SELECT COUNT (*) FROM PERSON ;WHERE CONDITION Q2: SELECT AVG (INCOME) FROM PERSON ;WHERE CONDITION 2 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 مثال • مثال: – اگر به دنبال حقوق سالیانه S.jahedباشیم و بدانیم که او در شهر بم کرمان زندگی می کند و خانم است و در حال گرفتن مدرک PhDخود است ،می توان با استفاده از پرس و جوی آماری (Q1در اسالید قبلی) و با استفاده از شرایط زیر تعداد کسانی که این شرایط را دارند را محاسبه کنیم: ’(LAST_DEGREE=‘Ph.D.’ AND SEX=‘F’ AND CITY= ‘Bam )’AND STATE=‘Kerman 3 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 مثال2- • حال اگر جواب Q1با شرایط گفته شده در اسالید قبلی 1 (یک) باشد ،با انجام پرس و جوی Q2با استفاده از شرایط مشابه اسالید قبلی ،می توان به درآمد سالیانه S.Jahed رسید. • حتی اگر تعداد نتیجه مربوط به Q1دقیقا ً یک نباشد ولی نزدیک به آن و عدد کوچکی باشد ،می توان به کمک توابع تجمعی آماری مانند Min ،Maxو Averageحدود و یا بازه ای از حقوق S.Jahedرا پی برد. 4 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 مفاهیم پایه ای1- • SDBمرجع به فرم پایگاه داده ای رابطه ای است. • Nتعداد موجودیتها و mتعداد صفات شمای SDBمیباشد • این پایگاه داده مرجع در اسالید بعدی آمده است: – Xijبه معنای مقدار jامین صفت ) (Ajاز رکورد iام موجود در SDBمیباشد . – هر صفت Ajدارای ||Ajمقادیر ممکن است. 5 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 مفاهیم پایه ای2- Am Aj A1 Record X1m X1j X11 1 Xij Xi1 2 N Xnm 6 I رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 مفاهیم پایه ای3- • SDBهای خاص منظوره ،مانند پایگاه داده های نظرسنجی، بعضی آمارها را در فرم جدول ارائه می دهندMacrostatistics( . نامیده می شوند) • شکل روبرو تعداد را در قالب جدول 3بعدی نشان می دهد. 7 Sex Dept D3 D2 D1 0 12 10 M 3 0 1 F 5 10 12 M 8 2 20 F 1 0 15 M 0 10 20 F رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 BirthYr 19411951 19521962 >1962 مفاهیم پایه ای4- • • • • پرس و جوهای آماری می تواند با استفاده از بعضی کلیدها ) (keysو یا فرمولهای خصوصیتی) (Characteristics Formulasانجام شود. آمارهای مبتنی بر کلید در فرم هایی مانند ) Sum(C, Salaryو ) C=(Ali, Taghi,Naghi, javadمی باشد. فرمولهای خصوصیتی (مشخص شده با استفاده از Aو Bو ). . .یک فرمول منطقی از صفات ترکیب شده با اپراتورهای Or ،Andو Not می باشند. مثال: ))– A= (Sex=F) ((Dept-Code=Dept1)(Dept_code=Dept2 )(Birth-Year<1965 8 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 مفاهیم پایه ای5- • یک فرمول خصوصیتی) (CFمجموعه ای از رکوردها را مشخص می کند که مجموعه پرس و جو ) (Query Setنامیده میشود () )X(Aو تعداد رکوردهای ) |X(A)| ،X(Aخواهد بود. • :Allبرای هر CFمانند ،Cرابطه ) .X(C) X(Allبرقرار است. این یعنی مجموعه پرس و جوهای ) (query setهر Cزیر مجموعه ای از کل SDBاست. • مجموعه های ابتدایی ) (Elementary Setsمجموعه های پرس و جوی ساده غیر قابل تجزیه ای هستند: • C=(A1=a1)(A2=a2)… (AM=aM), که Ajیک صفت از SDBو ajیکی از مقادیر آن صفت است • تعداد مجموعه های ابتدایی ) (Eدر یک SDBبا صفات A1,…Amبرابر است با | E=|A1|* … * |Amکه بعضی از مقادیر خالی می باشند. 9 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 6-مفاهیم پایه ای : از قرار زیر هستندSDB • پرس و جوهای مهم آماری در • • • • • • • Count(C) = |X(C)| Sum (C, Aj) = iX(C)Xij Rfreq(C) = Count(C)/N (relative frequency of the query set.) Avg(C,Aj) Max(C,Aj) Min(C,Aj) Median(C,Aj) = |X(C)|/2 (used to compute the median value in an ordered set of a numerical value of an attribute Aj.) آماری است که به افشای محرمانگی اطالعات بروی،• آمار حساس . منجر گرددSDB یک موجودیت واحد 92-91 نیمسال دوم تحصیلي- درس امنیت پایگاه داده ها-رسول جلیلي 10 تکنیک های حفاظت از استنتاج • یکی از دالیل در خطر بودن امنیت SDBها ،امکان استنتاج اطالعات محرمانه مربوط به موجودیت های نمایش داده شده در SDBمی باشد. • با در نظر گرفتن Aiبه عنوان یک صفت با اطالعات محرمانه غیر عددی و یا یک صفت عددی ،و Xjکه یک موجودیت را در SDB تعریف می کند: – :Exact Compromiseزمانی رخ می دهد که کاربر با استفاده از تعدادی پرس و جوی آماری بتواند مقدار 1برای صفت غیر عددی Aiو یا مقدار دقیق عددی رکورد jام از SDBرا استنتاج نماید. – :Partial Compromiseزمانی اتفاق می افتد که کاربر با استفاده از تعدادی پرس و جوی آماری مقدار صفر را برای صفت غیر عددی Aiو یا یک مقدار تقریبی از مقدار صفت عددی را بتواند استنتاج نماید.. 11 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 تکنیک های حفاظت از استنتاج2- • انواع تکنیک ها: – مفهومی)(Conceptual • به مسئله استنتاج در سطح مفهوم نگاه می کند و با مدل داده ای مفهومی SDBکار میکند. – مبتنی بر محدودیت)(Restriction-based – حفاظت از استنتاج را بوسیله محدود سازی بعضی پرس و جوهای آماری تامین می کند – پرس و جوها شامل تعداد بسیار کم و یا بسیار زیادی از رکوردها نباید باشند. – باید به کارایی سیستم در اثر رد کردن تعداد زیادی از پرس و جو ها نیز توجه داشته باشد. – مبتنی بر انحراف)(Perturbation-based • حفاظت از استنتاج را با تعریف بعضی تغییرات بروی اطالعات بکار گرفته برای جواب دادن به پرس و جوهای آماری تامین می کند. • این تغییرات می تواند بر داده های ذخیره شده در SDBو یا اینکه نتایج محاسبه شده قبل از افشاء به کاربر باشد. 12 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91 پایان مركز امنيت شبكه شريف http://nsc.sharif.edu 13 رسول جلیلي -درس امنیت پایگاه داده ها -نیمسال دوم تحصیلي 92-91
© Copyright 2025 Paperzz