download

Matakuliah
Tahun
: Decision Support System
: 2009
DATAWAREHOUSING & BUSINESS
INTELLIGENT
Pertemuan 11 -12
Sasaran Pembelajaran
• Mahasiswa menjelaskan sumberdaya data DSS dan
pengelolaannya melalui datawrehouse dan intelijen bisnis, dengan :
– Menjelaskan isue-isue sumberdaya data dan manajemen data
DSS.
– Menguasai konsep2 dan penggunaan DBMS.
– Memahami teknologi data warehousing dan data marts.
– Memahami interaksi antara Web dan teknologi database.
Bina Nusantara University
3
Pokok Bahasan
- DSS Data Sources
- Data Warehouse
- Data aquisition
- Data Mart
Bina Nusantara University
4
Kasus : Information Sharing satu Principle Component dari
National Strategy for Homeland Security
• Jejaring dari systems yang menyediakan integrasi dan
distribusi Pengetahuan/knowledge
• Horizontal dan vertical information sharing
• Improved communications
• Mining data tersimpan dalam Web-enabled warehouse
Bina Nusantara University
5
Data, Information, Knowledge
• Data
– Items adalah penjelasan paling elementer dari
sesuatu, events, activities, dan transaksi2
– Bisa internal ataupun external
• Informasi
– Organized data yang memiliki arti/meaning dan
nilai/value
• Knowledge
– Processed data atau informasi yang menyampaikan
pemahaman / understanding atau
pembelajaran/learning yang dapat diaplikasikan pada
suatu problem atau activitas
Bina Nusantara University
6
Sumber data DSS
• Data Internal
– Bersumber dari Legasi sistem
– Semua data perusahaan yang diolah oleh TPS yang ada
– Semua data mentah ataupun yang telah diproses untuk
menghasilkan laporan
• Data Eksternal
• Data Pengetahuan Personal
Bina Nusantara University
7
Sumber data External
• Web
– Intelligent agents
– Document management systems
– Content management systems
• Commercial databases
– Sell access to specialized databases
Bina Nusantara University
8
Data dan Pengetahuan Personal
• Para pengguna atau user memiliki Pengetahuan,
keahlian yang dapat disimpan untuk digunakan masa
yang akan datang.
• Informasi subyektif, misalnya tentang :
–
–
–
–
Penjualan
Opini pasar
Lingkungan persaingan
Sosial dan budaya
Bina Nusantara University
9
Pengumpulan Data
• Data dikumpulkan dengan cara manual maupun
menggunakan alat sensor
• Metoda Pengumpulan data mentah
–
–
–
–
–
–
Survei
Observasi
Wawancara Sumber ahli
Sensor-scanner
Dokumen resmi
dll
Bina Nusantara University
10
Masalah dan Kualitas Data
• Masalah Data
Bina Nusantara University
11
Bina Nusantara University
12
Kualitas Data
• Raw data dikumpulkan secara manual atau dengan instruments
• Kualitas menjadi kritis ? Kualitas menentukan kegunaan
• Kategori :
• Contextual data quality : relevansi, nilai tambah, batasan
waktu, kelengkapan,jumlah data.
• Intrinsic data quality : akurasi, obyektivitas, kehandalan,
reputasi
• Accessibility data quality : aksesabilitas, keamanan akses
• Representation data quality : interpretable, kemudahan
dipahami, representasi tepat, konsisten
– Kadang diabaikan atau ditangani secara gampang
– Masalah terkuak ketika data disummarize
Bina Nusantara University
13
Sumber Masalah Kualitas
Sumber Masalah Kualitas
%
Entri data oleh karyawan
76
Perubahan pada sumber
53
Migrasi data atau proyek2 konversi
48
Berbagai Harapan para pengguna
46
Data Eksternal
34
Kesalahan sistem
26
Entri data oleh pelanggan
25
Lainnya
12
Sumber : Wayne Eckerson
Bina Nusantara University
14
Masalah dan Kualitas Data
• Isue terkait Integritas Data,
–
–
–
–
–
Keseragaman data yang ditangkap
Versi, jaminan keaslian data
Kelengkapan dan kebenaran data
Kesesuaian data
Drill down, pelacakan kembali ke sumber data
Bina Nusantara University
15
Web dan Layanan Database Komersial
• Sumberdata Eksternal
– Mitra bisnis,
– Web/internet
– Bank data komersial
Bina Nusantara University
16
Database Management Systems
• Software program
• Supplements operating system
• Manages data ; menambahkan, memperbaharui,
menghapus, memanipulasi, menyimpan, dan
mendapatkan kembali informasi
• Queries data dan generates reports
• Data security
• Kombinasi dengan bahasa pemodelan untuk konstruksi
DSS
Bina Nusantara University
17
Database Models
• Hierarchical
– Top down, like inverted tree
– Fields have only one “parent”, each “parent” can have multiple “children”
– Fast
• Network
– Relationships created through linked lists, using pointers
– “Children” can have multiple “parents”
– Greater flexibility, substantial overhead
• Relational
– Flat, two-dimensional tables with multiple access queries
– Examines relations between multiple tables
– Flexible, quick, and extendable with data independence
• Object oriented
– Data analyzed at conceptual level
– Inheritance, abstraction, encapsulation
Bina Nusantara University
18
Database Models, continued
• Multimedia Based
– Multiple data formats
• JPEG, GIF, bitmap, PNG, sound, video, virtual reality
– Requires specific hardware for full feature availability
• Document Based
– Document storage dan management
• Intelligent
– Intelligent agents dan ANN
• Inference engines
Bina Nusantara University
19
Bina Nusantara University
20
Karakteristik Data Warehouse
•
•
•
•
•
•
•
•
Subject oriented
Terintegrasi sehingga data dari sumber heterogen distandarisasi
Time series; tidak ada current status
Nonvolatile
– Read only
Summarized
Not normalized; boleh jadi redundan
Data berasal baik dari sumber internal maupun external tersedia
Metadata included
– Data tentang t data
• Business metadata
• Semantic metadata
Bina Nusantara University
21
Architecture
• Dapat berupa satu tiers, atau lebih
– Determined by warehouse, s/w data acquisition (back end), dan
s/w client (front end)
• One tier, semua dijalankan pada platform yang sama, ini jarang
terjadi
• Two tier biasanya mengkombinasikan DSS engine (client) dengan
warehouse
– More economical
• Three tier memisahkan bagian-bagian functional ( client appl_server – database_server)
Bina Nusantara University
22
Bina Nusantara University
23
Bina Nusantara University
24
Migrating Data
• Business rules
– Stored in metadata repository
– Applied to data warehouse centrally
• Data extracted from all relevant sources
– Loaded through data-transformation tools or programs
– Separate operation and decision support environments
• Correct problems in quality before data stored
– Cleanse and organize in consistent manner
Bina Nusantara University
25
Data Warehouse Design
• Dimensional modeling
– Retrieval based
– Implemented by star schema
• Central fact table
• Dimension tables
• Grain
– Highest level of detail
– Drill-down analysis
Bina Nusantara University
26
Data Warehouse Development
•
Data warehouse implementation techniques
–
–
–
–
•
•
Top down
Bottom up
Hybrid
Federated
Projects may be data centric or application centric
Implementation factors
– Organizational issues
– Project issues
– Technical issues
•
•
Scalable
Flexible
Bina Nusantara University
27
Data Marts
• Subkumpulan /subset data warehouse umumnya dari sumber
subject tunggal
• Data Mart Dibedakan :
– Dependent
• Created from warehouse
• Replicated
– Functional subset of warehouse
– Independent
• Scaled down, lebih murah, hemat waktu
• Dirancang untuk sebuah department atau SBU, informasi terbatas dan
memungkinkan unit dapat membangaun DSS sendiri
• Organization dapat memiliki multiple data marts
– Sulit untuk diintegrasikan
Bina Nusantara University
28