Διαχείριση Δεδομένων και Πληροφοριών

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ
ΕΠΙΣΚΟΠΗΣΗ
ΠΕΡΙΕΧΟΜΕΝΑ ΜΑΘΗΜΑΤΟΣ
ΜΕΡΟΣ Α:
ΕΙΣΑΓΩΓΗ - ΠΛΑΙΣΙΟ ΛΕΙΤΟΥΡΓΙΑΣ (1 ΠΑΡΑΔΟΣH)
- Αρχές Πληροφοριακών Συστημάτων,
- Πληροφοριακά Συστήματα και Επιχειρήσεις
- Παραδείγματα Εφαρμογών / Συστημάτων
ΜΕΡΟΣ Β:
ΤΕΧΝΟΛΟΓΙΕΣ Π.Σ. (1 ΠΑΡΑΔΟΣH)
Βασικές Τεχνολογίες Πληροφοριακών Συστημάτων
Αρχιτεκτονικές και Περιβάλλοντα
ΜΕΡΟΣ Γ:
ΠΩΣ ΥΛΟΠΟΙΟΥΝΤΑΙ ΤΑ Π. Σ. (1 ΠΑΡΑΔΟΣΗ)
Σχεδιασμός (plan) - Αναδιοργάνωση Πληροφοριακών Συστημάτων
Μεθοδολογίες και Εργαλεία Ανάπτυξης
ΜΕΡΟΣ Δ:
ΔΙΟΙΚΗΤΙΚΑ και ΛΕΙΤΟΥΡΓΙΚΑ ΘΕΜΑΤΑ Π. Σ. (1 ΠΑΡΑΔΟΣH)
- ΣΥΓΧΡΟΝΑ ΣΥΣΤΗΜΑΤΑ – ΨΗΦΙΑΚΗ ΕΠΙΧΕΙΡΗΣΗ
- Επιπτώσεις Πληροφορικών Συστημάτων - Ποιότητα
- ΘΕΜΑΤΑ ΔΙΟΙΚΗΣΗΣ Π.Σ
Σημείωση: Αρκετές από τις διαφάνειες του μαθήματος προέρχονται από το Βιβλίο MIS του Κ. Laudon
από δημόσιες πηγές του διαδικτύου, και από το Βιβλίο MIS του J. Post.
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
274
ΜΕΡΟΣ 2ο: ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

ΒΑΣΙΚΕΣ ΤΕΧΝΟΛΟΓΙΕΣ
- Υπολογιστές και Συστήματα (Υλικό)
- Λογισμικό Π.Σ.

Διοίκηση Δεδομένων και Πληροφοριών

ΑΡΧΙΤΕΚΤΟΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΟΝΤΑ
- Τηλεπικοινωνίες
- Client-Server (Πελάτης - Εξυπηρετητής)
- Enterprise-Wide Computing
- Middleware
- Τυποποιήσεις και Ανοικτά Συστήματα
- Παραδείγματα Τυπικών Προϊόντων
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
275
Σύνοψη ΤΕΧΝΟΛΟΓΙΑΣ ΒΑΣΕΩΝ
ΔΕΔΟΜΕΝΩΝ





Πως μπορεί κανείς να διαχειριστεί πολλά δεδομένα σε
μια μοντέρνα επιχείρηση?
Γιατί η προσέγγιση με DBMS είναι τόσο σημαντική για
την επιχειρηματικότητα?
Πως δουλεύει κανείς με ένα DBMS?
Πως αναπτύσσονται επιχειρηματικές εφαρμογές με τη
χρήση ενός DBMS?
Νέες μορφές των DBMS: Web Databases, Data
Warehouses, Clouds and Databases
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
276
Τι είναι ένα DBMS (ΣΔΒΔ)?
1. Διαχειρίζεται μεγάλο όγκο δεδομένων.
2. Υποστηρίζει αποτελεσματική πρόσβαση σε μεγάλο όγκο
δεδομένων
3. Υποστηρίζει ταυτόχρονη πρόσβαση πολλών χρηστών σε
μεγάλο όγκο δεδομένων.
– Παράδειγμα: Αεροπορική Εταιρεία και Πράκτορες.
4. Υποστηρίζει ασφαλή, ατομική πρόσβαση σε μεγάλο όγκο
δεδομένων
– Αν δύο άνθρωποι «αποσύρουν» χρήματα την ίδια
χρονική στιγμή από τον ίδιο λογαριασμό (μέσω
ATM) – το υπόλοιπο του λογαριασμού θα είναι
ΛΑΘΟΣ όποιος και αν ολοκληρώσει τη συναλλαγή
τελευταίος.
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
277
3 ΟΨΕΙΣ ΤΩΝ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ
1.
Μοντελοποίηση και Σχεδιασμός ΒΔ
– Τι κάνουμε πριν από την υλοποίηση και λειτουργία
ΒΔ.
2.
Προγραμματισμός: Ερωτήσεις και Πράξεις σε ΒΔ
– SQL = “παγκόσμιος γλώσσα”
3.
Υλοποίηση Συστημάτων ΒΔ.
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
278
Database Management Systems
Αναφορές και
Ερωτήματα
Database
DBMS
Programs
Πωλήσεις και Δεδομένα Συναλλαγών
(transactions)
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
279
Βασικοί Ρόλοι με ένα DBMS
Διαχειριστής Βάσεων Δεδομένων
Προγραμματιστές
Αναλυτές
(Τυποποίηση, Σχεδιασμοί, Έλεγχος)
Δεδομένα
Προγράμματα
Επιχειρηματικές Ανάγκες
Database
Management
System
Πρόγραμμα
Ερωτήματα
Και Αναφορές
Μάνατζερ
Πρόγραμμα
Συλλογή Δεδομένων και
Επεξεργασία Συναλλαγών
Επιχειρηματικές
Διεργασίες
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
280
Το Σενάριο Επεξεργασίας με DBMS
Logical
Files
(VIEWS)
.
F1
DATABASE
(Integrated)
DBMS
(Software)
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
User/Group
Application
Programs
P1
F2
P2
F3
P3
F4
.
.
P4
.
.
Βασικές Τεχνολογίες
281
Χαρακτηριστικά και Ιδιότητες των DBMS










Αυτό-περιγραφική Φύση των Συστημάτων Βάσεων Δεδομένων –
Ομοιογένεια στην Δημιουργία, Πρόσβαση και Έλεγχο των
Δεδομένων
Μοίρασμα (SHARING) δεδομένων και χρήση από πολλούς χρήστες
Υποστήριξη κανόνων Ακεραιότητας, Ασφάλειας, Δικαιοδοσίας στα
Δεδομένα
Κεντρικός έλεγχος Λειτουργίας (Database Administration)
Πολλαπλοί Τρόποι Πρόσβασης
Έλεγχος Συνδρομικότητας και Μηχανισμοί για Ανάκαμψη
Τυποποιήσεις
Αύξηση της Παραγωγικότητας στην Ανάπτυξη Εφαρμογών
Απομόνωση Προγραμμάτων και Δεδομένων – ΑΦΑΙΡΕΣΗ
ΔΕΔΟΜΕΝΩΝ (Abstraction)
ΑΠΟΔΟΣΗ !!! (Performance - Performance – Performance)
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
282
Σύνοψη Εξέλιξης των ΣΔΒΔ
60’s
Ιεραρχικά
Δικτύου DBTG
70's
80's
Σχεσιακά
Η Επιλογή στις περισσότερες
εφαρμογές
90’s
Αντικειμενοστρεφή
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Γνωσιακά
Βασικές Τεχνολογίες
283
Το Σχεσιακό Μοντέλο σε μια Διαφάνεια
.Ο Μικρόκοσμος των Υπαλλήλων – Τμημάτων όπου εργάζονται
Department
Employee
?
dno
10
20
eno
1
7
22
name
Toy
Shoe
name
Lou
Laura
Mike
salary
10000000
150000
80000
dept
10
20
20
select E.name, E.salary, D.no
from Employee E, Department D
where E.salary < 100000
and D.name = 'Shoe'
and E.dept = D.dno;
Ι.Β -- Εισαγωγή στις Βάσεις Δεδομένων
Σελίδα 1.284
Πολλές Σχέσεις (relations)
Customers
CID
12345
28764
29587
33352
44453
87535
LastName
Jones
Adamz
Smitz
Sanchez
Kolke
James
Phone
312-555-1234
602-999-2539
206-656-7763
303-444-1352
303-888-8876
305-777-2235
Sales
City
Chicago
Phoenix
Seattle
Denver
Denver
Miami
AccountBalance
$197.54
$526.76
$353.76
$153.00
$863.39
$255.98
Salespeople
SPID
255
452
554
663
887
LastName
West
Thomas
Jabbar
Bird
Johnson
DateHired
5/23/05
8/15/04
7/15/01
9/12/03
2/2/02
Phone
Commission
213-333-2345
5
213-343-5553
3
213-534-8876
4
213-225-3335
4
213-887-6635
4
Items
ItemID
1154
2254
3342
7653
8763
9987
Category
Shoes
Clothes
Electronics
Shoes
Clothes
Electronics
Description
Red Boots
Blue Jeans
LCD-40 inch
Blue Suede
Mens’ Work Boots
Blu-Ray Player
Price
$100.00
$12.00
$1,000.00
$50.00
$45.00
$400.00
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
SaleID CID
117
12345
125 87535
157 12345
169 29587
178 44453
188 29587
201 12345
211
44453
213 44453
215 87535
280 28764
285 28764
SPID
887
663
554
255
663
554
887
255
255
887
663
887
SaleDate
3/3/2012
4/4/2012
4/9/2012
5/5/2012
5/1/2012
5/8/2012
5/28/2012
6/9/2012
6/10/2012
6/9/2012
5/27/2012
6/15/2012
ItemsSold
SaleID
117
117
117
125
125
157
169
169
178
ItemID
1154
3342
7653
1154
8763
7653
3342
9987
2254
Quantity
2
1
4
4
3
2
1
5
1
Βασικές Τεχνολογίες
285
Συσχετισμοί
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
286
Περιγραφή μιας πιο ρεαλιστικής Βάσης
Animal
AnimalOrder
OrderID
OrderDate
ReceiveDate
SupplierID
ShippingCost
EmployeeID
Animal
OrderItem
OrderID
AnimalID
Cost
Breed
Category
Breed
Employee
Supplier
SupplierID
Name
ContactName
Phone
Address
ZipCode
CityID
City
CityID
ZipCode
City
State
AreaCode
Population1990
Population1980
Country
Latitude
Longitude
Merchandise
Order
PONumber
OrderDate
ReceiveDate
SupplierID
EmployeeID
ShippingCost
EmployeeID
LastName
FirstName
Phone
Address
ZipCode
CityID
TaxPayerID
DateHired
DateReleased
AnimalID
Name
Category
Breed
DateBorn
Gender
Registered
Color
ListPrice
Photo
Sale
Category
SaleID
SaleDate
EmployeeID
CustomerID
SalesTax
Category
Registration
OrderItem
PONumber
ItemID
Quantity
Cost
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
SaleAnimal
SaleID
AnimalID
SalePrice
Customer
CustomerID
Phone
FirstName
LastName
Address
ZipCode
CityID
SaleItem
Merchandise
ItemID
Description
QuantityOnHand
ListPrice
Category
SaleID
ItemID
Quantity
SalePrice
Βασικές Τεχνολογίες
287
Σημερινή Τυπική Διάταξη - Αρχιτεκτονική
Clients
Web server
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Database
server
Βασικές Τεχνολογίες
288
DBMS : Οι Πρωταγωνιστές
ΣΗΜΕΡΑ ΕΧΟΥΝ ΜΕΙΝΕΙ ΤΡΙΑ ΜΕΓΑΛΑ ΕΜΠΟΡΙΚΑ
ΣΥΣΤΗΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ:



DB2 v.10, σε κάθε IBM ή IBM-compatible πλατφόρμα
(και όχι μόνο!, Unix, Linux, Windows, κλπ.)
ORACLE 12 (12C), σχεδόν παντού – πρώτη σε μερίδιο
αγοράς – ειδικά σε Unix + μεγάλες
εγκαταστάσεις
Microsoft SQL Server 2012, σε Microsoft πλατφόρμες
– INFORMIX (Αγοράστηκε από IBM!)
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
289
DBMS : Ειδικοί Πρωταγωνιστές

Οι MPP πρωταγωνιστές (massively parallel):
– Terradata (ο μεγαλύτερος), Tandem (NonStop SQL), Oracle Parallel
Server, Informix, Sybase (Navigator), DB2, DEC,… (μερικοί έχουν
κλείσει ήδη…)

Οι μεγάλοι στον κόσμο των Windows / PC
- MICROSOFT ΑCCESS
- Powersoft, Gupta…
Χαρακτηριστικά:
(a) SQL πρόσβαση (gateways)
(b) Εξαίρετα για Client-Server (DBMS)
(c) Μοιάζουν πολύ με τα «μεγάλα» DBMS
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
290
OPEN DBMS
(Συστήματα Ανοικτού Κώδικα)

MySQL

PostgreSQL + EnterpriseDB

Berkeley DB, Firebird, etc.
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
291
Αναφορά Πωλήσεων
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
297
Σημερινές Τάσεις – Εξελίξεις σε ΒΔ

Από τη Δεκαετία του 1990 έως και σήμερα (2012)
- Η εποχή των ΣΥΝΘΕΤΩΝ ΟΝΤΟΤΗΤΩΝ σε Βάσεις Δεδομένων
(engineering objects, πολυμέσα - multimedia, software objects)
- Object-Relational Database Systems
–
–
–
–
Ενεργές (Active) Βάσεις Δεδομένων, Intelligent Systems, Πολυμέσα
Αποθήκες Δεδομένων (Data Warehouses)
Εξόρυξη Δεδομένων / Πληροφοριών (Data Mining)
Κατανεμημένες (Multidatabases, Federated), Παραλληλοποίηση
– Συστήματα στο Internet (Web-based), Java, XML, …, Cloud
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
298
Σχεσιακές και Αντικειμενοστραφείς Βάσεις
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
299
OODBMS Εταιρείες
GemStone Systems, Inc.
Hewlett-Packard, Inc. (OpenODB)
IBEX Corporation, SA.
Illustra (Informix, Inc.)
Matisse Software, Inc.
O2 Technology, Inc.
Objectivity, Inc.
Object Design, Inc.
ONTOS, Inc.
POET Software Corporation
UniSQL
Unisys Corporation (OSMOS)
Versant Object Technology
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
300
Βασικές Τεχνολογίες
300
Τεχνολογία Διοίκησης Δεδομένων

OLAP (Online Analytic Processing) – Αναλυτική Επεξεργασία
– Ανάλυση σε πολυδιάστατο χώρο
»Πωλήσεις ΑΝΑ (Προϊόν, Πελάτη, Χρόνο)
»Κύβος
– drill down, rollup
– Essbase, Commander, Oracle Express, SAS, Excel, SQL Server,…

Data Warehouses
– Νέα μορφή για Decision Support Systems (Συστήματα Στήριξης
Αποφάσεων)
– Redbrick, Oracle DW, Informix, Sybase, Micro Strategy


Data Marts (Μικρότερα Data Warehouses)
Data Mining (Εξόρυξη Δεδομένων – Πληροφοριών)
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
301
OLAP - Εφαρμογές

Κλασσικές Εφαρμογές
–
–
–
–
–
–

Οικονομική Ανάλυση, Μοντελοποίηση και Αναφορές
Προϋπολογισμός,
Διασφάλιση Ποιότητας και Έλεγχος Ποιότητας,
Κερδοφορία,
Ανάλυση Έρευνας
Παρακολούθηση προώθησης προϊόντων
OLAP και OLTP δεν μπορούν να δουλέψουν ταυτόχρονα
στα ίδια λειτουργικά δεδομένα!
– εντελώς διαφορετικές και συγκρουόμενες απαιτήσεις
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
302
Βασικές Τεχνολογίες
302
OLAP: Η έννοια του ΚΥΒΟΥ
Sales Volu mes
M
O
D
E
L
M ini V a n
C o up e
C a rr
G le a s o n
C lyd e
S edan
B lue
D E A L E R S H IP
R e d W hite
COLOR
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
303
Πολυδιάστατος Κύβος - Παράδειγμα
Hybrid
Full S
MTB
Road
Race
Customer
Location
CA
1420
1258
1184
1098
1578
MI
437
579
683
873
745
NY
1011
1257
985
874
1256
TX
880
750
935
684
993
Jan
Feb
Mar Apr
May
Time
Sale Month
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
304
Βασικές Πράξεις / Περιήγηση
Year
Επίπεδα
Quarter
Roll-up
Για υψηλότερου επιπέδου
αθροίσματα
Month
Week
Drill-down
Για χαμηλότερου επιπέδου
λεπτομέρειες
Day
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
305
Microsoft Pivot Table
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
306
Microsoft Pivot Chart
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
307
Σχεδιασμός Νιφάδας Χιονιού
Merchandise
ItemID
Description
QuantityOnHand
ListPrice
Category
Sale
SaleID
SaleDate
EmployeeID
CustomerID
SalesTax
OLAPItems
SaleID
ItemID
Quantity
SalePrice
Amount
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
City
CityID
ZipCode
City
State
Customer
CustomerID
Phone
FirstName
LastName
Address
ZipCode
CityID
Βασικές Τεχνολογίες
308
Σχεδιασμός Αστεριού
Dimension Tables
Products
Sales Date
Fact Table
Sales
Quantity
Amount=SalePrice*Quantity
Customer
Location
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
309
Βασικές Τεχνολογίες
309
Κλασσική Αρχιτεκτονική DW
BUSINESS
INTELLIGENCE
(clients)
Q&R
OLAP
DSS
Data
Data
Mart
Mart
DM
Administration
Agent
REPOSITORY
Meta
Database
Data
Warehouse
Wrappers /
Loaders
Text
SOURCES
Το MIDDLEWARE
των Αποθηκών
Δεδομένων
Mediator
File
External
DB
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
data
Βασικές Τεχνολογίες
310
Αρχιτεκτονική SAP BI
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
311
Ανάλυση Πωλήσεων Ανά Χώρα
BI Web: Ανάλυση Πωλήσεων Ανά Χώρα
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
312
Καρτέλα Εργαζομένου
BI Web: Καρτέλα Εργαζομένου
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
313
Planning & Budgeting
Planning & Budgeting
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
314
Magic Quadrant for Data Warehouse
Database Management Systems
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
315
Data Mining


Αυτόματη Ανάλυση Δεδομένων
Στατιστικά
–
–
–
–
–

Correlation
Regression (multiple correlation)
Clustering
Classification
Nonlinear relationships
Επιπλέον Αυτοματισμοί
– Ανάλυση του καλαθιού αγοράς

Αριθμητικά Δεδομένα και μη-αριθμητικά δεδομένα
– Γλωσσική Ανάλυση
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
316
Κοινός Στόχος στο Data Mining
Ανεξάρτητες Μεταβλητές
Διαστάσεις/Χαρακτηριστικά
Τοποθεσία
Εξαρτώμενες Μεταβλητές
Γεγονότα
Ηλικία
ΕΜΜΕΣΕΣ
ΕΠΙΔΡΑΣΕΙΣ
Εισόδημα
ΠΩΛΗΣΕΙΣ
Ώρα
Μήνας
Κατηγορία
ΑΜΜΕΣΕΣ ΕΠΙΔΡΑΣΕΙΣ
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
317
Data Mining: Clusters
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
318
Data Mining Tools: Spotfire
http://www.spotfire.com
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
319
Market Basket Analysis
Τι αγοράζουν «μαζί» οι Πελάτες?
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
320
Data Mining: Market Basket Analysis

Στόχος: Μέτρηση της σχέσης μεταξύ δύο ειδών
– Τι είδη αγοράζουν οι πελάτες μαζί?
– Ποιες σελίδες Web ή ιστοσελίδες επισκέπτονται σε ζευγάρια?

Κλασσικά Παραδείγματα
– Στα ψιλικατζίδικα (που τα βρίσκει κανείς ανοικτά και τις Κυριακές)
βρήκαν ότι συχνά οι πελάτες αγοράζουν μαζί Μπύρα και Πάνες.
– Amazon.com: δείχνει συσχετιζόμενες αγορές

Στρατηγική Χρήσης τέτοιων στοιχείων
– Αποφάσισε αν πρέπει να βάλεις τα είδη κοντά (μαζί) για αύξηση
του cross selling
– Εναλλακτικά, τα βάζεις στην αρχή και στο τέλος του διαδρόμου
ώστε οι πελάτες στη διαδρομή να πάρουν και άλλα προϊόντα
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
321
E-Business Databases
SQL
Results
Database Server
Web Server
Web program script
<HTML>
Text
Data
</HTML>
Order Form
Descriptions
Prices
Customer
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
322
Web Βάσεις Δεδομένων
Βάση Δεδομένων
Προγραμματιστές
Web Διακομιστής
Χρήστες
Δεδομένα
Φόρμες Διαδικτύου
Και Αναφορές
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Αναφορές
Βασικές Τεχνολογίες
323
Web και Βάσεις Δεδομένων


Πάνω από 1 ΔΙΣ. HTML pages, 15 terabytes
Τεράστιος Πλούτος Πληροφοριών
– Βιβλιοπωλεία, Εστιατόρια, Ταξιδιωτικό Υλικό, Αγορές, Λεξικά,
Νέα, Χρηματαγορές, Οδηγοί, Χάρτες, …
– Πολλών Μορφών: κείμενα, εικόνες, φωνή, βίντεο…
– Πολλών Τύπων: HTML, XML, postscript, pdf, JPEG, MPEG, MP3

Με Ιδιαίτερα Δυναμικά Χαρακτηριστικά
– Πάρα πολλές νέες σελίδες κάθε μέρα (> 1 εκατ.)
– Δομή γράφου με συνδέσμους μεταξύ σελίδων (7-10 συνδέσμους)

Εκατοντάδες εκατομμυρίων ερωτήματα /
πλοηγήσεις την ημέρα
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
324
Το πρόβλημα Ολοκλήρωσης Πληροφοριών
(Information Integration)


Συσχετιζόμενα Δεδομένα υπάρχουν σε πολλούς
(διαδικτυακούς) τόπους και θα μπορούσαν να
δουλέψουν μαζί
Όμως, οι διαφορετικές Βάσεις Δεδομένων έχουν
πολλαπλές διαφορές:
1.
2.
3.
4.
Μοντέλο (relational, object-oriented?).
Περιγραφή (κανονικοποιημένο / μη-κανονικοποιημένο?).
Ορολογία: είναι οι Σύμβουλοι και Υπάλληλοι? Οι
υπεργολάβοι? Οι συνταξιούχοι?
Συμβατικοί Όροι (μετρικό σύστημα, θερμοκρασία, κλπ)
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
325
Το Περίγραμμα
1.
2.
3.
Ολοκλήρωση Πληροφοριών: Το να κάνεις
Βάσεις Δεδομένων από διάφορους τόπους να
δουλεύουν σαν μια.
Ημι-δομημένα Δεδομένα (Semistructured Data) :
Ένα νέο μοντέλο που έρχεται να αντιμετωπίσει
με τα προβλήματα της ολοκλήρωσης
πληροφοριών
XML : Μια ειδική γλώσσα για την περιγραφή
των semistructured data schemas και για την
παράσταση των δεδομένων.
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
326
Γράφος για Ημι-δομημένα (semistructured) Δεδομένα
root
beer
bar
beer
manf
name
servedAt
manf
A.B.
Bud
prize
name
M’lob
name
addr
Joe’s
Maple
The bar object
for Joe’s Bar
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
year
1995
award
Gold
The beer object
for Bud
Βασικές Τεχνολογίες
327
Υπολογιστική Νέφους με Βάσεις Δεδομένων
Cloud Computing with Databases
Google: BigTable, για εσωτερική αποθήκευση
AppEngine: http://code.google.com/appengine/
Άριστο για σύνθετα έγγραφα / αντικείμενα
ΔΕΝ είναι SQL; ΔΕΝ γίνονται συνενώσεις (JOIN)
Generic: Hadoop (Apache) - Λογισμικό Ανοικτού Κώδικα για Cloud
Amazon:
S3
SimpleDB
RDS
Microsoft:
Azure
Αρχεία, ιδιαίτερα μεγάλα
http://aws.amazon.com/s3/
Παρεμφερές με το BigTable
http://aws.amazon.com/simpledb/
Σχεσιακού Μοντέλου Υπηρεσία
MySQL ή Oracle 12g
http://aws.amazon.com/rds/
SQL Server
http://www.microsoft.com/windowsazure/
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
328
Πλεονεκτήματα της Χρήσης Υπηρεσιών
Νέφους για DBMS

Δεν υπάρχουν σταθερά κόστη
– Δεν απαιτείται Υλικό ή Λογισμικό
– Δεν απαιτείται συντήρηση
– Εύκολη Διαχείριση

Το Τίμημα καθορίζεται ανάλογα με τη χρήση
– Μηνιαίο Κόστος ανάλογα με το μέγεθος της ΒΔ
– Μηνιαίο Κόστος ανάλογα με τη χρήση (data transfer)

Επεκτασιμότητα
– Πολλαπλοί, κατανεμημένοι διακομιστές / εξυπηρετητές
– Πολλαπλές, υψηλής ταχύτητας Internet συνδέσεις

Αξιοπιστία
– Κατανεμημένο
– Σύστημα που το τρέχουν ειδικοί
– Ελεγχόμενη ασφάλεια
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
329
Όρια με τις Cloud Βάσεις Δεδομένων


Τα κόστη καμιά φορά ξεφεύγουν – ιδιαίτερα όταν η χρήση
είναι πολύ συχνή
Τότε ίσως είναι φτηνότερα να πάει κανείς στη λύση
αγοράς και κλασσικής χρήσης (in-house)
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
330
Τίμημα - Cloud Database Pricing
Παράδειγμα: Amazon RDS (MySQL), U.S. East
1 Extra large instance
20 hours/day
20 GB/month at 50 million I/O per month
10 GB/month data transfer in
All values are estimates and might
500 GB/month data transfer out
not include all fees.
20 GB/month regional transfer
=> $616 per month ($7400/year)
Παράδειγμα : Microsoft SQLAzure Business Edition
1 Extra large instance ($0.96/hour = $576/month)
20 GB/month ($200/month)
10 GB/month data transfer in ($1/month)
500 GB/month data transfer out ($75/month)
=> $852 per month ($10,224/year)
You get a relatively large database with T1-level data transfer for less than 10
percent of the cost of a DBA.
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
331
Cloud and Databases
“It was much nicer before people
started storing all their data in
the Cloud.”
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
332
ΕΞΕΛΙΞΗ στην Εφαρμογή και Τεχνολογία
Διοίκησης / Διαχείρισης Δεδομένων
Επιχειρησιακή
Διαχείριση - ΟΠΣ
Απλή Διαχείριση
Δεδομένων
Αρχές 80
Προ- Σχεσιακά
DBMS
Τέλη 80
Πρώτα
Σχεσιακά
Απλό
OLTP
Simple
transactions,
on-line
backup &
recovery
Αρχές - Μέσα 90
Client-server
Σχεσιακά
Ενεργές
Βάσεις
Δεδομένων
Stored
procedures,
triggers
Επιχειρησιακή
Κάλυψη
Αποθήκες
Δεδομένων &
Hi-end OLTP
Scaleable OLTP,
parallel query,
partitioning,
cluster support,
row-level locking,
high availability
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Τέλη 90 – 21ος C
Internet
Computing
Πακέτα & Κάθετες
Εφαρμογές Business Intelligence
Support for all
types of data,
extensibility,
objects
Middleware
(messaging,
queues, events)
Java, CORBA,
Web interfaces
XML )
Βασικές Τεχνολογίες
333
Business Integration Scenarios
334
Ι. Βασιλείου --- Επισκόπηση Πληροφοριακών Συστημάτων- Athens MBA
Βασικές Τεχνολογίες
334