close

Enter

Log in using OpenID

Ali Rıza Kuyucu_Teradata Day 2014 Sunum

embedDownload
​Teradata Büyük Veri- Analitik Çözümleri
​Ali Rıza Kuyucu, PS Direktörü, Teradata Türkiye
​25/09/2014
Gündem
 Büyük Veri Tanımı
 Teradata Büyük Veri Çözümü
 Unified Data Architecture
Komponentleri ve Analitik
Çözümler
 Organizasyonda Büyük Veri
Rolleri
2
© 2014 Teradata
Büyük veri için ne deniyor?
Forbes:
Big data is new and scary –very, very scary. No, wait.
Big data is just another name for the same old data and it’s not all that big,
and it’s something we should be embracing, not fearing. Big data is as
powerful as a tsunami, but it’s a deluge that can be controlled . . . in a positive
way, to provide business insights and value.
Aug 2013
McKinsey:
The use of big data will become a key basis of competition for individual firms.
From the standpoint of competitiveness and the potential capture of value, all
companies need to take big data seriously but we found that the opportunities
and challenges vary from sector to sector. The computer and electronic
products and information sectors, as well as finance and insurance, and
government are poised to gain substantially from the use of big data.
March 2013
3
Kime İnanmalı
Telefon, çok fazla eksikliği olduğu için bir iletişim aracı olarak kabul edilemez.
Western Union, 1876
İcat edilecek herşey icat edilmiştir.
Amerika patent ofisi, 1899
Fonografin hiçbir ticari değeri yoktur.
Thomas Edison, 1880
Dünya bilgisayar pazarı olsa olsa 5 bilgisayarlıktır.
Thomas Watson, IBM, 1943
Linux günümüzün hype’ıdır.
Gartner Group, 1999
Biz Linux’u bir hobi ya da öğrencilerin bir merakı olarak görüyoruz, ama ticari dünyada
elle tutulur bir değerini göreceğimize inanmıyoruz.
Bill Gates, 2001
4
​Analistler Ne Diyor?
Tek bir platformdan Analitik platforma geçiş
"Logical" Data Warehouse
“We will abandon the old models based on the desire to
implement for high-value analytic applications.”
This pattern recognizes that
enterprises often need a wide
range of choices to meet different
needs.
A robust toolset for data science
and predictive modeling is provided.
Multiple
applications and
both big-dataaware and
“traditional” BI
packages may be
required.
6
3
Source
systems
Options for use
of BI DBMS or
analytics against
data directly in
the hub are
provided.
2
4
3
1
Source
systems
Common denominator is using a
scalable data hub for as much as
possible. Distributed systems,
NoSQL, mainframes, file stores,
appliances and cloud services may
be included.
5
2
4
1
2
3
4
5
6
Hub
SVC
DW/
BI DB
Big
data
Standalone
Workbench
Pattern: hub-and-spoke
Forrester Research: The Patterns of Big Data
Data Lake
Yeni İş Zekası Yaklaşımı
Klasik Yöntem
Yapısal& Tekrarlanabilir Analiz
Iş birimleri soruları belirler
“Sadece gerekli olanı
tut”
IT veriyi soruya yanıt olacak
şekilde yapılandırır
“Gerekli olması
ihtimaline karşı veriyi
tut
IT bütün veri kaynaklarıni
saklayacak, temizleyecek ve
analiz edebilecek bir
platform sunar
8
Büyük Veri Yöntemi
Multi-structured & Iterative Analysis
İş Ekipleri veriyi cevaplamaya
değer sorular icin inceler.
⠕BÜYÜK VERİ ne kadar
farklı bir konu?
⠕«
⠕Saklanabilecek verinin
maliyeti azaldı
⠕Değişik veri tipleri ve yüksek
hacimli veri tipleri üzerinde
çalışan analitik araçlar gelişti
⠕Her ihtiyaç için kullanılabilecek
doğru platformu içeren mimari
yaklaşım
10
55
Enhanced customer experience
49
Process efficiency
New products/New business model
42
More targeted marketing
41
12
13
9
23
Monetize information directly
17
Regulatory compliance
others
13
3
5
0
9
10
16
Enhanced security capabilities
11
17
32
Improved risk management
N = 465; multiple responses allowed
15
37
Cost reduction
Big Data Adoption in 2013 Shows
Substance Behind the Hype
Gartner
9
10
20
30
40
50
60
Percentage of Respondents
Business issues now addressing
Likely to address (12-14 months)
70
DATA
INSIGHT
ACTION
TERADATA UNIFIED DATA ARCHITECTURE
System Conceptual View
ERP
MOVE
MANAGE
ACCESS
Marketing
Marketing
Executives
Applications
Operational
Systems
Business
Intelligence
Customers
Partners
SCM
INTEGRATED DATA WAREHOUSE
CRM
Images
DATA
PLATFORM
TERADATA DATABASE
Audio
and Video
Machine
Logs
Data
Mining
TERADATA
DATABASE
HORTONWORKS
INTEGRATED DISCOVERY PLATFORM
Frontline
Workers
Business
Analysts
Math
and Stats
Data
Scientists
Text
Languages
Web and
Social
Engineers
TERADATA ASTER DATABASE
USERS
SOURCES
ANALYTIC TOOLS
& APPS
TERADATA REFERENCE INFORMATION ARCHITECTURE
METADATA
METADATA
ERP
SQL
ARCHIVE
ARCHIVE
HADOOP
Operational
Systems
SCM
Acquisition1..n
Access1..n
Integrated Data
Customers
Partners
CRM
Frontline
Workers
Images
HADOOP
Audio
and Video
Machine
Logs
TERADATA
DATABASE
SQL
Executives
TERADATA
DATABASE
Business
Analysts
TERADATA
DATABASE
Data
Scientists
Text
Web and
Social
SOURCES
Discovery Environment 1…n
HADOOP
ASTER
Engineers
DATA
LABS
USERS
ANALYTIC TOOLS
& APPS
Aster – Her tür veri içinde gizli kalmış değerin çıkarılması
Marketing
• Yapısal ve yapısal olmayan
veri
Marketing
Users
• Patentli SQL – MapReduce
fonksiyonları
• 100 den fazla hazır Analitik
Fonksiyon
• MPP Mimarisi
• Bütün veri tabanlarına
anında bağlanıp analizde
kullanabilme
DISCOVERY PLATFORM
Multi-Genre Analytics
• İleri Analitik Yöntemler
Business
Intelligence
Data
Mining
Data
Scientists
Math
and Stats
Business
Analysts
Languages
USERS
ANALYTIC TOOLS
20
Teradata Aster Discovery Portfolio
Büyük Veri Analitiğinde en Hızlı Çözüm
PATH ANALYSIS
Discover Patterns in Rows of
Sequential Data
STATISTICAL ANALYSIS
High-Performance Processing
of Common Statistical
Calculations
MARKETING ANALYTICS
Analyze Customer Interactions
to Optimize Marketing
Decisions
22
TEXT ANALYSIS
Derive Patterns and Extract
Features in Textual Data
SEGMENTATION
Discover Natural Groupings of
Data Points
DATA
TRANSFORMATION
Transform Data for More
Advanced Analysis
Müşterilerinizin sizinle yolculuğunu modelleyin
Müşterilerin bizimle iletişime geçtiği
bütün kanal bilgilerini bir araya
getirip analiz edebilir miyiz?
Fraudulent Paths
Golden Path to Application Submit
Paths To Attrition
23
Aster ile Garanti Parçaları İlişki Analizi
24
​Büyük Veri Rolleri
Büyük veri rolleri
Büyük veri takımlari birbirini tamamlayan üç gruptan oluşur
1. Data Scientist (Veri Bilimci) – İstatistik ve veri madenciliği bilgisine sahip ve
dağıtık sistemlerle nasıl çalışabileceğini bilen profildir.
2. Dev-OPS – Map-Reduce frameworkünün detaylarını bilen, monitör
edebilen, gerektiğinde sistemi scale edebilen ve performansla ilgili
problemleri çözen gruptur.
3. Java Developers – Dağıtık sistemler üzerinde programlama yapabilen,
java diline ve detaylarına hakim, MapReduce frameworkünü iyi anlamış
senior Java geliştiricileridir. Bu takımın görevi, DataScientist’in çıktısını
production ortamına taşımaktır.
28
Veri Bilimcisi
29
Veri Bilimcisi ve İstatistikçi Arasındaki Farklar
30
Veri Bilimcisi ve İstatistikçi Arasındaki Farklar
31
Veri Madenciliği için kullanılan Yaklaşım
CRISP-DM
32
Hızlı ve karmaşık keşif
Business User
?
1
2
Data
Acquisition
3
Data
Preparation
4
Analysis
Data Scientist
Rapid Exploration
Fail Fast and Discover More
33
Visualization
Veri Bilimci
Veri Bilimci:
• Veri analizi ve algoritmalara hakim
• Dağıtık sistemlerin nasıl çalıştığını bilen
• Bir veya birden çok programlama diline
hakim,
• Büyük veri teknolojileri hakkında bilgi
sahibi
olmalıdır.
Diğer bir deyişle
Data Scientist: Senior Developer + DevOps +
Statistician
34
Veri artışı vs veri analizi iş gücü
35
Veri Bilimci Talebi
36
Teradata Professional Services
Strategic Services
Big Data
Advanced
Analytics
Technical Services
BICC, Data Governance,
Customer Experience
Management (CEM)
Continuously
investing with
Data Scientists
Most experienced and
biggest team for DW
implementations
38
38
© 2014 Teradata
Author
Document
Category
Uncategorized
Views
0
File Size
2 512 KB
Tags
1/--pages
Report inappropriate content