soluzioni business data lake con emc isilon e pivotal hd

SOLUZIONI BUSINESS DATA LAKE CON
EMC ISILON E PIVOTAL HD
Accelera l'innovazione e le informazioni sul business
ESSENTIALS
•
•
Le funzioni potenti ed efficienti di
La rapida crescita di dati non strutturati rappresenta oggi una sfida significativa per molte
storage e analisi offerte dal NAS di
aziende in un'ampia gamma di settori. Con il significativo aumento del volume e delle origini
EMC Isilon e da Pivotal HD forniscono
dei dati, le tecniche tradizionali per archiviare e analizzare le informazioni si sono
gli elementi fondamentali per il
dimostrate troppo dispendiose e lente per poter trattare gli enormi volumi di dati prodotti e
Business Data Lake
gestiti dalle aziende moderne.
Ottieni risultati rapidi grazie a
Per realizzare questa opportunità è essenziale disporre di un'architettura dati moderna,
un'analisi dei dati potente e in loco
•
LA PROMESSA DEL BUSINESS DATA LAKE
Elimina costi e complessità legati a
aperta e flessibile, il Business Data Lake, che offre i seguenti vantaggi:
•
di stare al passo con i requisiti di data storage in costante evoluzione
un'infrastruttura separata per il
supporto dell'analisi
Un'infrastruttura estremamente scalabile ed efficiente che consente di ridurre i costi e
•
Strumenti di analisi potenti ma intuitivi, che permettono di ottimizzare il valore per il
business delle informazioni all'interno dei dati
•
Protezione dei dati di livello enterprise per massimizzare l'availability ed efficaci
opzioni di sicurezza per soddisfare i requisiti di business governance
Riassumendo, il Business Data Lake rappresenta un repository avanzato di informazioni
strategiche con un potenziale in grado di trasformare il business.
SOLUZIONE EMC ISILON E PIVOTAL HD
Lo storage scale-out di EMC® Isilon® e Pivotal HD, Enterprise Hadoop Distribution,
rappresentano gli elementi fondamentali per una soluzione di Business Data Lake potente
ed estremamente efficace, che combina Big Data storage a elevata scalabilità e potenti
funzionalità di analisi. Questa soluzione consente di creare un Business Data Lake in grado
di rappresentare l'elemento fondamentale per ottenere nuove informazioni, accelerare
l'innovazione e trasformare il business.
Isilon è l'unica piattaforma NAS scale-out con supporto nativo per Hadoop Distributed File
System (HDFS). Con i dati non strutturati in Isilon è possibile sfruttare Pivotal HD per
eseguire query di analisi dei dati in batch e in tempo reale senza incorrere in spese in conto
capitale superflue e costi operativi eccessivi o perdere tempo prezioso per effettuare la
replica dei Big Data in un'infrastruttura separata. È sufficiente connettere le risorse di
elaborazione di Pivotal HD al sistema di storage Isilon per ottimizzare il valore dei dati.
SOLUTION OVERVIEW
ANALISI HADOOP IN LOCO CON EMC ISILON E PIVOTAL HD
PIVOTAL HD
•
Massimizzazione del valore di tutti i
dati per promuovere il business
•
Ottimizzazione delle competenze SQL
esistenti per analisi avanzate
•
PIVOTAL HD
Pivotal HD offre le funzionalità di Apache Hadoop, potenziate e fornite in pacchetto in una
distribuzione enterprise-ready completamente supportata. Inoltre, Pivotal fornisce servizi a
valore aggiunto con un engine di elaborazione di query SQL avanzato, comprovato e
parallelo, combinato con un sistema distribuito in memoria. Pivotal HD è l'unica soluzione di
elaborazione batch e di analisi di tipo "closed loop" del settore per OLAP e OLTP con HDFS
Riduzione del time-to-value con una
come livello di data storage comune. Applicando le analisi agli eventi quotidiani dell'azienda,
griglia dati in memoria per analisi a
è possibile creare sistemi prescrittivi in grado di attuare le azioni opportune in tempo reale.
ciclo chiuso
ARCHITETTURA PIVOTAL HD
QUERY ENGINE DI ANALISI SQL RAPIDO E COMPROVATO PER
HADOOP
A differenza dei nuovi concorrenti che si apprestano per la prima volta ad applicare SQL in
Hadoop, Pivotal HAWQ vanta oltre 10 anni di innovazione con il database Greenplum e ha
realizzato uno strumento di ottimizzazione delle query SQL potente e avanzato. HAWQ
consente di individuare agevolmente il piano ottimale per le query più impegnative, incluse
quelle con oltre 30 join. Il processore HAWQ è ottimizzato per l'esecuzione di query
analitiche e carichi di lavoro di query misti in ambienti estremamente distribuiti e paralleli
su HDFS. Dal momento che HAWQ è completamente conforme a SQL, le competenze e i
prodotti esistenti possono essere utilizzati al meglio per accelerare in modo significativo i
progetti di analisi dei dati, spesso con prestazioni di 100 volte superiori rispetto a Hadoop.
HAWQ dispone inoltre di un'interfaccia esterna con HDFS, HBase e Hive, che consente di
leggere ed eseguire query dei dati archiviati nell'ecosistema Hadoop, nonché caricarli
direttamente in HAWQ. Supporta un'ampia gamma di formati di dati, tra cui Text, AVROe
RCFile.
DATA SERVICE IN TEMPO REALE PER HADOOP
GemFire XD, completamente compatibile con SQL e realizzato sulla base di oltre un
decennio di innovazione, è una griglia dati in memoria che, combinata con Pivotal HD e
HAWQ, fornisce la prima piattaforma di qualità a livello di produzione del settore per la
creazione di soluzioni analitiche di tipo "closed loop". GemFire XD consente la creazione di
applicazioni OLTP, scale-out e a bassa latenza, integrate con un datastore Big Data (HDFS)
out of the box. Ciò garantisce una risposta rapidissima alle applicazioni, consentendo al
contempo l'analisi dei dati in back-end tramite HAWQ, Hive o MapReduce in tempo reale.
EMC ISILON
•
Con le soluzioni di storage scale-out Isilon è possibile garantire significative possibilità di
soluzione di analisi Hadoop con
espansione per data asset non strutturati e progetti di analisi correlati. Le soluzioni Isilon
supporto HDFS nativo per consentire
•
sono facilmente scalabili da 16 terabyte (TB) a oltre 20 petabyte (PB) di capacità in un unico
analisi in loco
cluster Isilon. Grazie alla possibilità di sfruttare il supporto HDFS nativo di Isilon e le
Riduzione dei costi con tasso di utilizzo
capitale necessarie per un'infrastruttura Hadoop separata e dedicata.
superiore all'80%
•
NAS SCALE-OUT EMC ISILON
Implementazione più rapida della
funzionalità Big Data Analytics in loco, è inoltre possibile evitare le ingenti spese in conto
Scalabilità superiore a 20 PB in un
unico cluster
•
Eliminazione di rischi di tipo "single
point of failure" associati alle
implementazioni Hadoop tradizionali
SUPPORTO MULTIPROTOCOLLO PER LA FLESSIBILITÀ OPERATIVA
AUMENTA LA FLESSIBILITÀ
Oltre al supporto HDFS nativo, lo storage NAS scale-out Isilon include il supporto integrato
per un'ampia gamma di protocolli standard del settore, tra cui NFS, SMB, HTTP, FTP e
accesso a oggetti basato su REST per iniziative cloud. Con Isilon è pertanto possibile fornire
un'infrastruttura di storage a elevata flessibilità per l'ambiente di Business Data Lake che
consente di semplificare i flussi di lavoro, accelerare progetti di analisi del business,
supportare iniziative di cloud infrastructure e ricavare maggiore valore dai dati e dalle
applicazioni aziendali.
ABBATTI I COSTI
Con Isilon è possibile semplificare l'infrastruttura di storage attraverso il consolidamento di
file asset su vasta scala e data asset non strutturati e l'eliminazione di silos di storage,
fornendo al contempo l'elemento fondamentale per il Business Data Lake. Le soluzioni
Isilon permettono di conseguire un tasso di utilizzo dello storage superiore all'80%. E con la
deduplica dei dati Isilon SmartDedupe™ è possibile ridurre ulteriormente i requisiti di Big
Data storage fino al 35% eliminando i dati ridondanti. Grazie a questo livello ineguagliabile
di efficienza di Isilon, sono necessarie quantità ridotte di capacità di storage e spazio fisico
per ospitare lo stesso volume di dati rispetto ad altre alternative, con una conseguente
riduzione del capitale iniziale e dei costi fissi. E poiché una soluzione Isilon è semplice da
gestire, richiede un numero inferiore di risorse IT per amministrare lo storage rispetto ai
sistemi tradizionali.
ACCELERA I RISULTATI
L'approccio di analisi dei dati in loco di Isilon consente di azzerare le risorse e i tempi
necessari per la replica dei Big Data in un'infrastruttura separata. Potrebbero ad esempio
essere necessarie più di 24 ore per copiare 100 TB di dati su una linea da 10 GB. Con Isilon
sarà invece possibile avviare immediatamente progetti di analisi dei dati e ottenere risultati
in pochi minuti. La capacità di eseguire analisi in loco eliminando la laboriosa fase di
acquisizione dei dati consente di supportare analisi alla velocità del business.
PROTEGGI I BIG DATA ASSET
Le soluzioni di storage Isilon forniscono livelli incontrastati di protezione e availability dei
dati non strutturati. Grazie a Isilon OneFS®, le soluzioni EMC eliminano inoltre i rischi di tipo
"single-point-of-failure" associati alle implementazioni Hadoop tradizionali, permettendo a
tutti i nodi presenti in un cluster di storage EMC Isilon di diventare namenode a tutti gli
effetti. Ciò consente di migliorare in modo significativo la resilienza dell'ambiente EMC di
analisi e data storage.
EMC Isilon fornisce opzioni di protezione end-to-end per i dati non strutturati, incluse
funzioni rapide ed efficienti di data backup e disaster recovery per aumentare ulteriormente
l'availability dei data asset.
Per poter soddisfare i requisiti di governance aziendale e conformità alle normative vigenti,
Isilon offre efficaci opzioni di sicurezza, tra cui audit dei file system e protezione dei dati di
tipo WORM (Write Once, Read Many) per impedire modifiche o eliminazioni accidentali o
malevole. Con Isilon, è inoltre possibile fornire una separazione sicura dei ruoli tra
l'amministrazione dello storage e l'accesso al file system e creare zone di autenticazione in
grado di fornire storage pool sicuri e isolati per specifici dipartimenti all'interno
dell'organizzazione.
RIEPILOGO
Un Business Data Lake può essere utilizzato come repository avanzato di informazioni
strategiche per consentire di trasformare il business e ottenere vantaggi significativi. Lo
storage NAS scale-out EMC Isilon e Pivotal HD rappresentano gli elementi fondamentali per
una soluzione di Business Data Lake potente ed estremamente efficace che combina Big
Data storage a elevata scalabilità e potenti funzionalità di analisi.
UNA NUOVA FASE
Per sapere di più sui vantaggi che le soluzioni di Business Data Lake possono offrire alle
organizzazioni con EMC Isilon e Pivotal HD, rivolgersi all'Account Manager o al rivenditore
autorizzato EMC o Pivotal.
Le soluzioni EMC Isilon sono disponibili anche nell'EMC Store all'indirizzo
http://store.emc.com/isilon.
CONTATTI
Per saperne di più sulle possibilità
offerte da prodotti, servizi e soluzioni
EMC per superare le sfide aziendali e
IT, contattare il rappresentante
locale o un rivenditore autorizzato
oppure visitare il sito all'indirizzo
italy.emc.com.
EMC2, EMC, il logo EMC, Isilon, OneFS, AutoBalance e SmartDedupe sono marchi o marchi registrati di
EMC Corporation negli Stati Uniti e in altri paesi. Tutti gli altri marchi citati nel presente documento
appartengono ai rispettivi proprietari. © Copyright 2014 EMC Corporation. Tutti i diritti riservati.
6/14 Solution Overview H12775
EMC ritiene che le informazioni contenute in questo documento siano esatte al momento della data di
italy.emc.com
pubblicazione. Le informazioni sono soggette a modifica senza preavviso.