Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics, offering information and knowledge of the Big Data.

invito all'azione

Get Started

cloud

Sei pronto per cominciare?

Scarica Sandbox

Come possiamo aiutarti?

chiudiPulsante di chiusura
invito all'azione

Apache Hadoop Data Warehouse Architecture
for EDW Optimization

Riduci i costi spostando su Hadoop dati ed elaborazioni®

cloud Hortonworks is a leader. Read the Forrester Wave.

DOWNLOAD Report

What is an EDW?

Enterprise Data Warehouse (EDW) is an organization’s central data repository that is built to support business decisions. EDW contains data related to areas that the company wants to analyze. For a manufacturer, it might be customer, product or bill of material. EDW is built by extracting data from a number of operational systems. As the data is fed into EDW it is converted, reformatted and summarized to present a single corporate view. Data is added into the data warehouse over time in the form of snapshots and normally EDW contains data spanning 5 to 10 years.

EDW Optimization

Problems with a typical EDW

Il data warehouse aziendale è diventato un componente standard dell'architettura di dati aziendale. Tuttavia, la complessità e il volume dei dati rappresentano una sfida interessante per le soluzioni EDW esistenti, in termini di efficienza.

Per poter sfruttare appieno il potenziale di trasformazione insito nei Big Data, le aziende devono essere in grado di gestire la complessità e utilizzare tutte le fonti di dati, quali ad esempio i social network, il web, i sistemi IoT e molti altri ancora. L'integrazione delle nuove fonti di dati nei sistemi EDW esistenti permetterà alle aziende di effettuare analisi a un livello molto più profondo. Il problema, tuttavia, è dato dal fatto che, per le tecnologie EDW esistenti, sta diventando sempre più difficile riuscire a fornire un ambiente economicamente sostenibile con prestazioni, scalabilità e flessibilità ottimali.

Elementi della soluzione

Hortonworks Data Platform

*

Potenti capacità di Hadoop per la data governance e l'integrazione, la gestione, l'accesso, la sicurezza e l'utilizzo dei dati: un sistema strutturato per l'integrazione a livello profondo con la tecnologia esistente nel data center. Altre informazioni

Syncsort

*

Software ETL ad alte prestazioni per accedere e caricare in modo semplice i dati aziendali tradizionali sul sistema HDP. Altre informazioni

AtScale

*

Interfaccia aziendale per una business intelligence (BI) rapida su Hadoop per coprire la distanza tra gli utenti aziendali e i loro dati. Altre informazioni

SERVIZI PROFESSIONALI

*

Guida e assistenza da parte di personale esperto per verificare rapidamente il valore della nuova architettura e ottenere il massimo da una soluzione di ottimizzazione dell'architettura di dati Hortonworks convalidata e completamente testata. Altre informazioni

Optimizing EDW with Apache Hadoop ®

Flexible

*

Data can be loaded in HDP without having a data model in place

*

Data model can be applied based on the questions being asked of data (schema-on-read

*

HDP is designed to answer questions as they occur to the user

Efficient

*

100% of the data is available at granular level for analysis

*

HDP can store and analyze both structured and unstructured data

*

Data can be analyzed in different ways to support diverse use cases

Cost Effective

*

HDP (Hortonworks Data Platform) is 100% open - there is no licensing fee for software

*

HDP runs on commodity hardware

*

New data can be landed in HDP and used in days or even hours

Use-Cases on EDW Optimization

CASO D'USO 1
immagine media

BI rapida su Hadoop

I sistemi EDW proprietari sono stati adottati in passato per poter sfruttare una BI rapida e sistemi di analisi profondi e dettagliati; tuttavia il prezzo dei sistemi EDW è elevatissimo e inoltre questi sistemi non si sono adattati alle sfide dei big data odierni, come i dati non strutturati e le analisi su larga scala.

Hortonworks makes fast BI on Hadoop a reality, with the combination of a fast in-memory SQL engine to create data marts with an OLAP cubing engine that lets you query huge datasets in seconds. This gives you the choice of querying pre-aggregated data for maximum performance or in full-fidelity form when the nest grains of detail are needed, allowing access from any major BI tool that supports ODBC, JDBC or MDX.

Altre informazioni

CASO D'USO 2
immagine media

PROCESSI ETL INTEGRATI PER HADOOP

A typical EDW spends between 45 to 65 percent of its CPU cycles on ETL processing.These lower-value ETL jobs compete for resources with more business-critical workloads and can cause SLA misses. Hadoop can offload these ETL jobs with minimal porting effort and at substantially lower cost, saving money and freeing up capacity on your EDW for higher-value analytical workloads. Hortonworks makes it easy by providing high-performance ETL tools, a powerful SQL engine and integration with all major BI vendors.

Altre informazioni

CASO D'USO 3
immagine media

ARCHIVIAZIONE DEI DATI IN HADOOP

Il continuo aumento dei volumi di dati e dei costi obbligano molte aziende ad archiviare i vecchi dati su nastro, rendendo impossibile l'analisi e costoso l'eventuale recupero dei dati.

Hadoop offre un costo al terabyte paragonabile a quello delle soluzioni di backup su nastro. Grazie alla convenienza economica, è possibile archiviare anni di dati, invece che pochi mesi. Tutti i dati aziendali restano disponibili per il recupero, per l'interrogazione e per le analisi profonde da effettuare con gli stessi strumenti utilizzati sui sistemi EDW esistenti.

Altre informazioni