Nessun risultato trovato

La tua ricerca non ha prodotto risultati

È consigliabile provare quanto segue per riuscire a trovare quello che stai cercando:

  • Controlla l'ortografia della ricerca per parola chiave.
  • Utilizza sinonimi per la parola chiave digitata, ad esempio prova “applicazione” anziché “software”.
  • Prova una delle ricerche popolari mostrate di seguito.
  • Inizia una nuova ricerca.

 

Domande di tendenza

Che cos'è un data warehouse?

Un data warehouse è un tipo di sistema di data management progettato per abilitare e supportare le attività di business intelligence (BI), in particolare l'analisi. I data warehouse servono esclusivamente a eseguire query e analisi e spesso contengono grandi quantità di dati storici. I dati all'interno di un data warehouse sono generalmente derivati da una vasta gamma di origini come i file di registro dell'applicazione e le applicazioni di transazione.

Un data warehouse centralizza e consolida grandi quantità di dati da più origini. Le sue capacità analitiche consentono alle organizzazioni di ricavare importanti insight sul business dai loro dati per migliorare il processo decisionale. Nel tempo, crea un record storico che può risultare prezioso per i data scientist e i business analyst. A causa di queste funzionalità, un data warehouse può essere considerato l'“unica fonte di verità” di un'organizzazione.

Un tipico data warehouse spesso include i seguenti elementi:

  • Un database relazionale per archiviare e gestire i dati
  • Una soluzione di estrazione, caricamento e trasformazione (ELT) per preparare i dati all'analisi
  • Funzionalità di analisi statistiche, reporting e data mining
  • Strumenti di analisi del cliente per visualizzare e presentare i dati agli utenti aziendali
  • Altre applicazioni analitiche più sofisticate che generano informazioni utilizzabili
  • applicando algoritmi di machine learning e intelligenza artificiale (AI)

Perché non eseguire Analytics sull'ambiente OLTP?

I data warehouse sono ambienti relazionali utilizzati per l'analisi dei dati, in particolare dei dati storici. Le organizzazioni utilizzano i data warehouse per scoprire modelli e relazioni nei loro dati che si sviluppano nel tempo.

Al contrario, gli ambienti transazionali vengono utilizzati per elaborare le transazioni su base continuativa e vengono comunemente utilizzati per gli ordini e le transazioni finanziarie e retail. Non si basano su dati storici. Infatti, negli ambienti OLTP, i dati storici vengono spesso archiviati o semplicemente eliminati per migliorare performance.

I data warehouse e i sistemi OLTP differiscono in modo significativo.

Data warehouse Sistema OLTP
Workload Ospita analisi dei dati e query ad hoc Supporta solo operations predefinite
Modifiche dei dati Esegue aggiornamenti automatici su base regolare Aggiornamenti da parte degli utenti finali che rilasciano dichiarazioni individuali
Schema struttura Utilizza schemi parzialmente denormalizzati per ottimizzare le performance Utilizza schemi completamente normalizzati per garantire la coerenza dei dati
Scansione dei dati Comprende da migliaia a milioni di righe Accede solo a pochi record alla volta
Dati storici Memorizza molti mesi o anni di dati Memorizza i dati solo per settimane o mesi

Data warehouse, data mart e archivi dati di operations

Sebbene svolgano ruoli simili, i data warehouse sono diversi dai data mart e dagli archivi dati di operations (ODS). Un data mart svolge le stesse funzioni di un data warehouse, ma in un ambito molto più limitato, di solito un singolo reparto o una singola linea di business. Questo rende i data mart più facili da definire rispetto ai data warehouse. Tendono tuttavia a introdurre un'incoerenza perché può essere difficile gestire e controllare in modo uniforme i dati su numerosi data mart.

Gli ODS supportano solo operations quotidiane, quindi hanno una vista dei dati storici molto limitata. Sebbene funzionino molto bene come origini di dati correnti e siano spesso utilizzati come tali dai data warehouse, non supportano query storiche complesse.

Ho bisogno di un data lake?

Le organizzazioni utilizzano sia i data lake sia i data warehouse per grandi volumi di dati da varie origini. La scelta di quando utilizzare l'uno o l'altro dipende dal modo in cui l'organizzazione prevede di utilizzare i dati. Di seguito viene indicato come viene usato al meglio ciascuno di essi:

  • Data lake: archiviano tantissimi dati disparati e non filtrati da utilizzare successivamente per uno scopo particolare. I dati di applicazioni line-of-business, app per dispositivi mobili, social media, dispositivi IoT e altro vengono acquisiti come dati non elaborati in un data lake. La struttura, l'integrità, la selezione e il formato dei vari set di dati sono derivati al momento dell'analisi dalla persona che esegue tale operazione. Quando le organizzazioni necessitano di storage a basso costo per dati non formattati e non strutturati ricevuti da più origini che intendono utilizzare per qualche scopo in futuro, un data lake potrebbe essere la scelta giusta.
  • Data warehouse : sono specificamente destinati ad analizzare i dati. L'elaborazione analitica all'interno di un data warehouse viene eseguita su dati che sono stati preparati per l'analisi, ovvero raccolti, contestualizzati e trasformati, con lo scopo di generare insight basati sulle analisi. I data warehouse sono anche adatti a gestire grandi quantità di dati provenienti da varie origini. Quando le organizzazioni hanno bisogno di analisi dei dati avanzati o di analisi che attingano a dati storici da più origini attraverso la loro impresa, un data warehouse è probabilmente la scelta giusta.

Vantaggi di un data warehouse

I data warehouse offrono il vantaggio esclusivo e unico di consentire alle organizzazioni di analizzare grandi quantità di dati Variant e di ricavarne un valore significativo, oltre a mantenere un record storico.

Quattro caratteristiche uniche (descritte dal computer scientist William Inmon, considerato il padre del data warehouse) consentono ai data warehouse di fornire questo vantaggio generale. Secondo questa definizione, i data warehouse sono

  • Orientati agli oggetti. Possono analizzare dati su un particolare argomento o area funzionale (come le vendite).
  • Integrati. I data warehouse creano coerenza tra diversi tipi di dati provenienti da origini disparate.
  • Non volatili. Una volta che i dati si trovano in un data warehouse, sono stabili e non cambiano.
  • Variante temporale. L'analisi del data warehouse esamina il cambiamento nel tempo.

Un data warehouse ben progettato eseguirà le query molto rapidamente, fornirà un elevato throughput dei dati e offrirà agli utenti finali la flessibilità di “eseguire un'analisi approfondita” o ridurre il volume dei dati al fine di eseguire un esame più approfondito e soddisfare una varietà di richieste, ad alto livello o a un livello dettagliato e molto preciso. Il data warehouse funge da base funzionale per gli ambienti di BI middleware che forniscono agli utenti finali report, dashboard e altre interfacce.

Architettura del data warehouse

L'architettura di un data warehouse è determinata dalle esigenze specifiche dell'organizzazione. Di seguito sono indicate alcune delle architetture comuni:

  • Semplice. Tutti i data warehouse condividono una struttura di base dove metadati, dati di riepilogo e dati non elaborati sono archiviati nel repository centrale del warehouse. Il repository è alimentato da fonti di dati da un lato ed è accessibile da parte degli utenti finali ai fini di analisi, reporting e data mining dall'altro.
  • Semplice con un'area di gestione temporanea. I dati operativi devono essere puliti ed elaborati prima di essere messi nel warehouse. Sebbene tale operazione possa essere eseguita a livello di programmazione, molti data warehouse aggiungono un'area di gestione temporanea per i dati prima che vengano introdotti nel warehouse, per semplificare la preparazione dei dati.
  • Hub e spoke. L'aggiunta di data mart tra il repository centrale e gli utenti finali consente a un'organizzazione di personalizzare il proprio data warehouse in modo da poter gestire diverse linee di business. Quando i dati sono pronti per l'uso, vengono spostati nel data mart appropriato.
  • Sandbox. Le sandbox sono aree private, protette e sicure che consentono alle aziende di esplorare in modo rapido e informale nuovi set di dati o metodi di analisi dei dati senza dover rispettare la compliance con le regole formali e il protocollo del data warehouse.

L'evoluzione dei data warehouse—Da Data Analytics a AI e Machine Learning

Quando sono apparsi alla fine degli anni '80, i primi data warehouse avevano lo scopo di semplificare il flusso di dati dai sistemi operativi ai sistemi di supporto alle decisioni (DSS). Questi primi data warehouse richiedevano un'enorme quantità di ridondanza. La maggior parte delle organizzazioni disponeva di più ambienti DSS per la gestione di vari utenti. Sebbene gli ambienti DSS usassero gran parte degli stessi dati, le operazioni di raccolta, pulizia e integrazione dei dati venivano spesso replicate per ogni ambiente.

Con l'aumentare della loro efficienza, i data warehouse si sono evoluti da semplici archivi di informazioni che supportavano le tradizionali piattaforme di BI in ampie infrastrutture di analisi che supportano un'ampia varietà di applicazioni, tra cui analisi operativa e gestione delle performance.

Le iterazioni del data warehouse sono progredite nel tempo per fornire un valore aggiuntivo incrementale all'impresa.

Passaggio Funzionalità Valore aziendale
1 Reporting transazionale Fornisce informazioni relazionali per creare snapshot delle performance aziendali
2 Analisi approfondita, query ad hoc, strumenti di BI Espande le funzionalità per insight più approfonditi e analisi più potenti
3 Previsione delle performance future (data mining) Sviluppa visualizzazioni e business intelligence predittiva
4 Analisi tattica (spaziale, statistica) Offre scenari “what-if” per consentire decisioni pratiche informate basate su analisi più complete
5 Memorizza molti mesi o anni di dati Memorizza i dati solo per settimane o mesi

Il supporto di ognuno di questi cinque passaggi ha richiesto una crescente varietà di set di dati. Gli ultimi tre passaggi in particolare creano l'imperativo per una gamma ancora più ampia di dati e funzionalità di analisi.

L'intelligenza artificiale e il machine learning stanno trasformando quasi tutti i settori, i Customer Service e gli asset aziendali, e i data warehouse non sono un'eccezione. L'espansione dei Big Data e l'applicazione di nuove tecnologie digitali stanno stanno favorendo il cambiamento nell'ambito dei requisiti e delle capacità dei data warehouse.

Il data warehouse autonomo è l'ultimo passaggio di questa evoluzione, in quanto offre alle aziende la possibilità di estrarre ancora più valore dai propri dati, riducendo al contempo i costi e migliorando l'affidabilità e le performance del data warehouse.

Scopri di più sui data warehouse autonomi e su come iniziare a utilizzarli.

Progettazione di un data warehouse

Quando un'organizzazione decide di progettare un data warehouse, deve iniziare definendo i propri specifici requisiti aziendali, concordando l'ambito e stabilendo una progettazione concettuale. L'organizzazione può quindi creare sia la progettazione logica che fisica del data warehouse. La progettazione logica riguarda le relazioni tra gli oggetti, mentre quella fisica riguarda il modo migliore per archiviare e recuperare gli oggetti. La progettazione fisica include anche processi di trasporto, backup e ripristino.

Qualsiasi progettazione di data warehouse deve prendere in considerazione quanto segue:

  • Contenuto di dati specifici
  • Relazioni all'interno e tra gruppi di dati
  • Ambiente di sistema per il supporto del data warehouse
  • Tipi di trasformazione dei dati richiesti
  • Frequenza di aggiornamento dei dati

Un fattore primario nella progettazione è rappresentato dalle esigenze degli utenti finali. La maggior parte degli utenti finali è interessata a eseguire analisi e considerare i dati in forma aggregata, anziché come singole transazioni. Tuttavia, spesso gli utenti finali non sanno veramente cosa vogliono fino a quando non si presenta una specifica esigenza. Il processo di pianificazione dovrebbe pertanto includere un'esplorazione tale da riuscire a prevenire le necessità. La progettazione del data warehouse dovrebbe infine prevedere spazio per l'espansione e l'evoluzione al fine da poter tenere il passo con le esigenze in continua evoluzione degli utenti finali.

Cloud e data warehouse

I data warehouse in cloud offrono caratteristiche e vantaggi equivalenti a quelli dei data warehouse on-premise, oltre agli ulteriori vantaggi garantiti dal cloud computing, quali flessibilità, scalabilità, agilità, sicurezza e costi ridotti. I data warehouse cloud permettono alle aziende di dedicarsi esclusivamente a ottenere maggiore valore dai dati, anziché doversi impegnare a creare e gestire l'infrastruttura hardware e software ai fini del supporto del data warehouse.

Ulteriori informazioni su Oracle Cloud e data warehouse (PDF)

Implementazione priva di complessità: Autonomous Data Warehouse

L'iterazione più recente del data warehouse è il data warehouse autonomo, che si basa su AI e machine learning per eliminare le attività manuali e semplificare configurazione, implementazione e gestione dei dati. Un data warehouse autonomo distribuito come servizio in cloud non richiede alcun intervento umano per attività di amministrazione del database, configurazione o gestione dell'hardware o installazione di software.

Le attività di creazione del data warehouse, backup, applicazione di patch al database e relativo aggiornamento, espansione o riduzione del database vengono eseguite in automatico, con la stessa flessibilità, scalabilità, agilità e costi ridotti offerti dalle piattaforme cloud. Il data warehouse autonomo rimuove la complessità, accelera l'implementazione e libera le risorse, consentendo alle organizzazioni di concentrarsi su attività che aggiungono valore al business.

Oracle Autonomous Data Warehouse

Oracle Autonomous Data Warehouse è un data warehouse completamente autonomo, facile da usare e a scalabilità flessibile, che oltre a offrire elevate performance delle query, non richiede alcun tipo di amministrazione del database. La configurazione di Oracle Autonomous Data Warehouse è molto semplice e veloce.

Maggiori informazioni su Oracle Autonomous Data Warehouse (PDF)