Oracle Cloud Free Tier

Sviluppa, testa e implementa applicazioni su Oracle Cloud, gratuitamente.

Che cos'è la gestione dei dati?

Definizione di gestione dei dati

La gestione dei dati è la pratica che consente di raccogliere, conservare e utilizzare i dati in modo sicuro, efficiente ed economico. L'obiettivo del data management è quello di aiutare persone, organizzazioni e oggetti connessi a ottimizzare l'uso dei dati nel rispetto di policy e regolamenti, consentendo di prendere decisioni e intraprendere azioni che massimizzino i vantaggi per l'organizzazione. Poiché le organizzazioni si affidano sempre più ad asset immateriali per creare valore, oggi adottare una solida strategia di gestione dei dati sta diventando più importante che mai.

Definizione di gestione dei dati

La gestione dei dati digitali in un'organizzazione implica una vasta gamma di attività, policy, procedure e pratiche. L'attività di gestione dei dati ha una vasta portata, che copre fattori come:

  • Creazione, accesso e aggiornamento dei dati su un livello di dati diversificato
  • Archiviazione di dati su più cloud e on-premise
  • Disponibilità elevata e disaster recovery
  • Utilizzo di dati in una crescente varietà di app, strumenti di analisi e algoritmi
  • Garanzia di sicurezza e privacy dei dati
  • Archiviazione ed eliminazione dei dati in base ai programmi retention e ai requisiti di compliance

Una strategia di gestione dei dati formale riguarda l'attività di utenti e amministratori, le funzionalità delle tecnologie di gestione dei dati, le disposizioni dei requisiti normativi e le esigenze dell'organizzazione al fine di ottenere valore dai dati.

Il capitale dei dati è capitale aziendale

Nell'ambito dell'economia digitale dei nostri giorni, i dati rappresentano un tipo di capitale, un fattore economico di produzione di beni e servizi digitali. Una casa automobilistica non può produrre un nuovo modello se non ha il capitale finanziario necessario. Allo stesso modo, non può rendere le sue auto autonome se mancano i dati per alimentare gli algoritmi integrati. Questo nuovo ruolo dei dati ha impatto sulla strategia competitiva e sul futuro dell'informatica.

Poiché questo ruolo dei dati è centrale e strategico, sono essenziali complesse pratiche di gestione e un solido sistema di gestione per ogni organizzazione, indipendentemente dalle dimensioni o dal tipo.

Sistemi odierni di gestione dei dati

Le organizzazioni di oggi hanno bisogno di una soluzione di gestione dei dati che fornisca un modo efficiente per gestire i dati attraverso un livello di dati diversificato, ma unificato. I sistemi di gestione dei dati si basano su piattaforme di gestione dei dati e possono includere database, data lake e data warehouse, sistemi di gestione dei big data, analisi dei dati e altro ancora.

Tutti questi componenti interagiscono sotto forma di "utilità di dati" per fornire le funzionalità di gestione dei dati di cui un'organizzazione ha bisogno per le app di cui dispone, così come per l'analisi e gli algoritmi che utilizzano i dati che hanno origine da tali app. Sebbene gli strumenti correnti consentano agli amministratori di database (DBA) di automatizzare molte delle attività di gestione tradizionali, l'intervento manuale è comunque spesso richiesto a causa delle dimensioni e della complessità della maggior parte delle implementazioni di database. Ogni volta che è richiesto un intervento manuale, la possibilità di errore aumenta. La riduzione della necessità della gestione manuale dei dati è uno degli obiettivi chiave di una nuova tecnologia di gestione dei dati: il database autonomo.

Sistemi odierni di gestione dei dati

Piattaforme di gestione dei dati

Il passaggio più critico per la distribuzione continua del software è l'integrazione continua. CI è una pratica di sviluppo in cui gli sviluppatori eseguono il commit delle le loro modifiche al codice (di solito piccole e incrementali) in un repository di origine centralizzato, che avvia una serie di build e test automatizzati. Questo repository consente agli sviluppatori di acquisire i bug in anticipo e automaticamente prima di trasmetterli alla produzione. Solitamente, la pipeline di integrazione continua prevede una serie di passaggi, a partire dal commit del codice all'esecuzione di analisi statiche/linting automatizzato di base, acquisizione delle dipendenze e infine creazione del software ed esecuzione di alcuni unit test di base prima di creare un artefatto di compilazione. I sistemi di gestione del codice sorgente, come Github, Gitlab e così via, offrono l'integrazione di webhook a cui possono iscriversi strumenti CI come Jenkins per avviare l'esecuzione di build e test automatizzati dopo ogni controllo del codice.

Una piattaforma di data management è il sistema di base per la raccolta e l'analisi di grandi volumi di dati all'interno di un'organizzazione. Le piattaforme di dati commerciali includono in genere strumenti software per la gestione, sviluppati dal fornitore del database o da fornitori di terze parti. Queste soluzioni di gestione dei dati aiutano i team IT e i DBA a svolgere attività tipiche, tra cui:

  • Identificazione, avviso, diagnostica e risoluzione di errori nel sistema di database o nell'infrastruttura sottostante
  • Allocazione di risorse di storage e memoria del database
  • Modifica alla progettazione del database
  • Ottimizzazione delle risposte alle query del database per ottimizzare le performance dell'applicazione

Le sempre più diffuse piattaforme di database cloud consentono alle aziende di ampliare o ridurre il numero di servizi in modo rapido ed economico. Alcune sono disponibili come servizio, consentendo alle organizzazioni di risparmiare ulteriormente.


Che cos'è un database autonomo

Basato sul cloud, un database autonomo utilizza l'intelligenza artificiale (AI) e il machine learning per automatizzare numerose attività di data management eseguite dai DBS, tra cui la gestione dei backup dei database, la sicurezza e il tuning delle performance.

Noto anche come database self-driving, un database autonomo offre vantaggi significativi per la gestione dei dati, tra cui:

  • Complessità ridotta
  • Possibilità di potenziale errore umano ridotta
  • Maggiore affidabilità e sicurezza del database
  • Efficienza operativa migliore
  • Costi ridotti

Le piattaforme data cloud, sempre più diffuse, consentono alle aziende di attuare ampliamenti e riduzioni in modo rapido ed economico. Alcune sono disponibili come servizio, consentendo alle organizzazioni di risparmiare ulteriormente.

Sistemi di gestione dei big data

In qualche modo, i big data corrispondono al significato della parola stessa, ovvero grandi quantità di dati. Rispetto ai dati tradizionali, esistono però tantissimi tipi di big data, che vengono inoltre raccolti a un'altissima velocità. Si pensi a tutti i dati che arrivano ogni giorno, od ogni minuto, da un social media come Facebook. La quantità, la varietà e la velocità sono gli aspetti che rendono tali dati così preziosi per le aziende, ma anche particolarmente complessi da gestire.

Poiché viene raccolto un numero sempre più elevato di dati da origini diverse, ad esempio videocamere, social media, registrazioni audio e dispositivi Internet of Things (IoT), sono stati creati sistemi di gestione dei big data, Tali sistemi sono specializzati in tre aree generali.

  • Integrazione di big data: recupera diversi tipi di dati, da quelli batch a quelli in streaming, e li trasforma in modo da poterli utilizzare.
  • Gestione dei big data: archivia ed elabora i dati in un data lake o in un data warehouse in modo efficiente, sicuro e affidabile, spesso utilizzando lo storage degli oggetti.
  • L'analisi dei big data scopre nuovi insight con con analytics, inclusi graph analytics e utilizza Machine Learning e visualizzazione AI per costruire modelli.

Le aziende utilizzano i big data per migliorare e accelerare lo sviluppo del prodotto, la manutenzione predittiva, la Customer Experience, la sicurezza, l'efficienza operativa e molto altro ancora. Con l'aumentare dei big data, aumenteranno anche le opportunità.

Sfide nella gestione dei dati

La maggior parte delle sfide odierne nella gestione dei dati deriva dal ritmo più rapido delle attività e dalla crescente proliferazione dei dati. La varietà, la velocità e il volume in continua espansione dei dati disponibili spingono le organizzazioni a cercare strumenti di gestione più efficaci. Ecco alcune delle principali sfide che vengono affrontate dalle organizzazioni:

Mancanza di insight sui dati

I dati provenienti da un numero crescente di origini di ogni tipo, per esempio dispositivi intelligenti, social media e videocamere, vengono raccolti e archiviati. Nessuno di tali dati risulta tuttavia utile se l'organizzazione non sa di averli a disposizione, dove si trovano e come usarli. Le soluzioni di gestione dei dati richiedono scalabilità e prestazioni per fornire insight significativi in modo tempestivo.

Difficoltà a mantenere i livelli di prestazioni di gestione dei dati

Le organizzazioni acquisiscono, archiviano e utilizzano sempre più dati. Per garantire tempi di risposta ottimali con un tale livello di espansione, le organizzazioni devono monitorare continuamente il tipo di domande a cui risponde il database e modificare gli indici man mano che le query cambiano, senza alcun impatto sulle performance.

Sfide conformi ai requisiti in continua evoluzione dei dati

Le normative di compliance sono complesse e multi-giurisdizionali. Inoltre, cambiano costantemente. Le organizzazioni devono essere in grado di esaminare con facilità i propri dati, nonché di identificare qualsiasi elemento rientri nei requisiti nuovi o modificati. In particolare, le informazioni personali devono essere rilevate, tracciate e monitorate ai fini della compliance con le normative mondiali sulla privacy sempre più severe.

Bisogno di elaborare e convertire facilmente i dati

La raccolta e l'identificazione dei dati stessi non forniscono alcun valore: l'organizzazione deve eseguirne l'elaborazione. Se la conversione dei dati in elementi necessari per l'analisi richiede tempi lunghi, l'analisi non verrà eseguita. Di conseguenza, il valore potenziale di tali dati viene perso.

Il costante bisogno di archiviare i dati in modo efficace

Nel nuovo mondo della gestione dei dati, le organizzazioni archiviano i dati in più sistemi, inclusi data warehouse e data lake non strutturati che archiviano i dati in qualsiasi formato in un singolo repository. I data scientist di un'organizzazione hanno bisogno di un modo per trasformare rapidamente e semplicemente il formato originale dei dati nella forma, nel formato o nel modello di cui hanno bisogno in una vasta gamma di analisi.

Domanda di ottimizzazione continua dell'agilità e dei costi IT

Con la disponibilità dei sistemi di gestione dei dati cloud, le organizzazioni possono ora scegliere se conservare e analizzare i dati in ambienti on-premise, nel cloud o in una combinazione ibrida dei due sistemi. Le organizzazioni IT devono valutare il livello di identità tra ambienti on-premise e cloud per mantenere la massima agilità IT e ridurre i costi.

Principi di gestione dei dati e privacy dei dati

Il Regolamento generale sulla protezione dei dati (GDPR) emanato dall'Unione europea e attuato a maggio 2018 comprende sette principi chiave per la gestione e il trattamento dei dati personali. tra cui liceità, correttezza e trasparenza, limitazione della finalità, accuratezza, limitazione dello storage, integrità, riservatezza e altro ancora.

Il GDPR e altre leggi che seguono le sue orme, come il California Consumer Privacy Act (CCPA), stanno cambiando il volto del data management. Questi requisiti forniscono leggi per la protezione dei dati standardizzate che consentono agli individui di controllare i propri dati personali e il modo in cui vengono utilizzati. I consumatori vengono in pratica trasformati in soggetti interessati ai dati con un vero e proprio strumento legale laddove le organizzazioni non riescono a ottenere il consenso informato all'acquisizione dei dati, esercitano uno scarso controllo sull'uso o sulla posizione dei dati o non rispettano i requisiti di cancellazione o portabilità dei dati.

Best practice per la gestione dei dati

Per affrontare le sfide nella gestione dei dati è necessario un set completo di best practice, elaborate in modo adeguato. Le best practice specifiche variano in base al tipo di dati e al settore in questione. Le best practice riportate di seguito riguardano le principali sfide nella gestione dei dati che le organizzazioni si trovano ad affrontare oggigiorno:

Crea un livello di discovery per identificare i tuoi dati

Un livello di discovery sul livello di dati dell'organizzazione consente ad analisti e data scientist di cercare e individuare i set di dati per rendere i dati utilizzabili.

Sviluppa un ambiente di data science per reimpiegare in modo efficiente i tuoi dati

Un ambiente di data science automatizza il più possibile l'attività di trasformazione dei dati, semplificando la creazione e la valutazione di modelli di dati. Un set di strumenti che elimina la necessità della trasformazione manuale dei dati può accelerare lo sviluppo di ipotesi e il test in relazione ai nuovi modelli.

Utilizza la tecnologia autonoma per mantenere i livelli di performance durante l'espansione del livello di dati

Le funzionalità dei dati autonomi utilizzano l'IA e il machine learning per monitorare continuamente le query del database e ottimizzare gli indici man mano che le query cambiano. Ciò consente al database di mantenere tempi di risposta rapidi ed evita a DBA e data scientist di dover eseguire lunghe attività manuali.

Usa la discovery per rimanere al passo con i requisiti di compliance

I nuovi strumenti utilizzano la discovery per esaminare i dati e identificare le catene di connessione che devono essere rilevate, tracciate e monitorate ai fini della compliance multigiurisdizionale. Poiché le richieste di compliance aumentano a livello globale, questa capacità sarà sempre più importante per i funzionari addetti al rischio e alla sicurezza.

Assicurati di utilizzare un database converged

Un database converged è un database dotato di supporto nativo per tutti i tipi di dati moderni e per i più recenti modelli di sviluppo integrati in un unico prodotto. I migliori database converged possono eseguire vari tipi di carichi di lavoro, tra cui graph, IoT, blockchain e machine learning.

Assicurati che la tua piattaforma di database abbia le prestazioni, la scalabilità e la disponibilità per supportare il tuo business

L'obiettivo di riunire i dati è di poterli analizzare per prendere decisioni migliori e più tempestive. Una piattaforma di database scalabile e altamente performante consente alle aziende di analizzare rapidamente i dati di più origini utilizzando advanced analytics e il machine learning in modo da poter prendere decisioni aziendali migliori.

Usa un livello di query comune per gestire forme numerose e variegate di storage dei dati

Le nuove tecnologie consentono l'interazione tra repository di gestione dei dati, eliminando eventuali differenze esistenti tra loro. Un livello di query comune per diversi tipi di storage dei dati consente a data scientist, analisti e applicazioni di accedere ai dati senza la necessità di conoscere la posizione in cui sono archiviati e di doverli trasformare manualmente in un formato utilizzabile.


Valore di un ambiente di data science

La data science è un settore interdisciplinare che utilizza metodi scientifici, processi, algoritmi e sistemi per estrarre valore dai dati. I data scientist combinano le competenze in varie discipline, tra cui statistica, informatica ed economia aziendale, per analizzare i dati raccolti dal Web, dagli smartphone, dai clienti, dai sensori e da altre fonti.

Evoluzione della gestione dei dati

Con il nuovo ruolo dei dati come capitale aziendale, le organizzazioni stanno scoprendo adesso ciò che le startup e gli innovatori digitali già sapevano: i dati sono una risorsa preziosa per identificare trend, prendere decisioni e agire prima dei concorrenti. La nuova posizione dei dati nella catena di valore spinge le organizzazioni a cercare attivamente modi migliori per ottenere valore da questo nuovo capitale.

Scopri cosa può fare la migliore gestione dei dati per te, inclusi i vantaggi di una strategia autonoma nel cloud (PDF) e funzionalità cloud di database scalabili e ad alte prestazioni.

Prodotti correlati alla gestione dei dati