Nessun risultato trovato

La tua ricerca non ha prodotto risultati.

È consigliabile provare quanto segue per riuscire a trovare quello che stai cercando:

  • Controlla l'ortografia della ricerca per parola chiave.
  • Utilizza sinonimi per la parola chiave digitata, ad esempio prova “applicazione” anziché “software”.
  • Prova una delle ricerche popolari mostrate di seguito.
  • Inizia una nuova ricerca.
Domande di tendenza

Data Science

Ecco una semplice definizione di data science:

la data science combina più campi, tra cui statistica, metodi scientifici e analisi dei dati, per estrarre valore dai dati.

Coloro che si occupano di data science sono i cosiddetti data scientist, che combinano un'ampia gamma di competenze per analizzare i dati raccolti dal Web, dagli smartphone, dai clienti, dai sensori e da altre fonti.

Dati: una risorsa inutilizzata per il machine learning

La data science è uno dei settori più interessanti di oggi. Ma perché è così importante?

Perché le aziende basano le proprie attività su una preziosa raccolta di dati. Dal momento che la tecnologia moderna ha consentito la creazione e l'archiviazione di quantità crescenti di informazioni, i volumi di dati sono aumentati rapidamente. Si stima che il 90% dei dati a livello mondiale sia stato creato negli ultimi due anni. Ad esempio, gli utenti di Facebook caricano 10 milioni di foto ogni ora.

Ma spesso questi dati vengono ancora conservati in database e data lake, per lo più intatti.

I moltissimi dati raccolti e archiviati mediante queste tecnologie possono offrire vantaggi in termini di trasformazione ad aziende in tutto il mondo, ma solo se siamo in grado di interpretarli. È qui che entra in gioco la data science.

La data science mostra i trend e produce insight che le aziende possono utilizzare per prendere decisioni più mirate e creare prodotti e servizi più innovativi. Forse il vantaggio più importante è che consente ai modelli di machine learning (ML) di apprendere dalla grande quantità di dati con cui vengono alimentati anziché affidarsi principalmente agli analisti aziendali per capire cosa possono scoprire dai dati.

I dati costituiscono la base dell'innovazione, ma il loro valore deriva dalle informazioni che i data scientist possono ottenere e in base alle quali possono agire.

Qual è la differenza tra data science, intelligenza artificiale e machine learning?

Qual è la differenza tra data science, intelligenza artificiale e machine learning?

Per comprendere meglio la data science e il modo in cui sfruttarla è importante conoscere anche altri termini correlati a questo campo, come l'intelligenza artificiale (AI) e il machine learning. Spesso scoprirai che questi termini vengono usati in modo intercambiabile, ma con diverse sfumature di significato.

Ecco una semplice analisi:

  • AI significa far sì che un computer imiti in qualche modo il comportamento umano.
  • Data science è un sottoinsieme dell'AI e si riferisce in particolare alle sovrapposizione tra le aree di statistica, metodi scientifici e analisi dei dati, che vengono tutte utilizzate per estrarre significato e insight dai dati.
  • Machine learning è un altro sottoinsieme dell'AI e consiste nelle tecniche che consentono ai computer di ottenere informazioni dai dati e distribuire applicazioni AI.

E per andare sul sicuro, introdurremo un'altra definizione:

  • Apprendimento approfondito, un sottoinsieme del machine learning che consente ai computer di risolvere problemi più complessi

Come la data science sta trasformando le aziende

Data Science e crescita dei dati

Le organizzazioni utilizzano la data science per trasformare i dati in un vantaggio competitivo ridefinendo i prodotti e i servizi. I casi d'uso di data science e machine learning includono:

  • Determinare il tasso di abbandono dei clienti analizzando i dati raccolti dai call center, in modo che il marketing possa agire per tentare di fidelizzarli
  • Migliorare l'efficienza analizzando i modelli di traffico, le condizioni meteorologiche e altri fattori, in modo che le aziende di logistica possano migliorare la velocità di consegna e ridurre i costi
  • Migliorare le diagnosi dei pazienti analizzando i dati degli esami clinici e i sintomi segnalati, in modo che i medici possano diagnosticare le malattie in anticipo e trattarle in modo più efficace
  • Ottimizzare la supply chain prevedendo i guasti alle attrezzature
  • Rilevare le frodi nei servizi finanziari riconoscendo comportamenti sospetti e azioni anomale
  • Migliorare le vendite creando consigli per i clienti in base agli acquisti effettuati in precedenza

La data science è diventata una priorità per tante aziende, che stanno investendo molto in questo settore. Nel recente sondaggio di Gartner condotto su più di 3.000 CIO, gli intervistati hanno classificato l'analisi dei dati e la business intelligence come le principali tecnologie di differenziazione per le loro organizzazioni. Secondo i CIO intervistati, queste tecnologie rappresentano le risorse più strategiche per le loro aziende ed è per questo motivo che stanno investendo in tale settore.

Come viene eseguito il processo di data science

Come viene eseguito il processo di data science

Sebbene il processo di analisi e interpretazione dei dati sia iterativo piuttosto che lineare, il tipico ciclo di vita della data science utilizzato per un progetto di creazione di modelli di dati prevede le seguenti fasi:

  • Pianificazione: definire un progetto e i risultati potenziali.
  • Costruzione di un modello di dati: i data scientist utilizzano spesso una vasta gamma di librerie open source o strumenti integrati nel database per creare modelli di machine learning. Spesso, gli utenti vorranno che le API aiutino con l'importazione, la profilazione e la visualizzazione dei dati, oppure con la progettazione delle funzionalità. Avranno bisogno degli strumenti giusti, nonché dell'accesso ai dati giusti e ad altre risorse, come la capacità di elaborazione.
  • Valutazione di un modello: i modelli dei data scientist devono raggiungere un'alta percentuale di accuratezza prima di essere implementati in tutta sicurezza. Normalmente, la valutazione dei modelli genererà una suite completa di metriche di valutazione e visualizzazioni per misurare le performance dei modelli rispetto ai nuovi dati, nonché per classificarli nel tempo in modo da consentire un comportamento ottimale in produzione. La valutazione dei modelli non si limita alla semplice performance, ma tiene conto del comportamento di base previsto.
  • Spiegazione dei modelli: spiegare la meccanica interna dei risultati dei modelli di machine learning in termini umani non è stato sempre possibile, ma sta diventando sempre più importante. I data scientist vogliono spiegazioni automatizzate della ponderazione relativa e dell'importanza dei fattori che contribuiscono alla generazione di una previsione, nonché dettagli esplicativi, specifici per ciascun modello, relativi alle previsioni dello stesso.
  • Distribuzione di un modello: scegliere un modello di machine learning già pronto e integrarlo nei sistemi giusti è spesso un processo difficile e laborioso. Può essere semplificato applicando modelli come API scalabili e sicure o utilizzando modelli di machine learning integrati nel database.
  • Monitoraggio dei modelli: sfortunatamente, la distribuzione di un modello non significa che il lavoro sia finito. I modelli devono essere sempre monitorati dopo lo sviluppo per assicurarsi che funzionino correttamente. Dopo un certo periodo di tempo, i dati su cui si è basato il modello potrebbero non essere più rilevanti per previsioni future. Ad esempio, per quanto riguarda il rilevamento delle frodi, i criminali escogitano sempre nuovi metodi per violare gli account.

Strumenti per la data science

Strumenti per la data science

La creazione, la valutazione, lo sviluppo e il monitoraggio di modelli di machine learning può essere un processo complesso. Ecco perché il numero di strumenti di data science è aumentato. Tra gli strumenti più comunemente utilizzati dai data scientist, ci sono i notebook open source, ovvero applicazioni Web che consentono di scrivere ed eseguire codici, visualizzare dati e vedere i risultati, il tutto in un unico ambiente.

Alcuni dei notebook più diffusi sono Jupyter, RStudio e Zeppelin. I notebook sono molto utili per eseguire analisi, ma presentano delle limitazioni quando devono essere utilizzati dai data scientist per lavorare in team. Per risolvere questo problema, sono state create le piattaforme di data science.

Per capire qual è lo strumento di data science giusto per te, devi porti le seguenti domande: Che tipo di linguaggi usano i tuoi data scientist? Che tipo di metodi di lavoro preferiscono? Che tipo di fonti di dati stanno utilizzando?

Ad esempio, alcuni utenti preferiscono avere un Customer Service indipendente dalla fonte dei dati che utilizzi librerie open source. Altri preferiscono la velocità degli algoritmi di machine learning integrati nel database.

Chi supervisiona il processo di data science?

Chi supervisiona il processo di data science?

Nella maggior parte delle organizzazioni, i progetti di data science vengono generalmente supervisionati da tre tipi di manager:

  • Business manager: questi manager collaborano con il team di data science per definire il problema e sviluppare una strategia per l'analisi. Possono essere responsabili di una linea di business, ad esempio marketing, finanza o vendite, e gestire un team di data science che fa riferimento a loro. Lavorano a stretto contatto con gli IT manager e i manager di data science per garantire la consegna dei progetti.
  • Manager IT: i senior IT manager sono responsabili dell'architettura dell'infrastruttura che supporteranno le operations di data science. Monitorano continuamente le operations e l'utilizzo delle risorse per garantire che i team di data science operino in modo efficiente e sicuro. Possono anche essere responsabili della creazione e dell'aggiornamento degli ambienti IT per i team di data science.
  • Manager di data science: supervisionano i team di data science e le loro attività quotidiane. Creano i team e sono in grado di gestirli, nonché di pianificare e monitorare i progetti.

Ma l'attore più importante in questo processo è il data scientist.

Chi è il data scientist?

Chi è il data scientist?

La data science è un settore giovane, che deriva dai campi dell'analisi statistica e del data mining. Il Data Science Journal è stato pubblicato per la prima volta nel 2002 dall'International Council for Science: Committee on Data for Science and Technology. Dal 2008, anno in cui è comparsa la qualifica di data scientist, il settore ha iniziato una rapida ascesa. Tuttavia, nonostante un numero sempre maggiore di università abbia introdotto corsi di laurea in data science, vi è una carenza di data scientist.

Un data scientist si occupa di sviluppare strategie per l'analisi dei dati, preparare i dati per l'analisi, esplorare, analizzare e visualizzare i dati, creare modelli con i dati utilizzando linguaggi di programmazione quali Python e R, nonché implementare i modelli nelle applicazioni.

Il data scientist non lavora da solo, ma in team. I team di data science possono includere, oltre a un data scientist, un analista aziendale che definisce il problema, un ingegnere informatico che prepara i dati e definisce le modalità di accesso, un architetto IT che supervisiona i processi e l'infrastruttura sottostanti e uno sviluppatore di applicazioni che implementa i modelli o i risultati dell'analisi in applicazioni e prodotti.

Le sfide associate all'implementazione dei progetti di data science

Chi è il data scientist?

Nonostante le promesse e gli enormi investimenti nei team di data science, molte aziende non stanno sfruttando appieno il valore dei dati a loro disposizione. Nella loro corsa per assumere talenti e creare programmi di data science, alcune aziende si sono imbattute in flussi di lavoro inefficienti e persone diverse che utilizzano strumenti e processi differenti che non funzionano bene insieme. In assenza di una gestione centralizzata più strutturata, gli executive potrebbero non ottenere un ritorno sui loro investimenti.

Questo ambiente caotico presenta molte problematiche.

I data scientist non lavorano in modo efficiente. Poiché l'accesso ai dati deve essere concesso da un amministratore IT, i data scientist devono spesso attendere molto tempo per accedere ai dati e alle risorse da analizzare. Una volta ottenuto l'accesso, il team di data science potrebbe utilizzare strumenti differenti e potenzialmente incompatibili per analizzare i dati. Ad esempio, un data scientist potrebbe sviluppare un modello in linguaggio R, ma l'applicazione in cui verrà utilizzato potrebbe essere scritta in un altro linguaggio. Ed è per questo motivo che possono essere necessarie settimane, o addirittura mesi, per implementare i modelli in applicazioni utili.

Gli sviluppatori di applicazioni non riescono ad accedere a modelli di machine learning utilizzabili. Talvolta, i modelli di machine learning ricevuti dagli sviluppatori non sono pronti per essere implementati nelle applicazioni. Inoltre, questi modelli non possono essere implementati in tutti gli scenari a causa della rigidità dei punti di accesso e la scalabilità dei modelli viene affidata allo sviluppatore di applicazioni.

Gli amministratori IT dedicano troppo tempo alle attività di supporto. A causa della proliferazione di strumenti open source, l'elenco degli strumenti che l'IT deve potenzialmente supportare è in continua crescita. Ad esempio, un data scientist che si occupa di marketing potrebbe utilizzare strumenti diversi da quelli utilizzati da un data scientist che si occupa di finanza. Inoltre, i team potrebbero avere flussi di lavoro differenti, il che significa che l'IT deve continuamente ricreare e aggiornare gli ambienti.

I Business Manager hanno poca familiarità con la data science. I flussi di lavoro di data science non sono sempre integrati nei sistemi e nei processi decisionali aziendali e ciò rende difficile per i business manager collaborare in modo competente con i data scientist. Senza una migliore integrazione, i business manager avranno difficoltà a capire perché serve così tanto tempo per passare dalla creazione del prototipo alla produzione e saranno meno propensi a investire nei progetti che ritengono troppo lenti.

La piattaforma di data science offre nuove funzionalità

La diffusione delle piattaforme di data science

Molte aziende si sono rese conto che senza una piattaforma integrata, le attività di data science risultavano inefficienti, non sicure e difficili da scalare. Questa consapevolezza ha favorito la diffusione delle piattaforme di data science. Queste piattaforme sono software hub attorno ai quali si svolgono tutte le attività di data science. Una piattaforma efficiente risolve molti dei problemi relativi all'implementazione della data science e aiuta le aziende a dare valore ai dati in modo più rapido ed efficiente.

Una piattaforma centralizzata di machine learning consente ai data scientist di lavorare in un ambiente collaborativo utilizzando gli strumenti open source preferiti. Inoltre, tutti i dati vengono sincronizzati da un sistema di controllo delle versioni.

I vantaggi di una piattaforma di data science

I vantaggi di una piattaforma di data science

Una piattaforma di data science riduce la ridondanza e promuove l'innovazione, consentendo ai team di condividere codici, risultati e report. Rimuove i colli di bottiglia nel flusso di lavoro semplificando la gestione e incorporando le best practice.

In generale, le migliori piattaforme di data science mirano a:

  • Rendere i data scientist più produttivi aiutandoli ad accelerare le operazioni e distribuire i modelli più velocemente e con meno errori
  • Semplificare le attività dei data scientist che richiedono grandi volumi e varietà di dati
  • Fornire un'intelligenza artificiale affidabile, di livello enterprise, senza pregiudizi, verificabile e riproducibile

Le piattaforme di data science sono costruite per favorire la collaborazione tra una vasta gamma di utenti, inclusi data scientist esperti, data scientist alle prime armi, ingegneri e ingegneri o specialisti del machine learning. Ad esempio, una piattaforma di data science potrebbe consentire ai data scientist di implementare modelli come le interfacce API, facilitandone l'integrazione in applicazioni diverse. I data scientist possono accedere a strumenti, dati e infrastrutture senza dover attendere i team IT.

La domanda di piattaforme di data science è esplosa sul mercato. Infatti, si prevede che il mercato delle piattaforme aumenterà a un tasso annuo composto superiore al 39% nei prossimi anni, raggiungendo i 385 miliardi entro il 2025.

Caratteristiche di una piattaforma per un data scientist

Caratteristiche di una piattaforma per un data scientist

Se sei pronto a scoprire le funzionalità delle piattaforme di data science, tieni presente i seguenti punti chiave:

  • Scegli un'interfaccia utente project-based che promuova la collaborazione. La piattaforma dovrebbe consentire ai team di collaborare dalla fase di ideazione del modello fino alla fase di sviluppo finale e permettere a ciascun membro del team di accedere in modo autonomo ai dati e alle risorse.
  • Dai priorità all'integrazione e alla flessibilità. Assicurati che la piattaforma includa il supporto per gli strumenti open source più recenti, provider di controllo delle versioni comuni come GitHub, GitLab e Bitbucket e una perfetta integrazione con altre risorse.
  • Includi funzionalità di livello enterprise. Assicurati che la piattaforma sia scalabile e possa adattarsi ai tuoi team in crescita. La piattaforma deve essere altamente disponibile, includere potenti controlli di accesso e supportare un numero elevato di utenti simultaneamente.
  • Rendi la piattaforma di data science più autonoma. Cerca una piattaforma in grado di assorbire il carico di lavoro dei team di progettazione e IT, che consenta ai data scientist di avviare immediatamente gli ambienti, monitorare tutte le attività e implementare facilmente i modelli in produzione.
  • Garantisci un più semplice sviluppo dei modelli. Lo sviluppo e la messa in funzione dei modelli è uno dei passaggi più importanti del ciclo di vita del machine learning, ma spesso viene trascurato. Assicurati che il Customer Service scelto semplifichi la messa in funzione dei modelli, fornendo API o accertandoti che gli utenti creino modelli volti a consentire una facile integrazione.

Quando una piattaforma di data science è la mossa giusta

La tua organizzazione potrebbe essere pronta per una piattaforma di data science, se hai notato che:

  • La produttività e la collaborazione stanno mostrando segnali di tensione
  • I modelli di machine learning non possono essere verificati o riprodotti
  • I modelli non vengono mai implementati in produzione.

Una piattaforma di data science può fornire un valore reale alla tua azienda. La piattaforma di data science di Oracle include un'ampia gamma di servizi che offrono un'esperienza end-to-end completa progettata per accelerare lo sviluppo dei modelli e migliorare i risultati della data science.

Libreria delle risorse di Data Science

Cos'è l'intelligenza artificiale?
Scopri di più sull'intelligenza artificiale

L'intelligenza artificiale (AI) consente alla tecnologia e alle macchine di elaborare i dati per apprendere, trasformare ed eseguire attività umane.

Scopri di più sul machine learning
Scopri di più sul machine learning

Il machine learning è un sottoinsieme dell'intelligenza artificiale (AI) che si occupa di creare sistemi che apprendono attraverso i dati con l'obiettivo di automatizzare e velocizzare il processo decisionale nonché accelerare il time-to-value.

Novità e opinioni
Novità e opinioni

Le tecnologie di machine learning, intelligenza artificiale e data science stanno cambiando il modo in cui le aziende affrontano problemi complessi per trasformare i rispettivi settori. Leggi gli articoli più recenti per capire in che modo il settore in cui operi e i tuoi competitor si stanno avvicinando a queste tecnologie.