Data Science Service Features


Preparazione dei dati

Accesso flessibile ai dati

I data scientist possono accedere e utilizzare qualsiasi fonte di dati nel cloud o on-premise. In questo modo, sono disponibili più potenziali funzionalità di dati che portano a modelli migliori.

Etichettatura dati

Oracle Cloud Infrastructure (OCI) Data Labeling è un servizio dedicato alla creazione di data set con etichetta per addestrare in modo più accurato l'AI e i modelli di Machine Learning. Con OCI Data Labeling, gli sviluppatori e i data scientist assemblano dati, creano e sfogliano data set e applicano etichette ai registri dei dati.

Preparazione dei dati su larga scala con Spark

Invia query Spark interattive al tuo cluster OCI Data Flow Spark. In alternativa, puoi utilizzare Oracle Accelerated Data Science SDK per sviluppare facilmente un'applicazione Spark ed eseguirla su larga scala su OCI Data Flow, tutto dall'ambiente Data Science.

Raccolta di funzioni (in anteprima)

Definisci pipeline di progettazione delle funzioni e crea funzioni con un'esecuzione completamente gestita. Sia le versione che il documento possiedono pipeline. Condividi, gestisci e controlla l'accesso alle funzioni. Utilizza le funzioni sia per gli scenari di inferenza batch che in tempo reale.

Creazione dei modelli

Interfaccia JupyterLab

Gli ambienti notebook JupyterLab incorporati e ospitati sul cloud consentono ai team di data science di creare e formare modelli utilizzando un'interfaccia utente familiare.

Framework di Machine Learning open source

OCI Data Science fornisce familiarità e versatilità per i data scientist, con centinaia di strumenti e framework open source noti, come TensorFlow o PyTorch, o aggiunge framework di scelta. Una partnership strategica tra OCI e Anaconda permette agli utenti OCI di scaricare e installare pacchetti direttamente dal repository Anaconda senza alcun costo, rendendo l'open source sicuro più accessibile che mai.

Libreria Oracle Accelerated Data Science (ADS)

Oracle Accelerated Data Science SDK è un toolkit Python user-friendly che supporta il data scientist durante l'intero flusso di lavoro di data science end-to-end.

Addestramento dei modelli

Potenti hardware, comprese le unità di elaborazione grafica (GPU, graphical processing unit)

Grazie alle GPU NVIDIA, i data scientist possono creare e addestrare modelli di deep learning in meno tempo. Rispetto alle CPU, le accelerazioni delle prestazioni possono essere dalle 5 alle 10 volte più veloci.

Jobs

Utilizza Jobs per eseguire task di data science ripetibili in modalità batch. Esegui lo scale up dell'addestramento dei modelli con il supporto per le GPU NVIDIA Bare Metal e l'addestramento distribuito.

Modifica in console dei job artifact

Crea, modifica ed esegui i job artifact di Data Science direttamente dalla console OCI utilizzando il Code Editor. Viene fornito insieme l'integrazione Git, il controllo delle versioni automatiche, la personalizzazione e molto altro ancora.

Gestione della governance e dei modelli

Catalogo dei modelli

I data scientist utilizzano il catalogo dei modelli per conservare e condividere i modelli di Machine Learning completati. Il catalogo memorizza gli artifact e acquisisce i metadati relativi alla tassonomia e al contesto del modello, gli iperparametri, le definizioni degli schemi dei dati di input e di output del modello e le informazioni dettagliate sulla provenienza dell'origine del modello, inclusi il codice di origine e l'ambiente di addestramento.

Valutazione e confronto dei modelli

Genera automaticamente una suite completa di parametri e visualizzazioni per misurare le prestazioni del modello rispetto ai nuovi dati e confrontare i modelli candidati.

Ambienti riproducibili

Utilizza ambienti conda predefiniti e curati per soddisfare una vasta gamma di casi d'uso, quali NLP, visione computerizzata, previsioni, analytcs dei grafici e Spark. Pubblica ambienti personalizzati e condividili con i colleghi, garantendo la riproducibilità di ambienti di addestramento e inferenza.

Controllo delle versioni

I data scientist possono connettersi al repository Git della loro organizzazione per preservare e recuperare le attività di Machine Learning.

Automazione e MLOps

Implementazione dei modelli gestiti

Implementa modelli di Machine Learning come endpoint HTTP per effettuare previsioni dei modelli in tempo reale sui nuovi dati. Fai semplicemente clic per eseguire l'implementazione dal catalogo dei modelli e OCI Data Science gestirà tutte le operazioni dell'infrastruttura, inclusi il provisioning della computazione e il bilanciamento del carico.

Pipeline ML

Operazionalizza e automatizza i flussi di lavoro di sviluppo, addestramento e implementazione dei modelli con un servizio completamente gestito per creare, eseguire il debug, tenere traccia, gestire ed eseguire pipeline ML.

Monitoraggio ML

Monitora continuativamente i modelli in fase di produzione per rilevare la deviazione dei dati e dei concetti. Consente ai data scientist, ai tecnici dell'affidabilità dei siti e ai tecnici DevOps di ricevere avvisi e valutare rapidamente le esigenze di riaddestramento dei modelli.

Applicazioni ML

Originariamente progettate per le applicazioni SaaS di Oracle al fine di incorporare le funzioni di AI, le applicazioni ML sono ora disponibili per automatizzare l'intero ciclo di vita di MLOps, tra cui sviluppo, provisioning e manutenzione continua e gestione della flotta, per gli ISV con centinaia di modelli per ciascuna delle loro migliaia di clienti.