Data Science Service Features

Caratteristiche chiave

Preparazione dei dati
Creazione dei modelli
Addestramento dei modelli
Gestione della governance e dei modelli
Automazione e MLOps
Azioni rapide AI

Preparazione dei dati

Accesso flessibile ai dati

I data scientist possono accedere e utilizzare qualsiasi fonte di dati nel cloud o on-premise. In questo modo, sono disponibili più potenziali funzionalità di dati che portano a modelli migliori.

Preparazione dei dati su larga scala con Spark

Invia query Spark interattive al tuo cluster OCI Data Flow Spark. In alternativa, puoi utilizzare Oracle Accelerated Data Science SDK per sviluppare facilmente un'applicazione Spark ed eseguirla su larga scala su OCI Data Flow, tutto dall'ambiente Data Science.

Raccolta di funzioni (in anteprima)

Definisci pipeline di progettazione delle funzioni e crea funzioni con un'esecuzione completamente gestita. Sia le versione che il documento possiedono pipeline. Condividi, gestisci e controlla l'accesso alle funzioni. Utilizza le funzioni sia per gli scenari di inferenza batch che in tempo reale.

Creazione dei modelli

Interfaccia JupyterLab

Gli ambienti notebook JupyterLab incorporati e ospitati sul cloud consentono ai team di data science di creare e formare modelli utilizzando un'interfaccia utente familiare.

Framework di Machine Learning open source

OCI Data Science fornisce familiarità e versatilità per i data scientist, con centinaia di strumenti e framework open source noti, come TensorFlow o PyTorch, o aggiunge framework di scelta.

Libreria Oracle Accelerated Data Science (ADS)

Oracle Accelerated Data Science SDK è un toolkit Python user-friendly che supporta il data scientist durante l'intero flusso di lavoro di data science end-to-end.

Oracle Accelerated Data Science SDK

Addestramento dei modelli

Potenti hardware, comprese le unità di elaborazione grafica (GPU, graphical processing unit)

Grazie alle GPU NVIDIA, i data scientist possono creare e addestrare modelli di deep learning in meno tempo. Rispetto alle CPU, le accelerazioni delle prestazioni possono essere dalle 5 alle 10 volte più veloci.

Jobs

Utilizza Jobs per eseguire task di data science ripetibili in modalità batch. Esegui lo scale up dell'addestramento dei modelli con il supporto per le GPU NVIDIA Bare Metal e l'addestramento distribuito.

Modifica in console dei job artifact

Crea, modifica ed esegui i job artifact di Data Science direttamente dalla console OCI utilizzando il Code Editor. Viene fornito insieme l'integrazione Git, il controllo delle versioni automatiche, la personalizzazione e molto altro ancora.

Gestione della governance e dei modelli

Catalogo dei modelli

I data scientist utilizzano il catalogo dei modelli per conservare e condividere i modelli di Machine Learning completati. Il catalogo memorizza gli artifact e acquisisce i metadati relativi alla tassonomia e al contesto del modello, gli iperparametri, le definizioni degli schemi dei dati di input e di output del modello e le informazioni dettagliate sulla provenienza dell'origine del modello, inclusi il codice di origine e l'ambiente di addestramento.

Valutazione e confronto dei modelli

Genera automaticamente una suite completa di parametri e visualizzazioni per misurare le prestazioni del modello rispetto ai nuovi dati e confrontare i modelli candidati.

Ambienti riproducibili

Utilizza ambienti conda predefiniti e curati per soddisfare una vasta gamma di casi d'uso, quali NLP, visione computerizzata, previsioni, analytcs dei grafici e Spark. Pubblica ambienti personalizzati e condividili con i colleghi, garantendo la riproducibilità di ambienti di addestramento e inferenza.

Controllo delle versioni

I data scientist possono connettersi al repository Git della loro organizzazione per preservare e recuperare le attività di Machine Learning.

Automazione e MLOps

Implementazione dei modelli gestiti

Implementa modelli di Machine Learning come endpoint HTTP per effettuare previsioni dei modelli in tempo reale sui nuovi dati. Fai semplicemente clic per eseguire l'implementazione dal catalogo dei modelli e OCI Data Science gestirà tutte le operazioni dell'infrastruttura, inclusi il provisioning della computazione e il bilanciamento del carico.

Pipeline ML

Operazionalizza e automatizza i flussi di lavoro di sviluppo, addestramento e implementazione dei modelli con un servizio completamente gestito per creare, eseguire il debug, tenere traccia, gestire ed eseguire pipeline ML.

Monitoraggio ML

Monitora continuativamente i modelli in fase di produzione per rilevare la deviazione dei dati e dei concetti. Consente ai data scientist, ai tecnici dell'affidabilità dei siti e ai tecnici DevOps di ricevere avvisi e valutare rapidamente le esigenze di riaddestramento dei modelli.

Applicazioni ML

Originariamente progettate per le applicazioni SaaS di Oracle al fine di incorporare le funzioni di AI, le applicazioni ML sono ora disponibili per automatizzare l'intero ciclo di vita di MLOps, tra cui sviluppo, provisioning e manutenzione continua e gestione della flotta, per gli ISV con centinaia di modelli per ciascuna delle loro migliaia di clienti.

Documentazione relativa alle applicazioni ML

Azioni rapide AI

Accesso senza codice

Utilizza LLM di Mistral, Meta e altri senza scrivere una singola riga di codice tramite un'interfaccia utente trasparente nei notebook OCI Data Science.

Importa qualsiasi LLM da OCI Object Storage, quindi perfeziona e distribuisci tramite un'interfaccia utente facile da usare.

Implementazione

Distribuisci LLM con pochi clic, utilizzando i più diffusi server di inferenza, come vLLM (da UC Berkeley), Text Generation Inference (da Hugging Face) o TensorRT-LLM (da NVIDIA), per prestazioni ottimali.

Ottimizzazione

Per ottenere prestazioni ottimali, sfrutta la formazione distribuita con PyTorch, Hugging Face Accelerate o DeepSpeed per LLM con ottimizzazione perfetta. Abilita lo storage di pesi ottimizzati con lo storage degli oggetti. Inoltre, Condas fornito dal servizio elimina il requisito per gli ambienti Docker personalizzati e consente la condivisione con meno rallentamento.

Valuta

Produci report di valutazione dettagliati per il tuo LLM, basati su BERTScore o su ROCCIA (Recall-Oriented Understudy for Gisting Evaluation), per aiutarti a capire come le prestazioni del modello si confrontano con altri modelli.