Oracle Cloud Infrastructure (OCI) Data Science is an end-to-end machine learning (ML) service that offers JupyterLab notebook environments and access to hundreds of popular open source tools and frameworks. Build and train ML models with NVIDIA GPUs, AutoML features, and automated hyperparameter tuning. Deploy models as HTTP endpoints or use Oracle Functions. Manage models through version control, repeatable jobs, and model catalogs.
Os cientistas de dados podem acessar e usar qualquer fonte de dados em qualquer nuvem ou on-premises. Isso fornece mais recursos de dados potenciais que levam a modelos melhores.
A integração com o OCI Data Flow fornece uma interface fácil para criar e executar jobs do Spark em grande escala a partir do ambiente de Data Science. Além disso, um ambiente PySpark permite o desenvolvimento iterativo de aplicativos de fluxo de dados em sessões de notebook.
Simplifique os fluxos de trabalho de análise de dados exploratórios com recursos de criação de perfil de dados de ponta, visualizações inteligentes e ferramentas de preparação de dados.
O OCI Data Science oferece suporte às ferramentas de manipulação de dados de código aberto favoritas do cientista de dados, como Pandas, Dask e Numpy, bem como ferramentas de visualização de código aberto populares, como Plotly, Matplotlib e Bokeh, para ajudar os cientistas a explorar os dados.
Os ambientes de notebook JupyterLab integrados e hospedados na nuvem permitem que as equipes de ciência de dados criem e treinem modelos usando uma interface de usuário familiar.
O OCI Data Science fornece familiaridade e versatilidade para cientistas de dados, com centenas de ferramentas e estruturas de código aberto populares. Crie modelos de machine learning com TensorFlow ou PyTorch ou adicione estruturas de sua escolha.
Com as GPUs NVIDIA, os cientistas de dados podem construir e treinar modelos de aprendizado profundo em menos tempo. Quando comparados com CPUs, os aumentos de desempenho podem ser 5 a 10 vezes mais rápidos.
A biblioteca Accelerated Data Science oferece suporte ao Oracle AutoML, assim como a ferramentas de código aberto, como H2O 3 e auto-sklearn. O AutoML oferece amostragem adaptável, seleção automatizada de recursos, seleção de algoritmo e ajuste de hiperparâmetros. O AutoML gera um candidato a modelo preciso para economizar um tempo significativo do cientista de dados.
Economize tempo e esforço ajustando modelos com ajuste automático de hiperparâmetros usando o recurso ADS Tuner.
A avaliação automatizada gera um conjunto abrangente de métricas e visualizações para medir o desempenho do modelo em relação a novos dados e comparar os candidatos a modelo. Isso torna mais fácil para os cientistas de dados produzirem modelos de alta qualidade.
A explicação do modelo automatizado inclui explicações globais e locais com previsões de modelo específicas para o comportamento geral de um modelo. Para consumidores de modelos, as explicações agnósticas de modelo automatizadas melhoram o entendimento e a confiança, atendem às necessidades regulatórias e aumentam a velocidade de adoção do machine learning.
Implemente modelos de machine learning como endpoints HTTP para atender previsões de modelo em novos dados em tempo real. Basta clicar para implementar no catálogo de modelos e o OCI Data Science lida com todas as operações de infraestrutura, incluindo provisionamento de computação e balanceamento de carga.
Implemente facilmente modelos de data science como Oracle Functions - uma arquitetura altamente escalável, sob demanda e sem servidor na Oracle Cloud Infrastructure.
Os membros da equipe usam o catálogo de modelos para preservar e compartilhar modelos de machine learning concluídos. O catálogo armazena os artefatos e captura metadados em torno da taxonomia e do contexto do modelo, hiperparâmetros, definições dos esquemas de dados de entrada e saída do modelo e informações detalhadas de proveniência sobre a origem do modelo, incluindo o código-fonte e o ambiente de treinamento onde o modelo foi treinado.
Aproveite os ambientes conda pré-construídos e com curadoria para abordar uma variedade de casos de uso, como NLP, análise gráfica, Spark e NVIDIA RAPIDS. Publique ambientes personalizados e compartilhe com os colegas, garantindo a reprodutibilidade dos ambientes de treinamento e inferência.
Cientistas de dados podem se conectar ao repositório Git de sua organização para preservar e recuperar o trabalho de machine learning.
Os clientes usam o OCI Data Science para melhorar a colaboração em ciência de dados e economizar tempo e custos criando modelos de machine learning.
Use Python, a linguagem mais popular para ciência de dados, com JupyterLab e centenas de bibliotecas e estruturas de código aberto, como Dask, scikit-learn e XGBoost. Ou instale as bibliotecas de sua escolha para maior flexibilidade.
Accelerated Data Science (ADS) é uma biblioteca Python de ponta a ponta que cobre todo o ciclo de vida da ciência de dados, tornando mais rápido e fácil a produção de modelos de alta qualidade.
Com uma infraestrutura de autoatendimento sob demanda, os cientistas de dados selecionam a quantidade de recursos de computação e armazenamento de que precisam para lidar com projetos de qualquer tamanho, sem se preocupar com o provisionamento ou manutenção da infraestrutura.
As políticas de segurança baseadas em equipe permitem que os cientistas de dados incluam membros da equipe nos projetos. Essas políticas controlam o acesso a modelos, código e dados, facilitando a colaboração e protegendo o trabalho confidencial. Os controles de segurança são totalmente integrados ao Oracle Cloud Infrastructure Identity and Access Management.
Acesse dezenas de tutoriais e notebooks de exemplo, cobrindo tópicos de como acessar dados à matemática por trás das técnicas de explicação do modelo. Comece a lidar com diferentes problemas de negócios com metodologia comprovada e dicas de implementação.
Produto |
Preço Unitário |
Métrica |
Computação - Padrão - E2 |
vCPU por hora |
|
Computação - Padrão de Máquina Virtual - X7 |
vCPU por hora |
|
Computação - Padrão - E3 - OCPU |
vCPU por hora |
|
Computação - Padrão - E3 - Memória |
Gigabyte por hora |
|
VM.GPU2.1 (NVIDIA P100) |
GPU por hora |
|
VM.GPU3.x (NVIDIA V100 Tensor Core – 16 GB) |
GPU por hora |
|
Armazenamento de volume em bloco |
Capacidade de armazenamento de Gigabytes por mês | |
Unidades de Desempenho por Volume em Bloco |
Unidades de Desempenho por Gigabyte por mês |
Produto |
Preço Unitário |
Métrica |
Armazenamento de Objetos – Armazenamento |
Capacidade de armazenamento de Gigabytes por mês |
Produto |
Preço Unitário |
Métrica |
Computação - Padrão de Máquina Virtual - X7 |
vCPU por hora |
|
Base do Balanceador de Carga | Hora do Balanceador de Carga | |
Largura de banda do Balanceador de Carga | Mbps por hora | |
Armazenamento de Volume em Bloco |
Capacidade de armazenamento de Gigabytes por mês |
|
Unidades de desempenho por volume em bloco |
Unidades de Desempenho por Gigabyte por mês (10 VPUs em US$ 0,017 para Desempenho Equilibrado) |
A prática comum do setor de nuvem é definir instâncias de computação com base no número de CPUs virtuais (vCPUs) que elas incluem. Cada vCPU fornece a capacidade para um thread de execução. Uma vCPU não fornece um núcleo de computação físico completo, é parte de um núcleo. Em contraste, as formas de computação x86 da Oracle usam OCPUs que equivalem a núcleos de CPU físicos, cada um dos quais fornece dois threads. Para tornar mais fácil para os clientes comparar os provedores de serviços em nuvem, a Oracle apresenta os preços de vCPU em nossas páginas da web, enquanto o faturamento é baseado no número de tempo de OCPU que eles consomem. A taxa de OCPU por hora cobrada aos clientes é o dobro do preço da vCPU nas páginas web, pois eles recebem duas vCPUs de poder de computação em vez de uma.
O Oracle Cloud Infrastructure (OCI) Data Science lançou um novo recurso chamado Model Deployment para habilitar o fornecimento de modelos de machine learning como endpoints HTTP e fornecer pontuação de dados em tempo real.
Leia a publicação completaUm tour interativo pela interface do usuário.
Experimente a interface do usuário com este tour interativo
Experimente o produto ao vivo, de graça.
Descubra códigos de amostra, laboratórios e tutoriais
Descubra mais no boletim informativo de ciência de dados