País

AI Blueprints

Implemente, dimensione e monitore cargas de trabalho de IA generativa em minutos com o Oracle Cloud Infrastructure (OCI) AI Blueprints. Obtenha blueprints de implementação pré-empacotados e verificados pela OCI, completos com recomendações de hardware, componentes de software e monitoramento pronto para uso.

Experimente os blueprints de IA

Por que o OCI AI Blueprints?

Implemente com confiança com as melhores práticas verificadas pela OCI

Amenize as preocupações com a implementação de cargas de trabalho de IA para dimensionar implementações, determinar a compatibilidade de drivers e aplicações e gerenciar decisões de observabilidade e gerenciamento com projetos desenvolvidos com base nas melhores práticas verificadas pela OCI.

Inscreva-se no próximo webcast
Simplifique a implementação da IA generativa

Implemente e monitore cargas de trabalho de IA generativa de missão crítica em minutos com blueprints que incluem hardware, software e monitoramento prontos para uso verificados.

Leia o blog do desenvolvedor
Amenize as preocupações com o monitoramento e a observabilidade da IA

Adote conexões predefinidas com aplicações de observabilidade de terceiros, como Prometheus, Grafana e MLflow, para amenizar as preocupações com monitoramento e observabilidade nas cargas de trabalho de IA.

Experimente o OCI AI Blueprints agora

Casos de uso populares para AI Blueprints

Blueprints

Inferência de LLM e VLM com um vLLM

Simplifique a implementação de grandes modelos de linguagem (LLMs) e modelos de linguagem de visão (VLMs) usando um mecanismo de interface de código aberto chamado de grande modelo de linguagem virtual (vLLM). Implemente um modelo personalizado ou selecione um dos vários modelos abertos no Hugging Face.
Blueprints

Benchmarking de ajuste

Simplifique o benchmarking de infraestrutura para ajustes finos usando a metodologia MLCommons. Ela ajusta um modelo Llama-2-70B quantizado com um conjunto de dados padrão.
Blueprints

Ajuste de LoRA

O OCI AI Blueprints permite o ajuste eficiente de modelos usando a adaptação de baixa classificação (LoRA), um método altamente eficiente de ajuste fino de LLM. Ajuste um LLM personalizado ou use a maioria dos LLMs abertos do Hugging Face.
Blueprints

Verificação de Integridade

Antes de implementar cargas de trabalho de produção ou pesquisa, você pode usar um modelo robusto e pré-verificado para validação completa da integridade da GPU para detectar e resolver problemas de forma proativa. Verifique se s infraestrutura de GPU está preparada para experimentos de alta demanda em ambientes de nó único e de vários nós.
Blueprints

Inferência de CPU

Adote uma estrutura abrangente para atender LLMs em CPUs usando a plataforma Ollama com uma variedade de modelos compatíveis, como Mistral, Gemma e outros.
Blueprints

Inferência de vários nós com RDMA e vLLM

Com esse modelo, é possível distribuir o serviço de inferência entre vários nós de computação, cada um normalmente equipado com uma ou mais GPUs. Por exemplo, implemente LLMs do Llama de 405B em vários nós H100 com RDMA usando vLLM e LeaderWorkerSet.
Blueprints

Inferência escalonada com vLLM

Atenda LLMs com dimensionamento automático usando KEDA, que pode ser dimensionado para várias GPUs e nós usando métricas de aplicação, como latência de inferência.
Blueprints

Inferência de LLM com MIG

Implemente LLMs em uma fração de uma GPU com GPUs de várias instâncias NVIDIA e use um vLLM.

Use o OCI AI Blueprints para sua tecnologia

Coloque a aplicação de IA em execução de forma rápida e eficiente com recomendações de hardware opinativas, pilhas de software pré-empacotadas e ferramentas de observabilidade prontas para uso.

Recomendações de hardware validadas

Implemente suas cargas de trabalho de IA generativa com confiança usando modelos pré-empacotados testados nas configurações recomendadas de GPU, CPU e rede da OCI, poupando você de testes de desempenho demorados e suposições.
Pilhas de software pré-embaladas e opinativas

Adote as estruturas, bibliotecas e configurações de modelo necessárias para casos de uso populares de IA, como RAG, ajuste fino e inferência, ou personalize os casos de uso de acordo com as necessidades do seu negócio.
Observabilidade e dimensionamento automático incorporados

Obtenha gerenciamento de infraestrutura simplificado com tarefas de MLOps automatizadas, incluindo monitoramento, registro e dimensionamento. Comece rapidamente com ferramentas pré-instaladas, como Prometheus, Grafana, MLflow e KEDA, para obter um ambiente de nível de produção com o mínimo de esforço.

18 de março de 2025

OCI AI Blueprints: Vá além ao implementar cargas de trabalho de IA na OCI

Maywun Wong, Diretor de Marketing de Produtos, Oracle
Amar Gowda, Gerente Sênior de Produtos, Oracle
Vishnu Kimmari, Gerente Sênior de Produtos, Oracle

Introdução ao OCI AI Blueprints, uma plataforma de gerenciamento de carga de trabalho de IA do Kubernetes com um conjunto de blueprints que podem ajudar você a implementar, dimensionar e monitorar cargas de trabalho de IA em produção em minutos.

Leia a publicação completa

Blogs de desenvolvedores em destaque

Exibir tudo

Conheça o OCI AI Blueprints

Avaliação gratuita

Teste mais de 20 serviços de nuvem de uso livre com uma avaliação de 30 dias para ter ainda mais.

Teste a OCI gratuitamente

Experimente o OCI AI Blueprints

Explore, experimente ou implemente o OCI AI Blueprints na tenancy de produção.

Acesse todos os blueprints

Estime seus custos

Veja como a Oracle permite que os clientes economizem de forma consistente em computação, armazenamento e rede em comparação com outros provedores de serviços de nuvem em hiperescala.

Compare os custos

Fale com um especialista

Interessado em saber mais sobre a Oracle Cloud Infrastructure? Deixe um de nossos especialistas ajudar.

Entre em contato

AI Blueprints

Implemente com confiança com as melhores práticas verificadas pela OCI

Simplifique a implementação da IA generativa

Amenize as preocupações com o monitoramento e a observabilidade da IA