Recursos do Generative AI Service

 

modelos

Os novos modelos disponíveis da Cohere e Meta para a OCI Generative AI incluem:

  • Cohere Command: o Command é o principal modelo de geração de texto da Cohere. Ele está disponível em dois tamanhos: 6 bilhões de parâmetros e 52 bilhões de parâmetros. O primeiro modelo tem latência e custos mais baixos, enquanto o segundo oferece maior precisão.
  • Cohere Summarize: o Summarize fornece resumos de alta qualidade que capturam com precisão as informações mais importantes de seus documentos.
  • Cohere Embed: esses modelos de incorporação em inglês e multilíngue (v3) convertem texto em representação de incorporação de vetores. As versões "light" do Embed são menores e mais rápidas (somente em inglês).
  • Meta Llama 2: o Llama 2 é uma coleção de modelos de geração de texto com até 70 bilhões de parâmetros. É o principal grande modelo de linguagem (LLM) de código aberto, gratuito para pesquisa e uso comercial.

Clusters de IA dedicados

Com os clusters de IA dedicados, você pode hospedar modelos fundamentais em GPUs dedicadas e privadas. Eles oferecem desempenho estável de alta taxa de transferência, necessário para casos de uso de produção, e podem oferecer suporte a cargas de trabalho de hospedagem e ajuste fino. A OCI Generative AI permite que você expanda seu cluster sem tempo de inatividade para lidar com alterações no volume. É possível hospedar até 50 modelos personalizados e adaptados no mesmo cluster dedicado, desde que todos compartilhem o mesmo modelo básico.

Integração com o LangChain

A OCI Generative AI é integrada ao LangChain, uma estrutura de código aberto que pode ser usada para desenvolver novas interfaces para aplicações de IA generativa com base em modelos de linguagem. O LangChain facilita a troca de abstrações e componentes necessários para trabalhar com modelos de linguagem.

Operações de IA generativa

A OCI Generative AI fornece controles de moderação de conteúdo, troca de modelos de endpoints sem tempo de inatividade e recursos de desativação e ativação de endpoints. Para cada endpoint de modelo, a OCI Generative AI também captura uma série de análises, incluindo estatísticas de chamadas, tokens processados, contagens de erros e muito mais.

OCI Generative AI para Oracle Cloud Applications

Ao incorporar recursos criados com a OCI Generative AI diretamente em suas aplicações de negócios, a Oracle está facilitando para os clientes o acesso instantâneo a recursos orientados por IA sem integrações complexas.

Saiba mais sobre as aplicações em nuvem da Oracle