Solução de IA

Automatizando Tarefas com Segurança com RAG e uma Escolha de LLMs

Introdução

No esforço para simplificar tarefas repetitivas ou automatizá-las completamente, por que não contar com a ajuda da IA? Usar um modelo básico para automatizar tarefas repetitivas pode parecer atraente, mas pode colocar em risco dados confidenciais. A geração aumentada de recuperação (RAG) é uma alternativa para ajuste fino, mantendo dados de inferência isolados do corpus de um modelo.

Queremos manter nossos dados de inferência e modelos separados, mas também queremos uma escolha em qual modelo de linguagem grande (LLM) usamos e uma GPU poderosa para eficiência. Imagine se você pudesse fazer tudo isso com apenas uma GPU!

Nesta demonstração, mostraremos como implantar uma solução de RAG usando uma única GPU NVIDIA A10; uma estrutura de código aberto como LangChain, LlamaIndex, Qdrant ou vLLM; e um LLM leve de 7 bilhões de parâmetros da Mistral AI. É um excelente equilíbrio de preço e desempenho e mantém os dados de inferência separados enquanto atualiza os dados conforme necessário.

Demonstração

Demonstração: Automatizando Tarefas com Segurança com RAG e uma Escolha de LLMs (1:15)

Pré-requisitos e configuração

  1. Conta Oracle Cloud —página de cadastro
  2. Instância de computação da Oracle GPU — documentação
  3. LlamaIndex—documentação
  4. LangChain—documentação
  5. vLLM — documentação
  6. Qdrant — documentação