Solução de IA

Automatizando Tarefas com Segurança com RAG e uma Escolha de LLMs

Tópicos da solução de IA

Introdução
Demonstração
Pré-requisitos e configuração
Vamos começar

Introdução

No esforço para simplificar tarefas repetitivas ou automatizá-las completamente, por que não contar com a ajuda da IA? Usar um modelo básico para automatizar tarefas repetitivas pode parecer atraente, mas pode colocar em risco dados confidenciais. A geração aumentada de recuperação (RAG) é uma alternativa para ajuste fino, mantendo dados de inferência isolados do corpus de um modelo.

Queremos manter nossos dados de inferência e modelos separados, mas também queremos uma escolha em qual modelo de linguagem grande (LLM) usamos e uma GPU poderosa para eficiência. Imagine se você pudesse fazer tudo isso com apenas uma GPU!

Nesta demonstração, mostraremos como implantar uma solução de RAG usando uma única GPU NVIDIA A10; uma estrutura de código aberto como LangChain, LlamaIndex, Qdrant ou vLLM; e um LLM leve de 7 bilhões de parâmetros da Mistral AI. É um excelente equilíbrio de preço e desempenho e mantém os dados de inferência separados enquanto atualiza os dados conforme necessário.

Demonstração

Pré-requisitos e configuração

Conta Oracle Cloud —página de cadastro
Instância de computação da Oracle GPU — documentação
LlamaIndex—documentação
LangChain—documentação
vLLM — documentação
Qdrant — documentação

Conheça

Etapas detalhadas e código de amostra no GitHub