What are large language models?

Large language models are artificial intelligence systems that have been trained on vast data sets, often consisting of billions of words taken from books, the web, and other sources, to generate human-like, contextually relevant responses to queries. Because LLMs are designed to understand questions—or “prompts” in LLM terminology—and generate natural language responses, they can perform tasks such as answering customer questions, summarizing information in reports, translating between languages, and composing poetry, computer code, and first drafts of emails. LLMs typically have a sophisticated understanding of the grammar and semantics of the languages in which they’re trained. They can be configured to use an organization’s own data to provide responses that are unique to the organization.

How are large language models fine-tuned for specific applications?

LLMs are fine-tuned for specific applications by following the initial pretraining phase that employs self-learning to develop a foundation model with a supervised learning phase on a smaller amount of more domain-specific, labeled data.

What industries benefit most from using large language models?

Almost every industry is discovering the benefits of LLMs. Healthcare, financial services, and retail are among those exploring a variety of use cases around improving customer support and automating business processes.

Can large language models be integrated with enterprise systems?

Large language models are often integrated with enterprise systems by fine-tuning foundation models with enterprise data and augmenting those models with proprietary data through retrieval-augmented generation.

País

O que são grandes modelos de linguagem?

Joseph Tsidulko | Redator Sênior | 29 de julho de 2025

Neste artigo

O que são grandes modelos de linguagem?
Os grandes modelos de linguagem explicados
LLMs versus outros modelos de IA: eficiência e escalabilidade
Benefícios e aplicações de grandes modelos de linguagem
Casos de uso e exemplos de grandes modelos de linguagem
O caminho à frente para os LLMs
Construa aplicações de LLM com a IA Generativa da OCI
Perguntas Frequentes sobre LLMs

Grandes modelos de linguagem, ou LLMs, são um tipo cada vez mais popular de inteligência artificial projetada principalmente para gerar respostas semelhantes às humanas às entradas do usuário fornecidas por texto, voz ou outros meios. Os LLMs são treinados em grandes quantidades de dados de texto e aprendem a prever a próxima palavra, ou sequência de palavras, com base no contexto fornecido. Eles podem até imitar o estilo de escrita de um determinado autor ou gênero.

Os LLMs saíram dos laboratórios e entraram na consciência pública no início da década de 2020. Desde então, graças à sua impressionante capacidade de interpretar solicitações e produzir respostas relevantes, eles se tornaram produtos independentes e recursos de valor agregado incorporados em software de negócios, fornecendo processamento de linguagem natural, tradução automática, geração de conteúdo, chatbots, resumo de documentos e muito mais.

Essa tecnologia continua evoluindo rapidamente, incorporando conjuntos de dados maiores e adicionando camadas de treinamento e ajuste para melhorar o desempenho dos modelos. Um treinamento mais amplo e profundo, possibilitado por uma infraestrutura computacional cada vez mais poderosa, está produzindo recursos de raciocínio cada vez mais sofisticados que podem ser colocados em prática, gerando planos para atingir as metas organizacionais. Esses recursos de raciocínio também sustentam a funcionalidade dos agentes de IA, que usam LLMs avançados para concluir tarefas que os operadores humanos estabeleceram para eles.

O que são grandes modelos de linguagem?

Um grande modelo linguagem (LLM) é um sistema de inteligência artificial que foi treinado em um vasto conjunto de dados, geralmente composto por bilhões de palavras extraídas de livros, da Web e de outras fontes, para gerar respostas contextualmente relevantes para consultas e semelhantes às humanas. Como os LLMs são projetados para compreender perguntas, chamadas de "prompts" na terminologia de LLM, e gerar respostas em linguagem natural, eles podem realizar tarefas como responder perguntas de clientes, resumir informações em um relatório, gerar primeiros rascunhos de emails, até mesmo escrever poesia e códigos de computador. Os LLMs geralmente têm uma compreensão sofisticada da gramática e da semântica dos idiomas em que são treinados. Eles podem ser configurados para usar os próprios dados de uma organização para fornecer respostas que são exclusivas da organização.

Apesar desses recursos impressionantes, os usuários devem estar atentos às limitações dos LLMs. Dados desatualizados podem resultar em erros, como um chatbot que fornece uma resposta errada sobre os produtos de uma empresa. A falta de dados pode fazer com que os LLMs formulem respostas, ou tenham "alucinações". E enquanto os LLMs são ótimos em previsão, historicamente eles fizeram um trabalho ruim explicando como chegaram a uma determinada conclusão. Estas são algumas das áreas que os LLMs mais recentes buscam aperfeiçoar.

Ainda assim, os LLMs marcam um avanço significativo no campo do processamento de linguagem natural. Os usos das empresas são abundantes – novos aplicativos estão sendo rapidamente desenvolvidos e adotados.

Principais conclusões

Grandes modelos de linguagem são o estado da arte no campo do processamento de linguagem natural e também estão sendo aplicados para desenvolver IA multimodal que pode gerar áudio e imagens.
"Grande" é um termo relativo que se refere ao número de parâmetros que o modelo avalia ao determinar a saída de um determinado prompt.
Os LLMs ganharam destaque em 2022 com o lançamento do ChatGPT, um aplicativo que disponibilizou o modelo GPT-3.5 da OpenAI para o público em geral. Outros modelos populares incluem Llama, Gemini e Cohere Command R.

Grandes modelos de linguagem explicados

O processamento de linguagem natural tem sido uma área ativa de pesquisa de inteligência artificial desde os anos 1960, e os primeiros modelos de linguagem remontam a décadas. Grandes modelos de linguagem impulsionaram o campo ao empregar o deep learning, que camadas machine learning em redes neurais para gerar modelos mais sofisticados. Outra característica dos LLMs é que o treinamento do modelo de fundação é realizado sem intervenção humana na forma de dados de rotulagem, um processo chamado aprendizado auto-supervisionado.

A concepção moderna de um LLM nasceu em 2017 com um artigo do Google que descreveu uma nova e poderosa arquitetura chamada redes de transformadores. Os transformadores aplicaram um mecanismo de autoatenção que permitiu o processamento paralelo, o que acelerou e reduziu o custo do treinamento e da implantação dos modelos. A OpenAI aplicou essa arquitetura para criar o GPT-1, que muitos consideram o primeiro LLM moderno.

As empresas perceberam que estão descobrindo rapidamente que os LLMs podem sustentar uma infinidade de casos de uso e oferecer um enorme potencial para ajudar a tornar seus negócios mais produtivos, eficientes e responsivos aos clientes.

LLMs versus outros modelos de IA: eficiência e escalabilidade

Os LLMs são um dos muitos tipos de IA desenvolvidos por meio do processo de machine learning. Existem alguns elementos, no entanto, que definem e distinguem esses modelos. O primeiro é o seu tamanho. O "grande" no LLM refere-se ao número de parâmetros que calculam uma saída final, bem como a quantidade de dados que entram no treinamento do modelo ajustando esses parâmetros.

Tamanho e Desempenho: os LLMs são definidos pelo tamanho do modelo, que reflete o número de parâmetros que determinam suas saídas. Os principais modelos tornaram-se exponencialmente maiores em apenas alguns anos: o GPT-1 tinha pouco mais de 100 milhões de parâmetros; seu sucessor mais recente, o GPT-4, especula-se ter mais de 1,75 trilhão, embora o OpenAI não tenha divulgado seu verdadeiro tamanho.

Normalmente, quanto maior o tamanho do modelo e quanto mais extenso for o seu conjunto de treinamento, melhor será o desempenho na geração de respostas únicas e relevantes que imitam habilmente os recursos de compreensão humana e geração de linguagem. O desempenho pode ser medido por perplexidade, uma métrica que quantifica a confiança do modelo quando ele prevê a próxima palavra em sua sequência de saída.

Modelos maiores geralmente geram desempenho superior, mas não em todos os sentidos. Suas possíveis desvantagens podem incluir maior latência - o tempo que o modelo leva para obter uma resposta a um prompt - e dificuldade de escalar por causa da infraestrutura de computação necessária. Eles também são mais difíceis de personalizar para casos de uso corporativos específicos. Por esse motivo, existem esforços notáveis para desenvolver LLMs menores que sejam mais econômicos para serem implementados enquanto ainda têm um bom desempenho, pelo menos em domínios e casos de uso mais limitados.
Escalabilidade e Implantação: os LLMs podem ser implantados de algumas maneiras diferentes. Fornecedores comerciais, como OpenAI, Google e Cohere, disponibilizam seus modelos por meio de serviços hospedados por meio de um navegador, aplicativo ou chamadas de API. Muitas empresas, no entanto, preferem hospedar seus próprios LLMs, geralmente modelos básicos que foram ajustados ou aumentados com dados de negócios proprietários, ou ambos, em servidores locais ou em seus ambientes de nuvem pública, onde executam a fase de inferência da execução dos modelos. Os indivíduos e o software interagem com eles por chamadas diretas ou por meio de pontos finais de API.

Independentemente do método de implementação, os LLMs, especialmente aqueles que podem ser acessados pelo público em geral ou por uma grande força de trabalho, precisam ser capazes de dimensionar para atender à demanda esperada sem prejudicar o orçamento da empresa. Uma economia com essa escala envolve tradeoffs. Medidas que podem melhorar a escalabilidade, como infraestrutura de inferência mais poderosa, computação distribuída e balanceamento de carga e armazenamento em cache eficazes, tudo isso tem um custo. Falhas na obtenção do equilíbrio custo-benefício correto podem resultar em latência que compromete a capacidade de executar aplicativos em tempo real, desempenho inconsistente, lenta aceitação pela força de trabalho e medidas inadequadas de privacidade e segurança de dados.
Adaptabilidade do Domínio: Os melhores modelos básicos podem incorporar dados abstratos de alto nível e exibir criatividade em seus resultados. Depois que um modelo básico com potência e funcionalidade adequadas for selecionado, o ajuste fino poderá aumentar ainda mais o desempenho em domínios especializados e casos de uso. Esta fase de aprendizado supervisionado adapta o LLM a um domínio desejado sem treinar fundamentalmente o modelo básico.

O alinhamento de distribuições de recursos enfatizando dados que têm características compartilhadas entre domínios nas fases inicial de treinamento e ajuste fino de desenvolvimento também é uma maneira eficaz de aumentar a adaptabilidade do domínio.

O diagrama ilustra como os grandes modelos de linguagem aprendem e, em seguida, fazem previsões. Na fase de treinamento, o modelo aprende padrões. Em seguida, ele passa para a fase de inferência, na qual processa novos dados para gerar insights ou previsões.

Os LLMs são um tipo de IA geradora de linguagem que aplica redes neurais extensivamente treinadas para avaliar e responder a prompts. "Grande" não tem um limite definido – o que se qualifica para esse atributo continua crescendo à medida que os modelos se tornam mais sofisticados e o poder de computação, especialmente o acesso a clusters de GPU, mais abundante.

Antes do início do treinamento, o idioma é convertido em tokens, que são representações numéricas de palavras ou partes de alfabetos e fala, que os computadores podem entender.

Em seguida, um algoritmo — que inclui uma extensa rede neural de computadores — e um conjunto de dados são selecionados para aprendizado autossupervisionado. Durante a fase de treinamento, o algoritmo ajusta seus bilhões ou mesmo trilhões de parâmetros para prever com precisão o próximo token em uma sequência até que o modelo responda adequadamente aos prompts. Assim, os parâmetros do modelo contêm o aprendizado obtido na fase de treinamento.
Arquitetura Básica de Transformadores: Os transformadores foram o salto conceitual que deu início à atual onda de entusiasmo em torno de LLMs e IA generativa. Proposto em um artigo inovador por pesquisadores do Google em 2017, a arquitetura do transformador se desviou de abordagens anteriores para a criação de modelos de linguagem. Em vez de depender estritamente de um processo chamado recorrência, que envolve uma série sequencial de entradas e saídas, os transformadores implementam um mecanismo chamado "auto-atenção" que simultaneamente considera a relação entre várias palavras - mesmo aquelas distantes umas das outras em um fluxo de texto - à medida que processa frases. Ele faz isso criando três vetores diferentes: um para a palavra em consideração, outro para as palavras circundantes para estabelecer sua importância na compreensão da palavra, e um terceiro vetor que representa a informação que a palavra contém. Este terceiro vetor terá um valor diferente dependendo do contexto da palavra. Por exemplo, o azul pode significar a cor, ou pode indicar o humor de uma pessoa, ou pode significar uma grande extensão de consideração, como em "o pensamento veio para ela do azul".

Por exemplo, a string de texto pode ser:
"Como você se sente?" ela perguntou.

"Não tenho certeza", ele respondeu. "Eu não consigo nem ir para o trabalho hoje, e tem sido assim por um tempo. Eu estou vermelho de raiva."

Antes de a autoatenção se tornar parte do processo, os algoritmos não tinham como capturar a relação entre "sentimento" e "vermelho", então era provável que houvesse uma interpretação errada. A auto-atenção fornece uma maneira de estabelecer a importância da conexão entre as duas palavras, mesmo que elas não estejam próximas uma da outra na sequência de palavras.

Além disso, usando a autoatenção, os modelos podem ser treinados em grandes quantidades de dados em paralelo, essencialmente processando frases de cada vez, em vez de ir palavra por palavra. Isso aproveita ainda mais os recursos das GPUs. Os transformadores também podem analisar tokens de um prompt simultaneamente para entregar respostas com mais rapidez e resolver melhor as ambiguidades.
Treinamento e Ajuste: Os modelos básicos, os LLMs atuais de cavalos de trabalho, são treinados em um corpus de dados geralmente extraídos da internet e de outros repositórios de informações escritas. Modelos bem-sucedidos resultantes desse intervalo de aprendizado auto-supervisionado, no qual bilhões de parâmetros são ajustados iterativamente, tendem a ser bons em fornecer resultados generalizados: criar texto entre contextos, entender o significado de diferentes estilos de fala e apresentar ideias complexas ou até abstratas.

Um modelo básico pode ser ajustado para melhorar sua precisão e otimizar seu desempenho em um domínio específico, como assistência médica ou financeira, ou caso de uso, como tradução ou resumo. O processo de ajuste fino começa com o modelo básico e, em seguida, treina ainda mais o LLM final em conjuntos menores e mais precisos de dados rotulados para aprimorar sua capacidade de lidar com tarefas específicas úteis a um setor ou aplicativo de negócios.
Importância do Modelo e da Escalabilidade: os desenvolvedores de LLM decidem, em última análise, o número de parâmetros a serem treinados com seu algoritmo e a quantidade de dados necessários para fazer isso de forma eficaz. Quanto maior o número, mais complexo será o modelo resultante e, geralmente, mais exclusivas, precisas e relevantes serão as saídas. Mas com esse desempenho superior, surgem custos operacionais e de treinamento mais altos, além de desafios no dimensionamento para atender a mais usuários quando o modelo é treinado.

A escalabilidade de qualquer implantação de LLM é parcialmente determinada pela qualidade do modelo. O algoritmo de treinamento, a arquitetura do modelo e o conjunto de dados escolhidos pelos desenvolvedores de IA afetam o quão bem seus modelos básicos otimizam o consumo de recursos, como memória, processadores e energia, para executar as funções desejadas.

Novas técnicas também estão surgindo para reduzir o tamanho do modelo e o corpus de dados de treinamento, o que facilita o custo e a dificuldade de escalabilidade, sem afetar significativamente o desempenho de um LLM, particularmente quando o LLM será usado para casos de uso mais restritos.

Benefícios e aplicações dos grandes modelos de linguagem

Os LLMs são o motor sob o capô para muitos tipos de aplicações de ponta. O público em geral descobriu amplamente suas capacidades de cair o queixo com o advento do ChatGPT, a versão baseada em navegador do modelo GPT-3.5 da OpenAI e versões mais recentes, incluindo GPT-4o e GPT-4. Mas os benefícios se estendem para e em toda a empresa, onde os LLMs estão demonstrando suas habilidades em setores e divisões de negócios que incluem serviços financeiros, RH, varejo, marketing e vendas, desenvolvimento de software, suporte ao cliente e assistência médica.

Aplicações de negócios populares de LLMs incluem chatbots de atendimento ao cliente, análise de sentimento do cliente e serviços de tradução que são contextuais, coloquiais e naturais. Os LLMs também estão realizando tarefas mais especializadas nos bastidores, como prever estruturas de proteínas durante a pesquisa farmacêutica, escrever código de software e alimentar os agentes que as empresas estão implementando cada vez mais para automatizar processos de negócios.

Versatilidade entre Aplicativos: os LLMs são a principal tecnologia que alimenta um número diversificado e em expansão de aplicativos empresariais e voltados para o consumidor. Essa versatilidade decorre do processo de auto-treinamento dos modelos em grandes conjuntos de dados, que produz uma IA extremamente hábil em analisar padrões complexos dentro dos dados para criar saídas contextuais relevantes.

Os aplicativos de ponta aproveitam esse atributo para realizar tarefas como escrever cópias e relatórios de marketing exclusivos, avaliar o sentimento do cliente, resumir documentos e até mesmo gerar saídas não relacionadas ao idioma, como imagens e áudio. Os agentes de IA exemplificam particularmente a versatilidade dos LLMs em sua capacidade de interagir com um ambiente e executar tarefas em todos os domínios sem conhecimento especializado.

O processo de ajuste fino dos modelos com aprendizado supervisionado expande ainda mais a gama de aplicações de negócios que podem ser criadas com IA generativa. E a RAG pode tornar os LLMs mais eficazes em ambientes corporativos, pois melhora a precisão e a relevância de suas saídas, incorporando dados de negócios proprietários que podem ser atualizados continuamente sem alterar o modelo subjacente.
Interações Aprimoradas com o Cliente: os LLMs rapidamente provaram sua habilidade no domínio do atendimento ao cliente. Este é um caso de uso óbvio para qualquer pessoa que tenha experimentado a capacidade de um LLM de manter um diálogo respondendo a uma pergunta diferenciada após a outra com saídas claras, detalhadas e úteis.

Os LLMs, no entanto, podem aprimorar as interações com os clientes de muitas maneiras, além dos chatbots. Algumas empresas os usam para gerar emails, mensagens de texto ou postagens de mídia social para clientes que abordam questões relacionadas a produtos, técnicas ou vendas. Outros colocaram os LLMs para trabalhar na tradução de consultas de clientes que falam idiomas estrangeiros. Os LLMs também podem ser configurados para ajudar os agentes de vendas e suporte — humanos e IA — fornecendo informações acionáveis e documentação relevante, resumindo interações anteriores, acompanhando os clientes e documentando as interações.

Uma das maiores empresas de serviços profissionais do mundo que faz negócios em mais de 100 países recentemente aumentou seu foco no gerenciamento do relacionamento com o cliente ao adotar aplicações de IA generativa com tecnologia de LLMs. Procurando obter mais insights de pesquisas de feedback do cliente, a empresa implementou LLMs para analisar o sentimento nessas respostas. A IA agora pode destacar tendências e fornecer amplos insights sobre como os produtos e serviços são recebidos e como eles podem ser melhorados.
Automação e Produtividade: os LLMs estão se mostrando extremamente eficazes na automação de tarefas repetitivas, incluindo aquelas que envolvem decisões muito complexas para que modelos de IA anteriores assumam. Essa automação pode ajudar a aumentar a produtividade dos funcionários, liberando os trabalhadores para se concentrarem em esforços de alto nível que exigem pensamento criativo e crítico.

Os agentes são uma tecnologia emergente na vanguarda de aproveitar os recursos sofisticados de raciocínio dos LLMs para orientar os fluxos de trabalho com o mínimo de intervenção humana. Esses aplicativos, baseados em modelos de linguagem de base, são projetados para tomar decisões à medida que interagem com humanos e outros softwares em ambientes corporativos, e podem executar tarefas de forma autônoma em vários domínios, gerando notificações de ações que precisam de revisão ou autorização para ajudar a garantir a supervisão.

Os LLMs também estão aumentando a produtividade de outras maneiras, incluindo a rápida divulgação de informações relevantes para líderes de negócios e outros tomadores de decisão, a criação de rascunhos de cópia para profissionais de marketing e a escrita de código de software em conjunto com os desenvolvedores.

Casos de uso e exemplos dos grandes modelos de linguagem

Os LLMs estão sendo aplicados a um número cada vez maior de casos de uso de negócios. Muitas empresas agora usam chatbots como parte de suas estratégias de atendimento ao cliente, por exemplo. Mas graças à versatilidade desses modelos, os desenvolvedores de software corporativos criativos estão aplicando a tecnologia subjacente para lidar com uma ampla gama de tarefas que vão além de simplesmente gerar respostas linguísticas.

1. Automação do suporte ao cliente

O suporte ao cliente é a aplicação mais evidente de LLMs em configurações corporativas, especialmente para os clientes. Interfaces de usuário conversacionais, ou chatbots, alimentados por modelos de linguagem, podem apresentar um número quase ilimitado de consultas a qualquer hora. Isso pode ajudar a reduzir drasticamente os tempos de resposta decorrentes da sobrecarga da equipe do call center, uma das principais fontes de frustração do cliente.

A integração de chatbots com outros aplicativos com tecnologia LLM pode automatizar ações de acompanhamento após uma chamada de suporte, como enviar uma peça de máquina de substituição, documento ou pesquisa. Os LLMs também podem ajudar diretamente os agentes humanos, fornecendo informações oportunas, análise de sentimentos, tradução e resumos de interações.

Um gestor de fundos que opera em mais de 50 países e 80 idiomas aproveitou esses recursos para tornar mais fácil para seus clientes descobrir e escolher os veículos financeiros que melhor se adaptam às suas necessidades. O especialista em gerenciamento de contas de aposentadoria modernizou seu suporte ao cliente com um chatbot personalizado que proporcionou um aumento de 150% nos níveis de serviço e uma redução de 30% nos custos operacionais. Os clientes agora podem visitar a página da empresa e fazer perguntas ao chatbot sobre suas contas a qualquer hora do dia e em muitos idiomas.

2. Geração e Resumo de Conteúdo

Os LLMs podem criar conteúdo original ou resumir o conteúdo existente. Ambos os casos de uso são extremamente úteis para empresas grandes e pequenas, que estão colocando a IA generativa para trabalhar escrevendo relatórios, emails, blogs, materiais de marketing e postagens de mídia social, aproveitando a capacidade dos LLMs de adaptar o conteúdo gerado a grupos específicos ou clientes individuais.

A sumarização condensa grandes quantidades de informações, com sensibilidade ao domínio, em um formato mais fácil para os humanos revisarem e absorverem rapidamente. Os LLMs fazem isso avaliando a importância de várias ideias dentro de um texto e, em seguida, extraindo seções-chave ou gerando visões gerais concisas do que eles consideram as informações mais relevantes e críticas do texto original.

Os LLMs às vezes são criticados como "sumarizando para a média", o que significa que seus resumos são excessivamente genéricos e perdem detalhes importantes ou pontos importantes de ênfase do material original. Também é complicado avaliar a confiabilidade dos resumos e classificar o desempenho de vários modelos de acordo. No entanto, as empresas estão adotando entusiasticamente essa capacidade.

Uma empresa líder em comunicações em nuvem implementou LLMs para resumir automaticamente as transcrições de centenas de tickets de suporte e transcrições de bate-papos que ocorrem diariamente em quase duas dúzias de idiomas. Esses resumos agora ajudam os engenheiros de suporte a resolver os desafios do cliente com mais rapidez e elevar a experiência geral.

3. Traduções de idiomas

A intenção inicial do Google em desenvolver transformadores era tornar as máquinas melhores na tradução entre idiomas; só mais tarde o modelo impressionou os desenvolvedores com suas capacidades mais amplas. As primeiras implementações dessa arquitetura pelos desenvolvedores alcançaram esse objetivo, oferecendo um desempenho incomparável na tradução de inglês para alemão com um modelo que levou significativamente menos tempo e recursos de computação para treinar do que seus antecessores.

Os LLMs modernos foram muito além desse caso de uso limitado. Embora a maioria dos LLMs não seja treinada especificamente como tradutores, eles ainda se destacam na interpretação de texto em um idioma e claramente o reafirmam em outro quando são amplamente treinados em conjuntos de dados em ambos os idiomas. Este avanço na quebra de barreiras linguísticas é extremamente valioso para as empresas que operam além fronteiras. As empresas multinacionais usam serviços linguísticos avançados para, por exemplo, desenvolver suporte multilíngue para seus produtos e serviços; traduzir guias, tutoriais e ativos de marketing; e usar ativos educacionais existentes para treinar trabalhadores ao se expandir para novos países.

O caminho à frente para os LLMs

Avanços em Modelos Multimodais

Uma área ativa de pesquisa está usando LLMs como modelos de base para IA que geram resultados em modalidades diferentes da linguagem. A impressionante versatilidade dos LLMs possibilita, por meio de um processo de ajuste fino usando dados rotulados, interpretar e criar áudio, imagens e até mesmo vídeo. Esses modelos que recebem prompts ou geram saídas em modalidades diferentes da linguagem são às vezes chamados de grandes modelos multimodais, ou LMMs.

Considerações ambientais

Os LLMs geralmente exigem grandes quantidades de poder de computação para desenvolver e operar em escala. Treinar um único modelo em um cluster de centenas ou às vezes milhares de GPUs ao longo de muitas semanas pode consumir grandes quantidades de energia. E uma vez que um modelo bem-sucedido é implantado, a infraestrutura que executa inferência continua a exigir eletricidade substancial para colocar em campo consultas constantes dos usuários.

O treinamento GPT-4 exigiu uma estimativa de 50 gigawatt-hora de energia. Em comparação, 50 gigawatts-hora de energia poderiam, teoricamente, alimentar 4.500 a 5.000 casas médias nos EUA por um ano. Agora, estima-se que o ChatGPT consuma centenas de megawatts-hora todos os dias para responder a milhões de consultas. À medida que os modelos de linguagem aumentam, as preocupações com o consumo de energia e a sustentabilidade podem se tornar mais prementes. Por essa razão, as empresas de inteligência artificial estão na vanguarda da busca de fontes alternativas de energia para reduzir suas pegadas de carbono.

Construa aplicações de LLM com a IA Generativa da OCI

A Oracle coloca o poder dos LLMs nas mãos das empresas sem exigir que elas enfrentem as porcas e os parafusos - ou as demandas de energia - dessa tecnologia empolgante. A IA Generativa da Oracle Cloud Infrastructure (OCI) é um serviço totalmente gerenciado que simplifica a implementação dos LLMs mais recentes de maneira personalizada, altamente eficaz e econômica, evitando o gerenciamento de infraestrutura complexa. As empresas podem selecionar entre vários modelos básicos e, em seguida, ajustá-los em clusters de GPU dedicados com seus próprios dados, gerando modelos personalizados que melhor atendam às suas necessidades de negócios.

As empresas que buscam fazer mais ajustes na tecnologia subjacente estão se voltando para o Machine Learning no Oracle Database. A plataforma permite que os cientistas de dados criem modelos rapidamente, simplificando e automatizando os principais elementos do ciclo de vida do machine learning sem precisar migrar dados confidenciais de seus bancos de dados Oracle. Os recursos incluem estruturas populares de machine learning, APIs, machine learning automatizado (AutoML) e interfaces no-code, bem como mais de 30 algoritmos de alto desempenho no banco de dados para produzir modelos a serem usados em aplicativos.

Muitas organizações líderes também aproveitam a infraestrutura de IA da Oracle para criar seus próprios LLMs. A infraestrutura de IA é o que sustenta os serviços de IA de nível superior, como a IA Generativa da OCI, e pode ser usada para os LLMs mais exigentes com computação, rede e armazenamento acelerados.

O potencial dos LLMs para transformar a forma como as empresas operam e se envolvem com seus clientes é tão grande que novos avanços e investimentos na tecnologia podem mover os mercados globais e agitar as estratégias empresariais. Mas é importante que os líderes de negócios e TI olhem além do hype – entendam os conceitos básicos de como os LLMs funcionam, bem como suas limitações e os desafios em adotá-los – mesmo que se esforcem para identificar os muitos benefícios tangíveis que podem obter com a tecnologia.

Os LLMs estão por trás de muitas das tecnologias revolucionárias que transformam a maneira como trabalhamos.

Acesse o ebook

Perguntas Frequentes sobre LLMs

Como os grandes modelos de linguagem são ajustados para aplicativos específicos?

Os LLMs são ajustados para aplicações específicas seguindo a fase inicial de pré-treinamento que emprega o autoaprendizado para desenvolver um modelo básico com uma fase de aprendizado supervisionado em uma quantidade menor de dados mais específicos do domínio e rotulados.

Quais setores se beneficiam mais com o uso de grandes modelos de linguagem?

Quase todos os setores estão descobrindo os benefícios dos LLMs. Assistência médica, serviços financeiros e varejo estão entre os que estão explorando uma variedade de casos de uso para melhorar o suporte ao cliente e automatizar os processos de negócios.

Os grandes modelos de linguagem podem ser integrados aos sistemas empresariais?

Grandes modelos de linguagem geralmente são integrados a sistemas corporativos, ajustando modelos básicos com dados corporativos e aumentando esses modelos com dados proprietários por meio de geração aumentada de recuperação.