Jeffrey Erickson | Estrategista de conteúdo | 12 de janeiro de 2024
Quando a OpenAI lançou o ChatGPT, seu grande modelo de linguagem (LLM), ao público em novembro de 2022, conquistou 100 milhões de usuários em apenas dois meses. Isso tornou o ChatGPT um dos aplicativos de consumo de crescimento mais rápido de todos os tempos.
Os investidores perceberam.
Desde então, os membros das 50 principais empresas de IA da Forbes coletivamente arrecadaram mais de US$ 27,2 bilhões. Algumas dessas empresas têm menos de um ano, com menos de 20 funcionários. Para startups de IA com ideias intrigantes, o dinheiro está fluindo.
No entanto, o dinheiro arrecadado não garante o sucesso. As startups de IA enfrentam desafios únicos que exigem mais do que a coragem, o timing de mercado e o gerenciamento de crescimento habituais. Treinar os LLMs que alimentam serviços como o ChatGPT ou o gerador de imagens de IA do Midjourney é uma das tarefas mais intensas em termos de computação que a humanidade já concebeu. As empresas de investimento dizem que a maior parte do capital que as startups de IA levantam vai direto para os recursos de computação.
Além disso, as startups de IA são responsáveis pela segurança e pela privacidade de informações confidenciais que se escondem nas montanhas de dados de treinamento que seus modelos ingerem, mesmo quando enfrentam gigantes que também se movem rapidamente para conquistar participação no mercado.
O fundador da Microsoft, Bill Gates, considera a IA de o desenvolvimento mais significativo na computação desde a interface gráfica do usuário, que lançou o Macintosh da Apple e todos os sistemas operacionais e aplicações populares desde então. Portanto, é compreensível que os empreendedores queiram participar dessa ação. Vamos analisar os fatores que as startups de IA devem conhecer antes de entrarem na briga.
Existem três tipos de startups de IA generativa: aquelas que constroem plataformas de LLM, como a OpenAI ou Cohere; aquelas que oferecem novas ferramentas para criar e treinar LLMs, como a MosaicML; e aquelas que usam LLMs de código aberto e os treinam para resolver problemas de negócios específicos - um exemplo é a Tome, que aplica IA para melhorar as apresentações de negócios.
Todas as startups de IA estão trabalhando na sombra do ChatGPT, Google e outras empresas que usaram arquiteturas de computação avançadas chamadas redes neurais e algoritmos de machine learning para criar interfaces de linguagem natural intuitivas que podem gerar texto, conteúdo visual e código de computador semelhantes a humanos e executar muitas outras tarefas.
Principais conclusões
Desde aquelas que mais recebem investimentos até as bootstrapping, as startups enfrentam obstáculos inigualáveis para os prestadores de serviços baseados em IA. Os 11 desafios listados abaixo apresentam uma boa ideia dos possíveis obstáculos que nos aguardam.
As startups de IA assumem responsabilidades de segurança e privacidade que vão além dos esforços padrão de proteção de dados corporativos. Muitas medidas de segurança serão familiares, como empregar um modelo de confiança zero e monitorar redes para atividades maliciosas que desativam respostas e alertas automatizados. Mas há também novos desafios. Por exemplo, modelos de IA podem vazar detalhes dos dados usados para treiná-los. Esses conjuntos de dados podem ter centenas de gigabytes, ou mesmo terabytes, extraídos de diversas fontes. Eles podem conter dados confidenciais, incluindo nomes, endereços e outras informações de identificação pessoal. Um modelo treinado usando esses dados poderia refletir detalhes privados em seus resultados?
É importante que uma startup saiba quais dados estão em seus conjuntos de treinamento e tenha um plano para minimizar os riscos envolvidos com informações confidenciais ou regulamentadas. Essas empresas têm de convencer os investidores de que têm estas preocupações atendidas, além de um plano de resposta de comunicação em vigor, caso surja algum problema.
As empresas de IA treinam e implementam grandes modelos de linguagem (LLMs) com amplos conjuntos de dados e bilhões de parâmetros para todos os tipos de casos de uso, incluindo processamento de linguagem natural (NLP) e criação de imagens. Elas também desenvolvem modelos de IA para visão computacional, previsão, detecção de anomalias e muito mais. Os LLMs, em particular, exigem volumes incrivelmente grandes de dados para produzir resultados precisos e consistentes.
Se você é uma startup de IA, o gerenciamento de dados está no centro do seu negócio.
Um desafio importante, no entanto, é encontrar os conjuntos de dados certos que atendam às suas necessidades de treinamento de IA e carregá-los em um data warehouse ou data lakehouse em massa. Os dados devem fluir com segurança através de redes neurais e algoritmos de machine learning usando superclusters de servidores de unidade de processamento gráfico (GPU), se você puder encontrá-los.
Chips grandes
Uma GPU é um chip com muito mais núcleos do que uma unidade de processamento central (CPU). Esse design, conforme observado no CUDA da Nvidia, abreviação de arquitetura de dispositivos unificados de computação, potencializa o paralelismo massivo necessário para tarefas como o treinamento de IA.
Uma afirmação que vemos repetidamente em programas de TV, filmes e na mídia popular é que a IA destruirá o mundo. Um contra-argumento: "Onde essa IA mal intencionada conseguirá as GPUs?"
Para executar as redes neurais nas quais os modelos de IA são desenvolvidos, as GPUs dividem o trabalho computacional. Em seguida, o sistema executa consultas por meio de várias GPUs em paralelo. Isso tira a carga da CPU do computador e permite que a rede processe cálculos complexos de forma extremamente rápida. O treinamento e execução de modelos de IA requer tanto poder de computação que os fabricantes de chips e provedores de nuvem do mundo estão tendo dificuldade para acompanhar a demanda. Esteja ciente de que você pode precisar entrar na fila para comprar chips ou convencer um provedor de nuvem de que sua startup de IA é digna dessas poderosas GPUs.
É seguro dizer que a maioria das startups de IA criará suas empresas com base em um LLM desenvolvido por outra empresa porque, na maioria dos casos, personalizar um modelo de IA de empresas como a OpenAI ou a Cohere é mais eficiente do que projetar, construir e treinar um modelo do zero.
Há duas abordagens comuns para personalizar um LLM para um determinado setor ou caso de uso: ajuste fino e geração aumentada de recuperação (RAG). Você ajusta os resultados de um sistema de IA treinando-o com grandes quantidades de dados específicos para sua causa e instruindo a IA a dar mais peso a essas informações em suas respostas. A outra opção, a RAG, envolve a incorporação de documentos altamente relevantes em um banco de dados que a IA usará para dar contexto aos prompts escritos ou verbais que receber. Com a RAG, esses documentos permitem que a IA adicione detalhes técnicos relevantes aos seus resultados e até cite onde obteve as informações. Por exemplo, uma startup do setor de saúde pode incorporar documentos ou artigos que ajudem seu LLM a entender melhor a intenção dos prompts de profissionais da área médica e, em seguida, fornecer linguagem de saída relacionada às suas especializações.
Cada método tem benefícios e desvantagens em termos de velocidade, qualidade e custo. A abordagem da personalização de LLM é uma decisão importante para qualquer startup de IA que espera fornecer um serviço específico do setor ou do caso de uso.
Para empresas em rápido desenvolvimento, é difícil dizer não à infraestrutura de nuvem pronta. Todos os provedores de nuvem em hiperescala oferecem o que é necessário para treinar ou personalizar grandes modelos de linguagem, incluindo clusters de instâncias de computação conectadas por uma rede de alta largura de banda e um sistema de arquivos de alto desempenho. E como esses serviços são baseados no consumo, geralmente é menos caro e geralmente muito mais rápido do que configurar a infraestrutura on-premises.
Como esses sistemas são baseados no consumo, velocidade e eficiência devem ser ponderadas em relação ao custo. Uma startup de IA pode manter suas despesas baixas executando um LLM que faça o que precisa ser feito com os algoritmos menos complexos e o mínimo de dados possível. Depois que o cálculo do orçamento for feito, escolha uma infraestrutura de nuvem que lide com seu modelo de forma eficiente. Por exemplo, a execução em servidores bare metal evita a sobrecarga de instâncias virtualizadas e oferece melhor desempenho. Isso se torna ainda mais significativo quando se trata de cargas de trabalho clusterizadas comuns a LLMs.
Lembre-se de que quanto mais rápido seu trabalho for executado, menor será o custo.
Podem ser necessários muitos gigawatts-hora de energia para treinar um LLM. Para referência, um gigawatt poderia alimentar até 874.000 casas por um ano, de acordo com a empresa de investimentos The Carbon Collective. Uma startup que busca financiamento de capital de risco para oferecer serviços baseados em LLM deve provar que está usando seu dinheiro com sabedoria. Por exemplo, nem todas as tarefas de IA precisam do mesmo nível de sofisticação de modelo ou de capacidade computacional. Uma coleção crescente de LLMs de empresas como OpenAI, Cohere, Anthropic e outras oferecem diferentes versões e tamanhos. Esteja pronto para explicar por que sua escolha atende às suas necessidades e orçamento.
Depois de escolher seu modelo e conjuntos de dados, selecione cuidadosamente uma infraestrutura com processamento paralelo eficiente e dimensionamento dinâmico para evitar o pagamento de recursos de computação que você não está usando. Esteja preparado para mostrar aos investidores que suas escolhas alcançam um equilíbrio entre desempenho e acessibilidade.
Existem três técnicas principais para dimensionar LLMs e aumentar a qualidade e/ou velocidade dos resultados do LLM: aumentar a quantidade de dados de treinamento, usar um modelo maior e mais complexo ou adicionar capacidade computacional.
Um modelo maior aumenta o número de camadas e parâmetros na arquitetura da rede neural, o que lhe proporciona maior capacidade de aprender e representar padrões complexos nos dados. Como resultado, seu LLM fornecerá respostas mais detalhadas e diferenciadas. Ao adicionar mais gigabytes de dados de treinamento, sua startup de IA pode oferecer respostas mais precisas ou completas. Em ambos os casos, você também precisará expandir recursos de computação caros para manter o desempenho do modelo.
Esse não é um desafio específico para a inteligência artificial. Os analistas de negócios têm se preocupado com a qualidade dos dados que usam há décadas. As startups de IA precisam aproveitar a experiência de cientistas de dados e especialistas no assunto para remover informações redundantes, conteúdo irrelevante e outros "ruídos" dos conjuntos de dados usados para treinar algoritmos e alimentar LLMs.
"Garbage in, garbage out" (lixo entra, lixo sai) é um ditado que deve ser relevante para startups de IA.
É importante que as startups de IA estabeleçam medidas quantitativas e qualitativas para o sucesso. As medidas quantitativas incluem ROI sobre investimentos em tecnologia e indicadores-chave de desempenho (KPIs) técnicos, como erro quadrado médio (MSE), que identifica resultados discrepantes.
Além disso, uma startup de IA deve ser capaz de medir resultados qualitativos, como o desempenho de um modelo de IA em dados novos ou não vistos anteriormente, como os resultados são relevantes para o público-alvo e como os resultados abrangentes estão no contexto do campo que está sendo discutido.
Há uma série de abordagens para financiar uma startup de IA. Você pode seguir o exemplo de LLMs como Midjourney e Surge AI, que aumentaram gradualmente suas bases de clientes sem gastar dinheiro em investimentos. Se sua startup de IA não pode esperar pelo crescimento bootstrap, há investidores anjo, aceleradores e incubadoras que estão à procura de fundadores de IA com inteligência aguçada e boas ideias. O benefício de incubadoras e aceleradores é que eles fornecem contextos, acesso a oportunidades de mercado, consultoria de negócios e até plataformas de tecnologia para criar um serviço de IA.
Plataformas de vendas e marketing de ponta estão empregando IA em todas as etapas da jornada do cliente, e qualquer startup de IA que queira aumentar a participação de mercado vai querer empregar IA para ajudar. Como? A IA pode usar dados detalhados, incluindo dados de geolocalização em tempo real para mapear e rastrear movimentos, para criar ofertas de produtos ou serviços personalizadas para clientes em potencial. Os assistentes de IA podem gerar oportunidades de upselling e cross-selling ou pressionar os compradores a concluir transações assim que os itens estiverem em seus carrinhos. Essas táticas comprovadamente aumentam as taxas de conversão e agradam aos investidores ansiosos por uma startup para aumentar as vendas.
Os serviços habilitados para IA pós-venda podem lidar com consultas, entender o contexto e oferecer sugestões, além de compartilhar detalhes concretos sobre horários de agendamento ou entrega e direcionar perguntas mais complexas para agentes humanos. Ver como esses serviços baseados em IA funcionam pode ajudar a comparar as ofertas de sua própria startup de IA.
Se você estiver construindo um negócio baseado em IA, considere a Oracle Cloud Infrastructure (OCI), que fornece uma infraestrutura robusta para treinar e atender modelos em escala. Por meio de sua parceria com a NVIDIA, a Oracle pode fornecer aos clientes superclusters, que são alimentados pelas GPUs mais recentes e conectados a uma rede RDMA over Converged Ethernet (RoCE) de latência ultrabaixa. Essa arquitetura fornece um método de alto desempenho e econômico para treinar modelos de IA generativa em escala. Muitas startups de IA, incluindo Adept e MosaicML, estão criando seus produtos diretamente na OCI.
A Oracle facilita os primeiros passos com os serviços da OCI, incluindo a seleção de serviços de nuvem Modo Gratuito. As startups podem aprender com sandboxes do desenvolvedor ou implementações em pacote de software popular, como a implementação de um cluster do Kubernetes.
Para ajudar as startups a decidir, a Oracle fornece ferramentas exploratórias, incluindo calculadoras de custos, análises de analistas de terceiros e comparações detalhadas entre a OCI e outras plataformas de nuvem.
A inteligência artificial está presente em nossas vidas há mais de uma década, trabalhando em segundo plano, monitorando fraudes em meio a milhões de transações bancárias, entrando em cena para lidar com interações de atendimento ao cliente na linha de frente e tomando decisões extremamente rápidas para acelerar a logística de remessas noturnas. Agora, com a última geração de LLMs, as habilidades sutis, poderosas e estranhas da IA obtêm a interface de usuário que merecem: a palavra natural falada ou escrita.
Como resultado, os LLMs capturaram a imaginação popular com a criação de imagens, texto escrito e tradução e até mesmo geração de código. Embora haja muitos desafios, agora é o momento para as startups de IA encontrarem investidores, atenderem novos clientes e aumentarem a escala como em 1999.
Estabelecer um centro de excelência em IA antes do início do treinamento específico da organização aumenta a probabilidade de sucesso. Nosso ebook explica o porquê e oferece dicas sobre como construir um CoE eficaz.
Quais são os desafios comuns para startups de IA?
As startups de IA enfrentam desafios para escolher o LLM certo para treinar, encontrar os dados de treinamento certos e reunir o imenso poder de computação necessário para dar suporte às suas redes neurais. Também há questões de privacidade de dados, segurança de dados e mudanças nas regulamentações a serem enfrentadas.
Que tipos de serviços as startups de IA oferecem?
As startups de IA estão surgindo em todos os setores de negócios, incluindo saúde, manufatura e defesa nacional. Algumas startups estão oferecendo produtos aos consumidores, enquanto outras estão desenvolvendo ferramentas usadas por outras empresas de IA para criar e treinar seus modelos.
Como as startups de IA conseguem obter financiamento?
As startups que procuram investidores podem fazer uma rápida pesquisa de investidores anjos, que estão à procura de oportunidades. Outras opções são as incubadoras ou aceleradoras de tecnologia, que podem fornecer orientação e assistência tecnológica para os fundadores de startups.