Mark Jackley | Content Strategist | 16 febbraio 2024
Un large language model (LLM) è un tipo sempre più popolare di intelligenza artificiale progettato per generare risposte scritte di tipo umano alle query. I LLM sono formati su grandi quantità di dati di testo e imparano a prevedere la parola successiva, o sequenza di parole, in base al contesto fornito, possono persino imitare lo stile di scrittura di un particolare autore o genere.
I LLM sono emersi dai laboratori e hanno fatto notizia all'inizio degli anni 2020 e da allora si sono trasformati sia in prodotti autonomi che in funzionalità a valore aggiunto integrate in molti tipi di software aziendali. Grazie alla loro impressionante capacità di interpretare le richieste e fornire risposte utili, i LLM sono utilizzati in una vasta gamma di applicazioni, tra cui l'elaborazione del linguaggio naturale, la traduzione automatica, la generazione di contenuti, i chatbot e la sintesi di documenti.
Un large language model (LLM) è un sistema di intelligenza artificiale che è stato addestrato su un vasto set di dati, spesso costituito da miliardi di parole prese da libri, dal Web e da altre fonti, per generare risposte simili a quelle umane e contestualmente pertinenti alle query. Poiché i LLM sono progettati per comprendere le domande, chiamate "prompt" nella terminologia LLM, e generare risposte in linguaggio naturale, possono eseguire attività come rispondere alle domande dei clienti, riepilogare le informazioni in un report, generare prime bozze di e-mail, persino scrivere poesie e codice informatico. I LLM in genere hanno una profonda comprensione della grammatica e della semantica del linguaggio in cui sono addestrati e possono essere raffinati utilizzando i dati di un'azienda.
Poiché sono in grado di riconoscere e interpretare il linguaggio umano, anche se non lo comprendono veramente come fanno gli esseri umani, i LLM rappresentano un progresso significativo nell'elaborazione del linguaggio naturale. Il più noto LLM è probabilmente ChatGPT, il programma AI di OpenAI addestrato su miliardi di parole da libri, articoli e siti web. L'azienda offre l'accesso diretto a ChatGPT tramite un browser web o un'app mobile, oppure può essere collegata a software aziendali tramite API programmabili. Altri LLM comuni includono Cohere, GPT-4 e BARD.
I dati testuali utilizzati per addestrare un LLM possono essere strutturati, come in un database o non strutturati. La maggior parte delle aziende dispone di grandi quantità di dati non strutturati, tra cui messaggi di testo, e-mail e documenti.
Gli usi aziendali più diffusi i LLM includono chatbot per il servizio clienti, assistenti digitali e servizi di traduzione che sono più contestuali, colloquiali e dal suono naturale rispetto ai tradizionali strumenti di traduzione letterale. I LLM possono anche eseguire attività abbastanza avanzate, come prevedere le strutture proteiche e scrivere codice software. Sanità, prodotti farmaceutici, finanza e retail sono tra i settori che mettono a frutto i LLM. Ad esempio, un fornitore di servizi sanitari potrebbe utilizzare un LLM per valutare i pazienti che chiamano in una hotline, mentre un'azienda di investimento potrebbe usarne uno per setacciare e riepilogare i rapporti sugli utili, le notizie e i post sui social media per individuare le tendenze azionarie. I LLM possono aiutare le organizzazioni a gestire e analizzare i dati, ricavando insight che possono creare valore aziendale. E in entrambi gli scenari, l'LLM sta eseguendo l'attività più velocemente di quanto potrebbero fare gli analisti umani.
Ciò ha portato a un grande interesse per la tecnologia, tanto che si prevede che il mercato globale per i LLM crescerà a un tasso di crescita annuale composto del 21,4% per raggiungere i 40,8 miliardi di dollari entro il 2029, secondo la ricerca di Valuates Reports del 2023.
Ci sono alcuni concetti chiave da capire quando si pensa ai LLM. Essi includono:
Come gli esseri umani, i LLM non sono perfetti. La qualità della loro produzione dipende dalla qualità del loro input, cioè dalle informazioni utilizzate per addestrarli. Dati obsoleti possono causare errori, come un chatbot che fornisce una risposta errata sui prodotti di un'azienda. La mancanza di dati sufficienti può indurre i LLM a formulare risposte, o "allucinare". Mentre i LLM sono bravi a predire, per ora comunque, sono meno bravi a spiegare come sono arrivati a una data conclusione. E molti LLM sono addestrati con libri, articoli di giornale e persino pagine di Wikipedia, portando a preoccupazioni sulla violazione del copyright. Se non gestiti in modo rigoroso, i LLM possono presentare problemi di sicurezza, ad esempio utilizzando informazioni sensibili o private in una risposta.
Una tecnica AI chiamata recupero-augmented generation (RAG) può aiutare con alcuni di questi problemi migliorando l'accuratezza e la rilevanza dell'output di un LLM. RAG consente di aggiungere informazioni mirate senza modificare il modello sottostante. I modelli RAG creano repository di conoscenze, in genere basati sui dati di un'organizzazione, che possono essere continuamente aggiornati per fornire risposte tempestive e contestuali. Ad esempio, i chatbot e altri sistemi di conversazione potrebbero utilizzare RAG per assicurarsi che le loro risposte alle domande dei clienti siano basate sulle informazioni attuali sull'inventario, sulle preferenze dell'acquirente e sugli acquisti precedenti e per escludere informazioni non aggiornate o non pertinenti al contesto operativo previsto dall'LLM.
La creazione di un centro di eccellenza AI prima dell'inizio della formazione specifica dell'organizzazione aumenta le probabilità di successo. Il nostro ebook spiega perché e offre suggerimenti per costruire un efficace CoE.
Quali sono i primi cinque grandi modelli linguistici?
Gli esperti non sono d'accordo sui migliori LLM, ma cinque che molti tout sono GPT-4 da OpenAI, Claude 2 da Anthropic, Llama 2 da Meta, Orca 2 da Microsoft Research e Command da Cohere. ChatGPT è anche disponibile in OpenAI.
Qual è la differenza tra LLM e AI?
L'intelligenza artificiale è un termine generico che comprende molte tecnologie che possono imitare il comportamento o le capacità umane. I modelli di linguaggio di grandi dimensioni sono un tipo di AI generativa, il termine generico per i modelli AI che generano contenuti tra cui testo, immagini, video, linguaggio parlato e musica.