Mark Jackley | Content Strategist | 16 februari 2024
Een groot taalmodel (LLM) is een type kunstmatige intelligentie dat is ontworpen om vragen te beantwoorden in op menselijke taal lijkende, schriftelijke reacties en momenteel groeit in populariteit. LLM's worden getraind op grote hoeveelheden tekstgegevens en leren het volgende woord of een reeks van woorden te voorspellen op basis van de geboden context. Hierbij kunnen ze zelfs de schrijfstijl van een bepaalde auteur of genre nabootsen.
LLM's doken op uit labs en haalden het nieuws in het begin van de jaren 2020. Sindsdien zijn ze uitgegroeid tot zowel op zichzelf staande producten als ook functionaliteiten met toegevoegde waarde die zijn ingebed in vele soorten bedrijfssoftware. Dankzij hun indrukwekkende vermogen om vragen te interpreteren en nuttige reacties te genereren, worden LLM's gebruikt in een breed scala van toepassingen, zoals natuurlijke taalverwerking, machinevertaling, het genereren van content, chatbots en samenvatten van documenten.
Een groot taalmodel (Large Language Model, LLM) is een AI-systeem (Artificial Intelligence, kunstmatige intelligentie) dat is getraind met een enorme gegevensset, die vaak bestaat uit miljarden woorden die afkomstig zijn uit boeken, het internet en andere bronnen, om mensachtige, contextueel relevante antwoorden op vragen te genereren. Omdat LLM's zijn ontworpen om vragen (‘prompts’ in LLM-terminologie) te begrijpen en reacties in natuurlijke taal te genereren, kunnen ze taken uitvoeren zoals vragen van klanten beantwoorden, informatie in een rapport samenvatten, eerste concepten van e-mails genereren of zelfs poëzie en computercode schrijven. LLM's hebben meestal een diepgaand begrip van de grammatica en semantiek van de taal waarin ze zijn getraind en ze kunnen worden verfijnd met de eigen gegevens van een bedrijf.
Omdat ze menselijke taal kunnen herkennen en interpreteren (met de kanttekening dat ze die niet echt begrijpen zoals mensen dat doen) vertegenwoordigen LLM's een aanzienlijke vooruitgang in de natuurlijke taalverwerking. Het meest bekende LLM is waarschijnlijk ChatGPT, het AI-programma van OpenAI dat is getraind op miljarden woorden uit boeken, artikelen en websites. Het bedrijf biedt directe toegang tot ChatGPT via een webbrowser of mobiele app. Het kan ook aan bedrijfssoftware worden gekoppeld via programmeerbare API's. Andere veelgebruikte LLM's zijn Cohere, GPT-4 en BARD.
De tekstgegevens waarmee een LLM wordt getraind, kunnen gestructureerd zijn, zoals in een database, of ongestructureerd. De meeste bedrijven hebben enorme hoeveelheden ongestructureerde data, zoals tekstberichten, e-mails en documenten.
Populaire zakelijke toepassingen van LLM's zijn chatbots voor klantenservice, digitale assistenten en vertaalservices die contextueel, informeel en natuurlijker klinken dan de eerdere tools die woord-voor-woord vertalen. LLM's kunnen ook vrij geavanceerde taken uitvoeren, zoals eiwitstructuren voorspellen en softwarecode schrijven. Gezondheidszorg, farmaceutica, finance en retail behoren tot de branches waarin LLM's nuttige toepassingen vindt. Een zorgverlener kan bijvoorbeeld patiënten die een hotline bellen testen met behulp van een LLM. Of een investeringsmaatschappij kan een LLM gebruiken om kwartaalverslagen, nieuwsberichten en berichten op sociale media te doorzoeken en samen te vatten om trends in de beurstkoersen te ontdekken. LLM's kunnen organisaties helpen om hun gegevens te beheren en te analyseren, wat inzichten helpt verkrijgen die bedrijfswaarde kunnen creëren. En in beide scenario's voert de LLM de taak sneller uit dan welke menselijke analist dan ook.
Dat heeft geleid tot grote interesse in deze technologie, zozeer zelfs dat de wereldwijde markt voor LLM's naar verwachting zal groeien met een samengesteld jaarlijks groeipercentage van 21,4% tot USD 40,8 miljard in 2029, volgens een onderzoek uit 2023 van Valuates Reports.
Er zijn een aantal belangrijke concepten die u moet kennen wanneer u nadenkt over LLM's. Dit zijn onder andere:
Net als mensen zijn LLM's niet perfect. De kwaliteit van hun uitvoer hangt af van de kwaliteit van de invoer, dat wil zeggen de informatie waarmee ze worden getraind. Als de gegevens verouderd zijn, kan dat leiden tot fouten. Denk bijvoorbeeld aan een chatbot die een verkeerd antwoord geeft op een vraag over de producten van een bedrijf. Een gebrek aan voldoende gegevens kan ervoor zorgen dat LLM's antwoorden gaan verzinnen ofwel ‘hallucineren’. Hoewel LLM's geweldig zijn in voorspellingen, zijn ze voorlopig toch minder goed als het erop aankomt om uit te leggen hoe ze tot een bepaalde conclusie zijn gekomen. En veel LLM's worden getraind met boeken, krantenartikelen en zelfs Wikipedia-pagina's, wat leidt tot zorgen over inbreuk op het auteursrecht. Wanneer LLM's niet zorgvuldig worden beheerd, kunnen ze beveiligingsuitdagingen opleveren, door bijvoorbeeld gevoelige of privégegevens te gebruiken in een antwoord.
Een AI-techniek, Retrieval-Augmented Generation (RAG), kan helpen bij enkele van deze problemen door de nauwkeurigheid en relevantie van de uitvoer van een LLM te verbeteren. RAG biedt een manier om gerichte informatie toe te voegen zonder het onderliggende model te wijzigen. Met RAG-modellen worden kennisrepository's gemaakt, meestal op basis van de eigen gegevens van een organisatie, die voortdurend kunnen worden bijgewerkt om snelle, contextuele antwoorden te bieden. Chatbots en andere gesprekssystemen kunnen bijvoorbeeld met behulp van RAG ervoor zorgen dat hun antwoorden op vragen van klanten zijn gebaseerd op actuele informatie over voorraad, de voorkeuren van de koper en eerdere aankopen, en om informatie uit te sluiten die verouderd is of niet relevant is voor de beoogde operationele context van de LLM.
Een AI center of excellence opzetten voordat de organisatiespecifieke training begint, vergroot de kans op succes. Ons eBook geeft uitleg over het belang van een effectieve CoE en geeft advies over hoe u er een kunt opzetten.
Wat zijn de vijf belangrijkste grote taalmodellen?
Experts zijn het niet over eens wat de belangrijkste LLM's zijn, maar vijf die veel worden aangeprezen zijn GPT-4 van OpenAI, Claude 2 van Anthropic, Llama 2 van Meta, Orca 2 van Microsoft Research en Command van Cohere. ChatGPT is ook van OpenAI.
Wat is het verschil tussen LLM's en AI?
AI ofwel kunstmatige intelligentie is een brede term die veel technologieën omvat die menselijk gedrag of mogelijkheden kunnen nabootsen. LLM's zijn een soort generatieve AI, de overkoepelende term voor AI-modellen die content genereren zoals tekst, afbeeldingen, video, gesproken taal en muziek.