Qu'est-ce que l'IA générative ? Quel est son fonctionnement ?

Greg Pavlik | Vice-Président senior d'Oracle Cloud Infrastructure | 15 septembre 2023

L'intelligence artificielle générative est une forme relativement nouvelle d'IA qui, contrairement à ses prédécesseurs, peut créer de nouveaux contenus en extrapolant à partir de ses données d'entraînement. Son extraordinaire capacité à produire de l'écriture, des images, de l'audio et de la vidéo qui semblent créés par l'humain captive le monde entier depuis que le premier chatbot d'IA générative destiné aux consommateurs a été mis à la disposition du public à l'automne 2022. Un rapport réalisé par McKinsey & Company en juin 2023 a estimé que l'IA générative pourrait apporter tous les ans entre 6,1 et 7,9 billions USD à l'économie mondiale en augmentant la productivité des travailleurs. Pour replacer ces chiffres dans leur contexte, la même étude évalue le potentiel économique annuel de l'augmentation de la productivité grâce à toutes les technologies d'IA entre 17,1 et 25,6 billions USD. Donc, bien que l'IA générative occupe le devant de la scène durant cet été 2023, elle ne constitue qu'une petite de l'IA

Mais toute action a une réaction égale et opposée. Ainsi, avec ses perspectives de productivité remarquables, l'IA générative apporte de nouveaux risques commerciaux potentiels, tels que l'inexactitude, les violations de la vie privée et l'exposition à la propriété intellectuelle, ainsi que la capacité de perturbation économique et sociétale à grande échelle. Par exemple, il est peu probable que les avantages de l'IA générative en termes de productivité se concrétisent sans d'importants efforts de requalification des travailleurs et, même dans ce cas, il ne fait aucun doute qu'un grand nombre d'entre eux perdront leur emploi actuel. Par conséquent, les décideurs gouvernementaux du monde entier, et même certains dirigeants de l'industrie de la technologie, préconisent l'adoption rapide de réglementations en matière d'IA.

Cet article explore en profondeur la promesse et les risques de l'IA générative : son fonctionnement ; ses applications les plus immédiates, ses cas d'utilisation et ses exemples ; ses limites ; ses avantages et risques commerciaux potentiels ; les bonnes pratiques à adopter ; et un aperçu de son avenir.

Qu'est-ce que l'IA générative ?

L'IA générative (GAI) est le nom donné à un sous-ensemble de technologies de machine learning qui ont récemment développé la capacité de créer rapidement du contenu en réponse à des invites de texte, qui peuvent être aussi bien court et simple que très long et complexe. Différents outils d'IA générative peuvent produire de nouveaux contenus audio, image et vidéo, mais c'est l'IA conversationnelle orientée texte qui a enflammé l'imagination. En effet, les gens peuvent converser avec des modèles d'IA générative entraînés par texte et en tirer des enseignements, à peu près de la même manière qu'avec les humains.

L'IA générative a pris le monde de vitesse dans les mois qui ont suivi la sortie de ChatGPT, un chatbot basé sur le modèle de réseau neuronal GPT-3.5 d'OpenAI, le 30 novembre 2022. GPT signifie transformateur génératif préentraîné, mots qui décrivent principalement l'architecture sous-jacente du réseau neuronal du modèle.

Il existe de nombreux cas antérieurs de chatbots conversationnels, à commencer par ELIZA, du Massachusetts Institute of Technology au milieu des années 1960. Mais la plupart des chatbots précédents, y compris ELIZA, étaient entièrement ou en grande partie basés sur des règles, de sorte qu'ils manquaient de compréhension contextuelle. Leurs réponses étaient limitées à un ensemble de règles et de modèles prédéfinis. En revanche, les modèles d'IA générative émergents n'ont désormais pas de règles ou de modèles prédéfinis de ce type. Métaphoriquement parlant, ce sont des cerveaux primitifs vierges (réseaux neuronaux) qui sont exposés au monde via un entraînement sur les données du monde réel. Ils développent ensuite indépendamment de l'intelligence, un modèle représentatif du fonctionnement de ce monde, qu'ils utilisent pour générer un nouveau contenu en réponse aux invites. Même les experts en IA ne savent pas exactement comment ils font car les algorithmes sont auto-développés et ajustés au fur et à mesure que le système s'entraîne.

Les petites et grandes entreprises devraient se réjouir du potentiel de l'IA générative à apporter les avantages de l'automatisation technologique au travail intellectuel, qui jusqu'à présent a largement résisté à l'automatisation. Les outils d'IA générative modifient le calcul de l'automatisation du travail intellectuel. Leur capacité à produire de l'écriture, des images, de l'audio ou de la vidéo semblables aux créations humaines en réponse à des textes courts en anglais signifie qu'ils peuvent collaborer avec des partenaires humains pour générer du contenu qui constitue un travail pratique.

« Au cours des prochaines années, de nombreuses entreprises vont former leurs propres grands modèles de langage spécialisés », a déclaré Larry Ellison, Président et Directeur de la technologie d'Oracle, lors de l'annonce des résultats de la société en juin 2023.

IA générative ou IA

L'intelligence artificielle constitue un vaste domaine de l'informatique, dont l'IA générative est une petite partie, du moins à l'heure actuelle. L'IA générative partage bien entendu de nombreux attributs en commun avec l'IA traditionnelle. Mais il y a aussi quelques distinctions.

  • Attributs communs : Elles dépendent toutes les deux de grandes quantités de données pour l'entraînement et la prise de décision (bien que les données d'entraînement pour l'IA générative puissent être des ordres de grandeur plus volumineuses). Elles apprennent toutes les deux des modèles à partir des données et utilisent cette connaissance pour faire des prédictions et adapter leur propre comportement. Elles peuvent optionnellement être améliorées au fil du temps en ajustant leurs paramètres en fonction de retours ou de nouvelles informations.
  • Différences : les systèmes d'IA traditionnels sont généralement conçus pour effectuer une tâche spécifique mieux ou à moindre coût qu'un humain, comme la détection des fraudes par carte de crédit, la recherche d'itinéraires ou, probablement bientôt, la conduite d'une voiture. L'IA générative est plus large ; elle crée un contenu nouveau et original qui ressemble à ce qu'on peut trouver dans ses données d'entraînement, mais qui ne sont pas semblables. En outre, les systèmes d'IA traditionnels, tels que les systèmes de machine learning, sont principalement entraînés sur des données spécifiques à leur fonction, tandis que les modèles d'IA générative sont entraînés sur des ensembles de données volumineux et divers (et, parfois, affinés sur des volumes de données beaucoup plus petits liés à une fonction spécifique). Enfin, l'IA traditionnelle est presque toujours entraînée sur des données étiquetées/catégorisées à l'aide de techniques d'apprentissage supervisé, tandis que l'IA générative doit toujours être entraînée, du moins au début, à l'aide d'un apprentissage non supervisé (où les données ne sont pas étiquetées et où le logiciel d'IA ne reçoit pas d'indications explicites).

Une autre différence à noter est le « coût exorbitant » de l'entraînement des modèles fondamentaux pour l'IA générative, pour reprendre les propos d'un chercheur en IA. Par exemple, 100 millions de dollars sont nécessaires au seul hardware destiné à la mise en route, ainsi que pour les coûts équivalents des services cloud, puisque c'est là que se fait la majeure partie du développement de l'IA. À cela s'ajoute le coût des volumes de données monumentaux requis.

Points à retenir

  • L'IA générative est devenue une attraction virale en novembre 2022 et devrait bientôt ajouter des milliards de dollars à l'économie mondiale, annuellement.
  • L'IA est une forme de machine learning basé sur un réseau neuronal formé sur de vastes ensembles de données qui peuvent créer du texte, des images, des vidéos ou du contenu audio nouveaux en réponse aux messages en langage naturel des utilisateurs.
  • Les chercheurs du marché prévoient que la technologie donnera un coup de pouce économique en accélérant considérablement la croissance de la productivité pour les travailleurs du savoir, dont les tâches ont résisté à l'automatisation auparavant.
  • L'IA générative comporte des risques et des limites que les entreprises doivent atténuer, tels que « l'hallucination » des informations incorrectes ou fausses et la violation involontaire des droits d'auteur.
  • Elle devrait également entraîner des changements importants dans la nature du travail, y compris d'éventuelles pertes d'emplois et une restructuration des rôles.

Explication de l'IA générative

Pour les petites et grandes entreprises, l'IA générative semble tenir la promesse magique d'apporter des avantages en termes d'automatisation technologique du travail intellectuel. Ou, comme l'a dit un rapport McKinsey, « des activités impliquant la prise de décision et la collaboration, qui avaient auparavant le plus faible potentiel d'automatisation ».

La technologie a toujours été plus efficace pour automatiser des tâches routinières ou répétitives pour lesquelles les décisions étaient déjà connues ou pouvaient être déterminées avec un haut niveau de confiance basé sur des règles spécifiques et bien comprises. Pensez à la fabrication, avec sa répétition précise de la chaîne de montage, ou comptabilité, avec ses principes réglementés fixés par les associations professionnelles. Mais l'IA générative a le potentiel de faire un travail cognitif beaucoup plus complexe. Pour proposer un exemple extrême, l'IA générative pourrait participer à la stratégie d'une entreprise en répondant à des demandes d'idées et de scénarios alternatifs à ceux des responsables d'une entreprise dont le secteur est en pleine perturbation.

Dans son rapport, McKinsey a évalué 63 cas d'utilisation dans 16 fonctions métier. Il conclut que 75 % des milliers de milliards USD qui pourraient être potentiellement générés à partir de l'IA générative proviendront d'un sous-ensemble de cas d'utilisation dans seulement quatre de ces fonctions : opérations client, marketing et ventes, ingénierie logicielle et recherche et développement. Les perspectives d'augmentation des revenus dans tous les secteurs ont été plus uniformément réparties, bien qu'il y ait eu des exceptions : la haute technologie se hisse en tête de liste en termes de hausse possible pour ce qui est de l'augmentation possible en pourcentage des recettes du secteur, suivi du secteur bancaire, des produits pharmaceutiques et médicaux, de l'éducation, des télécommunications et des soins de santé.

Par ailleurs, une analyse de Gartner a corroboré les prévisions de McKinsey : par exemple, plus de 30 % des nouveaux médicaments et matériaux seront découverts à l'aide de techniques d'IA générative d'ici 2025, contre zéro aujourd'hui, et 30 % des messages marketing sortants de grandes entreprises seront, de même, générés synthétiquement en 2025, contre 2 % en 2022. Dans une enquête en ligne de Gartner auprès de 2 500 dirigeants, l'expérience client et la fidélisation étaient les réponses principalement citées (à 38 %) concernant là où les entreprises investissaient dans l'IA générative.

La rapidité avec laquelle tout cela arrive s'explique par le fait que, contrairement à l'IA traditionnelle, qui automatise discrètement et ajoute de la valeur aux processus commerciaux depuis des dizaines d'années, l'IA générative a enflammé tous les esprits grâce au talent conversationnel humain de ChatGPT. Cela a également permis de mettre en lumière les technologies d'IA qui se concentrent sur d'autres modalités ; tout le monde semble expérimenter l'écriture de textes ou la création de musique, d'images et de vidéos à l'aide d'un ou de plusieurs modèles spécialisés dans chaque domaine. Ainsi, avec de nombreuses entreprises qui expérimentent déjà l'IA générative, son impact sur les entreprises et la société est susceptible d'être colossal, et se produira incroyablement rapidement.

L'inconvénient évident est que le travail intellectuel va changer. Les rôles individuels changeront, parfois de manière significative, de sorte que les salariés devront acquérir de nouvelles compétences. Certains emplois n'existeront plus. Cependant, les grands changements technologiques, tels que l'IA générative, ont traditionnellement toujours ajouté plus d'emplois (et de plus grande valeur) à l'économie qu'ils n'en éliminaient. Bien que cela ne console guère ceux dont les postes n'existeront plus.

Comment fonctionne l'IA générative ?

Il y a deux réponses à la question du fonctionnement des modèles d'IA générative. Empiriquement, nous savons comment ils fonctionnent en détail parce que les humains ont conçu leurs différentes implémentations de réseau neuronal pour faire exactement ce qu'ils font, itérant ces conceptions pendant des années pour les rendre plus performants. Les développeurs d'IA savent exactement comment les neurones sont connectés ; ils ont conçu le processus d'entraînement de chaque modèle. Pourtant, dans la pratique, personne ne sait exactement comment les modèles d'IA générative font ce qu'ils font : c'est l'embarassante vérité.

« Nous ne savons pas comment ils effectuent la partie créative parce que ce qui se passe à l'intérieur des couches du réseau neuronal est beaucoup trop complexe pour nous à déchiffrer, du moins aujourd'hui », explique Dean Thompson, ancien Directeur de la technologie de plusieurs startups d'IA qui ont été acquises au fil des ans par des entreprises, dont LinkedIn et Yelp, où il reste en tant qu'ingénieur logiciel senior travaillant sur de grands modèles de langage (LLM). La capacité de l'IA générative à produire de nouveaux contenus originaux semble être une propriété émergente de ce qui est connu, c'est-à-dire sa structure et son entraînement. Bien qu'il y ait beaucoup à expliquer vis-à-vis de ce que nous savons, ce qu'un modèle comme GPT-3.5 fait en interne , ou ce qu'il pense, pour le dire autrement, n'a pas encore été compris. Certains chercheurs en IA sont convaincus qu'on aura cette connaissance dans les 5 à 10 prochaines années ; d'autres ne sont pas certains de notre capacité à en atteindre une compréhension totale.

Voici un aperçu de ce que nous savons sur le fonctionnement de l'IA générative :

  • Commençons par le cerveau. Le cerveau humain est un bon point de départ pour comprendre les modèles d'IA générative, fait remarquer Jeff Hawkins dans son livre de 2004, « On Intelligence ». Hawkins, un informaticien, un scientifique du cerveau et un entrepreneur, a présenté son travail lors d'une session de 2005 au PC Forum, une conférence annuelle de dirigeants de la technologie dirigée par l'investisseur technologique Esther Dyson. Hawkins a émis l'hypothèse qu'au niveau des neurones, le cerveau fonctionne en prédisant continuellement ce qui va se passer, puis en apprenant les différences entre ses prédictions et la réalité subséquente. Pour améliorer sa capacité prédictive, le cerveau construit une représentation interne du monde. Dans sa théorie, l'intelligence humaine émerge de ce processus. Qu'elle soit influencée ou non par Hawkins, l'IA générative fonctionne exactement de cette façon. Et, étonnamment, elle agit comme si elle était intelligente.

  • Construire un réseau de neurones artificiels. Tous les modèles d'IA générative commencent par un réseau neuronal artificiel codé dans un logiciel. Pour se représenter un réseau neuronal, Thompson propose d'imaginer une feuille de calcul classique, mais en trois dimensions. En effet, les neurones artificiels sont empilés en couches, comme les vrais neurones dans le cerveau. Les chercheurs en IA appellent même chaque neurone une cellule, note Thompson, et chaque cellule contient une formule la reliant à d'autres cellules du réseau, imitant la façon dont les connexions entre les neurones du cerveau ont des forces différentes.

    Chaque couche peut avoir des dizaines, des centaines ou des milliers de neurones artificiels, mais le nombre de neurones n'est pas ce sur quoi les chercheurs en IA se concentrent. Au lieu de cela, ils mesurent les modèles par le nombre de connexions entre les neurones. Les forces de ces connexions varient en fonction des coefficients de leurs équations cellulaires, qui sont plus généralement appelés poids ou paramètres. Ces coefficients définissant les connexions sont ce à quoi on fait référence lorsque l'on lit, par exemple, que le modèle GPT-3 a 175 milliards de paramètres. La dernière version, GPT-4, aurait des milliards de paramètres, bien que cela ne soit pas confirmé. Il existe une poignée d'architectures de réseau neuronal avec des caractéristiques différentes qui se prêtent à produire du contenu dans une modalité particulière ; l'architecture du transformateur semble être la meilleure pour les grands modèles de langage, par exemple.

  • Enseigner le tout nouveau modèle de réseau neuronal. Les grands modèles de langage reçoivent d'énormes volumes de texte à traiter et sont chargés de faire des prédictions simples, telles que le mot suivant dans une séquence ou l'ordre correct d'un ensemble de phrases. En pratique, cependant, les modèles de réseau neuronal fonctionnent en unités appelées jetons (tokens), et non en mots.

    « Un mot commun peut avoir son propre jeton, des mots inhabituels seraient certainement constitués de plusieurs jetons, et certains jetons peuvent être juste un espace unique suivi de 'th' parce que cette séquence de trois caractères est courante », déclare Thompson. Pour effectuer chaque prédiction, le modèle entre un jeton au niveau de la couche inférieure d'une pile particulière de neurones artificiels ; cette couche le traite et transmet sa sortie à la couche suivante, qui traite et transmet sa sortie, et ainsi de suite jusqu'à ce que la sortie finale émerge du haut de la pile. Les tailles de pile peuvent varier considérablement, mais elles sont généralement de l'ordre de dizaines de couches, pas de milliers ou de millions.

    Au début de l'entraînement, les prédictions du modèle ne sont pas très bonnes. Mais chaque fois que le modèle prédit un jeton, il vérifie l'exactitude par rapport aux données d'entraînement. Qu'il soit bon ou mauvais, un algorithme de rétropropagation ajuste les paramètres, c'est-à-dire les coefficients des formules, dans chaque cellule de la pile qui a fait cette prédiction. L'objectif des ajustements est de rendre la prédiction correcte plus probable.

    « Il le fait aussi pour les bonnes réponses, parce que cette bonne prédiction n'a peut-être eu qu'une certitude de 30 %, mais ce pourcentage était le plus élevé de toutes les autres réponses possibles », explique Thompson. Donc, la rétropropagation cherche à transformer ces 30 % en 30,001 %, ou quelque chose comme ça.

    Une fois que le modèle a répété ce processus pour des milliards de jetons de texte, il devient très bon pour prédire le jeton ou mot suivant. Après la formation initiale, les modèles d'IA générative peuvent être affinés via une technique d'apprentissage supervisée, telle que l'apprentissage par renforcement à partir des retours humaines (RLHF). Dans RLHF, le résultat du modèle est donné aux évaluateurs humains qui effectuent une évaluation binaire positive ou négative (pouces vers le haut ou vers le bas) qui est renvoyée au modèle. Le RLHF a été utilisé pour affiner le modèle GPT 3.5 d'OpenAI afin de créer le chatbot ChatGPT devenu viral.

  • Mais comment le modèle a-t-il répondu à ma question ? C'est un mystère. Voici comment Thompson explique l'état actuel de la compréhension : « Il y a un grand point d'interrogation au milieu de mon explication. Ce que nous savons, c'est qu'il prend toute votre question comme une séquence de jetons, et la première couche traite tous ces éléments simultanément. Et nous savons qu'il traite ensuite les sorties de cette première couche dans la couche suivante, et ainsi de suite jusqu'à la pile. Enfin, nous savons qu'il utilise cette couche supérieure pour prédire, c'est-à-dire produire un premier jeton, et que le premier jeton est représenté comme une donnée dans tout ce système pour produire le jeton suivant, et ainsi de suite.

    La question logique attendue est la suivante : à quoi a-t-il pensé, et comment, dans tout ce traitement ? Qu'ont fait toutes ces couches ? Et la réponse est que nous ne savons pas. Nous ... ne ... savons ... pas. Vous pouvez l'étudier. Vous pouvez l'observer. Mais sa complexité dépasse notre capacité à analyser. C'est comme l'IRM-F [imagerie par résonance magnétique fonctionnelle] sur le cerveau des gens. Il s'agit de l'esquisse la plus grossière de ce que le modèle a réellement fait. Nous ne savons pas. »

    Bien qu'il soit controversé, un groupe de plus d'une douzaine de chercheurs qui avaient un accès précoce au GPT-4 à l'automne 2022 a conclu que l'intelligence avec laquelle le modèle répond aux défis complexes qu'ils lui posaient, et le large éventail d'expertise qu'il présente, indique que le GPT-4 a atteint une forme d'intelligence générale. En d'autres termes, il a construit un modèle interne de la façon dont le monde fonctionne, tout comme un cerveau humain pourrait, et il utilise ce modèle pour raisonner à travers les questions qui lui sont posées. L'un des chercheurs a déclaré au podcast « This American Life »qu'il avait vécu une expérience incroyable quand il a demandé à GPT-4 :" Donnez-moi une recette de biscuits aux pépites de chocolat, mais écrite dans le style d'une personne très déprimée», et que le modèle a répondu :« Ingrédients : 1 tasse de beurre adouci, si vous pouvez même trouver l'énergie pour l'adoucir. 1 cuillère à café d'extrait de vanille, la fausse saveur artificielle du bonheur. 1 tasse de pépites de chocolat semi-sucré, de minuscules petites joies qui finiront par fondre. »

Pourquoi l'IA générative est-elle importante ?

Pour comprendre l'importance de l'IA générative, vous pouvez l'imaginer comme une calculatrice de contenu créatif ouvert. De même qu'une calculatrice automatise les opérations mathématiques routinières et banales, permettant à une personne de se concentrer sur des tâches de plus haut niveau, l'IA générative a le potentiel d'automatiser les sous-tâches plus routinières et banales qui constituent une grande partie du travail intellectuel, permettant aux personnes de se concentrer sur les aspects les plus importants de leur travail.

Tenez compte des défis auxquels sont confrontés les professionnels du marketing pour obtenir des informations exploitables à partir des données non structurées, incohérentes et déconnectées auxquelles ils sont souvent confrontés. Traditionnellement, ils auraient besoin de consolider ces données comme une première étape, ce qui nécessite un peu d'ingénierie logicielle personnalisée pour donner une structure commune à des sources de données disparates, telles que les médias sociaux, les actualités et les retours des clients.

« Mais avec les LLM, vous pouvez simplement alimenter des informations provenant de différentes sources directement dans l'invite, puis demander des informations clés, ou quels sont les retours à prioriser, ou encore demander une analyse des sentiments, et cela fonctionnera, tout simplement » explique Basim Baig, Directeur de l'ingénierie spécialisé dans l'IA et la sécurité chez Duolingo. « La puissance du LLM ici est qu'il vous permet de passer cette étape massive et coûteuse qu'est l'ingénierie. »

En pensant plus loin, Thompson suggère que les spécialistes du marketing de produits pourraient utiliser des LLM pour étiqueter du texte en format libre à des fins d'analyse. Par exemple, imaginez que vous avez une énorme base de données de mentions de votre produit sur les médias sociaux. Vous pouvez écrire des logiciels qui appliquent un LLM et d'autres technologies pour :

  • Extraire les principaux thèmes de chaque publication sur les médias sociaux.
  • Regrouper les thèmes idiosyncrasiques qui proviennent de publications individuelles en thèmes récurrents.
  • Identifier les publications qui prennent en charge chaque thème récurrent.

Vous pouvez ensuite appliquer les résultats aux éléments suivants :

  • Étudier les thèmes récurrents les plus fréquents, en cliquant sur des exemples.
  • Suivre l'évolution des thèmes récurrents.
  • Demander à un LLM d'approfondir un thème récurrent pour des mentions récurrentes de caractéristiques de produits.

Modèles d'IA générative

L'IA générative représente une large catégorie d'applications basées sur un pool de plus en plus riche de variations du réseau neuronal. Bien que toutes les IA génératives correspondent à la description générale de la section « Comment fonctionne l'IA générative ? », les techniques d'implémentation varient pour prendre en charge différents médias, tels que les images par rapport au texte, et pour intégrer les progrès de la recherche et de l'industrie au fur et à mesure qu'ils se présentent.

Les modèles de réseau neuronal utilisent des modèles répétitifs de neurones artificiels et leurs interconnexions. Une conception de réseau neuronal, pour toute application, y compris l'IA générative, répète souvent le même schéma de neurones des centaines ou des milliers de fois, généralement en réutilisant les mêmes paramètres. C'est une partie essentielle de ce qu'on appelle une architecture de réseau neuronal. La découverte de nouvelles architectures est un domaine important de l'innovation en IA depuis les années 1980, souvent motivé par l'objectif de prendre en charge un nouveau support. Une fois qu'une nouvelle architecture a été inventée, de nouveaux progrès sont souvent réalisés en l'utilisant de manière inattendue. L'innovation supplémentaire provient de la combinaison d'éléments de différentes architectures.

Les deux architectures les plus anciennes et les plus courantes sont les suivantes :

  • Les réseaux neuronaux récurrents (RNN) ont émergé au milieu des années 1980 et sont toujours utilisés. Les RNN ont démontré comment l'IA pouvait apprendre et être utilisée pour automatiser des tâches qui dépendent de données séquentielles, c'est-à-dire des informations dont la séquence contient du sens, telles que la langue, le comportement du marché boursier et les flux de clics Web. Les RNN sont au cœur de nombreux modèles d'IA audio, tels que les applications génératrices de musique ; pensez à la nature séquentielle de la musique et aux dépendances temporelles. Mais ils sont également doués pour le traitement du langage naturel (NLP). Les RNN sont également utilisés dans les fonctions d'IA traditionnelles, telles que la reconnaissance vocale, l'analyse de l'écriture manuscrite, les prévisions financières et météorologiques, et pour prédire les variations de la demande énergétique parmi de nombreuses autres applications.
  • Les réseaux neuronaux convolutifs (CNN) sont arrivés environ 10 ans plus tard. Ils se concentrent sur les données de type grille et sont donc excellents dans les représentations de données spatiales et peuvent générer des images. Les applications d'IA générative de texte à image populaires, telles que Midjourney et DALL-E, utilisent les réseaux CNN pour générer l'image finale.

Bien que les RNN soient encore fréquemment utilisés, les efforts successifs visant à améliorer les RNN ont mené à une percée :

  • Les modèles de transformateur sont devenus un moyen beaucoup plus flexible et puissant de représenter des séquences que les RNN. Ils ont plusieurs caractéristiques qui leur permettent de traiter des données séquentielles, telles que le texte, de manière massivement parallèle sans perdre leur compréhension des séquences. Ce traitement parallèle des données séquentielles fait partie des caractéristiques clés qui permettent à ChatGPT de répondre si rapidement et si efficacement à des messages conversationnels simples.

La recherche, l'industrie privée et les efforts open source ont créé des modèles percutants qui innovent à des niveaux plus élevés d'architecture et d'application de réseaux neuronaux. Par exemple, il y a eu des innovations cruciales dans le processus d'entraînement, dans la façon dont les retours sur l'entraînement sont incorporés pour améliorer le modèle, et dans la façon dont plusieurs modèles peuvent être combinés dans des applications d'IA générative. Voici un aperçu de certaines des innovations les plus importantes du modèle d'IA générative :

  • Les auto-encodeurs variationnels (VAE) utilisent des innovations dans l'architecture de réseau neuronal et les processus d'entraînement et sont souvent intégrés dans des applications de génération d'images. Ils sont constitués de réseaux de codeurs et de décodeurs, chacun pouvant utiliser une architecture sous-jacente différente, telle que RNN, CNN ou transformateur. Le codeur apprend les caractéristiques importantes d'une image, compresse ces informations et les stocke en tant que représentation en mémoire. Le décodeur utilise ensuite ces informations compressées pour tenter de recréer l'original. En fin de compte, le VAE apprend à générer de nouvelles images similaires à ses données d'entraînement.
  • Les réseaux antagonistes génératifs (GAN) sont utilisés selon diverses modalités, mais semblent avoir une affinité particulière pour les applications vidéo et autres applications liées aux images. Ce qui distingue les GAN des autres modèles, c'est qu'ils se composent de deux filets neuronaux qui rivalisent l'un contre l'autre pendant leur entraînement. Dans le cas d'images, par exemple, le « générateur » crée une image et le « discriminateur » décide si l'image est réelle ou générée. Le générateur essaie constamment de tromper le discriminateur, qui essaie toujours de prendre le générateur sur le fait. Dans la plupart des cas, les deux réseaux neuronaux concurrents sont basés sur des architectures CNN, mais peuvent également être des variantes de RNN ou de transformateurs.
  • Les modèles de diffusion intègrent plusieurs réseaux neuronaux dans un cadre global, intégrant parfois différentes architectures telles que les CNN, les transformateurs et les VAE. Les modèles de diffusion apprennent en compressant les données, en y ajoutant et en retirant du bruit, et en essayant de régénérer l'original. L'outil populaire Stable Diffusion utilise respectivement un codeur et un décodeur VAE pour la première et la dernière étape, et deux variations CNN dans les étapes de bruit/suppression de bruit.

Quelles sont les applications de l'IA générative ?

Alors que le monde ne fait que commencer à effleurer la surface des utilisations potentielles de l'IA générative, il est facile de voir comment les entreprises peuvent en bénéficier en l'appliquant à leurs opérations. Imaginez comment l'IA générative pourrait changer les domaines clés des interactions avec les clients, des ventes et du marketing, de l'ingénierie logicielle et de la recherche et développement.

Dans le service client, la technologie d'IA précédente a automatisé les processus et introduit le libre-service client, mais elle a également provoqué de nouvelles frustrations chez les clients. L'IA générative promet de fournir des avantages aux clients et aux représentants du service client, avec des chatbots qui peuvent être adaptés à différentes langues et régions, créant ainsi une expérience client plus personnalisée et accessible. Lorsque des interventions humaines sont nécessaires pour résoudre le problème d'un client, les commerciaux du service client peuvent collaborer en temps réel avec des outils d'IA générative pour trouver des stratégies exploitables, améliorant ainsi la rapidité et la précision des interactions. La rapidité avec laquelle l'IA générative peut puiser dans toute la base de connaissances d'une grande entreprise et synthétiser de nouvelles solutions aux plaintes des clients donne au personnel de service une capacité accrue à résoudre efficacement les problèmes spécifiques des clients, plutôt que de compter sur des chaînes téléphoniques obsolètes et des transferts d'appels jusqu'à ce qu'une réponse soit trouvée, ou que le client perde patience.

En marketing, l'IA générative peut automatiser l'intégration et l'analyse de données provenant de sources disparates, ce qui devrait accélérer considérablement le délai d'obtention des informations et conduire directement à une prise de décision plus éclairée et à un développement plus rapide des stratégies de commercialisation. Les professionnels du marketing peuvent utiliser ces informations aux côtés d'autres informations générées par l'IA pour élaborer de nouvelles campagnes publicitaires plus ciblées. Cela réduit le temps que le personnel doit consacrer à la collecte de données démographiques et à l'achat de données de comportement et leur donne plus de temps pour analyser les résultats et réfléchir à de nouvelles idées.

Tom Stein, Président et Chef de la marque de l'agence de marketing B2B de Stein IAS, rapporte que chaque agence de marketing, y compris la sienne, explore de telles opportunités à grande vitesse. Cependant, Stein remarque qu'il existe également des gains plus simples et plus rapides pour les processus back-end d'une agence.

« Si nous recevons une demande d'information, généralement, 70 % à 80 % d'entre elles auront les mêmes requêtes que toutes les autres demandes d'information, peut-être avec des différences contextuelles spécifiques à la situation de cette entreprise », explique Stein, qui a également été président du jury des Cannes Lions Creative B2B Awards 2023. « Ce n'est pas si compliqué de se positionner pour qu'un certain nombre d'outils d'IA fassent ce travail pour nous... Donc, si nous récupérons 80 % de notre temps, et que nous pouvons le consacrer à ajouter de la valeur à la demande d'information et à la rendre tout simplement plus attrayante, c'est une victoire sur toute la ligne. Et il y a un certain nombre de processus comme ça. »

Les développeurs de logiciels qui collaborent avec l'IA générative peuvent rationaliser et accélérer les processus à chaque étape, de la planification à la maintenance. Au cours de la phase de création initiale, les outils d'IA générative peuvent analyser et organiser de grandes quantités de données et suggérer plusieurs configurations de programme. Une fois le codage lancé, l'IA peut tester et dépanner le code, identifier les erreurs, exécuter des diagnostics et proposer des correctifs, avant et après le lancement. Thompson note que, comme de nombreux projets logiciels d'entreprise intègrent plusieurs langages et disciplines de programmation, lui et d'autres ingénieurs logiciels ont utilisé l'IA pour se former dans des domaines inconnus beaucoup plus rapidement qu'ils ne le pouvaient auparavant. Il utilise également des outils d'IA générative pour expliquer un code inconnu et identifier des problèmes spécifiques.

En R&D, l'IA générative peut augmenter la vitesse et la profondeur des études de marché pendant les phases initiales de la conception du produit. Ensuite, les programmes d'IA, en particulier ceux dotés de capacités de génération d'images, peuvent créer des conceptions détaillées de produits potentiels avant de les simuler et de les tester, donnant aux collaborateurs les outils dont ils ont besoin pour effectuer des ajustements rapides et efficaces tout au long du cycle de R&D.

Le fondateur d'Oracle, Larry Ellison, a souligné lors de l'annonce des résultats de juin que « les LLM spécialisés accéléreront la découverte de nouveaux médicaments vitaux ». La découverte de médicaments est une application de R&D qui exploite la tendance des modèles génératifs à halluciner des informations incorrectes ou non vérifiables, mais dans le bon sens du terme : l'identification de nouvelles molécules et séquences de protéines à l'appui de la recherche de nouveaux traitements de santé. Par ailleurs, la filiale d'Oracle Cerner Enviza s'est associée à la Food and Drug Administration (FDA) des États-Unis et à John Snow Labs pour appliquer des outils d'IA au défi de « comprendre les effets des médicaments sur de larges catégories de population ». La stratégie d'IA d'Oracle consiste à rendre l'intelligence artificielle omniprésente dans ses applications cloud et son infrastructure cloud.

Cas d'utilisation de l'IA générative

L'IA générative a le potentiel considérable d'accélérer ou d'automatiser entièrement un ensemble diversifié de tâches. Les entreprises devraient prévoir des moyens délibérés et spécifiques pour maximiser les avantages qu'elles peuvent apporter à leurs opérations. Voici quelques cas d'utilisation spécifiques :

  • Réduire les lacunes en matière de connaissances : grâce à ses interfaces utilisateur directes basées sur les discussions, les outils d'IA générative peuvent répondre aux questions générales ou spécifiques des collaborateurs pour les orienter dans la bonne direction lorsqu'ils restent coincés sur des questions, des plus simples aux opérations complexes. Les commerciaux, par exemple, peuvent demander des informations sur un compte ciblé ; les codeurs peuvent apprendre de nouveaux langages de programmation.
  • Vérifier les erreurs : les outils d'IA générative peuvent rechercher des erreurs dans n'importe quel texte, des courriels informels aux exemples de textes professionnels. Ils peuvent aussi faire plus que corriger les erreurs : ils peuvent expliquer le pourquoi et le comment pour aider les utilisateurs à apprendre et à améliorer leur travail.
  • Améliorer la communication : les outils d'IA générative peuvent traduire du texte dans différentes langues, modifier le ton, créer des messages uniques basés sur différents ensembles de données, etc. Les équipes marketing peuvent utiliser des outils d'IA générative pour élaborer des campagnes publicitaires plus pertinentes, tandis que le personnel interne peut l'utiliser pour effectuer des recherches dans les communications précédentes et trouver rapidement des informations et des réponses pertinentes aux questions sans interrompre les autres collaborateurs. Thompson croit que cette capacité à synthétiser les connaissances institutionnelles sur toute question ou idée qu'un collaborateur peut avoir modifiera fondamentalement la façon dont les gens communiquent au sein de grandes entreprises, ce qui stimulera la découverte des connaissances.
  • Alléger la charge administrative : les entreprises aux tâches administratives lourdes, telles que le codage médical/la facturation, peuvent utiliser l'IA générative pour automatiser des tâches complexes, notamment le dépôt approprié de documents et l'analyse des notes des médecins. Cela permet au personnel de se concentrer davantage sur le travail pratique, comme les soins aux patients ou le service client.
  • Analyser des images médicales à la recherche d'anomalies : les médecins peuvent utiliser l'IA générative pour scanner les dossiers médicaux et les images afin de signaler les problèmes notables et de recommander des médicaments aux médecins, y compris les effets secondaires potentiels contextualisés avec les antécédents des patients.
  • Résoudre des problèmes de code : les ingénieurs logiciels peuvent utiliser des modèles d'IA générative pour dépanner et affiner leur code plus rapidement et de manière plus fiable qu'en le passant au peigne fin, ligne par ligne. Ils peuvent ensuite demander à l'outil des explications plus approfondies pour éclairer le codage futur et améliorer leurs processus.

Avantages de l'IA générative

Les avantages que l'IA générative peut apporter à une entreprise proviennent principalement de trois attributs principaux : la synthèse des connaissances, la collaboration homme-IA et la vitesse. Bien que bon nombre des avantages mentionnés ci-dessous soient similaires à ceux promis par le passé par les modèles d'IA et les outils d'automatisation antérieurs, la présence d'un ou plusieurs de ces trois attributs peut aider les entreprises à réaliser les avantages plus rapidement, plus facilement et plus efficacement.

Grâce à l'IA générative, les entreprises peuvent créer des modèles personnalisés formés sur leurs propres connaissances institutionnelles et propriété intellectuelle, après quoi les travailleurs du savoir peuvent demander au logiciel de collaborer sur une tâche dans le même langage que celui qu'ils utiliserait avec un collègue. Un tel modèle d'IA générative spécialisée peut répondre en synthétisant les informations de l'ensemble de la base de connaissances de l'entreprise avec une vitesse étonnante. Non seulement cette approche réduit ou élimine le besoin d'une expertise en ingénierie logicielle complexe, et souvent moins efficace et plus coûteuse, pour créer des programmes spécifiques pour ces tâches, mais elle est également susceptible de faire ressortir des idées et des connexions que les approches antérieures ne pouvaient pas faire.

  • Productivité accrue : les travailleurs du savoir peuvent utiliser l'IA générative pour réduire leur temps passé à effectuer des tâches quotidiennes courantes, telles que se former à une nouvelle discipline soudainement nécessaire à un projet à venir, organiser ou catégoriser des données, tester Internet pour des recherches applicables ou rédiger des e-mails. En tirant parti de l'IA générative, un nombre réduit de collaborateurs peut accomplir des tâches qui nécessitaient auparavant de grandes équipes, et en beaucoup moins de temps. Une équipe de programmeurs, par exemple, pouvait passer des heures à parcourir le code défectueux pour résoudre ce qui s'est passé, mais un outil d'IA générative peut être en mesure de trouver les erreurs en quelques instants et de les signaler en suggérant des corrections. Étant donné que certains modèles d'IA générative possèdent des compétences qui sont à peu près moyennes ou meilleures dans un large éventail de compétences professionnelles, la collaboration avec un système d'IA générative peut considérablement augmenter la productivité de son partenaire humain. Par exemple, un chef de produit junior pourrait également se hisser au niveau d'un chef de projet moyen, au moins, grâce à un coach en IA à ses côtés. Toutes ces fonctionnalités accéléreraient considérablement la capacité des travailleurs du savoir à réaliser un projet.

  • Réduction des coûts : en raison de leur rapidité, les outils d'IA générative réduisent le coût des processus et, et si une tâche prend deux fois moins de temps, elle coûte deux fois moins cher qu'elle ne le ferait autrement. En outre, l'IA générative peut minimiser les erreurs, éliminer les temps d'arrêt et identifier les redondances et autres inefficacités coûteuses. En raison de la tendance à l'hallucination de l'IA générative, la surveillance humaine et le contrôle de la qualité sont toujours nécessaires. Les collaborations entre l'homme et l'IA devraient permettre d'accomplir beaucoup plus de travail en moins de temps que si les personnes travaillaient sans l'IA, et avec une meilleure qualité et précision que si les outils d'IA travaillaient seuls, et donc de réduire les coûts. Par exemple, lors du test de nouveaux produits, l'IA générative peut aider à créer des simulations plus avancées et plus détaillées que les anciens outils. En fin de compte, cela réduit le temps et le coût de test de nouveaux produits.

  • Amélioration de la satisfaction client : les clients peuvent bénéficier d'une expérience supérieure et plus personnalisée grâce à des outils d'IA générative en libre accès basés sur l'IA et à des outils d'IA générative qui « chuchotent à l'oreille » des commerciaux du service client, leur fournissant des connaissances en temps réel. Alors que les chatbots de service client actuels alimentés par l'IA peuvent être parfois perçus comme limités et donc frustrants, il est facile d'imaginer une expérience client de bien meilleure qualité optimisée par le modèle d'IA générative spécialement entraîné par une entreprise, basé sur le calibre des conversations de ChatGPT d'aujourd'hui.

  • Prise de décision mieux informée : des modèles d'IA générative spécifiques à l'entreprise et spécialement entraînés peuvent fournir des informations détaillées via la modélisation de scénarios, l'évaluation des risques et d'autres approches complexes de l'analyse prédictive. Les décideurs peuvent tirer parti de ces outils pour mieux comprendre leur secteur d'activité et la position de l'entreprise à travers des recommandations personnalisées et des stratégies exploitables, éclairées par des données plus complètes et des analyses plus rapides que les analystes humains ou les technologies plus anciennes pourraient générer par eux-mêmes.

    Par exemple, les décideurs peuvent mieux planifier l'allocation des stocks avant une saison chargée grâce à des prévisions de la demande plus précises rendues possibles par une combinaison de données internes collectées par leur système de planification des ressources d'entreprise (ERP) et d'études de marché externes complètes, qui sont ensuite analysées par un modèle d'IA générative spécialisé. Dans ce cas, de meilleures décisions d'allocation minimisent le surachat et les ruptures de stock tout en maximisant les ventes potentielles.

  • Lancements de produits plus rapides : l'IA générative peut rapidement produire des prototypes de produits et des premières ébauches, aider à affiner les travaux en cours et tester/dépanner les projets existants pour trouver des améliorations beaucoup plus rapidement.

  • Contrôle de la qualité : un modèle d'IA générative spécialisé propre à l'entreprise est susceptible de révéler des lacunes et des incohérences dans les manuels d'utilisation, vidéos et autres contenus qu'une entreprise présente au public.

Exemple d'avantages spécifiques de l'IA générative
  Synthèse des connaissances Collaboration entre humains et IA Vitesse
l'augmentation de la productivité ; Organisation des données, accélération de la recherche et premières ébauches de produits. Formation des collaborateurs à de nouvelles disciplines, suggestion de nouvelles façons de résoudre les problèmes. Accélération de la capacité des travailleurs du savoir à réaliser un nouveau projet.
Coûts réduits Identification des redondances et des inefficacités pour améliorer les workflows. Minimisation des erreurs humaines et réduction des temps d'arrêt grâce à une surveillance collaborative. Exécution des tâches plus rapide (si une tâche prend deux fois moins de temps, elle coûte deux fois moins cher).
Satisfaction client améliorée Organisation et extraction rapide des informations de compte client pour accélérer la résolution des problèmes. Amélioration des chatbots pour automatiser des interactions simples et de meilleures informations pour les commerciaux lorsque de l'aide humaine est nécessaire. Communication des informations et des mises à jour de compte en temps réel aux clients et aux représentants du service après-vente.
Prise de décision plus éclairée Accélération du suivi des analyses en facilitant les analyses prédictives, telles que la modélisation de scénarios et l'évaluation des risques. Propose des recommandations personnalisées et des stratégies exploitables aux décideurs. Génération d'analyses plus rapides à partir de données plus étendues que les analystes humains ou les technologies plus anciennes.
Lancements de produits plus rapides Production de prototypes et de produits minimum viables (MVP). Test et dépannage de projets existants pour trouver des améliorations. Augmentation de la vitesse à laquelle les ajustements peuvent être mis en œuvre.

Limites de l'IA générative

Quiconque a utilisé des outils d'IA générative dans le cadre de l'enseignement et/ou de la recherche a probablement été confronté à leur limite la plus connue : ils inventent des choses. Puisque le modèle ne fait que prédire le mot suivant, il peut extrapoler à partir de ses données d'entraînement pour déclarer des mensonges avec autant d'autorité que les vérités qu'il rapporte. C'est ce que les chercheurs en IA entendent par hallucination, et c'est une raison essentielle pour laquelle les outils d'IA générative actuels nécessitent des collaborateurs humains. Les entreprises doivent prendre soin de se préparer et de gérer ces limites et d'autres lorsqu'elles implémentent l'IA générative. Si une entreprise établit des attentes irréalistes ou ne gère pas efficacement ses technologies, les conséquences peuvent nuire à ses performances et à sa réputation.

  • Nécessite une surveillance : les modèles d'IA générative peuvent introduire des informations fausses ou trompeuses, avec souvent un tel niveau de détail et une telle autorité que, même les experts peuvent être dupés. De même, leurs résultats peuvent contenir un langage biaisé ou offensant appris à partir de l'ensemble de données sur lequel le modèle a été entraîné. Les humains restent une partie essentielle du processus, pour empêcher ces résultats erronés de se propager et d'arriver jusqu'aux clients ou d'influencer la politique de l'entreprise.
  • Puissance de calcul et investissement initial : les modèles d'IA générative nécessitent des quantités massives de puissance de calcul pour l'entraînement et le fonctionnement. De nombreuses entreprises manquent des ressources et de l'expertise nécessaires pour construire et entretenir eux-mêmes ces systèmes. C'est l'une des raisons pour lesquelles le développement de l'IA générative est effectué à l'aide de l'infrastructure cloud.
  • Potentiel de convergence et non de divergence : les entreprises qui ne construisent pas leurs propres modèles spécialisés, en s'appuyant plutôt sur des outils d'IA générative publique, peuvent être condamnées à la médiocrité. Souvent, elles trouveront que leurs conclusions sont identiques aux autres parce qu'elles sont basées sur les mêmes données d'entraînement. Si ces entreprises n'insufflent pas d'innovation humaine dans leur travail, elles peuvent s'adapter efficacement aux bonnes pratiques actuelles, mais peine à trouver un différenciateur concurrentiel.
  • Résistance des collaborateurs et des clients : les collaborateurs, surtout quand ils ont une grande ancienneté, sont dotés de protocoles et de méthodes enracinés, qui peuvent les freiner dans leur adaptation à l'IA générative, ce qui entraîne une diminution de leur productivité. Ils peuvent aussi résister à la technologie par crainte de perdre leur emploi. Les gestionnaires et les chefs d'entreprise doivent apaiser ces craintes et être ouverts et transparents sur la façon dont la technologie va changer, ou ne pas changer, la structure de l'entreprise.

Risques et préoccupations liés à l'IA générative

L'IA générative suscite des réactions extrêmes des deux côtés du spectre des risques. Certains groupes craignent qu'elle mène à l'extinction humaine, tandis que d'autres insistent pour qu'ellesauve le monde. Ces extrêmes sortent du cadre de cet article. Cependant, voici quelques risques et préoccupations majeurs que les chefs d'entreprise qui mettent en œuvre la technologie d'IA doivent comprendre afin qu'ils puissent prendre des mesures pour atténuer les conséquences négatives potentielles.

  • Fiabilité et confiance : les modèles d'IA générative font des déclarations inexactes, hallucinant parfois des informations entièrement fabriquées. De même, de nombreux modèles sont entraînés avec des données plus anciennes, ne regardant généralement que les informations publiées jusqu'à une certaine date, de sorte que ce qui correspondait au marché de l'année dernière peut ne plus être pertinent ou utile. Par exemple, les entreprises qui cherchent à améliorer leurs opérations de supply chain peuvent constater que les suggestions de leurs modèles sont obsolètes et ne sont pas pertinentes dans l'économie mondiale en constante évolution. Les utilisateurs doivent vérifier toutes les affirmations avant d'y donner suite pour en assurer l'exactitude et la pertinence.

  • Confidentialité/propriété intellectuelle : les modèles d'IA générative continuent souvent d'apprendre des entrées d'informations fournies dans le cadre des invites. Les entreprises, en particulier celles qui collectent des informations personnelles sensibles auprès de leurs clients, telles que dans le domaine médical, doivent veiller à ne pas exposer les IP protégées ou les données confidentielles. Si le modèle accède à ces informations, il peut augmenter la probabilité d'exposition.

  • Ingénierie sociale surchargée : les acteurs de la menace utilisent déjà l'IA générative pour les aider à mieux personnaliser l'ingénierie sociale et les autres cyberattaques en les rendant plus authentiques.

    « Déjà, il est très difficile de distinguer si vous parlez à un bot ou à un humain en ligne », déclare Baig, Ingénieur en IA et en sécurité de Duolingo. Il est devenu beaucoup plus facile pour les criminels qui cherchent à gagner de l'argent de générer un tas de contenu pouvant tromper les gens.

  • Diminution de la qualité et de l'originalité du résultat : l'IA générative peut faciliter et accélérer la création de produits et de contenu, mais elle ne garantit pas un résultat de meilleure qualité. S'appuyer sur des modèles d'IA sans collaboration humaine significative peut entraîner des produits qui deviennent normalisés et manquent de créativité.

  • Parti pris : si un modèle d'IA générative est entraîné sur des données biaisées, allant de lacunes dans les perspectives à des contenus nuisibles et préjudiciables, ces biais se refléteront dans ses résultats. Par exemple, si une entreprise n'a historiquement embauché qu'un seul type d'employé, le modèle peut comparer les nouveaux candidats à l'employé « idéal » et éliminer des candidats qualifiés parce qu'ils ne correspondent pas au moule, même si l'entreprise avait l'intention de se débarrasser de ce moule.

  • IA fantôme : l'utilisation par les employés d'une IA générative sans l'approbation ou les connaissances officielles de l'entreprise peut conduire une entreprise à publier par inadvertance des informations incorrectes ou à violer les droit d'auteur d'une autre société.

  • Effondrement du modèle : les chercheurs en IA ont identifié un phénomène appelé effondrement de modèle qui pourrait rendre les modèles d'IA générative moins utiles au fil du temps. À mesure que le contenu généré par l'IA prolifère, les modèles entraînés sur ces données synthétiques, qui contiennent inévitablement des erreurs, finiront par oublier les caractéristiques des données générées par l'homme sur lesquelles ils ont été formés à l'origine. Cette préoccupation peut atteindre un point de rupture à mesure qu'Internet se dote de plus en plus de contenus créés par l'IA, entraînant une boucle de rétroaction qui dégradera le modèle.

  • Réglementation sur l'IA : l'IA générative est tellement nouvelle qu'il n'y a pas beaucoup de réglementations la concernant. Pourtant, les gouvernements du monde entier étudient comment la réglementer. Certains pays, comme la Chine, ont déjà proposé des mesures réglementaires sur la façon dont les modèles peuvent être entraînés et ce qu'ils sont autorisés à produire. Alors que de plus en plus de pays imposent des réglementations, les entreprises, en particulier les entreprises internationales, doivent surveiller les nouvelles lois et les changements pour assurer la conformité et éviter les amendes ou les poursuites pénales pour utilisation abusive de la technologie.

Éthique et IA générative

L'essor de l'analyse du big data il y a plus de dix ans a soulevé de nouvelles questions éthiques et des débats parce que les outils émergents ont permis d'inférer des informations privées ou sensibles sur des personnes qui n'avaient pas été révélées et ne voulaient pas l'être. Comment les entreprises devraient-elles gérer leur capacité à détenir de telles informations ?

Compte tenu de son potentiel d'optimisation de l'analyse des données, l'IA générative soulève de nouvelles questions éthiques et fait resurgir d'anciennes questions.

  • Comment l'IA générative affectera-t-elle les salariés ? L'IA générative rend déjà de nombreux collaborateurs inquiets quant à leurs perspectives d'emploi à long terme, et à juste titre. Si l'histoire montre que les progrès technologiques ont toujours permis de créer plus d'emplois et des emplois de plus grande valeur qu'ils n'en ont supprimés, les fonctions que l'IA pourrait rendre obsolètes sont celles qui paient les factures des personnes aujourd'hui.
  • Comment éliminer les préjugés potentiels ? Nous savons que tous les modèles d'IA ont le potentiel de produire des résultats biaisés. Les entreprises doivent choisir de manière proactive comment gérer ce défi à la fois du point de vue du risque pour l'entreprise et du point de vue éthique.
  • Comment les mauvais acteurs pourraient-ils utiliser les modèles GAI (IA générative) pour causer des dommages au public ? Les innombrables utilisations potentielles de l'IA générative comprennent malheureusement des actes criminels et préjudiciables, d'autant plus que les modèles génératifs deviennent plus accessibles au public. De fausses vidéos utilisant la voix et l'apparence de quelqu'un, des outils de piratage pour améliorer les cyberattaques, la désinformation généralisée et les campagnes d'ingénierie sociale ne sont que quelques-unes des façons potentielles dont les acteurs malveillants peuvent utiliser l'IA générative. Actuellement, de nombreux modèles sont dotés de protections, mais elles ne sont pas parfaites. Les entreprises qui mettent en œuvre leurs propres modèles doivent comprendre de quoi leurs systèmes sont capables et prendre des mesures pour assurer leur utilisation responsable.
  • À qui appartient le travail généré par l'IA ? Même si une entreprise affine un modèle sur ses propres données, les modèles d'IA générative sont entraînés sur de grandes quantités de données externes. La production d'un modèle peut inclure des éléments du travail d'autres entreprises, conduisant à des problèmes éthiques et juridiques potentiels, tels que le plagiat et la violation du droit d'auteur. Cela est particulièrement vrai pour les modèles d'IA générateurs d'images ; les artistes de tous les domaines créatifs explorent des moyens d'empêcher leur travail d'être intégré à ces programmes. Les organismes de réglementation peuvent créer de nouvelles règles au fil du temps, de sorte que toute personne utilisant l'IA générative devrait considérer d'où vient le contenu et comment il sera utilisé avant de le publier comme le leur.

Exemples d'IA générative

Les entreprises de toutes tailles et industries, de l'armée américaine à Coca-Cola, expérimentent prodigieusement l'IA générative. Voici un petit ensemble d'exemples qui démontrent le large potentiel de la technologie et son adoption rapide.

Snap Inc., l'entreprise derrière Snapchat, a déployé un chatbot appelé My IA, optimisé par une version de la technologie GPT d'OpenAI. Personnalisé pour s'adapter au ton et au style de Snapchat, My AI est programmé pour être convivial et personnalisable. Les utilisateurs peuvent personnaliser son apparence avec des avatars, des fonds d'écran et des noms et peuvent l'utiliser pour discuter en tête-à-tête ou entre plusieurs utilisateurs, simulant la façon typique que les utilisateurs de Snapchat communiquent avec leurs amis. Les utilisateurs peuvent demander des conseils personnels ou engager une conversation occasionnelle sur des sujets tels que la nourriture, les passe-temps ou la musique. Le bot peut même raconter des blagues. Snapchat oriente My AI pour aider les utilisateurs à explorer les fonctionnalités de l'application, telles que les objectifs de réalité augmentée, et pour aider les utilisateurs à obtenir des informations pour lesquelles ils ne se tourneraient normalement pas vers Snapchat, comme recommander des endroits où aller sur une carte locale.

Bloomberg a annoncé BloombergGPT, un chatbot entrainé à moitié à partir de données générales sur le monde et à moitié à partir de données propriétaires de Bloomberg ou de données financières nettoyées. Il peut effectuer des tâches simples, telles que l'écriture de bons titres d'articles et des tours surprenants, comme la transformation d'invites en langage clair en langage Bloomberg Query Language requis par les terminaux de données de la société, qui sont indispensables dans de nombreuses entreprises de l'industrie financière.

Oracle s'associe au développeur d'IA Cohere pour aider les entreprises à créer des modèles internes affinés avec des données d'entreprise privées, dans le but de diffuser l'utilisation d'outils d'IA générative spécifiques à l'entreprise.

« Cohere et Oracle travaillent ensemble pour permettre aux entreprises clientes d'entraîner très facilement leurs propres grands modèles de langage spécialisés tout en protégeant la confidentialité de leurs données d'entraînement », explique Larry Ellison d'Oracle aux analystes financiers lors de l'annonce des résultats de juin 2023. Oracle prévoit d'intégrer des services d'IA générative dans les plateformes d'entreprise pour augmenter la productivité et l'efficacité dans l'ensemble des processus existants d'une entreprise, en contournant la nécessité pour de nombreuses entreprises de créer et d'entraîner leurs propres modèles à partir de zéro. À cette fin, l'entreprise a également récemment annoncé l'intégration de capacités d'IA générative dans son logiciel de ressources humaines, Oracle Fusion Cloud Human Capital Management (HCM).

De plus :

  • Coca-Cola utilise des générateurs de texte et d'images pour personnaliser des textes publicitaire et créer des expériences client hautement personnalisées.
  • American Express, qui a longtemps été à l'avant-garde de l'utilisation de l'IA dans la détection des fraudes par carte de crédit, a sa filiale Amex Digital Labs développant des fonctionnalités grand public et B2B.
  • Le bureau numérique et d'IA du Pentagone expérimente cinq modèles d'IA générative, leur fournissant des données classifiées et les testant pour explorer comment elles pourraient être utilisées pour suggérer des options créatives que les dirigeants militaires humains n'ont jamais envisagées.
  • Duolingo utilise un bot alimenté par ChatGPT pour aider ses utilisateurs à apprendre une langue étrangère. L'application fournit des explications détaillées sur les raisons pour lesquelles les réponses aux tests pratiques sont correctes ou erronées, imitant la façon dont les utilisateurs pourraient interagir avec un tuteur humain.
  • Slack a lancé un chatbot qui vise à aider les collaborateurs des clients à distiller des informations et des conseils à partir du corpus de connaissances institutionnelles qui réside dans les canaux Slack de chaque client.

Outils d'IA générative

ChatGPT est l'outil qui est devenu une attraction virale, mais une multitude d'outils d'IA générative sont disponibles pour chaque modalité. Par exemple, pour écrire il y a Jasper, Lex, AI-Writer, Writer, et beaucoup d'autres. Pour la génération d'images, Midjourney, Stable Diffusion et Dall-E semblent être les plus populaires aujourd'hui.

Parmi les dizaines de générateurs de musique figurent AIVA, Soundful, Boomy, Amper, Dadabots et MuseNet. Bien que les programmeurs logiciels aient été connus pour collaborer avec ChatGPT, il existe également de nombreux outils de génération de code spécialisés, notamment Codex, codeStarter, Tabnine, PolyCoder, Cogram et CodeT5.

Histoire de l'IA générative

Il est peut-être surprenant de constater que la première étape vers les modèles d'IA générative utilisés aujourd'hui a été franchie en 1943, l'année même de la démonstration du premier ordinateur électrique programmable, le Colossus, qui a ensuite été utilisé par la Grande-Bretagne pour décoder des messages cryptés pendant la Seconde Guerre mondiale. L'étape de l'IA a fait l'objet d'un article de recherche, « A Logical Calculus of Ideas Immanent in Nervous Activity », par Warren McCulloch, Psychiatre et Professeur à l'University of Illinois College of Medicine, et Walter Pitts, Neuroscientifique informatique autodidacte.

Pitts, apparemment prodige en mathématiques, s'est enfui de chez lui à l'âge de 15 ans et était sans abri lorsqu'il a rencontré McCulloch, qui l'a accueilli dans sa famille. Le seul diplôme de Pitts était un Associate of Arts, décerné par l'université de Chicago après la publication de l'article fondateur qui a établi les mathématiques de base par lesquelles un neurone artificiel « décide » s'il doit émettre un 1 ou un 0.

La deuxième étape se déroule dans le nord et l'est, vers Buffalo, NY, et vers un psychologue de recherche du laboratoire aéronautique Cornell nommé Frank Rosenblatt. En juillet 1957, Rosenblatt a reçu une subvention de l'Office of Naval Research du Ministère américain de la marine dans le cadre du projet PARA (Perceiving and Recognizing Automaton) de Cornell. Il s'est appuyé sur les mathématiques de McCulloch et Pitts pour mettre au point le perceptron, un réseau neuronal doté d'une seule couche « cachée » entre la couche d'entrée et la couche de sortie. Avant de construire le Mark I Perceptron, qui se trouve aujourd'hui dans la Smithsonian Institution, Rosenblatt et la Marine l'ont simulé sur un ordinateur mainframe IBM 704 pour une démonstration publique en juillet 1958. Mais le perceptron était un réseau neuronal si simple qu'il a suscité des critiques de l'informaticien du Massachusetts Institute of Technology, Marvin Minsky, Cofondateur du laboratoire d'IA du MIT. Minsky et Rosenblatt auraient débattu des perspectives à long terme du perceptron dans les forums publics, ce qui a conduit la communauté de l'IA à abandonner largement la recherche sur les réseaux neuronaux des années 1960 aux années 1980.

Cette période est devenue connue sous le nom de l'hiver de l'IA.

Le paysage de la recherche sur les réseaux neuronaux a dégelé dans les années 1980 grâce aux contributions de plusieurs chercheurs, notamment Paul Werbos, dont les premiers travaux ont redécouvert le perceptron ; Geoffrey Hinton ; Yoshua Bengio ; et Yann LeCun. Leurs travaux conjoints ont démontré la viabilité de grands réseaux neuronaux multicouches et ont montré comment ces réseaux pouvaient apprendre de leurs bonnes et mauvaises réponses par l'attribution de crédit via un algorithme de rétropropagation. C'est alors que les RNN et les CNN sont apparus. Mais les limites de ces premiers réseaux neuronaux, combinées à des attentes précoces surestimées qui n'ont pas pu être satisfaites en raison de ces limites et de l'état de la puissance de calcul de l'époque, ont conduit à un deuxième hiver de l'IA dans les années 1990 et au début des années 2000.

Cette fois, cependant, de nombreux chercheurs de réseaux neuronaux sont restés dans la course, y compris Hinton, Bengio et LeCun. Le trio, parfois appelé « les Parrains de l'IA », a partagé le Turing Award 2018, reçu pour leurs travaux dans les années 1980, leur persévérance ultérieure et leurs contributions continues. Au milieu des années 2010, de nouvelles variantes de réseaux neuronaux et diverses émergeaient rapidement, comme décrit dans la section Modèles d'IA générative.

L'avenir de l'IA générative

Nous ne savons pas encore quel impact l'IA générative aura sur les entreprises et sur la façon de travailler. Mais une chose est claire : des investissements massifs sont consacrés à l'IA générative dans de multiples dimensions de l'activité humaine. Les sociétés de capital-risque, les entreprises établies et pratiquement toutes celles entre les deux investissent dans des startups d'IA génératives à une vitesse fulgurante. L'aspect magique universelle des LLM réside dans leur capacité étrange à faciliter l'interaction humaine avec le big data, pour aider les gens à donner un sens à l'information en l'expliquant simplement, clairement et étonnamment rapidement. Cela suggère que l'IA générative sera intégrée dans une multitude d'applications existantes et provoquera l'invention d'une deuxième vague de nouvelles applications.

Gartner, par exemple, prévoit que 40 % des applications d'entreprise auront intégré l'IA conversationnelle d'ici 2024, que 30 % des entreprises auront des stratégies de développement et de test augmentées par l'IA d'ici 2025 et que plus de 100 millions de travailleurs collaboreront avec des « robocollègues « d'ici 2026.

Bien sûr, il est possible que les risques et les limites de l'IA générative fassent dérailler ce moteur. Le réglage fin des modèles génératifs pour apprendre les nuances de ce qui rend une entreprise unique peut s'avérer trop difficile, l'exécution de modèles aussi intensifs en calcul peut s'avérer trop coûteuse et une exposition accidentelle de secrets commerciaux peut effrayer les entreprises.

Ou tout peut arriver, mais à un rythme plus lent que ce que beaucoup attendent maintenant. Pour rappel, la promesse d'Internet a finalement été réalisée. Mais cela a pris dix ans de plus que ce que la première génération de passionnés avait prévu, le temps de construire ou d'inventer l'infrastructure nécessaire et d'adapter le comportement des personnes aux possibilités offertes par le nouveau média. À bien des égards, l'IA générative est un autre nouveau moyen.

Les influenceurs réfléchissent largement à l'avenir de l'IA générative dans les entreprises.

« Cela peut signifier que nous construisons des entreprises différemment à l'avenir », explique Sean Ammirati, Investisseur en capital-risque et Professeur émérite de services en entrepreneuriat à la Tepper School of Business de l'Université Carnegie Mellon et Cofondateur du Corporate Startup Lab de CMU. De la même manière que les entreprises natives du numérique avaient un avantage après l'essor d'Internet, Ammirati envisage que les futures entreprises construites à partir de zéro sur l'automatisation générative basée sur l'IA seront en mesure de prendre la tête du peloton.

« Ces entreprises seront d'abord automatisées, donc elles n'auront pas à réapprendre comment arrêter de faire des choses manuellement qu'elles devraient faire de manière automatisée », dit-il. Vous pourriez finir avec un type d'entreprise très différent. »

Adopter facilement l'IA générative avec Oracle

Non seulement Oracle travaille depuis longtemps avec les fonctionnalités d'intelligence artificielle et les intègre dans ses produits, mais il est également à la pointe du développement et des activités d'IA générative. Oracle Cloud Infrastructure est utilisé par les principales entreprises d'IA générative. Ce cloud de nouvelle génération peut fournir la plateforme idéale aux entreprises pour créer et déployer des modèles d'IA générative spécialisés spécifiques à leurs entreprises et à leurs secteurs d'activité. Comme l'explique Larry Ellison, « Tous les data centers cloud d'Oracle disposent d'un réseau RDMA (accès direct à la mémoire à distance) à bande passante élevée et à faible latence, parfaitement optimisé pour la création de clusters de GPU à grande échelle utilisés pour entraîner des grands modèles de langage génératifs. Les performances extrêmement élevées et les économies de coûts liées à l'exécution de workloads d'IA générative dans notre cloud Gen 2 ont fait d'Oracle le premier choix parmi les entreprises de développement d'IA de pointe. »

Le partenariat d'Oracle avec Cohere a conduit à un nouvel ensemble d'offres de services cloud d'IA générative. « Ce nouveau service protège la confidentialité des données d'entraînement de nos clients d'entreprise, ce qui leur permet d'utiliser en toute sécurité leurs propres données privées pour entraîner leurs grands modèles de langage spécialisés privés », explique Larry Ellison.

L'histoire de l'IA générative a commencé il y a 80 ans avec les mathématiques d'un adolescent en fuite et est devenue une attraction virale à la fin de l'année dernière avec la sortie de ChatGPT. L'innovation dans l'IA générative s'accélère rapidement, car les entreprises de toutes tailles et de tous les secteurs expérimentent et investissent dans ses capacités. Mais avec ses capacités à améliorer considérablement le travail et la vie, l'IA générative apporte de grands risques, allant de la perte d'emplois à l'extinction potentielle de l'humanité, si l'on en croit les prophètes de malheur. Ce que nous savons avec certitude, c'est que le génie est sorti de la lampe, et il n'est pas prêt d'y revenir.

En quoi Oracle est-il le plus adapté à l'IA générative ?

Oracle propose une plateforme de données moderne et une infrastructure d'IA à faible coût et à hautes performances. Des facteurs supplémentaires, tels que des modèles puissants et performants, une sécurité des données inégalée et des services d'IA intégrés, démontrent pourquoi l'offre d'IA d'Oracle est véritablement conçue pour les entreprises.

FAQ sur l'IA générative

Qu'est-ce que la technologie d'IA générative ?

La technologie d'IA générative est basée sur des architectures logicielles de réseau neuronal qui imitent la façon dont le cerveau humain est censé fonctionner. Ces réseaux neuronaux sont entraînés en saisissant de grandes quantités de données dans des échantillons relativement petits, puis en demandant à l'IA de faire des prédictions simples, telles que le mot suivant dans une séquence ou l'ordre correct d'une séquence de phrases. Le réseau neuronal reçoit une récompense pour les bonnes réponses et une pénalité pour les mauvaises réponses. Ce processus lui permet d'apprendre jusqu'à ce qu'il soit capable de faire de bonnes prédictions. En fin de compte, la technologie s'appuie sur ses données d'entraînement et son apprentissage pour répondre de manière humaine aux questions et autres invites.

Qu'est-ce qu'un exemple d'IA générative ?

L'exemple le plus connu de l'IA générative aujourd'hui est ChatGPT, qui est capable de conversations de type humain et d'écrire sur un large éventail de sujets. Il existe aussi Midjourney et Dall-E, qui créent des images, et une multitude d'autres outils qui peuvent générer du texte, des images, des vidéos et du son.

Quelle est la différence entre l'IA générative et l'IA ?

Il est important de noter que l'IA générative n'est pas une technologie fondamentalement différente de l'IA traditionnelle ; elle existe à différents points d'un spectre. Les systèmes d'IA traditionnels effectuent généralement une tâche spécifique, telle que la détection de la fraude par carte de crédit. L'IA générative est généralement plus large et peut créer un nouveau contenu. Cela s'explique en partie par le fait que les outils d'IA générative sont entraînés à des ensembles de données plus volumineux et plus diversifiés que l'IA traditionnelle. En outre, l'IA traditionnelle est généralement entraînée en utilisant des techniques d'apprentissage supervisé, tandis que l'IA générative est entraînée en utilisant un apprentissage non supervisé.

Quel est le danger de l'IA générative ?

Un grand débat est en cours dans la société sur les risques possibles de l'IA générative. Le débat a donné lieu à des déclarations extrêmes de bords opposés selon lesquelles la technologie pourrait conduire à l'extinction de l'humanité, d'un côté, ou sauver le monde, de l'autre. Plus probablement, l'IA conduira à l'élimination de nombreux emplois actuels. Les entreprises devraient s'intéresser à la manière dont l'IA générative entraînera des changements dans les processus de travail et les postes, ainsi qu'à la possibilité pour elle d'exposer par inadvertance des informations privées ou sensibles ou de porter atteinte aux droits d'auteur.

À quoi sert l'IA générative ?

L'IA générative peut être utilisée à bon escient en partenariat avec des collaborateurs humains pour aider, par exemple, à réfléchir à de nouvelles idées et à former les collaborateurs à des disciplines adjacentes. C'est également un excellent outil pour aider les gens à analyser plus rapidement les données non structurées. Plus généralement, elle peut bénéficier aux entreprises en améliorant la productivité, en réduisant les coûts, en améliorant la satisfaction des clients, en fournissant de meilleures informations pour la prise de décision et en accélérant le rythme du développement de produits.

Que peut faire l'IA générative ?

L'IA générative ne peut pas avoir de véritables idées nouvelles qui n'ont pas été exprimées auparavant dans ses données d'entraînement ou du moins extrapolées à partir de ces données. Elle ne devrait pas non plus fonctionner seule. L'IA générative nécessite une surveillance humaine et n'est optimale que dans le cadre d'une collaboration avec les humains.

Quelles industries utilisent l'IA générative ?

En raison de son ampleur, l'IA générative est susceptible d'être utile dans pratiquement tous les secteurs.

Comment l'IA générative aura-t-elle un impact sur l'avenir du travail ?

L'IA générative est susceptible d'avoir un impact majeur sur le travail de la connaissance, les activités dans lesquelles les humains travaillent ensemble et / ou prennent des décisions commerciales. À tout le moins, les rôles des travailleurs du savoir devront s'adapter au travail en partenariat avec des outils d'IA générative, et certains emplois seront éliminés. L'histoire démontre cependant que le changement technologique comme celui attendu de l'IA générative conduit toujours à la création de plus d'emplois qu'il n'en détruit.