Sous-ensemble du Machine Learning, le Deep Learning imite le fonctionnement du cerveau humain par des réseaux neuronaux artificiels. Le Deep Learning est désigné comme un apprentissage profond car il vient de l'utilisation de plusieurs couches dans le réseau.
Webinar Oracle Technology Data Week
Depuis 2020, le Deep Learning est devenu l'approche dominante du Machine Learning dans de nombreux travaux de recherches. Son système de réseaux de neurones artificiels est appliqué à de nombreux domaines, tels que la reconnaissance vocale, la traduction automatique, l’analyse d’images médicales ou encore la fraude financière.
Sous-ensemble du Machine Learning, le Deep Learning imite le fonctionnement du cerveau humain par des réseaux neuronaux artificiels. L’objectif est de créer des modèles à partir de données afin d’éclairer la prise de décision. Cette méthode peut aussi bien faire partie d’un apprentissage supervisé, semi-supervisé ou non-supervisé.
Les architectures de Deep Learning telles que les réseaux neuronaux profonds, les réseaux de croyances profondes, les réseaux neuronaux récurrents et les réseaux neuronaux convolutifs ont été appliquées à des domaines tels que :
Le Deep Learning est désigné comme un apprentissage profond car il vient de l'utilisation de plusieurs couches dans le réseau. Le Deep learning concerne un nombre illimité de couches de taille limitée qu’il utilise pour extraire progressivement des caractéristiques de niveau supérieur à partir de l'entrée brute. Par exemple, dans le traitement d'images, les couches inférieures peuvent identifier les bords, tandis que les couches supérieures peuvent identifier les concepts pertinents pour un humain tels que des visages.
L'impact du Deep Learning dans l'industrie a commencé au début des années 2000. Les applications industrielles du Deep Learning à la reconnaissance vocale à grande échelle ont commencé vers 2010.
Certains chercheurs affirment que la victoire d'ImageNet en octobre 2012 a marqué le début d'une "révolution du Deep Learning" qui a transformé l'industrie de l'Intelligence Artificielle . Le projet ImageNet est une vaste base de données visuelles conçue pour être utilisée dans la recherche de logiciels de reconnaissance d'objets visuels. Depuis 2010, il organise un concours annuel de logiciels, le ImageNet Large Scale Visual Recognition Challenge (ILSVRC), dans le cadre duquel des logiciels sont en compétition pour classer et détecter correctement des objets et des scènes. En 2012, un réseau neuronal convolutif (CNN) appelé AlexNet a réalisé une erreur de 15,3 % dans le top 5 du défi ImageNet 2012, soit plus de 10,8 points de pourcentage de moins que le second. Selon The Economist, "soudain, les gens ont commencé à prêter attention, non seulement au sein de la communauté de l'IA mais aussi dans l'ensemble de l'industrie technologique".
En novembre 2012, le système de Ciresan et al. a remporté un concours, le ICPR, sur l'analyse de grandes images médicales pour la détection du cancer. En 2014, le groupe de Hochreiter a exploité le Deep Learning pour détecter les effets toxiques et non ciblés des produits chimiques environnementaux dans les nutriments, les produits ménagers et les médicaments.
La classification des images a été étendue à la tâche plus difficile de générer des descriptions (légendes) pour les images.En mars 2019, Yoshua Bengio, Geoffrey Hinton et Yann LeCun ont reçu le prix Turing pour leurs percées conceptuelles et techniques qui ont fait des réseaux neuronaux profonds une composante essentielle de l'IT.
Testez et développez des applications gratuitement avec le Cloud Oracle
Dans le Deep Learning, chaque niveau apprend à transformer ses données d'entrée en une représentation légèrement plus abstraite et composite. Dans une application de reconnaissance d'images, l'entrée brute peut être une matrice de pixels ; la première couche de représentation peut abstraire les pixels et coder les bords ; la deuxième couche peut composer et coder des arrangements de bords ; la troisième couche peut coder un nez et des yeux ; et la quatrième couche peut reconnaître que l'image contient un visage. Il est important de noter qu'un processus de Deep Learning peut permettre de savoir quelles caractéristiques placer de manière optimale dans quel niveau à lui seul.
Le Deep Learning aide à démêler ces abstractions et à choisir les caractéristiques qui améliorent les performances. Avec l'avènement du Big Data, les données sont devenues si vastes qu'il pourrait falloir des décennies à l'homme pour les comprendre et en extraire les informations pertinentes. Les entreprises réalisent l'incroyable potentiel qui peut résulter de cette richesse d'information et s'adaptent de plus en plus aux systèmes d'IA pour une assistance automatisée.
En 2017, les réseaux neuronaux comptaient généralement quelques milliers à quelques millions d'unités et des millions de connexions. Bien que ce nombre soit inférieur de plusieurs ordres de grandeur au nombre de neurones du cerveau humain, ces réseaux peuvent accomplir de nombreuses tâches à un niveau supérieur à celui des humains.
Si une société de paiement numérique voulait détecter l'existence ou le potentiel de fraude dans son système, elle pourrait utiliser des outils de Machine Learning à cette fin, tels que le Deep Learning. L'algorithme de calcul intégré dans un modèle informatique traitera toutes les transactions effectuées sur la plate-forme numérique, trouvera des modèles dans l'ensemble des données et signalera toute anomalie détectée par le modèle.
Le Deep Learning utilise les réseaux neuronaux artificiels pour réaliser le processus. La première couche du réseau neuronal traite une entrée de données brutes comme le montant de la transaction et la transmet à la couche suivante comme sortie. La deuxième couche traite les informations de la couche précédente en incluant des informations supplémentaires comme l'adresse IP de l'utilisateur et transmet son résultat. La couche suivante prend les informations de la deuxième couche et inclut des données brutes telles que l'emplacement géographique et améliore encore le schéma de la machine. Cela se poursuit à tous les niveaux du réseau de neurones.
Le Deep Learning est utilisé dans de nombreux secteurs d’activité, tels que les applications commerciales qui utilisent la reconnaissance d'images, les plateformes open-source avec des applications de recommandation aux consommateurs ou encore les outils de recherche médicale explorent la possibilité de réutiliser des médicaments pour de nouvelles maladies.
La reconnaissance vocale automatique à grande échelle est le premier cas réussi de Deep Learning et le plus convaincant. L'ensemble de données contient 630 locuteurs de huit dialectes majeurs de l'anglais américain, où chaque locuteur lit 10 phrases. Sa petite taille permet d'essayer de nombreuses configurations. Tous les principaux systèmes commerciaux de reconnaissance vocale sont basés sur du Deep Learning.
Les réseaux neuronaux sont utilisés pour la mise en œuvre de modèles de langage depuis le début des années 2000. La méthode de Deep Learning appelée mémoire à long et court terme (LSTM) a contribué à améliorer la traduction automatique et la modélisation du langage.
Les architectures neurales profondes fournissent les meilleurs résultats pour l'analyse des circonscriptions, l'analyse des sentiments, la recherche d'informations, la compréhension de la langue parlée, la traduction automatique, la liaison d'entités contextuelles, la reconnaissance du style d'écriture, la classification des textes et autres. Par exemple, Google Translate utilise un vaste réseau de mémoire à long terme et à court terme, grâce à une méthode de traduction automatique basée sur des exemples, dans laquelle le système apprend à partir de millions d'exemples.
Un grand pourcentage de médicaments candidats ne parviennent pas à obtenir l'approbation réglementaire. Ces échecs sont dus à une efficacité insuffisante (effet sur la cible), à des interactions indésirables (effets hors cible) ou à des effets toxiques imprévus. La recherche a étudié l'utilisation du Deep Learning pour prédire les cibles biomoléculaires, les effets hors cible et les effets toxiques des substances chimiques présents dans l'environnement dans les nutriments, les produits ménagers et les médicaments.
AtomNet, un réseau neuronal convolutionnel profond (CNN), peut prédire de nouvelles biomolécules candidates pour des cibles de maladies telles que le virus Ebola et la sclérose en plaques.
Ce guide complet donne un aperçu détaillé sur la façon dont Oracle Autonomous Database permet aux entreprises d’optimiser la gestion de leur base de données. Ce guide décrit également comment Autonomous Database permet de capitaliser sur les technologies émergentes (machine learning et IA) pour créer de nouvelles applications et exploiter la valeur de leurs données.