Qu’est-ce que le Machine Learning ?

Le Machine Learning est une branche de l’Intelligence Artificielle qui apprend par expérience, sans être programmé. Ses modélisations de données permettent de réaliser des prédictions.

machine learning illustration

Webinar Oracle Technology Data Week

Qu’est-ce que le Machine Learning ?

Si le Machine Learning est un terme souvent employé pour désigner l’Intelligence Artificielle ou le Deep Learning, ces concepts sont différents. Le Machine Learning est un système qui, alimenté de données, tend à apprendre et à s’améliorer en continu.

Machine Learning : un apprentissage automatique basé sur l’expérience

Considéré comme un sous-ensemble de l’Intelligence Artificielle, le Machine Learning fonctionne à partir d’algorithmes. Ces derniers sont alimentés par les données de manière à apprendre et s’améliorer automatiquement, grâce non pas à une programmation, mais à partir de l’expérience.

Le processus d'apprentissage commence par des observations ou des données, telles que des exemples, une expérience ou des instructions. L’objectif est de rechercher des modèles dans ces données afin de réaliser des prédictions et de prendre de meilleures décisions.

Les algorithmes de Machine Learning sont utilisés dans une grande variété d'applications, telles que le filtrage du courrier électronique, une tâche pour laquelle il est difficile, voire impossible, de développer des algorithmes conventionnels.

3 grands apprentissages de Machine Learning

Les algorithmes de Machine Learning s’exécutent selon différents apprentissages et produisent des modèles d’algorithmes spécifiques.


L’apprentissage supervisé

L’apprentissage supervisé permet d’apprendre une fonction de prédiction à partir d’exemples.

Les algorithmes construisent un modèle mathématique d'un ensemble de données qui contient à la fois les entrées et les sorties souhaitées. L’objectif est d'apprendre une règle générale qui fait correspondre les entrées aux sorties. Lorsque l’algorithme détermine correctement la sortie pour les entrées qui ne faisaient pas partie des exemples qu’on lui a donnés, il s’agit d’une fonction optimale.

Les algorithmes de Machine Learning supervisés peuvent appliquer ce qui a été appris dans le passé à de nouvelles données en utilisant des exemples étiquetés pour prédire des événements futurs.

L’apprentissage non supervisé

Les algorithmes d'apprentissage non supervisés prennent un ensemble de données qui ne contient que des entrées, et trouvent une structure dans les données, comme le regroupement ou le clustering.

Les algorithmes apprennent donc à partir de données d'essai qui n'ont pas été étiquetées, classées ou catégorisées. Au lieu de répondre à un retour d'information, les algorithmes d'apprentissage non supervisés identifient les points communs des données et réagissent en fonction de la présence ou de l'absence de ces points communs dans chaque nouvelle donnée.

L’apprentissage non supervisé

Les algorithmes de Machine Learning semi-supervisés se situent entre l'apprentissage supervisé et non supervisé, car ils utilisent à la fois des données étiquetées et non étiquetées pour la formation - généralement une petite quantité de données étiquetées et une grande quantité de données non étiquetées. De nombreux chercheurs ont constaté que cette méthode peut produire une amélioration considérable de la précision de l'apprentissage.

Le programme informatique interagit avec un environnement dynamique dans lequel il doit atteindre un certain objectif (comme conduire un véhicule ou jouer un jeu contre un adversaire). Lorsqu'il navigue dans son espace de problèmes, le programme reçoit un retour d'information qui est analogue à des récompenses, qu'il essaie de maximiser.

5 modèles d’algorithmes

Le Machine Learning crée des modèles, qui sont formés sur certaines données et peuvent ensuite traiter des données supplémentaires pour faire des prédictions. En voici quelques-uns :

Réseaux de neurones artificiels

Inspirés du fonctionnement des réseaux neuronaux biologiques, ces systèmes en multi-couches "apprennent" à exécuter des tâches à partir d’exemples. En général, les neurones artificiels sont agrégés en couches. Les réseaux neuronaux artificiels ont été utilisés pour diverses tâches, notamment la vision par ordinateur, la reconnaissance vocale, la traduction automatique, le filtrage des réseaux sociaux, la pratique de jeux de société et de jeux vidéo et le diagnostic médical. Les réseaux neuronaux artificiels constituent la plupart des modèles modernes de Deep Learning. Or, depuis 2020, le Deep Learning est devenu l'approche dominante pour de nombreux travaux en cours dans le domaine du Machine Learning.

Les machines à vecteur de support

Les machines à vecteurs de support (SVM), déterminent si le modèle entre dans la catégorie de la classification ou de la régression. Les algorithmes de classification sont utilisés lorsque les résultats sont limités à un ensemble restreint de valeurs, et les algorithmes de régression sont utilisés lorsque les résultats peuvent avoir une valeur numérique.

Arbre de décision

Un arbre de décision est employé comme modèle prédictif pour passer des observations sur un élément (représenté dans les branches) aux conclusions sur la valeur cible de l'élément (représentée dans les feuilles). Lorsque la variable cible consiste en un ensemble de valeurs, l’arbre appartient à la classification. Les feuilles désignent alors les étiquettes de classe et les branches les conjonctions de caractéristiques qui les déterminent. A contrario, lorsque la variable cible comporte des valeurs numériques, les arbres renvoient à la régression.

Analyse de régression

L'analyse de régression englobe une grande variété de méthodes statistiques pour estimer la relation entre les variables d'entrée et leurs caractéristiques associées. Sa forme la plus courante est la régression linéaire, où une seule ligne est tracée pour correspondre au mieux aux données apportées selon un critère mathématique, tel que les moindres carrés ordinaires.

Réseau bayésien

Ce modèle graphique probabiliste représente un ensemble de variables aléatoires et leur indépendance conditionnelle avec un graphe orienté acyclique (DAG). Par exemple, un réseau bayésien pourrait représenter les relations probabilistes entre les maladies et les symptômes. Compte tenu des symptômes, le réseau peut être utilisé pour calculer les probabilités de la présence de diverses maladies.

Pour tirer parti du Machine Learning, de nombreuses entreprises s’équipent de data sciencists afin d’exploiter les données à leur juste valeur et automatiser certaines tâches complexes ou répétitives, de manière à améliorer la productivité.

Testez et développez des applications gratuitement avec le Cloud Oracle