La reconnaissance d'images, dans le contexte de la vision artificielle, est la capacité d'un logiciel à identifier des objets, des lieux, des personnes, des écritures et des actions dans des images. Les ordinateurs peuvent utiliser les technologies de vision industrielle en combinaison avec une caméra et un logiciel d'intelligence artificielle pour réaliser la reconnaissance d'images.
17 au 19 Septembre : Webinar Oracle Technology Data Week
On exploite l’intelligence artificielle (AI) pour l’image depuis les années 60 sous différents noms : vision par ordinateur et reconnaissance d'images (image recognition). La vision par ordinateur est la science qui consiste à faire comprendre les images aux ordinateurs. Ils reconnaissent, identifient et localisent des objets avec différents degrés de précision. La reconnaissance d'images consiste à analyser les pixels et les formes d'une image pour reconnaître l'image comme un objet particulier.
Les logiciels de reconnaissance d'images ont besoin d’algorithmes de deep learning (qui est une sous-branche du machine learning). Les performances sont meilleures avec les modèles de réseaux neuronaux convolutifs (CNN), car la tâche spécifique nécessite une forte puissance de calcul.
Comment former un ordinateur à distinguer une image d'une autre image ?
On représente chaque pixel par un nombre ou un ensemble de nombres - et la plage de ces nombres se nomme la profondeur de couleur (ou profondeur de bits). En d'autres termes, la profondeur de couleur indique le nombre maximum de couleurs potentielles utilisées dans une image.
Une fois que chaque image se convertit en milliers de caractéristiques, avec les étiquettes connues des images, on peut former un modèle. Plus on exploite d'images pour chaque catégorie, mieux un modèle s’entraîne à donner la catégorie exacte de l’image.
Entraîner le modèle à catégoriser en faisant correspondre les caractéristiques d’une image avec des étiquettes.
Reconnaître (ou prédire) qu'une nouvelle image fait partie des catégories une fois qu’on a formé un modèle.
consiste à utiliser des images du monde réel pour produire des recherches en ligne plus fiables et plus précises. Les sites en ligne peuvent ainsi suggérer des articles qui sont thématiquement, stylistiquement ou autrement liés aux comportements et aux intérêts d'un consommateur.
alors que les contenus de photos et vidéos se multiplient avec le progrès de la technologie, la reconnaissance d'images par machine learning propose de les organiser plus facilement et plus efficacement en catégories. L’objectif consiste en une meilleure accessibilité, une recherche et une découverte améliorées, un partage de contenu transparent, etc. De nombreuses applications actuelles d'organisation automatique des images utilisent également la reconnaissance faciale, qui est une tâche spécifique dans le domaine de la reconnaissance d'images.
la plupart des communautés de réseaux sociaux et de partage de contenu les plus dynamiques existent grâce à des flux fiables et authentiques de contenu généré par les utilisateurs. Mais lorsque le volume devient important et qu’il demeure un élément nécessaire d'une plateforme ou d'une communauté donnée, un défi particulier se pose : vérifier et modérer ce contenu pour s'assurer qu'il respecte les normes de la plateforme/communauté. Ce type de modération automatisée du contenu peut être un outil essentiel pour garantir plus efficacement que les espaces communautaires sont ciblés, sûrs et qu'ils remplissent les objectifs fixés.
Les applications actuelles et futures de la reconnaissance d'images par IA comprennent les photothèques intelligentes, la publicité ciblée, l'interactivité des médias, l'accessibilité pour les malvoyants et l'amélioration des capacités de recherche. De nombreuses entreprises investissent des ressources et des recherches importantes dans la reconnaissance d'images et les applications connexes.
Découvrez la nouvelle génération d’infrastructure cloud