2 mai 2022
Qu'est-ce que le data mining ? En termes simples, il s'agit du processus de découverte d'informations dans de grands volumes de données. Ces données peuvent provenir de nombreuses sources ou d'une seule base de données, et les informations peuvent être générées par le repérage manuel ou l'automatisation. De nombreuses voies différentes existent pour produire des informations, souvent en fonction de variables telles que les ressources, les capacités de machine learning/intelligence artificielle, la complexité des données, le volume de données, ainsi que la formation et l'expérience du personnel. Ce processus implique une analyse approfondie des données pour découvrir des modèles et des facteurs sous-jacents, le tout pour créer des conclusions et produire des décisions éclairées.
L'utilisation du data mining a considérablement augmenté au cours des vingt dernières années, car davantage de sources de données fournissaient un environnement de big data. Le big data désigne de grands volumes de données, souvent sous forme de flux continus provenant de plusieurs sources et à grande vitesse. Au début de l'informatique décisionnelle, les tables de données étaient souvent exportées à partir d'appareils et préparées manuellement pour obtenir des informations. Mais à mesure que le monde est de plus en plus connecté, les données peuvent arriver en volumes trop massifs pour être disséquées manuellement, en particulier lorsqu'il s'agit d'un mélange de données structurées et non structurées.
Le data mining est un processus qui rend le big data fonctionnel. Sans data mining, les entreprises finiraient par s'asseoir sur des téraoctets de données provenant d'un large éventail de sources : appareils Internet des objets (IoT), bases de données, médias sociaux d'entreprise, e-mails marketing, capteurs, utilisation de sites Web, et bien plus encore, chacun avec son propre ensemble de métadonnées. Combiner de vastes volumes de données est physiquement impossible. Les techniques d'exploration de données utilisent des algorithmes pour identifier des modèles à travers cet ensemble massif d'enregistrements, puis génèrent un ensemble de recommandations sur lesquelles les équipes doivent agir.
Un exemple simple de cela vient des achats en ligne pour les revendeurs. Dans ces situations, les historiques des clients sont tous compilés dans une base de données massive. Un algorithme parcourt ces données pour rechercher des corrélations, par exemple, les personnes qui n'achètent qu'une certaine marque d'aliments pour chiens. Cet algorithme recherche des informations sur les achats connexes, tels que les suppléments ou les marques de traitement. Au fur et à mesure que les tendances émergent, ces informations peuvent être transmises à l'équipe marketing pour créer des promotions qui déclenchent des relations avec cette marque spécifique.
La section précédente a présenté les gros traits du data mining. Attardons-nous sur les processus de data mining. Le traitement automatisé et l'analyse humaine sont utilisés pour tirer le meilleur parti du data mining, le personnel établissant les directives tandis que le machine learning et l'intelligence artificielle passent au crible de grands volumes de données. En général, le workflow suivant est utilisé :
Une fois le modèle d'exploration de données créé, il est temps de le déployer dans les jeux de données. Une surveillance active est nécessaire pour s'assurer qu'il n'y a pas de surprises ou de raisons d'ajuster et d'affiner le modèle. Si tout fonctionne comme prévu, les données résultantes doivent définir des normes claires en matière de validité et d'utilité et, par conséquent, être prêtes à être examinées par les utilisateurs professionnels pour prendre des décisions basées sur les données.
En plus de l'exemple de vente au détail ci-dessus, le data mining peut être un processus de transformation pour un certain nombre de secteurs. Les exemples ci-dessous montrent comment le data mining peut être appliquée à des besoins spécifiques au secteur.
Le data mining peut transformer le secteur des soins de santé en améliorant et en accélérant les expériences pour les fournisseurs et les patients. Les fournisseurs peuvent utiliser le data mining pour accélérer la recherche, comprendre les données opérationnelles afin de répondre au mieux aux besoins en personnel et identifier les indicateurs clés pour l'assurance et la fraude. Pour les patients, le data mining identifie les modèles qui favorisent les options de soins préventifs, en veillant à ce que les conversations puissent commencer avant que les traitements ne soient nécessaires. Il peut également identifier les schémas cachés, telles que les effets secondaires, ouvrant la porte à une meilleure idée de la façon dont les traitements pourraient être affectés par la condition spécifique et unique d'un patient.
Dans l'industrie, des données sont générées tout au long du processus : achat de matériaux, logistique d'assemblage, contrôle qualité, dates d'expédition et retours en raison de défauts de fabrication. Le data mining peut examiner à la fois les étapes individuelles du processus et une vue d'ensemble. Cela permet aux équipes de résoudre les problèmes en mode micro et macro.
Par exemple, le data mining peut identifier qu'un fournisseur particulier a des délais d'expédition plus longs mais présente moins de défauts globaux, de sorte que les gestionnaires peuvent décider que le risque en vaut la peine car des étapes peuvent être exécutées en parallèle pour atténuer l'impact des retards. D'autre part, il peut également montrer qu'un sous-traitant livre de manière cohérente, mais que son taux de défauts plus élevé a un impact plus important sur le processus. Le data mining peut créer ces connexions afin que les décisions optimisent l'ensemble du processus de fabrication plutôt que d'être prises dans le vide.
Le data mining offre de nombreux avantages aux fournisseurs de services financiers, tant pour les opérations internes que pour l'expérience client. Sur le front des opérations, le data mining peut avoir un impact sur tout, des ressources humaines au marketing. En particulier pour ce secteur, cependant, le data mining peut limiter les risques informatiques, car la disponibilité et la sécurité sont la priorité absolue pour tout ce qui concerne la finance.
Du côté du client, le data mining offre à la fois des éléments de protection et une meilleure expérience client. Le data mining dans les modèles de transaction peut identifier et marquer les éléments qui semblent inhabituels par géographie, heure de la journée, catégorie d'achat ou tous ces éléments ensemble. Les résultats peuvent ensuite être transmis aux équipes de fraude pour voir s'ils nécessitent un suivi. Pour l'utilisateur final, les modèles d'exploration de données peuvent créer des déclencheurs marketing pour les promotions spécialisées, telles que le refinancement ou les prêts HELOC.
Chaque équipe d'une entreprise, des opérations internes au service client, peut bénéficier du data mining. Une exploration de données réussie commence par une infrastructure solide pour tirer parti de plusieurs sources de données à grande vitesse. Essayez Oracle Cloud Infrastructure gratuitement pour découvrir comment il constitue la base du data mining.