Aucun résultat trouvé

Votre recherche n’a donné aucun résultat.

Nous vous suggérons d’essayer ce qui suit pour trouver ce que vous recherchez :

  • Vérifiez l’orthographe de votre recherche par mot clé.
  • Utilisez des synonymes pour le mot clé que vous avez tapé, par exemple, essayez “application” au lieu de “logiciel”.
  • Essayez l’une des recherches populaires ci-dessous.
  • Lancer une nouvelle recherche.
Questions tendances

En savoir plus sur la base de données orienté graphe

Une base de données orientée graphe est une plateforme spécialisée et à objectif unique pour la création et la manipulation de graphes. Les graphes contiennent des nœuds, des arêtes et des propriétés, qui sont tous utilisés pour représenter et stocker les données d’une manière que les bases de données relationnelles ne sont pas équipées pour le faire.

L’analyse de graphes est un autre terme couramment utilisé, qui désigne le processus d’analyse des données dans un format de graphe utilisant des points de données comme nœuds et des relations comme arêtes. L’analyse de graphes nécessite une base de données qui prend en charge les formats de graphes ; il peut s’agir d’une base de données orientée graphe dédiée ou d’une base de données multimodèle prenant en charge plusieurs modèles de données, y compris des graphiques.

Qu’est-ce qu’un graphe ?

Un graphe est un ensemble de points (sommets) et de lignes reliant ces points (arêtes). Les graphes permettent aux utilisateurs de modéliser des données d’après des relations d’une manière plus naturelle et intuitive que les bases de données relationnelles le permettent habituellement.

Dans l’exemple ci-dessous, les sommets sont Melli, Jean, John, Lucy et Sophie et les arêtes qui représentent les relations sont “collabore avec” et “se querelle avec”.

Base de données orientée graphe

Le format du graphe offre une plateforme beaucoup plus flexible pour trouver des connexions distantes ou analyser des données basées sur des éléments tels que la force ou la qualité des relations. Lors de la recherche d’une relation indirecte entre deux points de données, la nature de la logique d’un format de graphe est une plateforme plus efficace pour effectuer cette tâche.

Les graphes permettent d’explorer et de découvrir des connexions et des modèles dans les réseaux sociaux, l’IoT, le big data, les data warehouse, ainsi que des données de transaction complexes pour plusieurs cas d’utilisation commerciale, notamment la détection de fraude dans le secteur bancaire, la découverte de connexions dans les réseaux sociaux et le client 360. Aujourd’hui, le graphe est de plus en plus utilisé dans le cadre de la data science comme moyen de mettre en évidence les connexions dans les relations.

Les algorithmes de graphes, opérations spécialement conçues pour analyser les relations et les comportements entre les données dans des graphes, permettent de comprendre des choses difficiles à voir avec d’autres méthodes. Par exemple, les algorithmes de graphes peuvent identifier quel individu ou élément est le plus connecté aux autres dans les réseaux sociaux ou les processus métier. Ils peuvent identifier les communautés, les anomalies, les modèles communs et les chemins qui relient les individus ou les transactions associées.

Fondamentaux de la base de données orientée graphe

Les bases de données orientées graphe organisent les données sous forme de graphe, quel que soit le modèle de données qu’elles utilisent. Dans un format de graphe, les principaux éléments sont les enregistrements (nœuds ou sommets) et les connexions entre les enregistrements (arêtes, liens ou relations). Puisqu’il est possible de créer des connexions (arêtes) entre deux ou plusieurs nœuds, la porte est ouverte à toutes sortes d’analyses dimensionnelles.

L’image ci-dessous offre une représentation visuelle d’un exemple de requête utilisant l’analyse de graphes. Dans cet exemple, tous les enregistrements sont représentés par des points. Par défaut, tous les points sont bleus. Lorsqu’une requête est effectuée, les enregistrements résultants et leurs connexions respectives sont affichés en rouge. Les bases de données orientées graphe permettent des connexions presque illimitées pour aider à identifier les modèles et à détecter les anomalies.

Fondamentaux de la base de données orientée graphe 1

Un exemple concret simple de ce qui peut être accompli avec une base de données orienté graphe est la création d’un itinéraire d’une point de départ à un point d’arrivée sur une carte. Vous pouvez imaginer que chaque intersection est un nœud et chaque rue est une arête. La requête consiste alors à déterminer le meilleur chemin pour aller de A à B. En outre, la force/qualité de la connexion peut être prise en compte en tant que trafic. Tous ces éléments peuvent être inclus dans le traitement de la requête (voir l’exemple ci-dessous) :

Fondamentaux de la base de données orientée graphe 2

Comment utiliser une base de données orientée graphe ?

Les bases de données orientées graphe sont un outil extrêmement flexible et puissant. Le format graphe permet de mettre en évidence des relations complexes afin d’obtenir des informations plus poussées, plus facilement. Les bases de données orientées graphe exécutent généralement des requêtes dans des langages tels que le PGQL (Property Graph Query Language). L’exemple ci-dessous montre la même requête en PGQL et SQL.

Utilisation de l’analyse de graphes

Comme le montre l’exemple ci-dessus, le code PGQL est plus simple et beaucoup plus efficace. Étant donné que les graphiques mettent l’accent sur les relations entre les données, ils sont idéaux pour plusieurs types d’analyses. En particulier, les bases de données orientées graphe sont parfaites pour :

  • Trouver le chemin le plus court entre deux nœuds
  • Déterminer les nœuds qui créent le plus d’activité ou d’influence
  • Analyser la connectivité pour identifier les points les plus faibles d’un réseau
  • Analyser l’état du réseau ou de la communauté en fonction de la distance ou de la densité de connexion dans un groupe

Un exemple simple d’analyse de graphe en action est présenté dans l’image ci-dessous, qui montre une représentation visuelle du jeu de société « Six Degrees of Kevin Bacon ». Ce jeu consiste à créer des liens entre Kevin Bacon et un autre acteur d’après une chaîne de films communs. Cet accent mis sur les relations en fait le moyen idéal pour faire la démonstration de l’analyse de graphes.

Imaginez un ensemble de données avec deux catégories de nœuds : tous les films jamais réalisés et tous les acteurs ayant joué dans ces films. Ensuite, en nous appuyant sur le graphe, nous exécutons une requête demandant de relier Kevin Bacon à l’icône du Muppet Show Peggy la cochonne. Le résultat serait le suivant :

Cas d’utilisation de l’analyse de graphes Image 1

Dans cet exemple, les nœuds disponibles (sommets) sont à la fois des acteurs et des films et les relations (arêtes) ont le statut « a joué dans ». À partir de ces éléments, la requête renvoie les résultats suivants :

  • Kevin Bacon a joué dans La rivière sauvage (The River Wild) avec Meryl Streep.
  • Meryl Streep a joué dans Les Désastreuses Aventures des orphelins Baudelaire (A Series of Unfortunate Events) de Lemony Snicket, avec Billy Connolly.
  • Billy Connolly a joué dans L’Île au trésor des Muppets (Muppet Treasure Island) avec Peggy la cochonne.

Les bases de données orientées graphe peuvent interroger de nombreuses relations différentes pour cet exemple concernant Kevin Bacon, par exemple :

  • « Quelle est la chaîne la plus courte qui relie Kevin Bacon à Peggy la cochonne ? » (analyse du chemin le plus court, telle qu’utilisée dans le jeu Six Degrees ci-dessus)
  • « Qui a travaillé avec le plus grand nombre d’acteurs ? » (centralité de degré)
  • « Quelle est la distance moyenne entre Kevin Bacon et tous les autres acteurs ? » (centralité de proximité)

Cet exemple est naturellement plus amusant que la plupart des utilisations de l’analyse de graphes. Mais cette approche fonctionne dans presque tous les ensembles de big data, soit dans toute situation où un grand nombre d’enregistrements montrent une connectivité naturelle les uns avec les autres. Certaines des finalités les plus répandues de l’utilisation de l’analyse de graphes sont l’analyse des réseaux sociaux, des réseaux de communication, du trafic et la consultation de site web, les données routières réelles, les transactions et les comptes financiers.

Cas d’utilisation d’une base de données orientée graphe : filtrer la désinformation et les robots sur les réseaux sociaux

Les bases de données orientées graphe peuvent être utilisées dans de nombreux scénarios différents, mais elles le sont fréquemment pour analyser les réseaux sociaux. En fait, les réseaux sociaux constituent le cas d’utilisation idéal, car ils comprennent un volume important de nœuds (comptes d’utilisateurs) et de connexions multidimensionnelles (engagements dans de nombreuses directions différentes). Une analyse de graphe d’un réseau social peut déterminer :

  • Le niveau d’activité des utilisateurs (nombre de nœuds)
  • Le niveau d’influence des utilisateurs (densité des connexions)
  • L’utilisateur ayant le plus haut niveau d’engagement bidirectionnel (direction et densité des connexions)

Cependant, ces informations ne sont d’aucune utilité si elles ont été faussées par des robots. Heureusement, l’analyse de graphes peut fournir un excellent moyen d’identifier et de filtrer les robots.

Citons un cas d’utilisation concret. L’équipe Oracle a utilisé Oracle Marketing Cloud pour évaluer la publicité et la traction sur les réseaux sociaux, en particulier pour identifier les faux comptes de robots qui biaisaient les données. Le comportement le plus courant de ces robots consistait à retweeter des comptes cibles, gonflant ainsi artificiellement leur popularité. Une simple analyse de modèle a mis cela en évidence en utilisant le nombre de retweets et la densité des connexions avec les voisins. Les comptes véritablement populaires ont présenté des relations différentes avec leurs voisins de celles des comptes alimentés par des robots.

Cette image montre des comptes véritablement populaires.

Cas d’utilisation d’une base de données orientée graphe Image 2

Et cette image illustre le comportement d’un compte géré par un robot.

Cas d’utilisation d’une base de données orientée graphe Image 3

Le principe consiste à utiliser la puissance de l’analyse de graphes pour identifier un modèle naturel par rapport à un modèle de robot. Il suffit ensuite de filtrer ces comptes, bien qu’il soit également possible de creuser plus profondément pour examiner, par exemple, la relation entre les robots et les comptes retweetés.

Cas d’utilisation d’une base de données orientée graphe Image 4

Les réseaux sociaux font de leur mieux pour éliminer les comptes de robots, car ils ont un impact sur l’expérience globale de leur base d’utilisateurs. Pour vérifier que ce processus de détection de robots était précis, les comptes signalés ont été vérifiés après un mois. Les résultats furent les suivants :

  • Suspendu : 89%
  • Supprimé : 2.2%
  • Toujours actif : 8.8%

Le pourcentage extrêmement élevé de comptes sanctionnés (91,2 %) témoigne de la précision de l’identification des modèles et du processus de nettoyage. Cette opération aurait pris beaucoup plus de temps dans une base de données tabulaire standard. Avec l’analyse de graphes, il est possible d’identifier rapidement des modèles complexes.

Cas d’utilisation d’une base de données orientée graphe : Fraude à la carte de crédit

Les graphes sont désormais des outils puissants de détection de fraude pour le secteur financier. Malgré les progrès de la technologie anti-fraude, grâce notamment à l’utilisation de puces intégrées dans les cartes, la fraude peut encore prendre plusieurs aspects. Les appareils de copiage peuvent voler les données contenues sur des bandes magnétiques, technique couramment employée dans les endroits dépourvus de lecteurs de puces. Une fois que ces données sont stockées, elles peuvent être chargés sur une carte contrefaite pour effectuer des achats ou retirer de l’argent.

En matière de détection des fraudes, l’identification des modèles est souvent la première ligne de défense. Les modèles d’achat attendus sont basés sur l’emplacement, la fréquence, les types de magasins et autres éléments qui correspondent à un profil utilisateur. Lorsqu’une transaction semble totalement anormale, par exemple, si une personne passe le plus clair de son temps à San Francisco et qu’elle fait soudainement des achats tard dans la nuit en Floride, cela peut indiquer un acte frauduleux.

La puissance de calcul nécessaire pour ces opérations est considérablement réduite grâce à l’analyse de graphes. L’analyse de graphes est idéale pour établir des modèles entre les nœuds. Dans ce cas, les catégories de nœuds sont définies en tant que comptes (titulaires de carte), lieux d’achat, catégorie d’achat, transactions et terminaux. Il est facile d’identifier les modèles de comportement habituels. Par exemple, au cours d’un mois donné, une personne peut :

  • Acheter de la nourriture pour animaux (catégorie d’achat) dans différentes animaleries (terminaux)
  • Régler des repas dans des restaurants le week-end (métadonnées de transaction) de la région (lieux d’achat)
  • Acheter du matériel de réparation (catégorie d’achat) dans un magasin local (lieu du compte, lieu d’achat)

La détection des fraudes est généralement gérée grâce au machine learning, mais l’analyse de graphes peut contribuer à créer un processus plus précis et plus efficace. Grâce à la mise en évidence de relations, les résultats sont des éléments de prévision efficaces pour déterminer et signaler les enregistrements frauduleux.

L’avenir des bases de données orientées graphe

Les bases de données orientées graphe et les techniques de graphe ont évolué avec l’augmentation de la puissance de calcul et du big data au cours des dix dernières années. En fait, il est de plus en plus clair qu’elles deviendront un outil standard pour analyser un univers de relations complexes entre les données. Alors que les entreprises et les organisations continuent de développer les capacités du big data et des analyses, la capacité à obtenir des informations de manière de plus en plus complexe rend les bases de données orientées graphe incontournables pour les besoins d’aujourd’hui et les succès de demain.