該当する結果がありません

一致する検索結果がありませんでした。

お探しのものを見つけるために、以下の項目を試してみてください。

  • キーワード検索のスペルを確認してください。
  • 入力したキーワードの同義語を使用してください。たとえば、「ソフトウェア」の代わりに「アプリケーション」を試してみてください。
  • 下記に示すよく使用される検索語句のいずれかを試してみてください。
  • 新しい検索を開始してください。
急上昇中の質問

グラフデータベースについて学ぶ

グラフデータベースは、グラフを作成および操作するための専用の単一目的プラットフォームです。グラフには、ノード、エッジ、およびプロパティが含まれており、これらはすべて、リレーショナルデータベースでは機能しない方法でデータを表現および格納するために使用されます。

グラフ分析は、もう1つの一般的に使用される用語であり、特に、データポイントをノードとして、関係をエッジとして使用して、グラフ形式でデータを分析するプロセスを指します。グラフ分析には、グラフ形式をサポートできるデータベースが必要で、専用のグラフデータベース、またはグラフを含む複数のデータモデルをサポートするマルチモデルデータベースである可能性があります。

グラフとは

グラフは、点(頂点)とそれらの点(エッジ)の間の線のコレクションです。グラフを使用すると、ユーザーは、リレーショナルデータベースで通常許可されるよりも自然で直感的な方法で、関係に基づいてデータをモデル化できます。

以下の例では、頂点はMelli、Jean、John、Lucy、およびSophieであり、関係を示すエッジはその関係が「協力」し「啀み合い」していることを示します。

グラフ・データベース

グラフ形式は、関係の強さや質などに基づいて、離れた接続を見つけたり、データを分析したりするための、はるかに柔軟なプラットフォームを提供します。2つのデータポイント間の間接的な関係を検索する場合、グラフ形式のロジックの性質は、このタスクを完了するためのより効率的なプラットフォームです。

グラフを使用すると、ソーシャルネットワーク、IoT、ビッグデータ、データウェアハウスの接続とパターン、さらには銀行での不正検出、ソーシャルネットワークでの接続の検出、顧客360などの複数のビジネスユースケースの複雑なトランザクションデータを探索して発見できます。今日、グラフは関係のつながりをより明確にする方法とされ、データサイエンスの一部としてますます使用されています。

グラフアルゴリズム(グラフ内のデータ間の関係や動作を分析するために特別に設計された操作)により、他の方法では見にくいものを理解することができます。たとえば、グラフアルゴリズムは、ソーシャルネットワークまたはビジネスプロセスで他の人と最も関連している個人またはアイテムを識別できます。アルゴリズムは、個人または関連するトランザクションを接続するコミュニティ、異常、一般的なパターン、およびパスを識別できます。

グラフデータベースの基礎

グラフデータベースは、データモデルの取得元に関係なく、データをグラフ形式に変換します。グラフ形式では、主要なアセットはレコード(ノードまたは頂点)とレコード間の接続(エッジ、リンク、または関係)です。2つのノード間または多数のノード間に接続(エッジ)を作成できるため、これにより、あらゆる種類の次元分析への扉が開かれます。

以下の画像は、グラフ分析を使用したクエリ例を視覚的に表したものです。この例では、すべてのレコードが点で表されています。デフォルトでは、すべての点が青色です。クエリが実行されると、結果のレコードとそれぞれの接続が赤で表示されます。グラフデータベースでは、ほぼ無制限の接続が可能であり、パターンの識別と異常の検出に役立ちます。

グラフデータベースの基礎1

グラフデータベースで達成できることの簡単な実例は、地図上で最初から最後までの方向を決定することです。すべての交差点がノードであり、どの道路もエッジであると想像できます。したがって、クエリは、AからBに到達するための最適なパスを決定することです。さらに、接続の強度/品質をトラフィックとして考慮することができます。これらすべてを含めて、クエリを処理できます(以下の例を参照)。

グラフデータベースの基礎2

グラフデータベースの使用方法

グラフデータベースは、非常に柔軟で非常に強力なツールです。グラフ形式のため、複雑な関係を決定して、はるかに少ない労力でより深いインサイトを得ることができます。グラフデータベースは通常、プロパティグラフクエリ言語(PGQL)などの言語でクエリを実行します。以下の例は、PGQLとSQLでの同じクエリを示しています。

グラフ分析の使用

上記の例に見られるように、PGQLコードはより単純ではるかに効率的です。グラフはデータ間の関係を強調するため、いくつかの異なるタイプの分析に最適です。特に、グラフデータベースは次の点で優れています。

  • 2つのノード間の最短経路を見つける
  • 最も多くの活動/影響を生み出すノードを決定する
  • 接続を分析して、ネットワークの最も弱い点を特定する
  • グループ内の接続距離/密度に基づいてネットワークまたはコミュニティの状態を分析する

実行中のグラフ分析の簡単な例は、下の画像です。これは、人気のあるパーティーゲーム「六次のケビン・ベーコン」を視覚的に表したものです。それに慣れていない人のために、このゲームは、相互の映画チェーンに基づいて、ケビン・ベーコンと別の俳優間のつながりを考え出すことを含みます。この関係の強調は、グラフ分析を実証するための理想的な方法になります。

次の2つのカテゴリのノードを持つデータセットを想像してみてください。これまでに作成されたすべての映画とそれらの映画に出演したすべての俳優。次に、グラフを使用して、ケビン・ベーコンをMuppetアイコンのミス・ピギーに接続するように求めるクエリを実行します。結果は次のようになります。

グラフ分析使用ケース画像1

この例では、使用可能なノード(頂点)は俳優と映画の両方であり、関係(エッジ)は「演じられた」ステータスです。ここから、クエリは次の結果を返します。

  • ケビン・ベーコンはメリル・ストリープと一緒に『激流』(The River Wild)で共演しました。
  • メリル・ストリープは、ビリー・コノリーと『レモニー・スニケットの世にも不幸せな物語』(Lemony Snicket’s A Series of Unfortunate Events)に出演しました。
  • ビリー・コノリーはミス・ピギーと『マペットの宝島』(Muppet Treasure Island)で行動しました。

グラフデータベースは、このケビン・ベーコンの例について、次のようなさまざまな関係をクエリできます。

  • 「ケビン・ベーコンとミス・ピギーをつなぐ最短のチェーンは何か?」(上記の六次のゲームで使用される最短経路分析)
  • 「誰が最も多くの俳優と仕事をしたか?」(次数中心性)
  • 「ケビン・ベーコンと他のすべての俳優間の平均距離はどれくらいか?」(近さの中心性)

もちろん、これはグラフ分析のどの使用法よりも面白い例です。しかし、このアプローチはほぼすべてのビッグデータで機能し、多数のレコードが相互に自然な接続を示している状況です。グラフ分析を使用する最も一般的な方法のいくつかは、ソーシャルネットワーク、通信ネットワーク、Webサイトのトラフィックと使用状況、実際の道路データ、および金融取引とアカウントを分析することです。

グラフデータベースのユースケース:ソーシャルメディア上の偽情報とボットのフィルタリング

グラフデータベースはさまざまなシナリオで使用できますが、一般的にはソーシャルネットワークの分析に使用されます。実際、ソーシャルネットワークは大量のノード(ユーザーアカウント)と多次元接続(さまざまな方向への関与)を伴うため、ケースを理想的に使用します。ソーシャルネットワークのグラフ分析では、次のことを判断できます。

  • ユーザーがどのくらいアクティブか?(ノード数)
  • どのユーザーが最も影響力があるか?(接続密度)
  • 双方向のエンゲージメントが最も多いのは誰か?(接続の方向と密度)

ただし、この情報は、ボットによって不自然に歪められている場合は役に立ちません。幸いなことに、グラフ分析はボットを識別して除外する優れた手段を提供できます。

実際のユースケースでは、オラクルチームはOracle Marketing Cloudを使用して、ソーシャルメディアの広告とトラクションを評価し、具体的にはデータを歪めた偽のボットアカウントを特定しました。これらのボットによる最も一般的な動作は、ターゲットアカウントをリツイートすることであり、その結果、それらの人気を人為的に膨らませました。単純なパターン分析により、リツイート数と近隣への接続密度を使用した外観が可能になりました。当然のことながら人気のあるアカウントは、ボット主導のアカウントと比較して、近隣との関係が異なります。

この画像は、自然に人気のあるアカウントを示しています。

グラフデータベースのユースケース画像2

この画像は、ボット主導のアカウント動作を示しています。

グラフデータベースのユースケース画像3

ここで重要なのは、グラフ分析の力を使用して、自然なパターンとボットのパターンを識別することです。そこからは、それらのアカウントを除外するのと同じくらい簡単ですが、ボットとリツイートされたアカウントの関係などを調べるためにさらに深く掘り下げることも可能です。

グラフデータベースのユースケース画像4

ソーシャルメディアネットワークは、全体的なユーザーベースのエクスペリエンスに影響を与えるため、ボットアカウントを排除するために最善を尽くします。このボット検出プロセスが正確であることを確認するため、フラグが立てられたアカウントが1か月後にチェックされました。結果は次のとおりです。

  • 一時停止:89%
  • 削除:2.2%
  • 今もアクティブ:8.8%

罰せられたアカウントのこの非常に高い割合(91.2%)は、パターンの識別とクレンジングプロセスの両方の正確さを示しました。これは、標準の表形式データベースではかなり時間がかかりますが、グラフ分析を使用すると、複雑なパターンをすばやく特定できます。

グラフデータベースのユースケース:クレジットカード詐欺

グラフは、不正を検出する手段として、金融業界で強力なツールになっています。カードに埋め込まれたチップの使用など、不正防止技術の進歩にもかかわらず、不正は依然としてさまざまな方法で発生する可能性があります。スキミングデバイスは、磁気ストリップから詳細を盗むことができます。これは、チップリーダーがまだインストールされていない場所で一般的に使用されている手法です。これらの詳細が保存されると、それらを偽造カードにロードして、購入したり、お金を引き出したりすることができてしまいます。

不正検出の手段として、パターンの識別は多くの場合、防御の最前線です。予想される購入パターンは、場所、頻度、店舗の種類、およびユーザープロファイルに適合するその他のものに基づいています。何かが完全に異常に見える場合(たとえば、サンフランシスコのベイエリアに住んでいるのに、フロリダで突然深夜に買い物をする人など)、それは潜在的に不正であるとフラグが立てられます。

これに必要な計算能力は、グラフ分析によって大幅に簡素化されます。グラフ分析は、ノード間のパターンの確立に優れています。このケースでは、ノードのカテゴリは、アカウント(カード所有者)、購入場所、購入カテゴリ、トランザクション、および端末として定義されています。自然な行動パターンを特定するのは簡単です。たとえば、特定の月に、人は次のことをする可能性があります。

  • 異なるペットショップ(ターミナル)でペットフード(購入カテゴリ)を購入する
  • その地域(購入場所)での週末のレストランの支払い(トランザクションメタデータ)
  • 地元のホームセンター(口座の場所、購入場所)で修理用ハードウェア(購入カテゴリ)を購入する

不正検出は通常、機械学習で処理されますが、グラフ分析はこの取り組みを補完して、より正確で効率的なプロセスを作成できます。関係性に焦点を当てたおかげで、結果は不正な記録を特定してフラグを立てる際の効果的な予測因子になりました。実際に使用する前に、データをキュレートして準備します。

グラフデータベースの未来

グラフデータベースとグラフ技術は、過去10年間で計算能力とビッグデータが増加するにつれて、進化してきました。実際、複雑なデータ関係の素晴らしい新世界を分析するための標準ツールになることがますます明らかになっています。企業や組織がビッグデータや分析の機能を推進し続けるにつれて、ますます複雑な方法でインサイトを引き出す能力により、グラフデータベースは今日のニーズと明日の成功のためになくてはならないものになっています。