未找到结果

您的搜索操作未匹配到任何结果。

我们建议您尝试以下操作,以帮助您找到所需内容:

  • 检查关键词搜索的拼写。
  • 使用同义词代替键入的关键词,例如,尝试使用“应用”代替“软件”。
  • 请尝试下方显示的热门搜索之一。
  • 重新搜索。
热门问题

了解图形数据库

图形数据库是一种专用于创建和处理图形的专业化单一用途平台。其中,图形包括节点、边和属性,它们能够以关系数据库无法实现的方式来表示和存储数据。

图形分析则是另一个常用术语,专指图形格式(以数据点作为节点,以数据关系作为边)数据的分析过程。图形分析离不开支持图形格式的数据库:专用图形数据库或支持图形格式的多模型数据库。

图形是什么?

一个图形即是由一系列的点(顶点)和这些点之间的线(边)构成的集合。与关系数据库相比,图形支持用户以更加自然、直观的方式,基于关系对数据建模。

在以下示例中,Melli、Jean、John、Lucy 和 Sophie 代表顶点,“collaborates with” 和 “feuds with” 代表边,表示关系。

图形数据库

图形格式可提供一个更灵活的平台,帮助用户基于关系强度或关系质量等因素查找远程关系或分析数据。当搜索两个数据点之间的间接关系时,图形格式更加有效。

您可以使用图形来探索和发现社交网络、物联网、大数据、数据仓库以及多种业务使用场景下的复杂业务数据中的联系和模式,包括银行中的欺诈检测、社交网络中的关系发现以及 360 度客户视图。如今,图形越来越广泛地被应用于数据科学,帮助用户更加清晰地呈现数据关系。

图形算法(专用于分析图形中数据间关系和行为的操作)可揭示其他方法难以揭示的内在本质。例如,在探索社交网络或业务流程中最密切的人物或事物的关系时,图形算法可以识别社区、异常、常见模式以及连通个人或相关事务的路径。

图形数据库基础知识

图形数据库可不受数据模型来源的限制,将数据转换为图形格式在图形格式中,关键资产是记录(节点或顶点)以及记录之间的联系(边、链接或关系)。由于图形数据库支持在两个节点或多个节点之间创建联系(边),它又为各种细度的分析打开了大门。

下图直观展示了使用图形分析进行查询。其中,所有记录均由点表示,默认都是蓝色的。在执行查询后,相应的记录及各自的连接显示为红色。由于支持几乎无限数量的连接,图形数据库可以有效识别模式,检测异常。

图形数据库基础知识 1

图形数据库查询的一个简单类比就是在地图上确定从起点到终点的方向。您可以想象每个交叉点都是一个节点,每条街道都是一条边,随后运行查询,确定从 A 到 B 的最佳路径。此外,您还可以将连接强度/质量看做交通流量。这些因素都可以纳入查询过程(请参见以下示例):

图形数据库基础知识 2

如何使用图形数据库?

图形数据库高度灵活,功能超强,可助您通过图形格式,更轻松地识别复杂关系,捕获更深入的洞察。它通常使用 PGQL 一类的语言来运行查询。请查看以下示例,了解使用 PGQL 和 SQL 进行查询有何不同。

图形分析使用场景

从示例中可以看出,PGQL 代码更简单,更高效。由于图形强调的是数据之间的关系,因此非常适合多种不同类型的分析。图形数据库尤其擅长:

  • 查找两个节点之间的最短路径
  • 确定产生重大活动/影响力的节点
  • 分析连接性,识别网络的最薄弱点
  • 基于组中的连接距离/密度来分析网络或社区状态

下图是图形分析的一个简单示例,它直观展示了“Six Degrees of Kevin Bacon”这一非常流行的聚会游戏,即基于共同出演的电影的链条找出 Kevin Bacon 与其他演员之间的联系。该游戏以关系为主,是演示图形分析的最佳方式。

请想象一个具有两类节点的数据集:曾经拍摄过的每一部电影,以及出现在这些电影中的每一位演员。然后,我们使用图形运行查询,在 Kevin Bacon 与布偶秀的 Miss Piggy 之间建立联系。结果如下:

图形分析使用场景图像 1

在这一示例中,可用节点(顶点)既是演员也是电影,关系(边)则是“出演”状态。在此基础上,查询将返回以下结果:

  • Kevin Bacon 与 Meryl Streep 一同参演了《The River Wild》。
  • Meryl Streep 与 Billy Connolly 一同参演了 Lemony Snicket 的《A Series of Unfortunate Events》。
  • Billy Connolly 与 Piggy Miss 一同参演了《Muppet Treasure Island》。

图形数据库可以查询多种关系,例如:

  • “Kevin Bacon 与 Miss Piggy 之间的最短连接是什么?”(最短路径分析,参见上述“六度分离”游戏)
  • “谁合作过的演员最多?”(度中心性)
  • “Kevin Bacon 与所有其他演员之间的平均距离是多少?”(紧密中心度)

当然,与大多数图形分析应用相比,这个示例比较有趣。但这种方法几乎适用于所有大数据 — 在任何情况下,大量记录都可以显示出彼此之间的自然联系。图形分析最常见的应用包括分析社交网络、通信网络、网站流量和使用情况、真实道路数据以及金融交易和帐户。

图形数据库使用场景:过滤社交媒体上的虚假信息和僵尸程序

图形数据库适用于很多场景,但最常见的是社交网络分析。事实上,社交网络是图形数据库的一个理想使用场景,因为它涉及大量的节点(用户帐户)和多维联系(多个不同方向的交互)。通过对社交网络进行图形分析,您可以了解:

  • 用户的活跃程度如何?即节点数量
  • 哪些用户影响力最大?即连接密度
  • 哪些用户的双向交互最多?即连接方向和密度

但是,如果僵尸程序扭曲了这些信息,这些信息就毫无意义。对此,图形分析可以有效识别和过滤僵尸程序。

例如,Oracle 团队曾使用 Oracle 营销云来评估社交媒体广告的效果和牵引力,尤其是识别可能扭曲数据的僵尸程序。这些僵尸程序一般会通过转发来人为提升目标帐户的知名度,而简单的模式分析可基于转发计数以及与邻居的连接密度来明辨真伪。与背后有僵尸程序作祟的帐户相比,自然热门帐户具有不同的邻居关系。

下图所示为自然热门帐户。

图形数据库使用场景图像 2

下图所示为僵尸程序驱动的帐户行为。

图形数据库使用场景图像 3

其中,关键是利用图形分析来识别自然模式与僵尸程序模式,然后过滤僵尸程序帐户。当然,您也可以进行更深入的分析,比如分析僵尸程序与被转发帐户之间的关系。

图形数据库使用场景图像 4

一般来说,社交媒体网络会倾尽全力来清除僵尸程序帐户,避免整体用户体验受到影响。为了验证这一僵尸程序检测流程是否准确,一个月后对标记帐户进行检查,结果如下:

  • 暂停:89%
  • 删除:2.2%
  • 仍然活跃:8.8%

高达 91.2% 的帐户受罚证明了模式识别和清理的准确性。简而言之,图形分析可以快速识别复杂模式 — 标准的表格数据库要花费更多时间才能实现类似结果。

图形数据库使用场景:防范信用卡欺诈

图形已成为了金融业的一种强大的欺诈检测工具。在信用卡领域,尽管反欺诈技术一直在进步,例如在卡片中嵌入芯片,但仍然无法避免各种各样的欺诈行为。例如,读卡机侧录器(常见于未安装芯片卡读卡器的场所)可以通过磁条来窃取信息,而一旦这些信息被恶意收集和存储起来,就可以加载到伪造卡上来购物或取款。

作为一种欺诈检测方法,模式识别通常是欺诈检测的第一道防线。具体来说,就是基于位置、频率、商店类型以及与客户档案契合的其他因素来识别客户的预期购买模式,当发生完全反常的行为时,例如某客户大部分时间都在旧金山湾区,却突然深夜在佛罗里达州购物,则将其标记为潜在欺诈。

图形分析可以大大降低模式识别的计算要求。它擅长在节点之间建立模式,在本例中,节点即帐户(持卡人)、购买地点、购买类别、交易和终端。自然行为模式非常易于识别,例如在特定月份中一个客户可以:

  • 在不同的宠物商店(终端)购买宠物食品(购买类别)
  • 周末在该地区(购买地点)向餐馆付款(交易元数据)
  • 在本地五金店(帐户位置和购买位置)购买维修用硬件(购买类别)

欺诈检测通常离不开机器学习,但图形分析可以创建一个更准确、更高效的流程。凭借对关系的关注,图形分析结果已成为确定和标记欺诈记录的有效预测指标,可以在实际使用数据之前做好数据整理和准备工作。

图形数据库的未来趋势

在过去十年里,随着计算能力和大数据的增长,图形数据库和图形技术也在不断发展。越来越多的事实表明,它们将成为分析复杂数据关系的标准工具。如今,各种企业和组织不断推进大数据和分析功能发展,而图形数据库支持通过日益复杂的方式获取洞察,是当下及未来企业成功的必要装备。