未找到结果

您的搜索操作未匹配到任何结果。

我们建议您尝试以下操作,以帮助您找到所需内容:

  • 检查关键词搜索的拼写。
  • 使用同义词代替键入的关键词,例如,尝试使用“应用”代替“软件”。
  • 请尝试下方显示的热门搜索之一。
  • 重新搜索。
热门问题

图形数据库定义

图形数据库是一种专用于创建和处理图形的专业化单一用途平台。其中,图形包括节点、边和属性,它们能够以关系数据库无法实现的方式来表示和存储数据。

图形分析则是另一个常用术语,专指图形格式(以数据点作为节点,以数据关系作为边)数据的分析过程。图形分析离不开支持图形格式的数据库:专用图形数据库或支持图形格式的融合数据库。

图形数据库类型

图形数据库有两种常用模式:属性图形和 RDF 图形。属性图形侧重于分析和查询,而 RDF 图形则侧重于数据集成。两种图形均是由一系列的点(顶点)和这些点之间的关系(边)构成的集合。但它们是有区别的。

属性图形

属性图形用于对数据之间的关系进行建模,并且可以基于这些关系实现查询和数据分析。属性图形具有可以包含主题相关详细信息的顶点,以及表示顶点之间关系的边。顶点和边可以具有与之相关联的属性。

本例中的属性图形表示一组同事及其关系。

图形数据库

属性图形功能全面,因此被广泛用于金融、制造、公共安全和零售等众多行业领域。

RDF 图形

RDF 图形(RDF 即资源描述框架)符合一系列 W3C(万维网联盟)标准,旨在通过语句表示复杂的元数据和主数据。它们通常应用于链接数据、数据集成和知识图。它们可以表示域中的复杂概念,也可以提供丰富的语义以及对数据的推论。

在 RDF 模型中,语句由三个元素表示:通过边连接的两个顶点反映语句的主语、谓语和宾语 — 这被称为 RDF 三元素。每一个顶点和边缘都由唯一的 URI 或唯一资源标识符标识。RDF 模型支持通过定义良好的语义以标准格式发布数据,从而实现信息交换。政府统计机构、制药公司和医疗机构已经广泛采用 RDF 图形。

图形和图形数据库的工作原理

图形和图形数据库通过图形模型来表示数据中的关系。它们可允许用户基于关系执行“遍历查询”,并应用图形算法查找模式、路径、社区、影响者、单点故障以及其他关系,从而更加高效地针对大量数据进行大规模分析。图形的强大之处在于分析、所提供的洞察以及链接不同数据源的能力。

在分析图形方面,算法会探索顶点之间的路径和距离、顶点的重要性以及顶点的聚类。例如,确定重要性算法时通常会查看传入边、相邻顶点的重要性以及其他指标。

图形算法(专用于分析图形中数据间关系和行为的操作)可揭示其他方法难以揭示的内在本质。在分析图形方面,算法会探索顶点之间的路径和距离、顶点的重要性以及顶点的聚类。算法通常会查看传入边、相邻顶点的重要性以及其他指标来帮助确定重要性。例如,在探索社交网络或业务流程中最密切的人物或事物的关系时,图形算法可以识别社区、异常、常见模式以及连通个人或相关事务的路径。

由于图形数据库以显式方式存储关系,因此利用顶点之间连通性的查询和算法可以在数秒内运行,而不是数小时或数天。用户无需执行无数的联接操作,并且可以更加轻松地将数据应用于分析和机器学习,以便于发现关于周围世界的更多信息。

图形数据库的优势

图形格式可提供一个更灵活的平台,帮助用户基于关系强度或关系质量等因素查找远程关系或分析数据。您可以使用图形来探索和发现社交网络、物联网、大数据、数据仓库以及多种业务使用场景下的复杂业务数据中的联系和模式,包括银行中的欺诈检测、社交网络中的关系发现以及 360 度客户视图。如今,图形数据库越来越广泛地被应用于数据科学,帮助用户更加清晰地呈现数据关系。

由于图形数据库以显式方式存储关系,因此利用顶点之间连通性的查询和算法可以在数秒内运行,而不是数小时或数天。用户无需执行无数的联接操作,并且可以更加轻松地将数据应用于分析和机器学习,以便于发现关于周围世界的更多信息。

图形数据库高度灵活,功能超强,可助您通过图形格式,更轻松地识别复杂关系,捕获更深入的洞察。它通常使用 PGQL 一类的语言来运行查询。请查看以下示例,了解使用 PGQL 和 SQL 进行查询有何不同。

图形分析使用场景

从示例中可以看出,PGQL 代码更简单,更高效。由于图形强调的是数据之间的关系,因此非常适合多种不同类型的分析。图形数据库尤其擅长:

  • 查找两个节点之间的最短路径
  • 确定产生重大活动/影响力的节点
  • 分析连接性,识别网络的最薄弱点
  • 基于组中的连接距离/密度来分析网络或社区状态

图形数据库和图形分析的工作原理

下图是一个简单的图形数据库示例,它以可视化方式显示了流行派对游戏“六度分离 (Six Degrees of Kevin Bacon)”。该游戏将基于一系列相互关联的电影,在 Kevin Bacon 与另一位演员之间建立联系。该游戏以关系为主,是演示图形分析的最佳方式。

请想象一个具有两类节点的数据集:曾经拍摄过的每一部电影,以及出现在这些电影中的每一位演员。然后,我们使用图形运行查询,在 Kevin Bacon 与布偶秀的 Miss Piggy 之间建立联系。结果如下:

使用图形的数据集

在这一示例中,可用节点(顶点)既是演员也是电影,关系(边)则是“出演”状态。在此基础上,查询将返回以下结果:

  • Kevin Bacon 与 Meryl Streep 一同参演了《The River Wild》。
  • Meryl Streep 与 Billy Connolly 一同参演了 Lemony Snicket 的《A Series of Unfortunate Events》。
  • Billy Connolly 与 Piggy Miss 一同参演了《Muppet Treasure Island》。

图形数据库可以查询多种关系,例如:

  • “Kevin Bacon 与 Miss Piggy 之间的最短关系链路是什么?”(上述“六度分离”游戏中所使用的最短路径分析)
  • “谁合作过的演员最多?”(度中心性)
  • “Kevin Bacon 与所有其他演员之间的平均距离是多少?”(紧密中心度)

当然,与大多数图形分析应用相比,这个示例比较有趣。但这种方法几乎适用于所有大数据 — 在任何情况下,大量记录都可以显示出彼此之间的自然联系。图形分析最常见的应用包括分析社交网络、通信网络、网站流量和使用情况、真实道路数据以及金融交易和帐户。

图形数据库使用场景:洗钱

图形数据库使用场景

从概念上讲,洗钱很简单。非法资金被转移至合法资金中,然后变成硬资产。这是巴拿马文件分析中所使用的流程。

更具体地说,在循环转账中,犯罪分子向自己发送大量从欺诈中获得的资金,但通过“正常”帐户之间的一系列漫长而复杂的有效转账将其隐藏起来。这些“正常”帐户实际上是使用综合身份创建的帐户。这些账户是从被盗的身份(电子邮件地址、地址等)生成的,因此通常共享某些相似的信息,而且这种相关信息让图形分析非常适合用于揭示欺诈来源。

为了简化欺诈检测,用户可以基于实体之间以及共享某些信息(包括电子邮件地址、密码、地址等)的实体之间的交易来创建图形。创建图形之后,随即运行一个简单查询查找所有具有类似信息的客户,并揭示哪些客户彼此之间相互汇款。

图形数据库使用场景:社交媒体分析

图形数据库适用于很多场景,但最常见的是社交网络分析。事实上,社交网络是图形数据库的一个理想使用场景,因为它涉及大量的节点(用户帐户)和多维联系(多个不同方向的交互)。通过对社交网络进行图形分析,您可以了解:

  • 用户的活跃程度如何?即节点数量
  • 哪些用户影响力最大?即连接密度
  • 哪些用户的双向交互最多?即连接方向和密度

但是,如果僵尸程序扭曲了这些信息,这些信息就毫无意义。对此,图形分析可以有效识别和过滤僵尸程序。

例如,Oracle 团队曾使用 Oracle 营销云来评估社交媒体广告的效果和牵引力,尤其是识别可能扭曲数据的僵尸程序。这些僵尸程序一般会通过转发来人为提升目标帐户的知名度,而简单的模式分析可基于转发计数以及与邻居的连接密度来明辨真伪。与背后有僵尸程序作祟的帐户相比,自然热门帐户具有不同的邻居关系。

下图所示为自然热门帐户。

图形数据库使用场景:社交媒体分析

下图所示为僵尸程序驱动的帐户行为。

图形数据库使用场景:社交媒体分析

其中,关键是利用图形分析来识别自然模式与僵尸程序模式,然后过滤僵尸程序帐户。当然,您也可以进行更深入的分析,比如分析僵尸程序与被转发帐户之间的关系。

一般来说,社交媒体网络会倾尽全力来清除僵尸程序帐户,避免整体用户体验受到影响。为了验证这一僵尸程序检测流程是否准确,一个月后对标记帐户进行检查,结果如下:

  • 暂停:89%
  • 删除:2.2%
  • 仍然活跃:8.8%

高达 91.2% 的帐户受罚证明了模式识别和清理的准确性。简而言之,图形分析可以快速识别复杂模式 — 标准的表格数据库要花费更多时间才能实现类似结果。

图形数据库使用场景:防范信用卡欺诈

图形数据库已成为了金融业的一种强大的欺诈检测工具。在信用卡领域,尽管反欺诈技术一直在进步,例如在卡片中嵌入芯片,但仍然无法避免各种各样的欺诈行为。例如,读卡机侧录器(常见于未安装芯片卡读卡器的场所)可以通过磁条来窃取信息,而一旦这些信息被恶意收集和存储起来,就可以加载到伪造卡上来购物或取款。

作为一种欺诈检测方法,模式识别通常是欺诈检测的第一道防线。具体来说,就是基于位置、频率、商店类型以及与客户档案契合的其他因素来识别客户的预期购买模式,当发生完全反常的行为时,例如某客户大部分时间都在旧金山湾区,却突然深夜在佛罗里达州购物,则将其标记为潜在欺诈。

图形分析可以大大降低模式识别的计算要求。它擅长在节点之间建立模式,在本例中,节点即帐户(持卡人)、购买地点、购买类别、交易和终端。自然行为模式非常易于识别,例如在特定月份中一个客户可以:

  • 在不同的宠物商店(终端)购买宠物食品(购买类别)
  • 周末在该地区(购买地点)向餐馆付款(交易元数据)
  • 在本地五金店(帐户位置和购买位置)购买维修用硬件(购买类别)

欺诈检测通常离不开机器学习,但图形分析可以创建一个更准确、更高效的流程。凭借对关系的关注,图形分析结果已成为确定和标记欺诈记录的有效预测指标,可以在实际使用数据之前做好数据整理和准备工作。

图形数据库的未来趋势

近十年来,随着计算能力的提高和大数据的激增,图形数据库和图形技术也在不断发展。越来越多的事实表明,它们将成为分析复杂数据关系的标准工具。如今,各种企业和组织不断推进大数据和分析功能发展,而图形数据库支持通过日益复杂的方式获取洞察,是当下及未来企业成功的必要装备。

Oracle 可帮助组织轻松采用图形技术。Oracle 数据库和 Oracle 自治数据库包含一个图形数据库和图形分析引擎,用户可以利用强大的图形算法、模式匹配查询和可视化功能来发现数据中的更多洞察。图形是 Oracle 融合数据库的一部分,该数据库支持多模型、多负载和多租户需求 — 一切均融合在一个数据库引擎中。

所有图数据库均声称具有高性能,但 Oracle 的图形产品在查询性能和算法上均表现出色,而且与 Oracle 数据库紧密集成。因此开发人员可以轻松地将图形分析添加到现有应用,并利用数据库默认提供的可扩展性、一致性、恢复、访问控制和安全性功能。