什么是数据延迟?专家指南

Michael Chen | 内容策略师 | 2024 年 5 月 13 日

数据延迟是指发送数据以供使用与生成所需结果之间的时间延迟。延迟可能由多种因素导致,包括网络拥塞、硬件限制、软件处理时间、端点之间的距离以及系统配置方式。

考虑击中汽车的刹车踏板和车辆停止之间的响应滞后。在实践中,人类倾向于在一秒钟内刹车,以感知需要这样做。想象一下,如果系统介入前出现两三秒的延迟,会有多大的破坏性。结果将大大降低速度限制,汽车之间的安全距离将需要大大增加。幸运的是,除非有什么不对劲,制动以十分之一秒开始,我们认为这是一个瞬时的实时响应。

任何控制系统(包括 Internet of Things (IoT) 技术)的延迟都将限制其运行精度。流行的 IoT 用例是智能家居技术,它允许我们通过集中式智能集线器或移动应用程序控制各种公用事业,例如照明、加热、安全和家电。考虑一个智能恒温器。当您将其设置为 70 度时,由于系统中的延迟,温度将在大约 69 到 71 之间波动。但是,让我们说,而不是两到三度的波动,你只需要 0.1 度的波动。由于热量或 A / C 之间的延迟和记录变化的恒温器之间,实际温度将几乎永远不会处于非常狭窄的 0.1 度范围内。因此,每隔一分钟左右,集线器就会在 A/C 和热量之间切换。这不仅对您的机械系统来说是困难的,当您的下一个能源法案到来时,您也会得到一个粗鲁的惊喜。

什么是数据延迟?

数据延迟是指数据从源传输到目标所用的时间,或数据处理和可供使用所用的时间。这种延迟可能是由各种因素引起的,包括网络拥塞和硬件限制、数据收集的配置方式以及数据处理系统中的瓶颈。

数据延迟可能会产生重大的负面影响;它也可以成为 IT 可以利用的杠杆,以平衡数据收集和传输的成本与业务需求。在某些行业,特别是那些需要实时或时间敏感信息(如金融行业)的行业,即使数据传输的延迟很小,也可能导致错失机会或不正确的定价。总的来说,组织将努力权衡各种应用中决策和最佳性能所需的速度,以抵消更快响应的成本,并且仍然限制了可以从系统中驱动多少延迟。

虽然延迟总是会降低性能,但数字系统是否变得不可用取决于一系列因素。

在控制系统(即管理、指导和指挥其他系统或设备的系统)中,过多的延迟会导致不稳定,甚至可能导致系统无法运行。在语音和视频呼叫等实时用例中,延迟充其量是令人讨厌的,超过某个阈值,使系统无法使用。在数据分析中,由于决策者没有完成分析,延迟可能会使流程延迟到完成分析的模拟点。

让我们看看几种类型的延迟。

实时应用中的数据延迟

人类对音频和视频中的数据丢失非常不容忍。在音频应用程序中,如果数据被延迟超过四分之一秒左右,它将变得无用,并且将被视为点击或弹出或以其他方式乱码音频。视频也是如此。延迟的数据与丢失的数据一样糟糕。算法可以尝试补偿,但如果网络延迟超过约 300 毫秒,实时视频将变得无法忍受损坏。

在现代网络中,延迟通常只有几十毫秒,视频和音频应用程序运行得很好。网络还可以识别实时流量并确定其优先级,以便延迟不会在到达时使数据毫无用处。

在近乎实时的应用中,延迟是一个问题。例如,当从远程工厂车间传感器收集数据以监视故障时,延迟可能会将响应时间减慢到生产线关闭的时间点,然后技术人员才能进行干预。但更快的信息共享需要非常高性能的广域网,这是昂贵的。答案是使用所谓的边缘计算系统,使存储和计算更接近创建数据的机器,降低数据传输要求,从而减少延迟。

业务分析中的数据延迟

到目前为止,我们讨论的系统需要亚秒级延迟才能有效工作。在创建业务数据时,业务数据以及业务数据的分析将始终更加有用。但是,除了这个非常广泛的声明外,很难确切地说,如果不考虑手头的应用程序,可以接受多少延迟。

在天气预报中,上周的大气条件数据可能有助于确定本周的天气模式,但过去几天和几小时的新数据将更有用。但是,对于及时性有多重要,存在一个限制。天气预报员需要每秒或每十分之一秒的数据更新吗?在某些时候,在很短的间隔内收集的数据没有足够的差异来值得花费。

在计算业务分析系统的设计中可以接受的延迟时,同样的思维方式也很重要。大型零售商是否希望了解每秒销售多少件蓝色衬衫?可能不行。每小时销售和库存数据是否足够?考虑到在一个小时内对库存进行有意义的更改是多么困难,是的,这可能就足够了。获得更好的性能将花费可能更好地花在其他地方的钱。

另一方面,关于销售数据的报告在几个小时内甚至几天内都是非常有价值的。高管可能想知道购买蓝色衬衫的人也会购买哪些商品,即使这些商品不在同一购物实例中也是如此。他们可以根据这些数据创建销售捆绑包,例如“购买外观”产品。同样,网上购物者喜欢“买这个的人,也买了那个”的建议。因此,收集“人们也购买”数据的延迟可能比简单地销售多少件衬衫要重要得多。让商店经理的报表每天都放在收件箱中,让他们在几秒钟内提取数据之间的差异可能会改变真正的商业游戏规则。

因此,虽然延迟会影响数据的收集方式、处理方式以及如何将其提供给未来的分析,但决定要改进的领域应该从了解业务挑战开始。数据收集需要与业务需求一样快,但花钱更快地实现数据收集可能是一项不明智的投资。关键是重点关注新技术投资将产生最大影响的领域。

同时,从需要 ETL 流程才能开始分析的系统迁移到允许将数据存储在高级数据库环境的系统,企业高管可以更快地(甚至是实时)了解更多趋势。添加自助服务功能,以便业务负责人可以生成通用分析,这也将减少另一个延迟源。

这与业务延迟的概念有关,即影响未来绩效的意外事件发生在您的组织对此信息采取行动的那一刻之间的时间。

管理延迟至关重要,因为这会极大地影响用户体验和满意度。高延迟会导致加载时间变慢、请求处理延迟以及整体性能不佳。监视和优化延迟级别是值得的。通过减少延迟,企业可以提高客户和员工的满意度。

如今的超大规模企业已经建立了合作伙伴关系,可以在任何云提供商的设施内全面访问数据,而且不会出现延迟。这是如何,再加上 10 个现在要知道的进步。

数据延迟常见问题解答

什么是可接受的数据延迟?

可接受的数据延迟因组织或系统使用数据而异。一般来说,可接受的数据延迟是指将数据从源传输或处理到目标以提供可接受性能所需的最长时间。在某些情况下,例如在财务系统或关键任务应用中,以最少的延迟进行实时数据处理至关重要。在其他情况下,例如在数据分析或报告中,数据更新可以进行批处理,数据传输或处理可能会略有延迟。最终,什么是“可接受”的数据延迟取决于组织或系统的特定优先级和用例。

在服务器中,内存、CPU 和网络适配器之间的延迟以微秒为单位进行测量。在大型存储系统中,它是毫秒。当客户进行购买时,将交易提交到存储可能需要一秒钟左右的时间。当人类参与时,延迟可能会更长。确定可接受的延迟几乎总是取决于手头的应用程序。

如何处理数据延迟?

处理数据延迟的策略取决于延迟的来源。如果一个组织只看到少数关于延迟的投诉,这个问题可能源于用户方面。可能的原因包括设备过时或互联网连接缓慢。对于广泛的问题,这是一个迹象,表明原因在于组织方面。一套有助于修复数据延迟的优秀实践,包括实施缓存工具、监视工具、更好的数据压缩策略,以及考虑更好的云基础设施提供商

数据速率是否影响延迟?

数据速率是指通过网络发送数据的速度,通常以每秒字节数表示。数据延迟与此相关,因为它是请求和响应之间的时间间隔。更高的数据速率有助于减少数据延迟,因为更高的数据速率可确保更好的带宽和整体性能。但是,数据延迟不一定直接依赖于数据速率,因为其他变量可能适用。然而,它们足够相关,数据速率问题可能是延迟问题的指示,反之亦然。

如何减少延迟变化?

对于用户来说,延迟变化可能源于设备上不可靠的互联网连接或低内存/存储等简单问题;解决这些问题通常会清除变化。在提供商方面,延迟变化可能是突然计算请求消耗了处理能力或带宽的症状。端到端应用监视和一般网络监视应该能够深入了解突发延迟峰值的原因。一旦根源被隔离,IT 团队就可以实施优化策略。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。