Greg Pavlik | Oracle Cloud Infrastructure 高级副总裁 | 2023 年 9 月 15 日
生成式人工智能 (AI) 是一种相对较新的 AI 形式。不同于之前的技术,生成式 AI 可以根据训练数据进行推断并生成新的内容。自 2022 年秋季首款生成式 AI 消费者聊天机器人公开发布以来,这项技术产出拟人化的写作、图像、音频和视频的能力吸引了全世界的关注。根据麦肯锡 2023 年 6 月发布的报告,生成式 AI 将提高员工的工作效率,预计每年能够为全球经济贡献 6.1 万亿美元至 7.9 万亿美元。该研究也指出,所有 AI 技术对生产力的提升可能带来 17.1 万亿美元到 25.6 万亿美元的效益。因此,截至 2023 年年中,生成式 AI 虽然“散发出浓郁牛油香”,但它仍然只是 AI 领域这块“牛排”中的一部分。
每一项行动都会伴随着赞同和反对的声音。在迎接光明的生产力前景的同时,生成式 AI 也带来了新的潜在业务风险,例如不准确性、隐私侵犯和知识产权暴露等问题,甚至会对经济和社会产生颠覆性的影响。例如,如果员工没有经过重新培训,就无法实现生成式 AI 的生产力优势,这无疑会使许多人失去现有的工作。因此,世界各地的政府政策制定者,甚至是一些科技行业的高管,都在提倡制定 AI 法规。
本文深入探讨了生成式 AI 的承诺和威胁:其工作原理;直接的应用、用例和例子;局限性;潜在业务效益和风险;使用的优秀实践;并展望这项技术的未来。
生成式 AI(Generative AI,简称 GAI)属于 AI 机器学习技术的一部分,这项不久前开发的新技术可快速创建内容以响应文本提示,包括从简短到长而复杂的文本。生成式 AI 工具可以生成音频、图像和视频内容,但深受关注的是其文本导向型 AI 会话能力,激发了人们的想象力。借助此优势,经过文本训练的生成式 AI 模型可实现拟人化的互动,便于人们与其进行交流和学习。
2022 年 11 月 30 日,基于 OpenAI GPT-3.5 神经网络模型的聊天机器人 ChatGPT 正式发布,生成式 AI 的浪潮席卷了全球。GPT 是生成预训练变换器 (Generative Pretrained Transformer) 的缩写,主要指该模型的底层神经网络架构。
在 20 世纪 60 年代中期,麻省理工学院研发了首个对话式聊天机器人 ELIZA。但大多数早期的聊天机器人,包括 ELIZA,完全或很大程度上是基于规则的,缺乏对情境的理解,因此回应仅限于一组预定义的规则和模板。相反的,现在的生成式 AI 模型没有这样的预定义规则或模板。打个比方,生成式 AI 就像是原始的、空白的大脑(神经网络),通过基于现实世界数据的训练来接触我们的世界。然后,生成式 AI 将独立地实现智能化,构建一个能够表示世界运行方式的模型,然后据此为提示生成新内容。即使是 AI 专家也不知道生成式 AI 是如何做到这一点的,因为算法会随着系统训练而自我发展和调优。
大大小小的企业都应该拥抱充满潜力的生成式 AI,因为生成式 AI 可以将技术自动化的优势带到知识工作中,而直到现在,这些工作基本上尚未实现自动化。生成式 AI 工具改变了知识工作自动化的计算方式。这些工具能够生成拟人化的文本、图像、音频或视频来响应简单的英语文本提示,这意味着它们可以与人类协同工作,生成适用于实际工作的内容。
甲骨文公司董事会主席兼首席技术官 Larry Ellison 在 2023 年 6 月的电话会议上表示,未来几年,很多公司都会训练自己的专业化大型语言模型。
人工智能 (AI) 是一个庞大的计算机科学领域,而生成式 AI 是其中的一小部分,至少目前是如此。当然,生成式 AI 与传统 AI 有着许多共同的属性,但也有一些明显的区别。
另一个值得注意的区别是,就像某位 AI 研究人员所说的,生成式 AI 的基础模型训练需要付出“天价的成本”。例如,在起步阶段,硬件以及与之相符的云技术服务成本就可能需要 1 亿美元,因为大多数 AI 开发工作都集中在这个阶段。然后,企业还需要支付大型数据卷的成本。
关键要点
对于大大小小的企业来说,看似神奇的是,生成式 AI 可以给知识型任务带来技术自动化的优势。或者,正如麦肯锡报告所述,“以前,涉及决策和协作的活动的自动化可能性最低”。
从历史上看,技术更擅长自动执行日常任务或重复性任务,因为这些任务具备既定的决策,或者可以根据可充分理解的具体规则来推断高度可信的决策。以制造业为例,无论是精确且重复性的装配线,还是会计工作,都需要遵守行业协会制定的规范原则。但生成式 AI 能够做到更复杂的认知工作。比如说,在行业中断期间,生成式 AI 能够根据指示为业务经理推荐替代方案,进而帮助该组织制定策略。
麦肯锡评估了跨 16 个业务职能的 63 个用例,结论指出,生成式 AI 可能带来数万亿美元的价值,其中 75% 来自四个职能:客户运营、营销和销售、软件工程以及研发。各行各业的创收前景分布更为均匀,部分行业表现更为亮眼:在行业收入增长率预测中,高科技行业占据了榜首,然后依次是银行、医药和医疗产品、教育、电信和医疗卫生行业。
此外,Gartner 的分析结果也与麦肯锡不谋而合:例如,到 2025 年,使用生成式 AI 技术发现新药物和材料的比例将从今天的 0增长至超过 30%;在大型组织中,合成生成的出站营销信息也预计将从 2022 年的 2% 增加至 2025 年的 30%。Gartner 对 2500 名高管进行了在线调研,结果显示,多数企业将生成式 AI 的投资用于改善客户体验和保留率 (38%)。
这一切发生得如此之快,主要是因为生成式 AI 和传统 AI 有所不同。几十年来,生成式 AI 一直低调地进行自动化,不断提高商业流程价值,直到 ChatGPT 的拟人化对话能力面世,生成式 AI 才成为了全世界的焦点。借此机会,人们也逐渐关注和了解生成式 AI 技术的其他模式;似乎每个人都在尝试使用一个或多个专业化的生成式 AI 模型来撰写文本,或者是制作音乐、图片和视频等。因此,随着越来越多组织尝试采用生成式 AI 技术,这项技术预计将会迅速颠覆商业和社会。
显然的,生成式 AI 所产生的影响是改变知识型任务。个人角色可能会发生显著变化,因此员工需要学习新的技能。某些岗位甚至可能会消失。然而,从历史上看,像生成式 AI 这样的大型技术变革总是会为经济带来比被淘汰的岗位更多(和更高价值)的就业机会。但对于那些被淘汰的人们而言,这无法有效的安慰他们。
对于生成式 AI 模型的工作原理,普遍上有两种答案。根据以往的经验,我们知道生成式 AI 的详细工作原理,因为人类设计了各种神经网络来准确地完成他们想要做的事情,并进行了几十年的迭代,使其变得越来越好。AI 开发人员知道神经元是如何连接的;他们设计了每个模型的训练流程。然而,在实践中,没有人能够确切知道生成式 AI 模型是如何完成工作的 — 这是一个令人尴尬的事实。
Dean Thompson 是多家 AI 初创公司的前首席技术官,公司已被大型企业(包括 LinkedIn 和 Yelp)收购,目前在相关企业担任大型语言模型 (LLM) 的高级软件工程师。他表示,他们不知道生成式 AI 实际上是如何执行创造性任务的,就目前而言,神经网络层内发生的事情对人们来说过于复杂。生成式 AI 具备生成新原创内容的能力,被广泛视为是一种基于已知架构和训练而产生的新兴资产。因此,虽然目前已经有很多理论可以解释我们所知道的情况,但像 GPT-3.5 这样的模型,其内部实际上发生了什么,或者说它在“想什么”,这些都还有待研究。有些 AI 研究人员相信,能够在未来 5 到 10 年内发现其中的奥秘;有些人则认为这可能成为永远的谜。
接下来,我们将简单介绍我们所了解的生成式 AI 的工作原理:
从大脑开始。Jeff Hawkins 在 2004 年发表的著作《On Intelligence》(译名为《人工智能的未来》)中表示,人类的大脑是了解生成式 AI 模型的一个不错的起点。Hawkins 是一位计算机科学家、大脑科学家和企业家,在 2005 年 PC Forum 上展示了自己的工作进展。PC Forum 是一个以技术投资者 Esther Dyson 为首的年度科技行业高管会议。Hawkins 假设,在神经元层面,大脑不断预测接下来会发生什么事情,并从预测与后续现实之间的差异中学习。为了提高预测能力,大脑针对世界建立了一个内部表示。在 Hawkins 的理论中,人类智力在这个过程开始出现。无论是否受到 Hawkins 的影响,生成式 AI 确实是以这种方式工作的。而且令人吃惊的是,它就像是拥有智力一样。
构建人造神经网络。所有生成式 AI 模型都始于在软件中编码的人工神经网络。Thompson 认为,如果使用视觉比喻,神经网络就像是我们熟悉的电子表格,但它是 3D 立体的,因为人工神经元会层层堆叠,类似于大脑中真实的神经元。AI 研究人员甚至还将每个神经元称为“细胞”,每个细胞都包含一个公式,可以与网络中的其他细胞互联,从而模拟大脑神经元之间不同强弱的连接。
神经网络的每一层可能有数十、数百甚至是数千个人工神经元,但 AI 研究人员关注的重点并不是神经元的数量,而是神经元之间的连接数量,因为他们将据此来测量模型。神经元连接的强弱会根据细胞方程的系数而变化,这些系数通常称为“权重”或“参数”。当您读取时,参考的就是由连接定义的系数,例如 GPT-3 模型有 1750 亿个参数。传闻新版 GPT-4 拥有数万亿个参数,但这是未经证实的说法。有些神经网络架构具有不同的特征,可以通过特定模式生成内容,例如变换器 (Transformer) 架构更适合大型语言模型。
训练新建的神经网络模型。大型语言模型通过处理大量文本来进行简单的预测,例如判断某个句段中的下一个单词或是几个句子的正确顺序。然而,在实践中,神经网络模型以令牌而不是单词为单位。
Thompson 表示,常见单词可能有自己的令牌,而不常见的单词肯定是由多个令牌组成,某些令牌可能只是一个空格,紧接着是“th”,因为这三个字符的序列非常常见。每一次预测时,模型会在特定人工神经元堆栈的底层输入一个令牌;这层处理完令牌后会将输出结果传递给下一层,以此类推,直至堆栈顶部输出最终结果。堆栈可大可小,但通常只有数十层,而不是千千万万层。
在早期训练阶段,模型的预测并不准确。模型在每一次预测令牌时,都会根据训练数据检查预测结果是否正确。无论是对与错,“反向传播”算法都会在进行预测的堆栈的每个细胞中调整参数,也就是公式的系数,以此提高准确预测的可能性。
Thompson 表示,这是为了获得正确的答案,因为准确预测可能只有 30% 的确定性,但这已经是所有答案中确定性最高的。因此,反向传播的目标是将 30% 变成 30.001% 或类似的结果。
在模型对数万亿个文本令牌重复进行此过程后,预测下一个令牌或单词时就会变得非常擅长。完成了初始训练之后,生成式 AI 模型可以通过受监督的学习技术进行微调,例如人类反馈中强化学习(RLHF)。在 RLHF 中,该模型的输出结果会提供给人工审核员进行正面或负面的二选一评估,再反馈给模型。RLHF 可用于微调 OpenAI 的 GPT 3.5 模型,进而创建了火遍全球的 ChatGPT 聊天机器人。
尽管如此,模型究竟是如何回答我的问题的呢?这是一个谜。以 Thompson 目前的了解,在整个过程中,很大一部分是“我们不知道”的。他所知道的是,生成式 AI 模型会把整个问题视为一个令牌序列,在第一层同时处理所有令牌。然后,模型会将在下一层处理第一层的输出结果,并在每一层重复此过程,直至堆栈顶层。顶层将进行预测,也就是生成第一个令牌,整个系统会基于这个令牌来生成下一个令牌,依此类推。
Thompson 接着表示,从逻辑上来说,下一个有待了解的问题是:生成式 AI 考虑了哪些方面?如何处理这一切?这些层都做了什么?显然地,我们无从知晓。我们……不知道。您可以研究一下,观察一下。但其复杂性超出了我们的分析能力。这就像是对人类的大脑进行 F-MRI(功能性磁共振成像)扫描一样。我们只能粗略了解模型的实际操作。我们不知道的太多了。
尽管存在争议,在 2022 年秋季率先接触 GPT-4 的十几位研究人员得出结论,该模型具备智能来应对他们给出的复杂挑战,并且展示了广泛的专业知识,这些都足以表明 GPT-4 已经获得了某种形式的通用智能。换句话说,GPT-4 建立了一个关于世界如何运作的内部模型,就像人类大脑一样,它可以利用这种模型针对提出的问题进行推理。其中一位研究人员在《This American Life》播客中分享到,他在向 GPT-4 提问时,简直觉得“我的天啊”。他提问:“给我一份巧克力曲奇饼干的食谱,但是要以很丧的风格来写。”该模型回答道:“原料:1 杯软化的黄油,但前提是你能够找到软化它的方式。1 茶匙香草精,人造的幸福味道。1 杯半甜巧克力片,终将会融化的一丁点快乐。”
要了解生成式 AI 的重要性,其中一个有效的方法是将其视为开放式创意内容的计算器。计算器可以自动执行常规和普通的数学计算,让人们能够专注于更高级别的任务。同理,生成式 AI 也具备一定潜力,能够自动执行例常工作中繁琐的子任务,帮助人们专注于更高层次的任务。
试想一想,营销人员经常需要从非结构化、不一致和互联数据中,获得切实可行的洞察,这个过程中需要面临哪些挑战?以往,他们首先需要将这些数据整合在一起,这需要相当多的定制软件工程,为不同的数据源(例如社交媒体、新闻和客户反馈)提供共同的结构。
多邻国 (Duolingo) AI 和安全领域的高级工程经理 Basim Baig 表示,通过使用 LLM,可以直接将不同来源的信息输入到提示中,然后请求生成关键洞察,或提问哪些反馈更重要,或请求情感分析,模型就会开始执行任务。LLM 的力量在于它能够让人们跳过庞大而昂贵的工程设计步骤。
不仅如此,Thompson 建议产品营销人员使用 LLM 来标记自由格式文本进行分析。假设您有一个庞大的社交媒体数据库,提到了您的产品。您可以编写一个软件来应用 LLM 及其他技术,从而:
然后,您可以将结果应用于:
生成式 AI 代表了广泛的应用类别,这些应用都是基于日益增加的神经网络变体。尽管所有生成式 AI 都符合《生成式 AI 的工作原理》一节中的总体描述,但实施方法会因不同的介质(例如图像、文本)而异,并且会随着研究和行业创新不断进步。
神经网络模型使用人工神经元的重复性模式及其互联的特性。对于任何应用,包括生成式 AI 而言,神经网络设计通常会重复数百或数千次相同的神经元模式,尤其是重复使用相同的参数。这是所谓的“神经网络架构”的重要组成部分。自 20 世纪 80 年代以来,新架构的发现一直是 AI 创新的一个重要领域,常以支持新媒介为目标。一旦发明了一种新的架构,后续的进展往往是人们意想不到的。其他的创新源于结合不同架构的元素。
在早期发明并沿用至今的两种架构是:
虽然 RNN 仍被广泛使用,但在改进 RNN 的过程中,出现了一些突破性的成果:
研究机构、私营部门和开源工作创造了有影响力的模型,有助于针对神经网络架构和应用实现更高层次的创新。例如,在训练过程中,如何导入训练反馈以改进模型,以及如何将多个模型组合到生成式 AI 应用中,这些方面都取得了至关重要的创新。以下是一些重要的生成式 AI 模型创新:
虽然我们才刚刚开始发现生成式 AI 的潜在用途,但通过将其应用于业务运营,企业可以轻松地了解如何从中获益。您可以尝试思考,生成式 AI 如何改变客户交互、销售和营销、软件工程以及研发等关键领域。
在客户服务中,早期的 AI 技术实现了流程自动化并推出了客户自助服务,但同时也带为客户来了新的问题。基于生成式 AI 的聊天机器人可以支持不同语言和地区,打造更加个性化和可访问的客户体验,为客户和客服代表提供了优势。当需要人为干预来解决客户问题时,客服代表可以实时与生成式 AI 工具进行协作,找到可行的策略,从而提高交互的速度和准确性。面对客户投诉,生成式 AI 可以快速访问整个大型企业知识库并生成新的解决方案,进而提高服务人员有效解决特定客户问题的能力。服务人员无需像过去一样依赖过时的电话树和呼叫转接,重复直到找到答案为止,让客户失去耐心。
在营销方面,生成式 AI 可以自动整合和分析来自不同来源的数据,进而大大加快获取洞察的速度,直接帮助企业做出更明智的决策,并加快制定上市策略。营销人员可以将这些信息与 AI 生成的其他洞察一起使用,实施针对性更强的新广告活动。这样可以减少员工在收集人口统计和购买行为数据方面所需的时间,从而将更多时间用于分析结果和集思广益。
B2B 营销机构 Stein IAS 的董事长兼首席品牌官 Tom Stein 表示,包括 Stein IAS 在内的每个营销机构都在快速探索机会。但 Stein 指出,要在机构的后端流程中取得成功,还有其他更简单、更快的方式。
作为 2023 Cannes Lions Creative B2B Awards 的评审团主席,Stein 认为,在所接获的 RFI[信息请求]中,通常 70% 到 80% 的 RFI 需要获得的信息是相同的,但可能因为公司情况不同而存在一些情境差异。因此,利用任意数量的 AI 工具来替我们完成任务,这并不是一件复杂的事情……如果能够腾出 80% 的时间,就可以花时间提升 RFI 的价值,取得更多成就,百利而无一害。像这样的流程还有很多。
从计划到维护,软件开发人员可以与生成式 AI 协作,进而简化流程并加快速度。在初始创建阶段,生成式 AI 工具可以分析和整合大量数据,并推荐多种程序配置方案。在开始进行编码工作后,AI 可以在启动之前和之后测试代码,并进行故障排除、识别错误、运行诊断和推荐修正方案。Thompson 指出,由于这么多企业软件项目涵盖了多种编程语言和学科,他与其他软件工程师能够利用 AI 来学习陌生领域的知识,学习速度也比以往更快。他还使用生成式 AI 工具来了解不熟悉的代码并识别具体问题。
在研发方面,生成式 AI 可以在产品设计初期阶段提高市场研究速度和深度。然后,AI 程序,特别是那些具有图像生成功能的程序,可以在模拟和测试潜在产品之前创建详细的设计,这些工具可以帮助员工在整个研发周期中快速和有效地做出调整。
Oracle 创始人 Ellison 在 6 月的电话会议中指出,专业化 LLM 将加速发现可挽救生命的新药物。药物发现是一种研发应用,以一种有利的方式来利用生成式模型幻想不正确或无法验证的信息的特点,例如识别新的分子和蛋白质序列,从而有助于发现新的治疗方案。此外,Oracle 子公司 Cerner Enviza 与美国食品和药物管理局 (FDA) 和 John Snow Labs 合作,将 AI 工具应用于“了解药物对庞大人口的影响”这一挑战。Oracle 的 AI 策略的目标是让 AI 融入到其云技术应用和云基础设施中。
生成式 AI 发展潜力巨大,可以加快各种任务或实现全面自动化。企业应谨慎规划,以具体的方式来在业务上充分发挥生成式 AI 的优势。以下是一些特定的使用场景:
生成式 AI 可以给企业带来的优势主要源于三个总体属性:知识综合、人类与 AI 协作以及速度。虽然下面提到的许多优势与早期的 AI 模型和自动化工具所承诺的优势较为相似,但其中一个或多个属性可以帮助企业更快、更轻松、更有效地利用优势。
借助生成式 AI,组织可以构建定制模型,采用自身的机构知识和知识产权 (IP) 进行训练,让知识工作者可以像和同事沟通一样,以相同语言要求软件一起协作完成任务。这种专业化生成式 AI 模型可以以惊人的速度整合企业知识库的所有信息并做出响应。此方法不仅可以在为这些任务创建特定程序时,减少或消除对复杂、低效且成本更昂贵的软件工程专业知识的需求,而且还能实现从前无法实现的构想和连接。
提高工作效率:知识工作者可以使用生成式 AI,缩短他们在日常任务上花费的时间,例如学习临时需要在下一个项目中掌握的新学科,组织数据或对数据进行分类,为相关研究梳理互联网信息或起草电子邮件。通过利用生成式 AI,企业只需更少的员工,就可以完成以前大型团队才能完成的任务,或者可以在很短的时间内完成以前需要数小时的工作量。例如,一个程序员团队可能会花费数小时时间来分析有缺陷的代码并解决故障,但生成式 AI 工具可能能够即时找到错误,在报告结果时附上推荐修复方案。某些生成式 AI 模型的知识工作能力大概处于平均或高于平均的水平,因此与生成式 AI 系统协作可以显著提高人类的生产力。例如,初级产品经理在 AI 的指导下,其能力至少可以达到项目经理的平均水平。所有这些功能都会大大提高知识工作者完成项目的能力。
降低成本:由于速度快,生成式 AI 工具可降低完成流程所需的成本。假设现在完成任务所需的时间是原先的一半,则该任务的成本也将减半。此外,生成式 AI 可以尽可能地减少错误、消除停机并识别冗余和其他成本高昂的低效问题。然而,有利就有弊:由于生成式 AI 更可能产生幻觉,因此人工监督和质量控制仍然是必要的。人类与 AI 协作相较于纯人工方式,可以在更短的时间内完成更多的工作量,同时又比 AI 工具单独工作的效果更好、更准确,因此能够降低成本。例如,在测试新产品时,生成式 AI 可以创建比旧工具更先进、更详细的模拟,进而减少了测试新产品所需的时间和成本。
提高客户满意度:基于生成式 AI 的自助服务和生成式 AI 工具可以“在耳边提示”客服代表,帮助他们实时掌握相关知识,从而为客户提供更加个性化的优质体验。当今,虽然由 AI 驱动的客服聊天机器人给人感觉限制重重,但我们很容易想象到,基于 ChatGPT 的对话能力,再加上经过特殊训练的生成式 AI 模型,定能提供更高质量的客户体验。
更明智的决策:经过专门训练后,特定于企业的生成式 AI 模型可以通过方案建模、风险评估和其他复杂的预测分析方法提供详细的洞察。决策者可以利用这些工具,通过个性化推荐方案和可行的策略,更深入地了解行业以及企业在业内处于什么地位。相较于单独的人类分析师或早期技术,生成式 AI 可以基于更深入的数据,更快地进行分析。
例如,决策者可以通过更加准确的需求预测,在旺季来临之前更好地规划库存分配。这些预测由他们的企业资源计划 (ERP) 系统收集的内部数据与全面的外部市场研究相结合,然后由专门的生成式 AI 模型进行分析。在这种情况下,更好的分配决策可以充分减少过度采购和缺货问题,同时尽可能提高潜在销售量。
加速产品发布:生成式 AI 可以快速生成产品原型和第一稿,支持在过程中进行微调,并且能够对现有项目进行测试/故障排除,从而更快地找到改进方法。
质量控制:特定于企业的专业化生成式 AI 模型可能在企业向公众提供的用户手册、视频和其他内容中出现差距和不一致的问题。
生成式 AI 的特定优势示例 | |||
---|---|---|---|
知识综合 | 人类与 AI 协作 | 速度 | |
提高生产率 | 组织数据,加快研究进度,生成产品第一稿。 | 帮助员工学习新学科,提出解决问题的新方法。 | 提高知识工作者完成新项目的能力。 |
降低成本 | 识别冗余和低效率问题,改进工作流。 | 通过协作式监督,尽可能减少人为错误,缩短停机时间。 | 加快完成任务(如果完成某个任务所需的时间减半,则其成本也减半)。 |
提高了客户满意度 | 快速组织和检索客户账户信息,加快问题解决速度。 | 优化聊天机器人,自动进行简单的交互,在需要人工帮助时,更好地为客服代表提供信息。 | 为客户和服务代表提供实时客户更新和信息。 |
更明智的决策 | 通过预测分析,例如场景建模和风险评估,快速获取洞察。 | 为决策者提供个性化推荐方案和切实可行的策略。 | 比人类分析师或早期技术,基于更深入的数据更快地生成分析。 |
加快产品发布 | 生成原型和“最简可行产品”(MVP)。 | 对现有项目进行测试和故障排除,以寻求改进。 | 识别可调整的部分,从而加快速度。 |
任何使用生成式 AI 工具进行学习和/或研究的人都可能体验过该技术人尽皆知的局限性:它们会胡说八道。该模型只会预测下一个单词,因此它可以从训练数据中推断出虚假信息,其权威性与它所报告的真实信息一样强。这就是 AI 研究人员所说的幻觉,也是当前生成式 AI 工具需要人类协作者的一大关键原因。企业在实施生成式 AI 时,必须做好准备,妥善地管理幻觉以及其他局限性。如果企业抱有不切实际的期望,或无法有效管理该技术,就可能会影响企业绩效和声誉。
生成式 AI 的风险频谱上呈现了两大极端的结果。某些人担心生成式 AI 会导致人类的灭绝,而其他人则认为它能够拯救世界。对于这些极端的看法,本文不做讨论。另外,我们将为实施 AI 技术的企业高管提供一些必须了解的重大风险和顾虑,以便他们可以采取行动来减轻任何潜在的负面影响。
可信性和可靠性:生成式 AI 模型会提供不准确的论据,有时还会幻觉似的编造出完全虚构的信息。同样的,许多模型都使用旧数据进行训练,通常仅查看在特定日期之前发布的信息。这些信息符合去年的市场需求,但到了今年可能就不再相关或有效了。例如,希望改善供应链运营的企业可能会发现,他们的模型推荐的方案已经过时,在不断变化的全球经济中并不符合当下需求。用户必须先验证所有信息,确保准确性和相关性,才能据此采取行动。
隐私/知识产权:生成式 AI 模型通常会持续从包含在提示中的信息学习。对于企业,特别是那些向客户收集敏感个人信息的企业(例如医疗机构),必须注意避免公开受保护的 IP 或机密数据。如果该模型访问此信息,则可能会增加暴露的风险。
社交工程:威胁行为者已经在使用生成式 AI,帮助他们获得更加真实的身份,以方便进行个性化社交工程和其他网络攻击。
多邻国 AI 和安全工程师 Baig 认为,现在,大家已经很难分辨自己是在与机器人还是人类在线聊天。对于网络罪犯而言,他们越来越容易通过产生大量的诈骗内容来大赚一笔。
降低输出质量和原创性:生成式 AI 可以使产品和内容的构建变得更轻松、更快,但却无法保证质量会更高。如果依赖 AI 模型但缺乏人工协作,可能会导致产品变得千遍一律,缺乏创意。
偏见:如果用带有偏见的数据对生成式 AI 模型进行训练,无论是有视角差距还是有害和歧视性的内容,这些偏见都将反映在输出结果中。例如,如果一家企业历来只雇用了某一类员工,该模型可能会对新的申请者进行交叉参考,排除不符合这个类型的“理想”候选人,即使该组织打算打破这一限制。
影子 AI:如果员工未经官方批准或同意使用生成式 AI 技术,可能导致企业无意中发布不正确的信息或侵犯其他组织的版权。
模型崩溃:AI 研究人员发现了一个称为模型崩溃的现象,这可能会使生成式 AI 模型随着时间降低效率。从本质上讲,随着 AI 生成的内容激增,综合数据无法避免错误,因此基于该数据进行训练的模型,终将“忘记”他们最初训练所采用的人工生成数据的特征。随着互联网上出现越来越多的 AI 生成内容,这种问题可能会达到临界点,进而开始可能降低模型质量的反馈循环。
AI 法规:由于生成式 AI 是一个非常新低技术,因此没有太多适用的法规。尽管如此,世界各地的政府都在研究如何监管这一技术。某些国家已经就如何对模型进行训练以及允许产出哪些结果出台了监管措施。随着越来越多的国家推出相关法规,对于企业,特别是国际公司而言,他们需要监测新的和不断变化的法律,以确保合规性,避免因滥用技术而受到罚款或刑事指控。
十多年前,大数据分析的兴起引发了新的道德问题和辩论,因为新兴工具有助于人们推断私人或敏感信息,而这些是他人没有也不会想要公之于众的信息。企业应如何掌握拥有此类信息的控制力?
生成式 AI 在推动数据分析的同时,也会重现之前的问题并带来新的道德问题。
各种规模和行业的企业都在积极尝试采用生成式 AI 技术。以下例子将展示该技术的深厚潜力和快速采用。
Snap Inc. 是 Snapchat 的母公司,推出了一款名为“My AI”的聊天机器人,由 OpenAI 的 GPT 技术提供支持。My AI 采用友好和个性化的设计,以迎合 Snapchat 的语调和风格。用户可以对 My AI 进行各种个性化设置,包括虚拟人设、壁纸和名字等,并与其进行一对一或多用户聊天,模拟 Snapchat 用户与朋友沟通的方式。用户可以向 My AI 获取个人推荐方案,或与其探讨一些轻松话题,比如美食、爱好或音乐等,甚至还可以让它讲笑话。Snapchat 将 My AI 定位成数字助手,帮助用户探索应用特性,例如增强现实滤镜;或者帮助用户获取一般不会利用 Snapchat 来获取的信息,例如根据本地地图推荐值得一览的地方。
Bloomberg 宣布推出了 BloombergGPT,这是一款聊天机器人,训练所采用的数据有一半是全球通用数据,另一半则是 Bloomberg 的专有数据或清洁的财务数据。BloombergGPT 可以执行简单的任务,例如编写文章标题;或者实施专有功能,例如将简明英语提示转写成该公司数据终端所需的 Bloomberg Query Language,这是许多金融公司必不可少的功能。
Oracle 与 AI 开发商 Cohere 合作,帮助企业构建使用企业私有数据进行微调的内部模型,旨在推广使用特定于公司的专用生成式 AI 工具。
甲骨文公司首席技术官 Ellison 在 2023 年 6 月的电话会议中对财务分析机构表示,Cohere 和 Oracle 携手合作,让企业客户能够轻松地训练自己的专业化大型语言模型,同时保护训练数据的隐私。Oracle 计划将生成式 AI 服务嵌入业务平台,从而在整个企业的现有流程中提高生产力和效率,让许多公司不再需要从零开始构建和训练自己的模型。此外,Oracle 近期也宣布将生成式 AI 功能融入人力资源软件 Oracle Fusion Cloud Human Capital Management (HCM)。
此外:
ChatGPT 成为了热门工具,但其实每种模式都有着大量的生成式 AI 工具。例如,仅仅是用于编写文本,就有 Jasper、Lex、AI-Writer、Writer 等工具。在图像生成方面,Midjourney、Stable Diffusion 以及 Dall-E appear 是当今较受欢迎的工具。
市面上也有不少音乐生成器,包括 AIVA、Soundful、Boomy、Amper、Dadabots 和 MuseNet。众所周知,软件程序员会与 ChatGPT 协同工作,但其实还有许多其他专业化的代码生成工具,包括 Codex、codeStarter、Tabnine、PolyCoder、Cogram 和 CodeT5。
令人惊讶的是,今天我们所使用的生成式 AI 模型,其起源可以追溯到 1943 年。这一年,第一台电动可编程计算机 Colossus 面世,后来被英国用来解码二战期间加密的信息。《神经活动中固有的思想的逻辑演算》(A Logical Calculus of Ideas Immanent in Nervous Activity) 研究论文是人类在 AI 发展中迈出的重要一步。该论文由美国伊利诺伊大学精神病学家兼教授 Warren McCulloch 以及自学成才的计算神经科学家 Walter Pitts 共同发表。
Pitts 是一个数学奇才,在 15 岁时离家出走。无家可归的他认识了 McCulloch,随后与其家人一起生活。Pitts 在研讨会上发表了一篇开创性的论文,建立了人工神经元“决定”输出 1 或 0 的基本数学原理,获得了芝加哥大学授予的文学副学士学位,这也是他唯一的学位。
AI 发展历程中的第二步的主要贡献者来自东北部,即纽约州布法罗和康奈尔航空实验室研究心理学家 Frank Rosenblatt。1957 年 7 月,作为康奈尔大学 PARA(感知和识别自动机)项目的一部分,Rosenblatt 在美国海军部海军研究办公室的资助下开展工作,以 McCulloch 和 Pitts 的数学为基础,开发了感知器。这是一种神经网络,在输入层和输出层之间有一个“隐藏”层。在建造 Mark I Perceptron(如今归 Smithsonian Institution 所有)之前,Rosenblatt 和海军部在 IBM 704 大型计算机上对其进行了模拟,并于 1958 年 7 月进行了公开演示。但感知器是一个简单的神经网络,引起麻省理工学院 AI 实验室联合创始人兼计算机科学家 Marvin Minsky 的批判。据记载,Minsky 和 Rosenblatt 在公共论坛上辩论了感知器的长期前景,导致 AI 社区从 20 世纪 60 年代到 20 世纪 80 年代,很大程度上放弃了的神经网络研究。
这个时期被称为“AI 冬季”。
20 世纪 80 年代,神经网络研究的景观由于一些研究人员的贡献而迅速发展,贡献者包括重新发现了感知器的 Paul Werbos,以及 Geoffrey Hinton、Yoshua Bengio 和 Yann LeCun。这些研究者的努力证明了大型多层神经网络的可行性,并表明了这种网络如何通过反向传播算法从正确和错误的答案中学习。这也是 RNN 和 CNN 开始出现的时候。但这些早期神经网络具有一定的局限性,由于这些局限性和当时的计算能力无法满足过高的期望,导致了 1990 年代至 2000 年代初的第二个 AI 冬季。
然而,这一次,许多神经网络研究人员都决定坚守岗位,其中包括 Hinton、Bengio 和 LeCun。此三人组合有时被称为“AI 的教父”,凭借在 20 世纪 80 年代的研究成果、后续的毅力以及持续性贡献,获得了 2018 年图灵奖。到了 2010 年代中期,新的、多元化的神经网络变体迅速出现,如《生成式 AI 模型》一节中所述。
生成式 AI 将会对企业和人们的工作方式带来哪些变化?这一点仍有待观察。显然地,在人类文明的方方面面,大量投资正在涌入生成式 AI。无论是风险投资家还是老牌企业,几乎所有企业都在快速投资于生成式 AI 初创公司。LLM 通用的“魔法”是能够协调人类与大数据交互的能力,通过简单、清晰的方式和惊人的速度来解释数据,帮助人们理解信息。这表明,生成式 AI 将嵌入大量现有应用,并推动第二波新应用的发明。
Gartner 预测,2024 年,40% 的企业应用将嵌入会话式 AI;2025 年,30% 的企业将拥有 AI 增强的开发和测试策略;2026 年,超过 1 亿名员工将与“机器同事”协作。
当然,生成式 AI 的风险和局限性可能会破坏这个生产力。事实上,我们难以通过微调生成式模型,并从这种微小的变化中实现差异化优势。这种计算密集型模型的运行成本过于高昂,而无意中暴露贸易秘密的风险也可能会让某些企业放弃。
这一切都可能会实现,但速度也许比现在预期的要慢。想一想,当初的互联网承诺,如今也都兑现了,只是实现这一切所花费的时间,比第一代互联网热衷者预期的要长 10 年。在此期间,人们建立或发明了必要的基础设施,在行为上也更加能够适应新媒介。从许多方面来看,生成式 AI 也是另一种新的媒介。
领军企业正在积极思考生成式 AI 在商业领域中的未来。
卡耐基梅隆大学 Tepper 商学院创业特聘服务教授,同时也是该大学企业创业实验室联合创始人的 Sean Ammirati 表示,这可能意味着,未来他们会以不同的方式来建立公司。就像“数字原生”企业在互联网兴起后获得了优势一样,Ammirati 认为基于生成式 AI 驱动的自动化而构建的公司也将在未来占尽先机。
Ammirati 认为,这些企业将采用自动化优先策略,不必重新学习如何停止手动处理可以被自动化的任务。这最终可能会形成一个非常不同的企业。
Oracle 不仅拥有多年的 AI 经验,将 AI 融入到产品之中,而且还处于生成式 AI 开发和活动的前沿。许多生成式 AI 公司都在使用 Oracle Cloud Infrastructure (OCI)。OCI 可为企业提供理想的平台,帮助他们构建和部署特定于组织和各个业务线的专业化生成式 AI 模型。正如甲骨文公司的 Ellison 所说,所有 Oracle Cloud 数据中心都具有高带宽、低延迟的 RDMA[远程直接内存访问]网络,该网络经过优化,适合用来构建大型 GPU 集群,以训练各种大型语言模型。新一代 OCI 中运行生成式 AI 工作负载,可以获得超高性能和相应的成本节省,因此 Oracle 是 AI 开发公司的理想之选。
Oracle 与 Cohere 合作打造了一套全新的生成式 AI 云技术服务产品。Ellison 表示,这项新服务保护了企业客户训练数据的隐私,帮助他们安全地使用自己的私有数据,训练自己私有的专业化大型语言模型。
80 年前,一名青少年在离家出走后创立了数学算法,写下了生成式 AI 故事的开端。去年年底,随着 ChatGPT 的发布,生成式 AI 才一炮而红。随着各种规模和行业的企业都开始尝试生成式 AI 并进行投资,该技术的创新也将持续加速。生成式 AI 有助于提高工作和生活的能力,同时也带来了巨大的风险,包括从失业到末日预言者所说的“人类灭绝”。尽管如此,我们可以确信的是:这只精灵已经从神灯中出来,并且不会再回去了。
Oracle 提供现代数据平台和低成本的高性能 AI 基础设施。强大的高性能模型、数据安全性和嵌入式 AI 服务等优势,充分体现了 Oracle 的 AI 产品是专为企业而打造的产品。
什么是生成式 AI 技术?
生成式 AI 技术建立在神经网络软件架构之上,模仿了人类大脑的运作方式。这些神经网络的训练方法是,在相对较小的样本中输入大量数据,然后要求 AI 做出简单的预测,例如序列中的下一个单词或句子序列的正确顺序。神经网络将获得答案正确或错误的反馈,因此可以从过程中不断学习,直到能够做出良好的预测。归根结底,该技术可以基于训练数据和学习,以拟人化的方式回答问题和其他提示。
生成式 AI 有哪些例子?
目前,家喻户晓的生成式 AI 例子是 ChatGPT,它能够像人类一样与人交流,并且可以编写多种主题的文案。其他的一些例子还包括了可以生成图像的 Midjourney 和 Dall-E。此外,还有其他许多可以生成文本、图像、视频和声音的工具。
生成式 AI 与 AI 有什么区别?
需要注意的重点是,生成式 AI 与传统 AI 并不是两种本质上不同的技术;两者只是在频谱上处于不同的点。传统 AI 系统通常用于执行特定任务,例如检测信用卡欺诈问题;而生成式 AI 的用途则更为广泛,并且可以创建新的内容。这部分原因是因为,生成式 AI 工具基于比传统 AI 更大、更多样化的数据集来进行训练。此外,传统 AI 通常使用受监督的学习技术来进行训练,而生成式 AI 则使用无人监督的学习技术进行训练。
生成式 AI 会带来哪些负面影响?
如今,生成式 AI 的潜在风险引发了整个社会的热烈讨论。从观点来看,目前主要分为两派:一派认为生成式 AI 最终可能会导致人类灭绝,而另一派则觉得这项技术能够拯救世界。但可能性更大的是,生成式 AI 将导致许多现有工作不复存在。企业应该关注生成式 AI 如何改变工作流程和岗位角色,以及该技术在无意中暴露私有或敏感信息或侵犯版权的风险。
生成式 AI 能够带来哪些优势?
生成式 AI 可以与人类协同工作,例如,帮助员工进行头脑风暴来获得新构思,或学习并掌握临近学科。生成式 AI 也是帮助人们快速分析非结构化数据的理想工具。更广泛地说,生成式 AI 有助于企业提高工作效率、降低成本、提高客户满意度、为决策提供更好的信息以及加快产品开发速度。
生成式 AI 有哪些局限性?
生成式 AI 无法生成以前从未在训练数据中表达过,或至少从未从这些数据中推断出来的新思路。生成式 AI 也不应该单独完成任务,它需要人工监督,并且只在人类与 AI 协作中才能够充分发挥作用。
哪些行业适合使用生成式 AI?
鉴于其功能之广,生成式 AI 几乎适用于所有行业。
生成式 AI 将如何影响未来的职场?
生成式 AI 可能会对知识工作产生重大影响,此类工作往往需要人类共同合作,和/或做出业务决策。在更小的程度上,知识工作者的角色会需要适应如何与生成式 AI 工具协作,同时某些职位将会消失。然而,就像历史上其他技术变革一样,我们预测生成式 AI 将会创造比被淘汰的岗位更多的就业机会。
注:为免疑义,本网页所用以下术语专指以下含义: