Jeffrey Erickson | 内容策略师 | 2024 年 1 月 12 日
2022 年 11 月,OpenAI 面向大众发布了名为 ChatGPT 的大语言模型 (LLM),在短短两个月内就积累了 1 亿用户,成为了一款迅速发展的消费者应用。
投资者也注意到了这一点。
从那时起,福布斯 AI 企业 50 强榜单上的企业筹集了超过 272 亿美元。其中,有些企业甚至才成立不到一年,员工更是少于 20 人。那些有创意的 AI 初创企业,获得了源源不断的资金。
然而,筹集到资金并不能保证成功。AI 初创企业面临着独特的挑战,需要的不仅仅是一般的勇气、市场时机和增长管理。训练为 ChatGPT 或 Midjourney 的 AI 图像生成器等服务提供动力的 LLM,是人类所能够想象的一种非常繁重的计算任务。投资机构表示,AI 初创企业将所筹集的大部分资金直接用于计算资源。
除此之外,AI 初创企业不仅会面对潜藏在模型所摄取的海量训练数据中的敏感信息,需要承担保护这些信息安全和隐私的责任,同时也需要与同样在快速抢占市场份额的行业巨头竞争。
Microsoft 创始人比尔·盖茨 (Bill Gates) 认为 AI 是自图形用户界面以来计算领域取得的又一个重大进展。图形用户界面支持了 Apple 的 Macintosh 以及之后的所有主流的操作系统和应用。因此,创业者想从中分一杯羹是可以理解的。下面,让我们看看 AI 初创企业在进入竞争激烈的市场时应该注意的因素。
生成式 AI 初创企业有三种类型:一、构建 LLM 平台(例如 OpenAI 或 Cohere)的企业;二、提供用于构建和训练 LLM(例如 MosaicML)的新工具的企业;三、采用开源 LLM 并对其进行训练以解决特定业务问题的企业,例如 Tome 就是应用 AI 来改善业务演示。
ChatGPT、Google 等企业照亮了所有 AI 初创企业前进的道路,这些企业使用强大的计算架构,比如神经网络和机器学习算法来构建友好的自然语言界面,可以生成类人的文本、视觉内容和计算机代码并执行许多其他任务。
关键要点
无论是资金雄厚的“奇才”还是白手起家的“新贵”,凡是初创企业都逃不过这些 AI 服务提供商才会遇到的绊脚石。下面,我们列出了 11 个挑战,让您可以清楚了解 AI 初创企业可能面临的障碍。
AI 初创企业需要承担的安全和隐私责任超出了标准的企业数据保护范畴。许多安全措施都很常见,例如采用零信任模型,以及监控网络,在发现恶意活动时自动响应和警报。此外,还有一些新的挑战。例如,AI 模型可能会泄露训练数据中的详细信息。这些数据集有数百 GB,甚至可以达到 TB 级,来自各种来源。数据集可能包含敏感数据,包括姓名、地址等个人身份信息。那些使用这些数据训练的模型,输出的结果是否会包含私人详细信息?
初创企业必须要了解训练集中包含了哪些数据并制定计划,以尽量降低敏感或受监管信息的相关风险,这一点非常重要。这些企业需要让投资者确信他们解决了这个顾虑,制定了沟通响应计划以备不时之需。
AI 企业使用大量数据集和数十亿个参数来训练和部署 LLM,可用于各种用例,包括自然语言处理 (NLP) 和图像创建。这些企业还为计算机视觉、预报和预测、异常检测等开发了 AI 模型。LLM 尤其需要大量的数据来生成准确和一致的输出。
如果您是一家 AI 初创企业,那么数据管理就是您业务的核心。
然而,其中的重大挑战在于如何找到能够满足 AI 训练需求的数据集,并将其上载到海量数据仓库或数据湖仓一体中。然后,数据必须使用图形处理单元 (GPU) 服务器超级集群,安全地流经神经网络和机器学习算法,但前提是您要能够找到它们。
大芯片
GPU 是比中央处理器 (CPU) 具有更多核心的芯片。以 Nvidia 的计算统一设备架构(缩写为 CUDA)为例,这种设计可为训练 AI 及其他任务所需的大规模并行性提供支持。
我们在电视节目、电影和大众媒体中反复看到这样的论断:AI 将会毁灭世界。而其中一个反论点是:邪恶的 AI 怎么获得 GPU?
AI 模型基于神经网络构建而成,为了运行这个神经网络,计算工作由多个 GPU 分担。然后,系统会通过多个 GPU 并行运行查询。这减轻了计算机 CPU 的负载,使得网络能够快速完成复杂的计算。训练和运行 AI 模型需要大量的计算能力,全球的芯片制造商和云技术提供商都难以满足需求。别忘了,您可能需要排队购买芯片,或说服云技术提供商认同您这家 AI 初创企业值得拥有这些珍贵的 GPU。
大多数 AI 初创企业都是围绕着另一家企业开发的 LLM 来建立自己的公司的。在大多数情况下,基于 OpenAI 或 Cohere 等企业的 AI 模型进行定制,比从头开始设计、构建和训练 AI 模型更高效。
为特定行业或使用场景定制 LLM 有两种常见方法:微调和检索增强生成 (RAG)。您可以通过对与您的原因相关的大量数据进行训练来微调 AI 系统的输出,并指示 AI 在其响应中给予这些信息更大的权重。另一个选项 RAG 涉及将高度相关的文档嵌入到数据库中,AI 将使用该数据库为收到的书面或口头提示提供上下文。通过 RAG,这些文档允许 AI 在其输出中添加相关的技术细节,甚至引用其获取信息的来源。例如,一家医疗卫生行业的初创企业可能会嵌入文档或文章,帮助 LLM 更好地理解医疗专业人员提示的意图,然后提供与其专科相关的输出语言。
每种方法在速度、质量和成本方面都有其优劣势。对于任何希望针对行业或使用场景提供特定服务的 AI 初创企业来说,LLM 定制方法是一个重要的决定。
对于处于快速发展阶段的初创企业来说,很难拒绝现成的云基础设施。所有超大规模云技术提供商都提供训练或定制大型语言模型所需的服务,包括通过高带宽网络和高性能文件系统连接的计算实例集群。这些服务都是按使用量计费的,因此通常会比设置本地基础设施更快、更便宜。
正因为这些服务是按使用量计费的,必须确保速度和效率与成本保持平衡。AI 初创企业可以运行能够用更少的复杂算法和数据完成所需工作的 LLM,从而降低支出。有了预算后,就可以开始选择能够高效处理模型的云基础设施了。例如,在裸金属服务器上运行可以避免虚拟化实例的开销并提高性能。这一点对于 LLM 常见的集群工作负载尤其重要。
要记得,您的作业运行得越快,开支就越小。
训练 LLM 可能需要上千兆瓦的电力。投资公司 The Carbon Collective 发现,一千兆瓦的电力可为多达 874000 个家庭供电一年。作为一家积极寻求风险投资来提供基于 LLM 的服务的初创企业,该公司必须证明其能够妥善使用资金。比如说,并非所有 AI 任务都需要同等的复杂模型或计算能力。OpenAI、Cohere、Anthropic 等企业推出了越来越多的 LLM,包含了各种版本和规模。准备好解释您所做出的选择如何满足您的需求和预算。
选择模型和数据集后,请仔细选择一个支持高效并行处理和动态扩展的基础设施,避免为没有用到的计算资源付费。准备好向投资者展示您的选择能够在性能和经济负担能力之间取得平衡。
通过扩展 LLM 来提高 LLM 输出的质量和/或速度的主要有三种方法:增加训练数据量、使用更大且更复杂的模型或增加计算能力。
较大的模型增加了神经网络架构中的层和参数的数量,进而增强了学习和表示数据中的复杂模式的能力。如此一来,您的 LLM 将能够提供更详细、更细致的答案。通过添加更多以 GB 计算的训练数据,您的 AI 初创企业可以提供更准确或更完整的响应。在这两种情况下,您还需要扩展昂贵的计算资源以维持模型性能。
这并不是 AI 才会面对的挑战。几十年来,业务分析师一直在关注他们使用的数据质量。AI 初创企业需要利用数据科学家和主题专家的专业知识,从用于训练算法和提供 LLM 的数据集中删除冗余信息、不相关的内容和其他“噪音”。
正所谓“垃圾进,垃圾出”,AI 初创企业应该特别能与这种说法产生共鸣。
对于 AI 初创企业来说,定量和定性措施对于取得成功非常重要。定量指标包括技术投资的投资回报率和技术关键绩效指标 (KPI),例如用于识别异常结果的均方误差 (MSE)。
除此之外,AI 初创企业必须要能够衡量定性结果,例如 AI 模型在面对新数据或从未见过的数据的表现如何,结果与目标受众的相关性如何,以及结果在所讨论领域的背景下的综合性如何。
AI 初创企业获得资金的方法有很多。您可以效仿 Midjourney 和 Surge AI 等 LLM,在没有获得投资的情况下逐渐扩大了客户群。如果您的 AI 初创企业没有那么多的时间等待自我成长,那么市场上的天使投资人、加速器和孵化器都在寻找头脑敏锐、有好主意的 AI 创始人。孵化器和加速器的优势在于其能够为构建 AI 服务提供关系、市场机会、业务建议乃至技术平台。
前沿的销售和营销平台在客户旅程的每个阶段都采用 AI,而任何想要扩大市场份额的 AI 初创企业都希望采用 AI 来提供帮助。要怎么做呢?AI 可以使用详细的数据(包括实时地理位置数据)来映射和跟踪移动,为潜在客户创建个性化的产品或服务产品。然后,AI 助手可以生成追加销售和交叉销售机会,或者在货品添加到购物车后提醒购物者完成交易。事实证明,这些策略有助于提高转化率,让希望初创企业能够提高销售额的投资者感到满意。
AI 售后服务可以处理查询、理解背景并提供推荐方案,同时还可以分享有关日程安排或交货时间的具体细节,并将更复杂的问题转给人工代理处理。了解这些 AI 支持的服务如何运作,有助于 AI 初创企业对产品进行基准测试。
如果您想要构建基于 AI 的业务,可以考虑使用 Oracle Cloud Infrastructure (OCI),该产品能够为大规模训练和服务模型提供强大的基础设施。通过与 NVIDIA 的合作,Oracle 可以为客户提供超级集群,这些超级集群搭载了新的 GPU,通过超低延迟的基于融合以太网的 RDMA (RoCE) 连接。此架构为大规模训练生成式 AI 模型提供了高性能且经济高效的方法。诸如 Adept 和 MosaicML 等多家 AI 初创企业都选择直接在 OCI 上构建产品。
Oracle 可助您轻松开始使用 OCI 服务,包括 Always Free 云技术服务。初创企业可以通过常用软件的开发人员沙盒或打包部署来学习,例如部署 Kubernetes 集群。
为了帮助初创企业做出选择,Oracle 提供了探索性工具,包括成本计算器、第三方分析机构的评价以及 OCI 与其他云技术平台之间的详细对比。
AI 已经进入我们的生活十多年了,它在后台工作,监测数百万银行交易中的欺诈行为,介入处理一线客户服务互动,并做出闪电般的决策以加快隔夜运输物流。现在,随着新一代 LLM 的出现,AI 的细致、强大且令人感到不可思议的能力获得了应有的用户界面:支持自然语言的语音或文本。
如此一来,LLM 可以创建图像、生成书面文本、进行翻译甚至是生成代码,吸引了大众的关注。尽管挑战重重,但现在是 AI 初创企业寻找投资者、服务新客户和扩大规模的大好时机,就像 1999 年的时候一样。
通过在启动 AI 模型训练项目前构建一个 AI 卓越中心 (CoE),组织可以更有力地推动 AI 项目成功。阅读电子书,了解为何以及如何构建一个行之有效的 CoE。
AI 初创企业面临哪些常见挑战?
AI 初创企业面临的挑战包括选择合适的 LLM 进行训练、找到正确的训练数据以及组建支持其神经网络所需的巨大计算能力。此外,还有数据隐私、数据安全以及法规的变化等问题。
AI 初创企业提供哪些类型的服务?
AI 初创企业正在各个商业领域涌现,包括医疗卫生、制造业等领域。有些初创企业正在向消费者提供产品,有些则构建工具以供其他 AI 企业构建和训练模型。
AI 初创企业如何获得资金?
想要寻找投资者的初创企业可以快速搜索天使投资者,他们可能正在寻找投资机会。此外,技术孵化器或加速器也可以为初创企业的创始人提供指导和技术帮助。
注:为免疑义,本网页所用以下术语专指以下含义: