Greg Pavlik | Oracle Cloud Infrastructure 資深副總裁 | 2023 年 9 月 15 日
生成式人工智慧是一種形式較新的 AI,與先前的 AI 不同,可以透過推演訓練資料來建立新內容。自從第一個生成式 AI 消費者聊天機器人在 2022 年秋季首次面世以來,其模仿人類產出文字、影像、音訊和視訊的優異能力,都激發了全世界的想像。2023 年 6 月的 McKinsey & Company 報告估算,生成式 AI 藉由提高勞工的生產力,每年可為全球經濟貢獻 6.1 到 7.9 兆美元。為了進一步說明,同一份研究也指出,整體 AI 技術藉由提高生產力而帶來的年度經濟潛力,落在 17.1 兆到 25.6 兆美元之間。因此,儘管生成式 AI 在 2023 年中聲勢甚旺,但仍然只是 AI整體的一部分。
不過,每個行動都伴隨著正面與負面效應。因此,除了可觀的生產力前景外,生成式 AI 也帶來了新的潛在商業風險,如不準確、侵犯隱私權和知識財產外洩,以及對經濟和社會造成大規模影響的能力。舉例來說,生成式 AI 的生產力優勢,很難在未進行大規模員工再培訓的情況下實現;即使得以實現,也無疑會使許多人失去現有的工作。因此,世界各地的政府決策者 (甚至是一些科技產業高階主管),都提倡迅速執行 AI 法規。
本文深入探討生成式 AI 的前景和挑戰:運作方式、立即適用的情境、使用案例及範例;限制;潛在的業務優勢與風險;使用上的最佳實務;以及窺見其未來。
生成式 AI (GAI) 是一部分 AI 機器學習技術的名稱,這些技術近期發展出了快速建立內容的能力,以回應可能簡短單純、也可能長而複雜的文字提示。不同的生成式 AI 工具可以分別產生新的音訊、影像和視訊內容,但文字導向的對話式 AI 才真正引起了人們的興趣。實務上,人們可以與使用文字訓練的生成式 AI 模型對話,並從中瞭解資訊,方式就像與人類互動。
2022 年 11 月 30 日,基於 OpenAI GPT-3.5 神經網路模型的 ChatGPT 聊天機器人推出後,生成式 AI 在接下來幾個月掀起了全球熱潮。GPT 是生成式預先訓練轉換器 (generative pretrained transformer) 的縮寫,這個名稱大致描述了模型的基礎神經網路架構。
自 1960 年代中期麻省理工學院的 ELIZA 開始,許多早期的對話式聊天機器人都已經問世。但大多數先前的聊天機器人 (包括 ELIZA) 都完全或大部分以規則為基礎,因此缺乏情境理解能力。其回應受限於一組預先定義的規則和範本。反之,現在新興的生成式 AI 模型則沒有這類預先定義的規則或範本。生成式 AI 可以比喻成原始、空白的大腦 (神經網路),透過真實世界資料的訓練來認識世界。接著就會獨立發展智慧 (即世界運作方式的表現模型),並用來產生新內容以回應提示。即使是 AI 專家,也無法確切知道其如何實現這一能力,因為在訓練系統時,演算法會自我發展和調整。
時至今日,知識工作一直很相當抗拒自動化,因此不論是大型或小型企業,都應該期待生成式 AI 為這個領域帶來科技自動化的好處。生成式 AI 工具改變了知識工作自動化的方式,能夠產生與人類相仿的文字、影像、音訊或視訊,以回應英文的純文字提示;這表示其能夠與人類夥伴合作,產生代表實際工作的內容。
Oracle 的董事長暨技術長 Larry Ellison 在公司 2023 年 6 月的法說會上表示:「在接下來幾年,許多公司都將訓練自己的專用大型語言模型。」
人工智慧是電腦科學中的一個廣大範疇,生成式 AI 僅佔其中一小部分 (至少目前如此)。當然,生成式人工智慧與傳統人工智慧許多共通之處,但也有一些明顯的區別。
引用一位 AI 研究人員的說法,另一個值得注意的差異在於,生成式 AI 基礎模型的訓練「成本極高」。例如,光是一開始的硬體成本就高達 1 億美元,加上大部分的 AI 開發都在雲端完成,因此還需要金額相當的雲端服務成本。之後還需要龐大的資料量,進一步提高成本。
關鍵因素
對各種規模的企業來說,生成式 AI 看似神奇的前景,在於其能夠為知識工作帶來科技自動化的優點。換句話說,就是 McKinsey 報告中描述的「需要決策和協作的活動,這些是以往最不可能自動化的工作」。
以往,科技最能發揮效用之處,在於將例行性或重複性任務自動化;這些任務若不是有已知的決策,就是可根據具體、熟知的規則來制定決策,並具備高信賴度。例子包括製造業精確的流水線重複任務,和會計業由產業協會制定的規範準則。然而,生成式 AI 有潛力執行更複雜的認知工作。以極端的例子來說,生成式 AI 能夠回應企業經理要求在產業動盪中提供另類思路和情節的提示,以協助組織制定策略。
McKinsey 在報告中評估了 63 個跨 16 種企業職能的使用案例,結論是可從生成式 AI 實現的數兆美元潛在價值中,有 75% 僅來自下列四個職能的部分使用案例:客戶營運、行銷與銷售、軟體工程,以及研究與開發。各產業的收入增長前景呈現相對平均的分佈,但也有一些亮點:以產業收入可能提升的百分比而言,高科技排名第一,其次是銀行、製藥和醫療產品、教育、電信和醫療保健。
此外,Gartner 的分析也與 McKinsey 的預測有關:例如,預計到 2025 年,超過 30% 的新藥和材料會使用生成式 AI 技術探索,而目前為零;同樣在 2025 年,合成產生的大型組織集客式行銷訊息,會從 2022 年的 2%,提升到 30%。在一份線上調查中,Gartner 詢問 2,500 名高階主管,其組織投資於生成式 AI 的哪些方面時,客戶體驗和留存是最多人選擇的答案 (佔 38%)。
這一切之所以能夠如此迅速實現,是因為生成式 AI 不像傳統人工智慧數十年來默默地進行自動化和為商業流程增加價值;而是透過 ChatGPT 人類般的對話能力,迅速獲得全世界關注。這也讓人們開始瞭解該技術,並注意到專注於其他形式的生成式 AI 技術;似乎每個人都在使用一個或多個專門用於各個領域的不同模型,嘗試創作文字、音樂、圖片和影片。因此,隨著許多組織開始嘗試,生成式 AI 會以驚人的速度對企業和社會產生巨大影響。
不過,有個顯而易見的缺點,就是知識工作會發生變化。個人角色會迎來或大或小的變革,因此工作者必須學習新技能。有些工作崗位還會消失。然而從歷史上來看,生成式 AI 這樣的重大技術變革,為經濟增加的工作崗位總是會比減少的還要多 (價值也更高)。不過,這對工作崗位消失的人來說,安慰效果不大。
關於生成式 AI 模型的運作方式,有兩種不同的回答。以經驗來說,我們瞭解其運作方式的細節,因為人類設計了不同的神經網路實行方式,以執行確切的任務,並在數十年間不斷改進這些設計。AI 開發人員確切知道神經元如何連接;他們設計了每個模型的訓練流程。不過在實務上,令人尷尬的真相是,沒有人真的知道生成式 AI 模型如何執行任務。
Dean Thompson 表示:「我們不知道模型如何執行實際的創意工作,因為神經網路層內部的運作對我們來說太過複雜,至少目前是如此。」Dean 曾是多家 AI 新創公司的技術長,這些公司近年被包括 LinkedIn 和 Yelp 在內的企業收購,而他目前仍在 Yelp 擔任資深軟體工程師,負責處理大型語言模型 (LLM)。生成式 AI 產生全新原創內容的能力,似乎是在已知結構和訓練之外的新特性。因此,雖然我們對已知的內容有很多可以解釋的地方,但我們尚未弄清楚 GPT-3.5 這類模型實際的內部運作機制 (也可以說是思考機制)。有些 AI 研究人員有信心在未來 5 到 10 年破解這個謎團;其他研究人員則不確定未來是否能完全了解其運作原理。
以下簡要介紹了我們實際瞭解的生成式 AI 運作方式:
從大腦開始。Jeff Hawkins 在 2004 年的《創智慧》一書中寫道:「要瞭解生成式 AI 模型,很適合從人類大腦開始。」Hawkins 是電腦科學家、大腦科學家暨企業家,2005 年,他在科技投資人 Esther Dyson 主辦的年度技術高階主管研討會 PC Forum 講座上,發表了他的研究成果。Hawkins 假設,在神經元層面,大腦的運作方式是持續預測接下來會發生的事情,然後從預測和後續實際情況之間的差異中學習。為提升預測能力,大腦構建了對應世界的內部表現方式。在他的理論中,人類智慧是從該過程產生的。不論是否受到 Hawkins 的影響,生成式 AI 確實是以這種方式運作。驚人的是,還表現得像是具有智慧一樣。
建置人工神經網路。所有生成式 AI 模型都以軟體中編碼的人工神經網路為基礎。Thompson 表示,神經網路有一種貼切的視覺化比喻,就是想像各位熟悉的試算表,但以三維呈現,因為人工神經元會多層堆疊,就如同真正的神經元在腦中堆疊的方式。Thompson 指出,AI 研究人員甚至把每顆神經元稱為一個「細胞」,而每個細胞都包含一個與網路中其他細胞相關的公式,這模擬了大腦神經元之間連接強度的差異。
每一層可能有數十、數百個或數千個人工神經元,但神經元的數量並非 AI 研究人員關注的焦點。他們是以神經元之間的連接數目來測量模型。這些連接的強度因神經元方程式的係數而異,這些係數更常被稱為「權重」或「參數」。例如,當您讀到 GPT-3 模型擁有 1,750 億參數時,指的就是這些定義連接的係數。最新版 GPT-4 據傳擁有上兆個參數,但未經證實。神經網路架構有數種,特性各不相同,可用於產生特定形式的內容;例如,轉換器架構似乎最適合用於大型語言模型。
教導新生神經網路模型。大型語言模型會獲得大量的文字來進行處理,而且需要做出簡單的預測,例如序列中的下一個單字,或一組句子的正確順序。不過,在實務上,神經網路模型是以稱為詞元的單位運作,而非單字。
Thompson 表示:「常見的單字可能會有自己的詞元,不常見的單字則一定是由多個詞元組成,而有些詞元可能只是一個空格,後面接著 'th',因為這三個字元的序列很常見。」為了進行每次預測,模型會在人工神經元的特定堆疊底層輸入一個詞元;該層會進行處理,然後將輸出傳遞給下一層,下一層再進行處理並傳遞其輸出,以此類推,直到最終輸出在堆疊的頂部出現為止。堆疊大小的差異可能很大,但通常在數十層的範圍內,而非數千或數百萬層。
在早期訓練階段,模型的預測結果並不理想。但每次模型預測一個詞元時,都會對照訓練資料檢查其正確性。不論是正確還是錯誤,「反向傳播」演算法都會在進行該預測之堆疊的每個細胞中調整參數,亦即公式的係數。調整的目標是增加正確預測的機率。
Thompson 表示:「演算法也會對正確答案進行調整,因為正確的預測可能只有 30% 的確定性,但這 30% 比其他可能的答案都還要高。因此,反向傳播會試圖將那 30% 轉變成 30.001%,或類似的數值。」
當模型對數兆個文字詞元重複進行此流程之後,會變得非常擅長預測下一個詞元 (或單字)。在初始訓練之後,生成式 AI 模型可以透過監督式學習技術進行微調,例如人類回饋強化學習 (RLHF)。在 RLHF 中,人類審查者會取得模型的輸出,並進行正面或負面的二分評估 (即好或不好),然後將這些評估回饋給模型。RLHF 已用於微調 OpenAI 的 GPT 3.5 模型,以協助建立了迅速竄紅 ChatGPT 聊天機器人。
但模型如何回答我的問題?這是個謎團。Thompson 如此說明對現況的理解:「在我說明中,存在著一個巨大的『未解之謎』。我們知道的是,模型會將整個問題視為一連串詞元,並在第一層同時處理這些詞元。而且,我們知道模型接著會在下一層處理來自第一層的輸出,然後依此類推,沿著堆疊一路往上。然後,我們知道模型使用頂層來進行預測,也就是產生第一個詞元,再將第一個詞元當作整個系統中的既定資訊,以產生下一個詞元,以此類推。
「下一個合理的問題是,模型在這整個處理流程中究竟思考了什麼,以及是如何進行思考的?這些層次又有什麼功能?而答案很明顯,我們不知道。我們... 不知道。儘管可以研究,也可以觀測,但其複雜度遠遠超出了我們的分析能力。這就像對人類大腦照出的 F-MRI [功能性磁振造影] 一樣,能夠概略呈現模型實際運作的樣貌,但我們並不理解。」
儘管存在爭議,但在 2022 年秋季,有十幾位得以提前使用 GPT-4 的研究人員得出的結論是,模型回應複雜挑戰時使用的智慧,及其展現的廣泛專業知識,顯示了 GPT-4 已達到某種形式的一般智慧。換句話說,其已建立一個內部模型來理解世界運作的方式,就如同人類大腦一樣,並使用該模型來思考人們提出的問題。一位研究人員在《This American Life》播客表示,當他要求 GPT-4「我要一份巧克力豆餅乾食譜,但要用很憂鬱的風格來寫」時,該模型回應:「材料:1 杯融化的奶油,如果你有力氣融化的話。1 茶匙香草精,虛假的人造幸福滋味。1 杯半甜巧克力豆,最終會融化消逝的微小快樂」,讓他驚訝不已。
把生成式 AI 想成開放式創意內容的計算機,就很容易理解其重要性。就如同計算機能夠自動化例行和乏味的數學運算,讓人們能夠專注於更高階的工作;生成式 AI 也有潛力自動化知識工作中更例行和乏味的子任務,讓人們能夠專注於工作中更高階的部分。
試想行銷人員時常面對非結構化、不一致且互不相連的資料,卻要從中取得可行洞察的挑戰。傳統上,他們必須先整合這些資料,而這需要大量的自訂軟體工程,以賦予分散資料來源 (如社群媒體、新聞和客戶回饋) 共同的結構。
在 Duolingo 專門處理 AI 和安全的資深工程經理 Basim Baig 表示:「但在使用 LLM 時,您可以直接將不同來源的資訊輸入提示中,然後詢問重要洞察、詢問應優先處理哪些意見,或要求進行情感分析,然後 LLM 就能夠處理。LLM 的強大之處,在於可讓您略過龐大又昂貴的工程步驟。」
此外,Thompson 建議產品行銷人員使用 LLM 標記自由格式文字以進行分析。例如,假設您有一個龐大的資料庫,其中包含社群媒體提及產品的相關資訊。您可以撰寫軟體,應用 LLM 和其他技術執行下列任務:
然後,您可以這樣應用這些結果:
生成式 AI 代表一種廣泛的應用類別,以日益豐富的神經網路變化為基礎。雖然所有生成式 AI 皆符合<生成式 AI 如何運作?>一節的整體描述,但實行技術會為了支援不同媒體 (例如影像與文字) 而不同,並且會隨著研究與產業的發展而不斷演進。
神經網路模型使用人工神經元的重複模式及其相互連接。不論應用為何 (包括生成式 AI),神經網路設計往往會重複相同的神經元模式數百或數千次,而且通常會重複使用相同的參數。這是所謂「神經網路架構」中不可或缺的一部分。自 1980 年代起,探索新架構即是 AI 創新的重要領域,且通常受支援新媒體的目標驅使。不過,一旦發明了新的架構後,通常可以透過以意想不到的方式應用架構來實現進一步的發展。額外的創新來自於結合不同架構的元素。
最古老且依然常見的架構包括以下兩種:
雖然 RNN 使用頻率仍高,但改良 RNN 的努力帶來了突破:
研究單位、私營產業和開源社群的付出,也促成了有影響力的模型,在神經網路架構和應用的更高層級創新。舉例來說,在訓練過程中就出現了重要的創新,包括如何納入訓練回饋以改進模型,以及如何將多個模型結合成生成式 AI 應用程式。以下簡介幾項最重要的生成式 AI 模型創新:
雖然世界才剛開始摸索生成式 AI 的潛在用途,但企業在營運中應用生成式 AI 的優點相當顯而易見。試想生成式 AI 對客戶互動、銷售和行銷、軟體工程及研究和開發等主要領域,可能造成什麼樣的改變。
在客戶服務方面,早期的 AI 技術已自動化流程並引進了客戶自助服務,但也對客戶帶來了新的挫折。生成式 AI 承諾會使客戶和服務專員獲益,透過可以適應不同語言和地區的聊天機器人,創造更個人化和便利的客戶體驗。當需要人為介入才能解決客戶的問題時,客戶服務專員可以即時與生成式 AI 工具合作找出可行的策略,提升互動的速度和準確度。生成式 AI 能夠迅速運用整個大型企業的知識庫、合成解決客戶投訴的全新方法,使服務人員更能夠有效解決特定的客戶問題,而不必依賴過時的自動總機和轉接,直到找到答案,或直到客戶耗盡耐心。
在行銷方面,生成式 AI 可以自動整合和分析來自不同來源的資料,這將顯著縮短獲得洞察的時間、直接促成更明智的決策,並加速開發上市策略。行銷人員可以搭配其他 AI 產生的洞察使用這些資訊,打造更聚焦於目標的全新廣告行銷活動。這減少了員工花在收集人口統計和購買行為資料的時間,因此有更多時間可以分析結果和激盪出新的想法。
B2B 行銷公司 Stein IAS 的董事長兼品牌長 Tom Stein 表示,每間行銷公司 (包括他們公司) 都在快速探索這類機會。不過,Stein 指出,行銷公司的後端流程也可以有更簡單、更快速的成功之道。
同時擔任 2023 年坎城創意節 B2B 獎項評審主席的 Stein 也說道:「如果我們接到 RFI [資訊請求],通常有 70% 到 80% 的 RFI 會要求與其他 RFI 相同的資訊,只是可能有該公司獨有狀況的情境差異。讓自己能夠使用任何數量的 AI 工具來執行工作,其實並不複雜...。因此,如果我們能夠節省那 80% 的時間,並利用這些時間增加 RFI 的價值,使其更為出色,那麼從各方面來說都會是成功。有很多流程也都是這樣。」
與生成式 AI 合作的軟體開發人員,可在從規劃到維護的每個步驟簡化及加速流程。在初始建立階段,生成式 AI 工具可以分析和整理大量資料,並建議多個程式組態。在開始編寫程式碼之後,無論是否已經發行,AI 都能測試程式碼並進行疑難排解、找出錯誤、執行診斷,以及建議修正。Thompson 指出,由於許多企業軟體專案結合了多種程式設計語言和學科,他和其他軟體工程師已使用 AI 在陌生領域自我學習,且速度遠快於以往。他還使用了生成式 AI 工具來解釋不熟悉的程式碼,以及找出特定問題。
在研發方面,生成式 AI 可以提高產品設計初始階段的市場研究速度和深度。接下來,AI 程式 (尤其是具有影像生成功能的程式) 可以在進行模擬和測試之前,建立潛在產品的詳細設計,為工作人員提供在整個研發週期中需要的工具,以實現快速並有效的調整。
Oracle 創始人 Ellison 在 6 月的法說會指出:「專用 LLM 會加快探索救命新藥的速度。」藥物探索是一種研發應用,利用生成式模型虛構不正確或無法驗證資訊的傾向 (但是往好的方向),找出新的分子和蛋白質序列,以協助尋找新的健康療法。此外,Oracle 子公司 Cerner Enviza 也與美國食品藥物管理局 (FDA) 及 John Snow Labs 合作,運用 AI 工具應付「瞭解藥物對廣大人群的影響」這一挑戰。Oracle 的 AI 策略是將人工智慧廣泛應用於其雲端應用程式和雲端基礎架構中。
生成式 AI 具備深遠的潛力,可以加速或完全自動化多種任務。企業應該規劃審慎且具體的方式,以最大化 AI 能為其營運帶來的好處。以下列舉幾個具體使用案例:
生成式 AI能夠為企業帶來的好處,主要來自三個總體特性:知識聚合、人類與 AI 協作及速度。雖然下列許多優點與早期 AI 模型和自動化工具以往承諾的優點類似,但只要具備這三個特性中的一或多個,即可協助企業更快、更輕鬆且更有效率地實現優勢。
在生成式 AI 的協助下,組織可以建立根據自有機構知識和智慧財產 (IP) 訓練的自訂模型,之後,知識工作者可以要求軟體使用與同事溝通的相同語言合作完成任務。這類專用的生成式 AI 模型,以驚人的速度聚合整個企業知識庫中的資訊,從而產生回應。要為這些任務建立特定程式時,這種方法不僅能降低或免除複雜 (而且通常效率較低又更昂貴) 的軟體工程專業知識需求,還可能浮現原有方法未能發掘的想法和連結。
提高生產力:知識工作者可以使用生成式 AI 來縮短日常例行任務花費的時間,例如自學新學科,以應對即將進行專案的突發需求、整理或分類資料、搜尋網路以找出適用的研究,或撰寫電子郵件。如果善用生成式 AI,就能以較少的員工,在極少時間內,完成先前需要大型團隊或數小時努力的任務。舉例來說,一組程式設計人員可能要花費數小時查看有瑕疵的程式碼以排解故障,但生成式 AI 工具也許能在瞬間找到錯誤,並提供建議的修復方法。由於有些生成式 AI 模型在廣泛的知識工作能力方面,皆具備大致平均或較好的技能,因此與生成式 AI 系統合作,可以顯著提高其人類夥伴的生產力。例如,初級產品經理在 AI 導師的幫助下,也至少可以成為一名具備平均水準的專案經理。這類功能將大幅加速知識工作者完成專案的能力。
降低成本:生成式 AI 工具的速度降低了完成流程的成本,而且如果完成任務只需要一半的時間,那麼該任務的成本也會只有原本的一半。此外,生成式 AI 可以將錯誤降到最低、消除停機時間,並識別冗餘和其他昂貴的低效率情形。然而,此方法有其代價:由於生成式 AI 容易出現虛構內容,因此仍然需要人工監督和品質控管。但人類與 AI 的協作,應該可在較短時間內完成比單靠人工更多的工作,而且比單純的 AI 工具更為出色、準確,因此可降低成本。例如,在測試新產品時,生成式 AI 可協助建立比舊工具更先進且更詳細的模擬。這最終將可以降低測試新產品的時間和成本。
提高客戶滿意度:客戶可以透過基於生成式 AI 的自助服務,以及向客戶服務專員「說悄悄話」以即時提供知識的生成式 AI 工具,獲得更優異的個人化體驗。雖然目前接觸到的 AI 客戶服務聊天機器人有時成效有限,讓人感到氣餒,但根據現在的 ChatGPT 對話品質,我們可以輕易想像公司經過特別訓練的生成式 AI 模型,能夠提供更高品質的客戶體驗。
更明智的決策:經特別訓練的企業專用生成式 AI 模型,可以透過情境建模、風險評估和其他複雜預測分析方法提供詳細洞察。決策者可以利用這些工具,透過個人化建議和可行策略,深入瞭解自身產業以及企業在其中的定位,獲得範圍更廣泛的資料,取得分析的速度也比人類分析師或舊科技自行產生的更快。
舉例來說,決策者可以結合企業資源規劃 (ERP) 系統收集的內部資料與全方位的外部市場研究,交由專用的生成式 AI 模型進行分析,透過更準確的需求預測,在旺季之前規劃庫存配置。在這種情況下,更好的配置決策可以降低囤貨過多和缺貨的狀況,並盡可能推升潛在銷售額。
產品上市更快速:生成式 AI 可以快速製作產品原型和初稿,協助微調進行中的工作,以及測試/疑難解答現有專案,以比過去更快的速度找到改進方法。
品質控管:企業的專用生成式 AI 模型可以發現使用手冊、影片和企業向大眾呈現的其他內容中,有落差和不一致之處。
生成式 AI 具體優勢範例 | |||
---|---|---|---|
知識聚合 | 人類與 AI 協作 | 速度 | |
提高生產力 | 整理資料、加速研究、製作初稿。 | 為工作者講解新學科、建議解決問題的新方法。 | 加速知識工作者完成新專案的能力。 |
降低成本 | 識別冗餘和效率不彰之處,以改善工作流程。 | 盡可能避免人為錯誤、透過合作監督縮短停機時間。 | 更快完成工作 (如果工作時間減半,成本也只要一半)。 |
提高客戶滿意度 | 快速整理及擷取客戶帳戶資訊,以加快解決問題。 | 改良的聊天機器人可以自動執行簡單的互動,並在需要人為協助時,為專員提供更完善的資訊。 | 同時為客戶和服務專員提供即時帳戶更新和資訊。 |
更明智的決策 | 調解預測分析 (例如情境建模和風險評估),快速取得洞察。 | 為決策者提供個人化的建議和可行策略。 | 相較於人類分析師或舊技術,更快從更廣泛的資料中產生分析。 |
產品上市的速度更快 | 產生原型與「最低可行產品」(MVP)。 | 測試及解決現有專案的問題,以找出改善項目。 | 提升導入調整的速度。 |
任何使用生成式 AI 工具進行教育和 (或) 研究的人員,都可能經歷過最知名的限制:捏造內容。由於模型僅會預測下一個單字,因此會像提供真實資訊一樣,篤定陳述從訓練資料推演出的虛假陳述。這就是 AI 研究人員所謂的虛構行為,也是目前這一代生成式 AI 工具需要與人類合作的主要原因。企業在導入生成式 AI 時,必須謹慎準備和管理此限制和其他限制。如果企業抱有不切實際的期望,或未能有效管理技術,其後果可能會損害公司的績效和聲譽。
生成式 AI 引發了對於不同風險考量的極端反應。有些群體擔心會導致人類滅絕,其他人則堅持能拯救世界。這些極端言論超出了本文範圍。然而,下列是企業領導者在導入 AI 技術時必須瞭解的一些重要風險和考量,以採取措施來減輕潛在的負面後果。
信任和可靠性:生成式 AI 模型會做出不準確的主張,有時會虛構出完全捏造的資訊。同樣地,許多模型使用較舊的資料進行訓練,通常只會查詢特定日期之前發佈的資訊,因此適用於去年市場的內容,可能不再相關或有用。舉例來說,希望改善供應鏈營運的企業,可能會發現其模型的建議已過時,且不再適用於持續變化的全球經濟。使用者必須在採取行動前先驗證所有主張,以確保其準確性和相關性。
隱私權/智慧財產:生成式 AI 模型通常會從提示中提供的資訊輸入繼續學習。企業 (尤其是向客戶收集敏感個人資訊的公司,例如醫療機構) 必須注意避免公開受保護的 IP 或機密資料。如果模型存取了這類資訊,可能會增加資料外洩的機率。
強化社交工程:威脅行為者已著手使用生成式 AI,協助他們進一步個人化社交工程和其他網路攻擊,使攻擊看起來更加真實。
Duolingo AI 和安全工程師 Baig 表示:「現在已經很難區分在線上交談的對象是機器人還是人類。對於想要獲利的罪犯來說,現在更容易產生大量可以欺騙人們的內容。」
降低輸出品質和原創性:生成式 AI 可能會使製作產品和內容更加輕鬆且更迅速,但無法保證會產生更高品質的結果。若是仰賴 AI 模型而缺乏一定程度的人類協作,可能導致產品變得標準化且缺乏創意。
偏見:如果一般 AI 模型是以帶有偏見的資料進行訓練 (不論是觀點上的差異,或有害和帶有偏見的內容),這些偏見都會反映在輸出中。舉例來說,如果一家企業過去只招聘某種類型的員工,該模型可能會將新的求職者與所謂的「理想」員工進行交叉參考,那麼即使組織打算進行改變,合格的求職者也可能會因為不符合既定的樣貌,依然遭到淘汰。
影子 AI:員工在未經組織正式許可或知情的情況下使用生成式 AI,可能會導致企業不慎散佈不正確的資訊,或侵犯其他組織的版權。
模型崩潰:AI 研究者發現了一種稱為「模型崩潰」的現象,這可能會使得生成式 AI 模型隨著時間推進而變得不太實用。基本上,隨著 AI 產生的內容不斷增多,使用合成資料 (難免包含錯誤) 進行訓練的模型,最終會「遺忘」最初訓練時使用的人類生成資料特性。當網路上充斥著愈來愈多的 AI 內容時,這種擔憂可能達到一個臨界點,形成一個損害模型的回饋循環。
AI 法規:因為生成式 AI 過於新穎,所以沒有許多適用的法規。儘管如此,全球各地的政府都在調查如何對 AI 進行規範。部分國家/地區 (如中國) 已提出了規範措施,以規定模型的訓練方式及可產出的內容。隨著愈來愈多的國家/地區實施法規,企業 (尤其是跨國公司) 必須監視全新和不斷變化的法律,以確保符合規範,並避免因不當使用技術,導致罰款或刑事指控。
十多年前,大數據分析的崛起引發了新的道德問題和辯論,因為新興工具讓人能夠推斷出人們不曾也不想公開的私人或敏感資訊。公司應如何處理其擁有這類資訊的能力?
由於生成式 AI 具有超強的資料分析潛力,因此引發了新的倫理問題,也再次顯露了舊有問題。
從美國軍方到 Coca-Cola 等各類規模和產業的企業,都對生成式 AI 進行了大量的實驗。以下列舉幾個展現該技術廣泛潛力和快速採用的例子。
Snapchat 母公司 Snap Inc. 推出了名為「My AI」的聊天機器人,並採用 OpenAI GPT 技術。My AI 經過自訂,以符合 Snapchat 的氛圍和風格,有著友善又親切的設定。使用者可以使用大頭貼、桌布和名稱自訂其外觀,並且可以用來一對一或與多位使用者進行聊天,模擬 Snapchat 使用者與其朋友溝通的常見方式。使用者可以要求提供個人建議,或參與有關食物、嗜好或音樂等主題的休閒對話,該機器人甚至可以講述笑話。Snapchat 將 My AI 定位為協助使用者探索應用程式的功能,例如擴增實境濾鏡,並協助用戶獲取他們通常不會透過 Snapchat 查詢的資訊,例如在當地地圖上建議地點。
Bloomberg 宣佈推出 BloombergGPT,這個聊天機器人約有一半的訓練資料來自全球一般資料,另一半來自 Bloomberg 資料或已清理的財務資料。該機器人可以執行簡單的任務,例如撰寫優美的文章標題,並具備專有技巧,例如將普通英文提示轉變成公司資料終端機使用的 Bloomberg Query Language;這是許多金融業公司不可或缺的功能。
Oracle 已與 AI 開發公司 Cohere 展開合作,協助企業構建內部模型,並使用私有企業資料進行微調,以推廣使用專用的公司專屬生成式 AI 工具。
Oracle 的 Ellison 在 2023 年 6 月的法說會上告訴金融分析師:「Cohere 和 Oracle 攜手合作,致力於讓企業客戶極度輕鬆地訓練自有的專用大型語言模型,同時保護其訓練資料的隱私。」Oracle 計劃在商業平台中嵌入生成式 AI 服務,以提升整體企業現有流程的生產力和效率,讓許多公司無需從頭開始建立及訓練自己的模型。為此,該公司最近也宣佈將生成式 AI 功能納入其人力資源軟體 Oracle Fusion Cloud Human Capital Management (HCM) 內。
此外:
ChatGPT 是一種迅速竄紅的工具,但每種形式都有大量的生成式 AI 工具可以使用。舉例來說,光是寫作,就有 Jasper、Lex、AI-Writer、Writeer 等選擇。在影像生成中,Midjourney、Stable Diffusion 及 Dall-E 似乎是目前最受歡迎的選項。
音樂產生器也有數十種,包括 AIVA、Soundful、Boomy、Amper、Dadabots 和 MuseNet。雖然軟體程式設計人員常與 ChatGPT 合作,但另外也有許多特殊的程式碼產生工具,包括 Codex、codeStarter、Tabnine、PolyCoder、Cogram 和 CodeT5。
可能令人驚訝的是,現今生成式 AI 模型旅程的第一步始於 1943 年,第一部可程式設計的電腦 Colossus 在那一年首次亮相,當時英國用來解碼第二次世界大戰期間的加密訊息。AI 的第一步,是由伊利諾伊大學醫學院的精神科醫生兼教授 Warren McCulloch 與自學成才的計算神經科學家 Walter Pitts 合著的研究論文《 神經活動中內在的思想邏輯學》。
Pitts 是一名顯而易見的數學天才,他在 15 歲離家出走而無家可歸。當他遇到 McCulloch 時,McCulloch 收養了他。Pitts 在發表了影響深遠的論文後,獲得了芝加哥大學頒發的副學士學位,也是他唯一的學。該論文確立了人工神經元「決定」要輸出 1 或 0 的基本數學原理。
第二步則往東北轉向紐約州水牛城,以及 Cornell Aeronautical Laboratory 的研究心理學家 Frank Rosenblatt。在 1957 年 7 月美國海軍 Office of Naval Research 的資助下,Rosenblatt 基於 McCulloch 和 Pitts 的數學知識,在康奈爾大學的 PARA 計畫 (感知和辨識自動化) 中開發了感知器,這是一種在輸入和輸出層之間,有著單一「隱藏」層的神經網路。在製造如今存放在 Smithsonian Institution 的第 1 型感知器之前,Rosenblatt 和海軍於 1958 年 7 月在 IBM 704 大型電腦上進行了一次模擬感知器的公開示範。不過,感知器是一種極其簡單的神經網路,因此受到了麻省理工學院電腦科學家 Marvin Minsky (MIT AI 實驗室聯合創辦人) 的批評。據稱,Minsky 和 Rosenblatt 在公開論壇上辯論了感知器的長期前景,導致從 1960 年代至 1980 年代為止,人工智慧社群在很大程度上放棄了神經網路研究。
這段期間被稱為「AI 寒冬」。
在 1980 年代,由於幾位研究者的貢獻,使得神經網路研究領域得以復甦,其中最值得一提的是 Paul Werbos,他的初期工作重新發現了感知器;其他研究者還包括 Geoffrey Hinton、Yoshua Bengio 和 Yann LeCun 等人。他們的共同研究證明了大型、多層次神經網路的可行性,並展示了這類網路如何透過反向傳播演算法進行信用分配,從正確和錯誤的答案中學習。這也是 RNN 與 CNN 開始嶄露頭角之時。但是早期神經網路的限制,再加上因為這些限制和當時運算能力而未能滿足過度高估的早期期望,導致 1990 年代和 2000 年代初期出現了第二次 AI 寒冬。
不過這次,包括 Hinton、Bengio 和 LeCun 在內的許多神經網路研究人員都屹立不搖。有時被稱為「AI 教父」的這個三人組,因為他們在 1980 年代的工作成果,以及後來的堅持不懈和不斷貢獻,於 2018 年共同獲得圖靈獎如<生成式 AI 模型>一節所述,到了 2010 年代中期,新型和多元化的神經網路類型迅速出現。
生成式 AI 對企業及人們工作造成的影響,依然有待觀察。但有一點很清楚:大規模的投資正湧向生成式 AI,範圍涵蓋人類勞動的多個層面。不論是風險投資家、老牌企業,還是介於兩者之間的幾乎所有企業,都在以極快的速度投資生成式 AI 新創公司。語言模型的共通「神奇之處」在於擁有不可思議的能力,可以擔任人類與大數據互動的媒介,透過簡單、清晰和驚人的速度解釋資訊,協助人們理解。這表示生成式 AI 會嵌入眾多現有應用程式中,並推動第二波全新應用程式的創新。
舉例來說,Gartner 預測,到 2024 年時,將有 40% 的企業應用程式內嵌對話式 AI,到 2025 年,將有 30% 的企業將使用 AI 增強的開發和測試策略,而到了 2026 年,將有超過 1 億名工作者會與「機器同事」協作。
當然,生成式 AI 的風險和限制,也可能會讓這個大趨勢受阻。微調生成式模型以學習使企業變得獨特的細節,可能會過於困難,執行這種計算密集型模型可能會太過昂貴,而意外洩露商業機密,也可能會嚇退企業。
或許這一切都有可能會發生,但速度可能比現在許多人預期得更慢。值得提醒的是,網際網路的前景最終依然實現了。不過,花費的時間比第一代愛好者預期的還長了十年,在此期間,人們建立或發明了必要的基礎設施,同時也根據新媒介的可能性而改變了他們的行為。從許多方面來說,生成式 AI 的確是另一種新媒介。
具影響力的人士,對生成式 AI 在商業領域的未來有著廣泛的想法。
「這可能意味著我們在未來將以不同方式建立公司」,卡內基美隆大學泰珀商學院傑出企業家教授、CMU 企業新創實驗室聯合創始人兼風險投資家 Sean Ammirati 表示。就像在互聯網興起後,「數位原生」公司獲得了優勢一樣,Ammirati 預見未來以生成式 AI 式自動化為基礎從頭建立的公司,將能夠取得主導地位。
他說:「這些公司將以自動化為主,因此無需停止手動工作,並重新學習應以自動方式執行的工作。」「您最終可能會發展成一間非常不同的公司。」
Oracle 不僅在應用人工智慧功能和予以整合到產品方面有著長遠的歷史,更在生成式 AI 開發和活動方面處於領先地位。許多頂尖生成式 AI 公司均採用 Oracle Cloud Infrastructure。這款新世代的雲端為企業提供了完美的平台,可用於建置和部署組織和個別業務部門專屬的專用生成式 AI 模型。如 Oracle 的 Ellison 表示:「Oracle 的雲端資料中心皆具備高頻寬、低延遲的 RDMA [遠端直接記憶體存取] 網路,並為構建大規模 GPU 叢集 (用於訓練生成式大型語言模型) 而完美最佳化。在我們的第 2 代雲端中執行生成式 AI 工作負載帶來的卓越性能和相關成本節約,使 Oracle 成為頂尖 AI 開發公司的首選。」
Oracle 與 Cohere 的合作關係,已促成一組新的生成式AI 雲端產品與服務。Ellison 表示:「這項新服務可保護企業客戶訓練資料的隱私,讓這些客戶能安全地使用自己的私用資料,以訓練自有的專用大型語言模型。」
生成式 AI 的故事始於 80 年前一位年輕逃家少年提出的數學理論,並在去年年底隨著 ChatGPT 的推出,而成為一個迅速竄紅的話題。生成式 AI 方面的創新正在快速發展,各種規模和產業的企業都在嘗試並投資於其能力。但是,生成式 AI 的功能雖然可以極大地提升工作和生活水準,但也伴隨著巨大的風險,其範圍包括造成失業和 (如果您相信末日預言者) 導致人類滅絕。我們能夠確信的是,趨勢已經形成,而且無法回頭。
Oracle 提供現代化資料平台和低成本的高效能 AI 基礎架構。強大的高效能模型、無與倫比的資料安全和內嵌的 AI 服務等額外因素,更展現 Oracle AI 產品與服務是專為企業打造。
什麼是生成式 AI 技術?
生成式 AI 技術建構於神經網路軟體架構,模仿了人們認為的人類大腦運作方式。這些神經網路透過在相對小的樣本中輸入大量資料來進行訓練,然後要求 AI 進行簡單的預測,例如序列中的下一個字或一系列句子的正確順序。神經網路會依正確和錯誤答案獲得正面和負面回饋,因此能從流程中學習,直到能做出良好預測為止。最終,這項技術利用其訓練資料和學習,以類似於人類的方式回應問題和其他提示。
生成式 AI 有哪些例子?
現在最知名的生成式 AI 範例是 ChatGPT,其能夠進行類似於人類的對話,並撰寫廣泛主題的文章。其他範例包括 Midjourney 與 Dall-E,這些範例可建立影像,另外還有其他許多工具可產生文字、影像、視訊與聲音。
生成式 AI 與 AI 有何差異?
請務必注意,生成式 AI 與傳統 AI 在本質上並非完全不同的技術,而是存在於不同領域上的技術。傳統 AI 系統通常會執行特定工作,例如偵測信用卡詐騙。一般而言,生成式 AI 更具廣泛性,而且可以產生全新的內容。部分原因是因為,生成式 AI 工具通常是在比傳統 AI 更廣泛且更多樣化的資料集上進行訓練。此外,傳統 AI 通常會使用監督式學習技術進行訓練,而生成式 AI 則是使用非監督式學習來訓練。
生成式 AI 有何危險?
社會上正進行著一場關於生成式 AI 潛在風險的大型辯論。辯論雙方的極端分子表示,這項技術最終可能會導致人類滅絕,或是拯救世界。更可能的情況是,AI 將導致許多現有的工作遭到淘汰。企業應該關注生成式 AI 會如何推動工作流程和職位角色的變化,以及其可能無意間洩露私人或敏感資訊,或侵犯版權的潛在風險。
生成式 AI 有什麼長處?
生成式人工智慧可以在與人類合作的情況下,出色地用於協助構思新點子,和指導工作者相關學科。這也是一個可協助人們更快速分析非結構化資料的絕佳工具。更廣泛地說,其能夠透過提高生產力、降低成本、提高客戶滿意度、提供更好的決策資訊,以及加速產品開發的速度,為企業帶來好處。
生成式 AI 無法完成什麼事?
生成式 AI 無法創造出在其訓練資料中從未出現過的獨一無二新概念,或者至少無法從該資料中推斷出新概念。該 AI 也不應該獨自運行。生成式 AI 需要人工監督,並在人類與 AI 協作表現最出色。
哪些產業使用生成式 AI?
由於廣泛的應用性,生成式 AI 可能對幾乎每個產業都有幫助。
生成式 AI 對未來的工作有什麼影響?
生成式 AI 可能對知識工作、人類協同工作和 (或) 制定業務決策有重大影響。至少,知識工作者角色必須適應與生成式 AI 工具合作,且部分工作將被淘汰。然而,從歷史上來看,類似於生成式 AI 的技術變革,產生的工作崗位總是比淘汰的多。