文/魏煒(北京大學匯豐商學院管理學教授)
曾有無數科幻作品描繪過未來的世界,在宇宙漫步和無人駕駛早已實現的當下,AI的革新讓我們對未來保有更多的期待。凱文·凱利在其新作中表示:“在未來的50年里,AI將成為可以與自動化和產業革命相提并論的,不,應該是影響更為深遠的趨勢。”
北京大學匯豐商學院管理學教授、商業模式研究中心主任、中國企業信息中心主任,“魏朱商業模式理論”創始人魏煒及其合作者以ChatGPT為標志的人工智能為切入點,于《北大金融評論》撰文探討大模型時代下企業商業模式的選擇和判斷,分析OpenAI模式的局限性,并針對這些局限性提出未來可能的發展方向,即依托“生成式大模型+辨識型小模型”技術架構形成領域大模型,并由此提出領域大模型的商業模式選擇。
凱文·凱利在其撰寫的《5000天后的世界》一書的開篇中就寫到:“在未來的50年里,AI將成為可以與自動化和產業革命相提并論的,不,應該是影響更為深遠的趨勢。”按照凱文凱利的判斷,未來的這個世界被稱為“鏡像世界”,在這個世界里,將會誕生“新的巨大平臺”。他總結歸納得出如下判斷:互聯網作為第一大平臺,將全世界的信息數字化;社交媒體作為第二大平臺,解決了人際關系數字化;繼兩大平臺之后,第三大平臺也即將全新登場,即鏡像世界,將現實世界全部數字化。
我們認同這一判斷,也相信人類正在快速地進入AI世界,并因此更加深入去理解以ChatGPT為標志的人工智能帶來的一系列的挑戰和機遇。在此時此刻,企業和從業者的興奮和焦慮、期待和失望、絕望和希望同時并存。如何在大模型時代抓住商業機會,構建獨特的商業模式使其在大模型浪潮下依舊能披荊斬棘,是每個企業當下都需要思考的重要命題。
大模型時代構建新的力量和財富
自從美國的OpenAI公司發布了ChatGPT之后,通用人工智能(AIGC)達到了發展奇點,這也催生了一系列圍繞AIGC的創業熱潮。亞馬遜首席科學家李沐近日離職,與其導師亞馬遜前副總裁Alex Smola一同創業,阿里M6大模型的前帶頭人楊紅霞加入字節人工智能實驗室,參與語言生成大模型的研發。阿里VP賈揚清離職創業投身大模型,創新工場董事長兼首席執行官李開復近日宣布將籌組名為“AI2.0”的項目,表示將在全球范圍尋找具有 AI大模型、語言生成模型、多模態等領域能力的優秀技術人才和研究員。諸多頂尖行業人才二次創業無不提示AIGC的盛世已在眼前。
人們為什么會如此敏感于大模型帶來的變化,并快速投身其中,是源于它會帶來新的力量與新的財富,更重要的是產生新的世界格局。想想互聯網技術帶來的產業與世界的現狀,我們可以設想一下,未來的鏡像世界中,所有的產業都將再一次被重塑,一方面再一次產生行業的新價值,另一方面加速淘汰落后產能。每個人都將要與智能機器一起生活和工作,并與數百萬人一起協同工作,全新的工作方式需要“新人”,也同樣有更多的“舊人”被淘汰。世界的格局,也不再是國家與國家相互作用來構建,而需要加上擁有大模型的科技巨頭公司,那將是一種前所未有的格局。
尋找大模型時代的商業機會
正如我們感知大模型時代來臨是從ChatGPT開始的,那么,要尋找大模型時代的機會,我們同樣需要從認識OpenAI模式局限性開始。我們以商業機會作為思考的領域,也因此會關注目前領先的OpenAI公司和其他已知擁有大模型技術的公司的商業模式所存在的局限性,通過研究分析和思考,我們認為,OpenAI公司通過直接向訂閱的企業客戶和C端用戶開放ChatGPT3.5/GPT4通用對話大模型接口來獲取收入的商業模式,將會面臨三方面的局限。
首先,由于用于專業知識訓練的語料不夠,ChatGPT在專業領域提供的回答通常過于膚淺,無法提供深入的建議和解答且無法溯源,甚至經常存在難以分辨的事實性錯誤以及生成質量不穩定、邏輯不連貫、重復或不一致的現象,這會導致回答缺乏可靠性,無法滿足專業領域對回答質量的高要求。第二,ChatGPT在專業領域存在隱私漏洞:ChatGPT將提問上傳云端,在異地處理并反饋解答。這可能存在用戶隱私泄露的危險。同時,ChatGPT將用戶的輸入作為訓練的語料,這也會導致用戶的輸入信息安全無法得到保證(雖然最近OpenAI已決定不再使用用戶數據訓練,但此舉必將限制OpenAI在專業領域的能力提升)。第三,更為嚴重的是,由于用戶數據與模型產權均被中心化公司所有,這種模式不能最大程度地激勵用戶在系統里創造新數據和新知識。
ChatGPT的上述問題是由于領域知識圖譜的訓練預料不足、閉源模式導致用戶信息外泄和用戶數據的產權被侵占等固有缺陷導致的,這就給企業通過用多年積累的領域知識對大模型進行微調和優化,從而獲得本行業的領域大模型提供了窗口機會。
綜上所述,現有OpenAI類公司提供的中心化、一體化、閉源的商業模式存在固有的缺陷,難以在各行各業廣泛推廣應用。
下面,我們將針對這些局限性提出一種未來可能的發展方向,即基于通用大模型和專業知識圖譜構建領域大模型,并由此提出領域大模型的商業模式選擇。
“生成式大模型+辨識型小模型”技術架構形成領域大模型是出路
正如我們在開篇討論的那樣,隨著ChatGPT的橫空出世,人們或者因為敏感其帶來的機會,或者因為焦慮其帶來的顛覆,都在想辦法讓自己與其發生關聯。但是,這是一個從0到1的過程,進入的路徑非常多,同時坑也特別多。和之前發生的數字技術背景下生存的芯片、操作系統等領域不一樣的地方是,現在沒有時間的壁壘,先發者也不會形成累積性的競爭優勢,正因為此,其對產業的顛覆也將超乎人們的想象。
在這樣的變化特征下,大模型時代的商業模式,需要針對這樣的變化特征做出應對,并利用這些變化特征產生新的商業價值機會,因此,需要在現在生成模型的基礎上,解決行業知識與時間價值的問題,后者我們發現可以用行業辨識型模型來解決,即必須使用辨識模型來解決生成模型的不足。辨識模型補足的是兩個比較重要的方面,一個是業務場景中特有的需求,另一個是結構化知識的生產,類似人類形成長期記憶。長期來講,兩者一定是缺一不可的。
從企業的視角去看,有關企業商業模式的構建,可以確定是一個領域大模型,這一大模型主要由小模型(辨識模型)產生的專業知識圖譜、提供通用知識和語言理解與組織能力的大模型(生成模型)兩部分組成。小模型的主要功能是基于知識圖譜等技術,為大模型提供訓練和微調的專業知識,以便生成式大模型進行專業知識的理解。
通用大模型的主要任務是面向客戶直接進行語義理解和答案的生成,如閉源的ChatGPT、開源的LLaMA等均屬于此類通用模型。我們可以簡單介紹一下構建這樣一個領域大模型的過程。
第一步是訓練基于生成式大模型的自然語言處理模型,其訓練主要分為預訓練和迭代微調兩個步驟。步驟一,預訓練階段,利用海量語料訓練生成式大模型,得到大模型的模型文件。步驟二,迭代微調階段,依據指令提示學習和思維鏈提示學習對上一步的模型文件進行微調,再通過強化學習的方式,分別進行獎勵模型訓練和生成策略優化。
第二步是用辨識型小模型生成領域知識圖譜。小模型部分本身也是一個針對特定任務的自然語言處理模型,其訓練同樣分為預訓練和微調兩個步驟。步驟一,預訓練階段,可以采用BERT、T5等預訓練模型。步驟二,微調階段,利用各種針對不同下游任務的語料對預訓練的模型進行特定領域的微調。利用微調后的自然語言處理模型,可以基于語義理解方面的能力,生成特定領域的專業知識圖譜。
第三步,分析專業知識圖譜,并進一步將從其中得到的專業信息用于大模型部分的增量預訓練、微調、校驗和溯源,產生具備專業知識能力的領域大模型。
第四步,利用加入了專業知識的領域大模型,實現專業領域的文本解析、報告生成和專業問答,同時也可以解決通用大模型在專業領域的非事實性回答的問題。
不同于行業某些專家認為“不要用知識圖譜、它根本不起作用”的觀點,我們通過開發實踐證明知識圖譜,在解決純生成式大模型(如GPT4)關于事實性問題的缺陷方面不但能發揮關鍵作用,而且相比于生成式大模型+插件機制的架構(如Bing Chat),經過知識圖譜微調、校驗和溯源的領域大模型在事實準確率和生成內容的專業性方面有著非常突出的優勢。
大模型的共生體和商業模式創新
領域大模型在未來擁有更加豐富的商業化場景,這些場景將形成一個如圖1所示的大模型共生體。該共生體擁有以下角色和相應的業務活動環節,包括搭建訓練框架、輸出模型文件、模型微調、私有模型及其部署、開放API、構建知識圖譜知識、構建終端應用和提供訓練數據等。進入該共生體的企業可以通過選取不同的業務活動并在其中扮演特定的角色,與共生體中的其他主體交易,由此可以衍生出很多不同的商業模式。
圖1 領域大模型的共生體
商業模式創新的起點可以源于對共生體中不同角色的選擇,這能夠幫助企業定位其邊界以及交易的主體。如下圖2所示,這是一個大模型共生體的三軸工具。其中,Y軸代表了上下游直接業務活動,包括了搭建訓練框架、預訓練、輸出模型文件和終端應用等。X軸是直接業務活動的橫向展開,在不同的直接業務活動層面進一步區分出不同的活動。例如,訓練框架、預訓練數據可以選擇是開源、閉源(私有)還是混合;在模型文件環節可以選擇GPT-3、GPT-4、Stable Diffusion等不同的訓練好的模型參數數據;在終端應用環節可以切入對話、搜索、畫圖、寫作等多樣化場景。除此以外,Z軸代表了業務活動的豎向分層。例如,針對提供模型文件這一業務活動,將已有訓練好的模型參數數據當作基礎模型,企業可以通過模型微調使用特定領域或任務相關的全量或增量語料,對模型進行進一步訓練。在模型微調的基礎上企業可以提供客戶的私有模型部署,客戶將系統的組件和服務部署在自己的私有數據中心或基礎設施中,不僅滿足了對數據隱私和安全性的要求,還可以進行定制開發以滿足特定的業務需求。
圖2 大模型共生體的三軸工具
三個坐標軸充分表達了現有的業務活動。擁有不同初始稟賦、技術優勢的企業可以從事共生體中不同的角色,從而采取不同的大模型的商業模式。例如:
模式1,通用大模型訓練與提供模型文件的商業模式。企業的主要業務活動選擇為基礎的通用大模型訓練,通過出租或銷售通用大模型盈利。
模式2,企業自用領域大模型訓練的商業模式。企業在自用場景下,對通用大模型的模型文件進行領域適應性的二次微調,輸出一種滿足專業企業需求的領域大模型。
模式3,為不同行業提供領域大模型文件的商業模式。企業可以結合領域專業數據公司提供的專業化數據構建領域知識圖譜,訓練更適用于垂直領域需要的領域大模型。
模式4,結合知識圖譜的領域大模型訓練的商業模式。這類企業的核心在于承擔了知識圖譜構建的活動,為某一領域構建更加專業化的解決方案。
模式5,平臺型商業模式。這類企業將模型訓練的基礎設施開放給用戶,讓用戶開發屬于自己的領域大模型。
模式6,一體化且可私有化部署的商業模式。企業提供領域大模型或通用大模型,可提供模型文件給用戶私有化部署。此模式與現行的OpenAI的API模式相比,能夠激勵行業客戶創造專屬的領域大模型。
這個路徑的選擇是普遍可應用的嗎?
我們確定“生成式大模型+辨識型小模型”作為大模型時代企業的技術架構及大模型的商業模式選擇路徑,正是基于對行業發展、技術演進以及企業現狀的梳理和判斷,更重要的是,企業按照這個選擇路徑尋找大模型時代的商業模式創新機會,是相對可行且沒有太大技術和投入壁壘的。
未來,我們相信基于“生成式大模型+辨識型小模型”技術架構的共生體,及其產生的商業模式將會擁有更廣闊的創新發展空間。大量新玩家會通過重新定位、價值鏈延伸以嶄新的身份與角色進入大模型的生態系統。相比于OpenAI的中心化一體化閉源模式,從大模型共生體中衍生出的幾種局部閉源或開源模式將更可持續地創造價值。除此以外,也可以廣泛地采用區塊鏈技術甚至區塊鏈系統。區塊鏈作為一種去中心化、透明且不可篡改的分布式技術,可以提供一種可靠的方式來確保數據的確權和分配獎勵,并記錄用戶的數據與知識來源、創造時間和所有權信息,通過智能合約來實現自動化的獎賞機制,為數據和知識的貢獻者提供激勵。
如果一定要探討實現大模型條件下的商業模式創新的障礙問題,那么主要的障礙是人的思想不能轉變過來。在現實的實踐中,我們發現,即便是離AI最近的算法工程師,都很難完全理解目前技術上翻天覆地的變化,更何況其他人。而在大模型時代,人們的工作模式將發生根本的變化。新的工作模型,對從業者的要求不再僅僅是個人的勝任力,還要求有協同工作的能力,以及創造力、新的能力要求,一些從業者也許會無法轉變到大模型時代所需要的能力結構中。還有一個障礙是大部分老板對這個更不了解,僅僅知道需要很多資金和資源的投入,并且不一定有當期或者近期的產出,所以一直處在搖擺之中。其實,后面的這一點,恰恰是我們建議企業選擇做領域大模型商業模式創新的原因,因為這樣的選擇,先從行業的中游、下游去做,既可以發揮企業自身對行業所擁有的優勢知識資源,又可以貼近顧客需求端,獲得競爭優勢。
亞馬遜創始人杰夫·貝佐斯曾說過:“亞馬遜必然會消亡”。據資料顯示,自2000年以來,《財富》500強企業中有52%的公司宣布破產或被收購、兼并,但是,伴隨著這些公司的消亡,一大批創新的公司正在茁壯成長,機遇到處都是,只是需要我們能夠與機遇走在一起。
*本文作者:
魏煒 北京大學匯豐商學院管理學教授
陳春花 新華都商學院理事長、教授
林毓聰 北京理工大學醫學技術學院深度學習方向博士后
黃洪武 深圳市司普科技有限公司CTO
徐明 瑋錫科技創始人、架構師
文章將刊登于《北大金融評論》第16期。
(本文作者介紹:北京大學匯豐商學院管理學教授)
責任編輯:張文
新浪財經意見領袖專欄文章均為作者個人觀點,不代表新浪財經的立場和觀點。
歡迎關注官方微信“意見領袖”,閱讀更多精彩文章。點擊微信界面右上角的+號,選擇“添加朋友”,輸入意見領袖的微信號“kopleader”即可,也可以掃描下方二維碼添加關注。意見領袖將為您提供財經專業領域的專業分析。