文/意見領袖專欄作家 張寧
為了較系統地分析ChatGPT對保險的影響,本文首先從ChatGPT的能力出發——明確其能力上限和優勢,然后介紹ChatGPT能力在保險公司應用的價值層次——明確其應用產生價值的路徑,接著介紹ChatGPT思想對于保險行業的啟示,最后闡述說明以ChatGPT為代表的AIGC技術普及的未來,保險行業可能的變化。必須聲明的是,本文并沒有使用ChatGPT——因其能力局限尚不滿足本文寫作需求。
一、ChatGPT的能力如何評價?
為了分析ChatGPT的能力可以從其內在機制和外在表現兩個視角入手。
這里面涉及到許多人工智能具體技術,我這里盡量簡化并介紹清楚。實際上迄今為止,OpenAI并沒有公開相關ChatGPT的完整技術細節,相關ChatGPT技術原理都是從ChatGPT“出生證”介紹上獲得的(圖1)。這段話說明幾個含義:
第一,ChatGPT類似于InstructGPT(sibling model),這意味著可以從公開的InstructGPT分析ChatGPT;
第二,ChatGPT通過交互對話方式訓練的;
第三,ChatGPT能夠回答問題、承認并糾正錯誤且能夠拒絕不適當的回答等(能力)。
圖1:ChatGPT的“出生證“
而InstructGPT是有公開資料的(圖2),這是一個完整的三階段步驟,這是一種混合“強化學習“和”模仿學習/比較學習“的方案:類強化學習是體現在第二步構造獎勵模型(函數)并用于第三步;模仿學習一是因為其第二部訓練方式采用了排序(偏好)方法(InstructGPT原始論文),第二是其對損失函數的構造包含了一部分(權重)調整的GPT3輸出(即以GPT3作為目標,這形成了迭代升級關系)。可以設想,New Bing所使用的GPT4也是在ChatGPT(GPT3.5)上進一步提升形成了。從人工智能視角,這又是一種系統性的增量學習過程。
GPT縮寫是Generative Pre-trained Transformer,大名鼎鼎的Transformer大有一統江湖的氣勢——盡管它現在被MLP阻擊中,其對模型的語義元素的相關性提取能力發揮到了極致,更重要的是構建的多層Transformer可以抽取相關性的相關性特征,這是GPT具有我們欽佩的“寫作創作“能力的來源,但重點是它仍然本質上訓練語料的各種特征組合后的條件分布的排序,這決定了它的能力的兩個上限:
GPT的上限非常簡單,然而基于定域概念試題元素構建的知識其實已經覆蓋了人類是生產生活的大部分場景,某些特定領域實際上是排斥超域概念試題和元素(或者不承認)如法律、大部分金融行業以及強化同行認同的論文報告生成。接下來我們看一看ChatGPT實際表現。
圖2:ChatGPT來源InstructGPT原理圖
2.ChatGPT的能力表現
由于上述原理中第三步的存在,ChatGPT的能力實際上是不斷迭代升級的,這里以本文寫作時間(2023年2月10日)的ChatGPT的能力進行說明。
首先我們看一下ChatGPT數學能力如何——畢竟其內在機制決定了應該很弱,這甚至可以直接問ChatGPT自己,它很坦誠說相當于小學六年級的水平。具體如何那?我使用了標準數學能力測試標準題庫,為了防止已經有人“教育過“它,我進行了敘述和數字的修改,大體上能夠在數學5年級水平上取得及格以上成績,確實就如我想,就解題能力來說,恐怕距離中國的小學六年級也有段距離——當然數學知識它應該要懂得多的多。
例如這道題:
一共有11個托盤,上面共有370個包裹,相鄰的托盤包裹數不能一樣。但是任意三個相鄰的包裹數合計99。問第六個托盤上的包裹數是多少?
在我的一頓啟發下,ChatGPT開始各種胡亂蒙(條件概率生成)。為了尊重ChatGPT的“人權“,咱們暫定它的數學能力(分析推理)就是小學六年級把,注意區分這不是數學知識掌握程度的判斷,數學知識可以通過語料覆蓋到所有可能的級別,然而如同我們都學了實變函數,但掌握的其實不多一樣。
這個結論實際上并沒有降低多少ChatGPT在工作中替代人類的可能性——因為大多數工作其實小學五年級的數學就夠了,多少工作人士已經忘記了微積分和二次函數。
因為后面要分析它對保險的影響(注意不僅僅是保險行業),接著我們看看ChatGPT的金融保險能力,這方面確實是個優等生。我使用了不同學科的規范試卷(經濟學基礎、金融學、保險學等六門課程試題)并與學生人工作答的試卷進行了比對,最后的結論是:如果不考慮金融中的數學知識,ChatGPT基本上可以達到研究生的水平,所以國外英文評測ChatGPT通過MBA考試是毫不稀奇的——英文語料決定了其英文水平更強大,所以ChatGPT在中文生成使用了P-翻譯技術提高可用性。
以下是一些截圖,答得不好的題目:
答得相對及格的例子:
此外在其他領域ChatGPT的能力也大約在大學或研究生水平(圖)。這意味著在許多場景下,ChatGPT確實相當于一個對應專業的本科畢業生或者研究生,能夠完成對應的工作。
但必須補充兩點:
第一點基于前面機制分析,ChatGPT不具有超域概念試題以及知識能力,例如當問及我提出的生命質量理論時,它是“一臉懵逼”的,盡管該理論已經被AGT泰康平安等國內外公司深度應用,并在全球配置了上千億的資產影響了幾十萬人。 原因是相關通用生命質量理論目前還局限在全世界高凈值人群、較少公司范圍內,我們的相關授課講座也沒有形成固定文本,所以對應的語料極少,自然也就沒有了“分析”能力——條件概率為0,哎,ChatGPT不懂我啊。
我們總結一下ChatGPT的能力表現:
補充的第二點,New Bing使用GPT4要比ChatGPT(GPT3.5)效果更好,例如對于經濟學題目判斷更加準確。
我們再舉一個上面ChatGPT回答過的問題來感受GPT4的強大,這個回答幾乎可以給滿分。
二、ChatGPT的能力對保險公司價值幾何?
ChatGPT的能力很強大,自然就有各種可能的應用,這里我們主要聚焦于保險公司,看看ChatGPT能夠產生哪些價值。 分析某技術對企業的價值,當然可以羅列很多場景,但這其實不能界定它的潛力和方向,更好的方式是用知識經濟價值周期論與場景結合。
科技對保險的價值周期分為三個層次,分別是賦能、增能、產能:賦能是被動引入行業主導技術升級,互聯網其實就是這一類;增能是以價值為導向主動技術判斷和融入,一些大數據技術和隱私計算的上限屬于此類;產能是技術融合創造價值,保險里目前大多數科技或者說保險科技的上限離此都有距離。
為了分析ChatGPT對保險公司的價值上限,我們從兩個角度探討,一個角度是其當前的表現,另外一個角度是其內在機制決定的能力上限帶來的價值上限。
從當前具有的能力看:
從以上可以看到,ChatGPT當前能力對保險公司的價值上限可以超越賦能,達到增能階段。但上限不代表可以做到,ChatGPT類應用如果要達到增能價值,需要解決這樣幾個關鍵性問題:
第一,ChatGPT的可信性問題,對應于上文我提到的“有限角度”,這從廣義上是人工智能的可信性障礙。ChatGPT的對話能力實際作為流程關鍵要素嵌入,需要確保其方案、輸出以及方式符合保險公司規范和監管要求,否則其只能發揮“賦能”作用,仍然需要人員作為主要業務節點?;谌斯ぶ悄軕玫慕涷?,這個問題其實在保險行業類公司其實相對容易解決,這是因為專業部門的可信性障礙是容易解決的,即使在機制上沒有辦法保證,也有辦法通過流程重構跨過這個門檻。
第二, ChatGPT的數學能力障礙需要跨越。保險中的精算等需要超過高中的數學能力,這使得ChatGPT(包括New Bing的GPT4)目前無法發揮實質性作用。該障礙的跨越是可能的,大約有兩種方式:第一種是目前推理機制融合方式,這是人工智能目前新的關注點,包括我們在內的一些團隊已經將自動推理機制引入加強非語料依賴推理能力;第二種是專業軟件輸出對象重塑為ChatGPT類的產品,與ChatGPT這類應用相反,大多數流程中的專業化規則化工作已經存在對應的專業軟件,這類軟件的重新定義重塑輸出,可以與ChatGPT比較好配合,一定程度可以跨越這個障礙,我預測這類新的應用或者服務很快就會席卷市場。
第三, ChatGPT的專業適應化。在目前ChatGPT展示的能力中,其專業化能力仍然有所欠缺,例如針對保險較復雜的專業安排等,這需要ChatGPT針對保險業進行微調,這種微調更有可能基于提示學習(Prompt learning),類似于我們已經做的針對醫療和金融的調整。但通過我對New bing的GPT4研究,發現這方面進化極大,或許在GPT4發布之后,這個障礙就自然可解了。
我們再來看內在機制角度,結論是直接的,內在機制決定的ChatGPT能力上限說明其作為工具很難形成產能價值;當然GPT本身機制也會調整,并可以通過解決上述三個障礙來接近逼近上限,但即使如此其單獨作為產能工具的條件仍然是不具備的。
結論:ChatGPT為代表的AIGC技術可以為保險業提供從賦能到增能的支持,距離產能還有一段路要走。
三、ChatGPT蘊含的思想對于保險的啟示
如果只把ChatGPT看做一種工具,那么在保險公司中應用ChatGPT的能力就夠了;但如果把ChatGPT看作一種新的生產方式,我們則應該看到ChatGPT蘊含的思想對保險的影響。
ChatGPT的思想可以從其訓練過程以及發布后的公眾反應進行總結,大體上可以按照知識經濟學可以分為三個層次:
第一個層次是數據要素創造價值的新模式的到來,即以泛數據為代表的、非監督學習/強化學習/模仿學習為主要特征提取方式的模式。該思想來自于ChatGPT的內在機制和公眾使用的判斷。保險科技的深入已經讓保險行業意識到數據作為要素的重要性和地位,并在以監督學習為代表的框架下創造了第一類價值,例如欺詐識別、非標題定價、巨災模型等等。但ChatGPT使得要素價值創造模式發生了改變,這種改變使得人工智能從弱人工智能邁向通用人工智能——一些人認為是強人工智能的必然階段。這種思想于保險行業也非常重要,可以預見類似于合規風險、理賠定損、客戶服務等業務中可以構建類似的穩定模式,形成新的價值,這一類價值的特點是不以替代人類勞動為目標,而是創造新的價值空間為目標,但由于其自身不能直接構建價值,會需要更多的人類協作,所以,這應該很受員工歡迎——AI是朋友而不是敵人。
第二個層次是增量知識的偏好增長。該思想來自于ChatGPT訓練過程。ChatGPT所基于的InstructGPT基于偏好構建獎勵模型,并使得后續能力養成過程中泛知識有序增長。這種方法也體現在許多復制GPTf3的模型中(如APO),其產生的較好效果說明其思想的重要性。如果把保險公司產品迭代看作“增量知識“,那么可以說保險公司其實迭代時考慮“偏好”是不足的,渠道所反饋的特征信息收到三重謬誤影響:幸存者需求(存量客戶)、中介激勵限制(代理人激勵)以及慣性認知(固有而陳舊的市場需求分析)。現實情況是,在不同層次上,保險公司的“增量知識”與真實的需求偏差很大:公司和客戶層面上,以健康險為例,公司看到的是險(保險),客戶看到的是健康;在代理人和客戶層面上,客戶看到的是生命質量需求,代理人看到的是金融產品等等。
第三個層次是需求目標的“第一性“。該思想來自于ChatGPT的推廣及應用。它對保險行業發展以及保險公司數字化轉型有重要的啟示意義,原因在于:保險行業尚未實質性融入到生命質量經濟體系中,而生命質量經濟是保險的邏輯基礎;保險公司數字化轉型并沒有以構建三流合一機制為目標,而是局限在賦能尺度上做文章。這使得保險公司需要重新審視新的經濟特征、新的需求特征以及新的數字要素價值。這里牽涉較多專業而細微的內容,這里從略。
四、AIGC無處不在的世界,保險行業會發生怎樣的變化?
隨著包括ChatGPT在內的AIGC迅速普及——甚至是光速普及,ChatGPT的能力將無處不在,ChatGPT的思想也不斷構建新的可能,我們的世界充滿了AIGC所生成的內容、能力和思想。在這樣的世界,保險行業會發生怎樣的改變?大約有三個變化將會發生:
(本文作者介紹:中央財經大學教授、家族辦公室合作與發展組織首席經濟學家。)
責任編輯:宋源珺
新浪財經意見領袖專欄文章均為作者個人觀點,不代表新浪財經的立場和觀點。
歡迎關注官方微信“意見領袖”,閱讀更多精彩文章。點擊微信界面右上角的+號,選擇“添加朋友”,輸入意見領袖的微信號“kopleader”即可,也可以掃描下方二維碼添加關注。意見領袖將為您提供財經專業領域的專業分析。