意見領袖 | 新金融聯盟NFA
“基礎大模型投入數據量大、算力成本高、算法難度大,所以由頭部AI公司進行建設。雖然通識能力較強,但其缺少金融專業知識,對金融場景應用有限?!?月10日,新金融聯盟學術理事、工商銀行首席技術官呂仲濤在新金融聯盟舉辦的“金融機構數智化轉型與大模型技術應用”內部研討會上表示。
呂仲濤認為,要實現大模型在金融行業的規模化應用,有兩條可行路徑:
對于大型金融機構而言,由于擁有海量金融數據,應用場景豐富,宜引入業界領先的基礎大模型,自建金融行業、企業大模型,考慮到建設周期較長,可采用微調形成專業領域的任務大模型,快速賦能業務。
對于中小金融機構而言,可綜合考慮應用產出和投入成本的性價比,按需引入各類大模型的公有云API或私有化部署服務,直接滿足賦能訴求。
各位來賓,大家好!很榮幸向各位領導和行業專家分享介紹工商銀行在人工智能大模型應用方面的落地探索實踐。
什么是大模型
2022年11月以來,隨著ChatGPT的發布,人工智能大模型技術成為社會各界關注的熱點。國際人工智能權威雜志《自然-機器智能》將大模型定義為網絡參數規模達到億級以上的“預訓練深度學習算法”。大模型通過海量數據的訓練學習,具備了強大的語言理解和表達、思維鏈推理等能力,在文本圖像理解、內容生成等AI任務表現出顯著優勢和巨大潛力。
相較于傳統人工智能算法一事一議的建模方式,大模型具備更強的通用能力,可處理多種任務,可較好解決傳統模型的碎片化問題。其特點可以總結為“三大一快”。三大,指的是大模型基于“大算力+大數據+大算法參數網絡結構”進行訓練,實現通用海量知識預置。一快,指的是大模型通用能力強,各行業可在大模型基礎上,直接使用或“站在巨人肩膀上”通過再次訓練快速學會新知識,快速賦能業務應用。
大模型可根據參數規模、數據模態、建模方式三個維度進行分類。
從參數規???/strong>,大模型一般指參數規模到達億級以上的深度學習模型。大模型作為一種復雜的類似人腦的神經網絡,一般來說其參數規模越大,可容納的知識越多,能力就越強。根據參數規模不同,可分為十億、百億、千億甚至萬億參數大模型,十億大模型只具備簡單的識別分析能力,用于文本分類、文本相似度等簡單任務;百億大模型具備一定的文本生成和通用能力,能處理邏輯推理簡單、難度相對較低的文章摘要生成、閑聊等任務,難以處理邏輯復雜、專業性強的任務;千億大模型“存儲空間”更大,不容易出現信息遺忘,可以學習海量數據,并具備較強的邏輯推理和生成能力,相較百億大模型,千億大模型在知識問答、閱讀理解、邏輯推理、文章撰寫等邏輯推理復雜、專業性強的任務上提升顯著;萬億大模型因算力消耗極大,短期內難以進行商業推廣應用。
千億大模型平衡了百億和萬億大模型優勢,相較于百億大模型,數據“記憶”能力更強,具備更強的邏輯推理和生成能力,相較于萬億大模型,性價比優勢明顯。因此,千億大模型是近幾年發展及應用的重點。
從數據模態看,模態是指數據表達的形態,通常包括文本、圖像、音頻、視頻等。大模型根據支持不同數據模態的數量,可分為單模態和多模態大模型,其中單模態大模型可以是處理文本的自然語言大模型、處理圖像的視覺大模型等。多模態大模型可以同時處理圖像、文本等多種數據類型,目前較為成熟的如用于以文生圖或以圖生文的多模態大模型。
2022年11月,OpenAI推出的基于千億級自然語言大模型的ChatGPT服務展示了出色的文本通用任務解決能力。單模態的自然語言大模型因其較強的理解能力,便捷的交互方式等因素,成為近期發展重點。雖然ChatGPT4已經走入多模態,但單模態大模型無論從語言還是視覺仍有發展空間,并非所有東西都是一下子到多模態。
人工智能建模方式是指在人工智能領域中,使用各種算法和技術來構建模型,以實現對現實世界的各種問題進行分析、理解、生成等任務。
從建模方式看,大模型分為分析式、生成式大模型兩類。其中分析式大模型也叫判別式大模型,其原理是通過學習訓練數據的歷史規律,對未知數據進行分類或預測,一般用于處理文本分類等上下文較為簡單的分析理解任務,典型算法如谷歌的BERT;生成式大模型通過學習數據產生的模式,能更好的分析理解數據,并實現新樣本內容的創造,可用于文章撰寫、代碼生成等內容智能化創作任務,典型算法如OpenAI的ChatGPT。
生成式大模型相較于分析式大模型,具備強大的內容生成和分析推理能力,實現了人工智能從傳統識別分析到生成創造能力的躍遷,業界把此類能力稱呼為AIGC,(人工智能內容生成),成為業界應用熱點。
對于確定的模型,均包含以上三種分類信息,例如,OpenAI的GPT-4是千億級、多模態、生成式大模型。
從ChatGPT誕生以來,國內外大模型浪潮持續高漲,并形成了算法研發、產品應用的產業鏈生態。但相較國際領先水平,國內大模型仍存在代際差距。從算法生態來說,目前最優秀的大模型是OpenAI的GPT-4,這是一個多模態大模型,在很多領域專業和學術基準上表現出人類水平。國內,各類AI公司紛紛入局,已推出如百度文心一言、清華GLM、阿里通義千問、訊飛星火等等產品,各有擅長。在應用層面,微軟依托投資GPT4紅利,已在搜索、辦公、安全等傳統領域推出智能化產品。國內,在應用層面仍初步起步階段,有待進一步探索。
大模型與傳統模型的關系
商業銀行不是靠一個大模型就能打遍天下,大模型與傳統模型有一定關系,二者同時推進。
要講清楚大模型和傳統模型的關系,首先,我們要了解大模型在人工智能技術關系的定位。通過工行的實踐,大模型技術不是一個獨立的算法或者服務,它是一個復雜的體系性工程,包括了大模型算力集群建設、大模型算法沉淀、大模型配套流水線工具、大模型服務等內容,同時通過大模型賦能,實現了自然語言處理、圖像識別、知識圖譜等垂直領域技術平臺的能力迭代升級。
工商銀行經過5年多的建設,目前已經沉淀人工智能模型3000余個,包括傳統機器學習模型、傳統深度學習模型和大模型三類。一是傳統機器學習模型,因可解釋性強,廣泛用于欺詐交易預測、理財產品營銷推薦等智能決策分析應用,二是傳統深度學習模型廣泛用于OCR識別、人臉識別、語音識別等感知識別類任務,有效提升勞動密集型工作;經過探索實踐,大模型可用于文本、圖像等AIGC任務,提升智力密集型工作質效。
從趨勢來看,大模型隨通用能力增強,將逐步超越傳統模型的能力,但受制于計算復雜度高、可解釋性差等問題,短期內,大模型和傳統模型會共存,同時,大模型可作為中控,將傳統模型作為技能進行調用。未來,隨著若大模型計算復雜度降低、可解釋性增強,綜合性價比來看,大模型將逐步替代傳統模型。
大模型與傳統模型的研發和應用模式有所區別。大模型引入分布式預訓練、基于人類反饋的強化學習、提示詞工程等新技術,實現“點醒激發”大模型潛能,相較傳統模型,一是研發態,大模型在算力投入、數據積累、人員技能、算法復雜度等方面要求更高,一般是組建專業團隊,多人訓練一個模型;二是應用態,從碎片化的API調用演化到統一的提示詞挖掘調用,技術集成研發難度降低。
大模型對于商業銀行的應用價值
大模型作為一種新型的人工智能技術,工商銀行積極探索應用,提升智能客服、智慧辦公、運營管理、營銷創造、智能研發等業務領域的智能化水平,真正解決一線員工的痛點問題。
智能客服領域,存在大量信用卡、存貸款等業務辦理規定,傳統模式,坐席人員在服務客戶時,需要和系統多次進行交互查詢,整個處理流程需要一定時間,客戶等待時間長。通過大模型的文檔理解分析和生成能力,自動從大量銀行業務辦理規定中,總結提煉全面、專業、精準的應答話術,給坐席人員提供參考,提升應答效率和客戶滿意度。
運營管理領域,網點員工日常工作中存在制度規范檢索難、復雜業務辦理難、專業術語解釋難等業務痛點問題,通過摘要生成、信息提取等大模型能力,讓大量“靜態”文檔轉換場景化、流程化的“活”指引,提升網點員工業務應變和溝通能力,打造高質量服務。
智慧辦公領域,通過大模型AIGC能力,助力編寫會議摘要、寫匯報初稿、潤色文檔、制作海報等,提升辦公效率。比如會議紀要生成,根據會議對話內容,大模型快速生成會議紀要初稿,降低人工記錄會議紀要的成本。同時,利用大模型代碼生成、代碼補全等能力,可提升一線開發人員編碼效率和質量。
大模型應用面臨的風險和挑戰
大模型本質是一個海量參數的深度學習算法,受制于當前模型黑盒、計算復雜度高等因素,存在答非所問、科技倫理風險等方面問題。比如,ChatGPT生成大量看起來合乎邏輯,但內容可能并非真實甚至是捏造的事實,存在非法利用、造謠等安全隱患。
國家高度重視大模型應用安全,國家網信辦明確“利用人工智能生成的內容應當體現社會主義核心價值觀”,并要求謹慎對客,同時對客場景需要統一報批。
雖然大模型有各類安全風險,但同樣給銀行業數字化轉型帶來新機遇。在這過程中,我們需要解決數據、算力、算法、應用等諸多挑戰。
一是大模型需要大數據。通過數據驅動,釋放數據要素價值,加速金融行業和企業大模型建設,加速推進銀行業數字化轉型。
二是大模型需要大算力。當前國內外算力市場面臨著算力供給短缺、多廠商異構算力融合、國產AI生態不足、機房和網絡建設等復雜情況,金融機構需要深化與產界各方的合作,來共同推動解決大規模算力部署和應用挑戰。
三是大模型需要大合作。銀行業要加快探索引入業界通用的大模型技術的策略和實踐,通過推進大模型算法在銀行業的應用實踐,加快大模型能力增強,從而提升大模型服務金融行業能力。
四是大模型需要大創新。大模型要能在銀行深化應用,就需要探索形成一套面向銀行業的高標準、低門檻的銀行業金融大模型應用模式,來快速推進人工智能在金融領域的深化應用。
商業銀行的落地方案
關于大模型應用落地,目前業界尚無標準方法論,企業可按照場景通用化、專業化程度,分別使用基礎大模型、行業大模型、企業大模型、任務大模型,四層模型訓練數據規模和投入算力逐層遞減,專業屬性逐層增強。
其中,基礎大模型由于投入數據量大、算力成本高、算法難度大,由頭部AI公司進行建設,雖然通識能力較強,但其缺少金融專業知識,對金融場景應用有限。
要實現大模型在金融行業的規?;瘧?,有兩條可行路徑:
對于大型金融機構而言,由于擁有海量金融數據,應用場景豐富,宜引入業界領先的基礎大模型,自建金融行業、企業大模型,考慮到建設周期較長,可采用微調形成專業領域的任務大模型,快速賦能業務。比如我行前期和鵬城實驗室聯創,通過微調,率先實現了人工智能大模型在行業內的應用。
對于中小金融機構而言,可綜合考慮應用產出和投入成本的性價比,按需引入各類大模型的公有云API或私有化部署服務,直接滿足賦能訴求。
通過工商銀行的前期實踐,我們認為大模型在文本、圖像等領域的AIGC能力優勢明顯,但當前階段并不成熟,仍存在科技倫理風險等問題。因此,短期內不建議直接對客使用,應優先面向金融文本和金融圖像分析理解創作的智力密集型場景,以助手形式,人機協同提升業務人員工作質效。
工商銀行經過前期大模型在數字員工的一些探索應用,我們發現基于大模型技術的人機交互能力、信息匯聚能力,可以實現多種能力的信息整合。一方面可以整合系統入口,形成全員通過自然語言交互,開展分析、預測、監測等金融工作新模式,實現為每位員工配備一位AI助理。另一方面,通過大模型、傳統模型、業務交易流程的融合,更有利于發揮數據要素的倍增和乘數效應,實現更為高效的業務流程。
我們相信在大模型的助力下,金融機構會提升人機協同智能化、經營決策智能化、業務流程智能化,更好實現數字化轉型,并最終賦能實體經濟和人民美好生活。
(本文作者介紹:一個高質量的新金融政策研討和行業交流平臺。)
責任編輯:張文
新浪財經意見領袖專欄文章均為作者個人觀點,不代表新浪財經的立場和觀點。
歡迎關注官方微信“意見領袖”,閱讀更多精彩文章。點擊微信界面右上角的+號,選擇“添加朋友”,輸入意見領袖的微信號“kopleader”即可,也可以掃描下方二維碼添加關注。意見領袖將為您提供財經專業領域的專業分析。