“2023中國AIGC產業發展論壇”于9月4日在北京召開。瀾舟科技創始人兼CEO周明出席并演講。
以下為演講實錄:
感謝大會的邀請,大家下午好。今天利用這樣一個機會,簡要地介紹一下瀾舟科技最核心的孟子大模型技術體系。我們用孟子大模型的時候賦能千行百業,在這里分享一下我們最近的一些進展。
我們現在進入了大模型時代,剛才有嘉賓也說了千模大戰的時代,我們希望把煉大模型和用大模型有機統一起來形成一個閉環,互相促進。過去兩年多,我們一直在做大模型。我從2020年年底從微軟出來開始創業做大模型,兩年多我們已經做了很多工作,包括在3月份就發布了孟子類ChatGPT模型,5月份大模型對外邀測,最近40B的模型對外邀測等等。大家感興趣的話可以到我們官網看一下實際效果。
在服務大模型服務千行百業的時候,在想什么問題是大模型在企業落地時存在很多的困難。不是說你練一個大模型甚至你有個ChatGPT水準的模型給企業一用,大家全部叫好,都說很好使,實際上中間有很多的鴻溝。所以站在客戶的角度怎么看待大模型非常重要。可能我作為一個客戶根本不知道什么是大模型。大模型的規格尺寸,訓練時用多大的數據是大模型公司你自己的事,我只關心發一條指令你能把我的任務完成,實際上這是AI Agent道理。我們必須要解決用戶使用大模型的最后一公里。
圍繞這些能力,要怎么建設一個體系來服務千行百業,我們提出了所謂L1-L4企業級的產品體系,跟大家分享一下。
L1孟子大模型是通用大模型,你可以認為它的認知能力是高中生的水平,具備基本的語言和能力,這個模型不能直接應用于企業。如果為了企業服務,上面還得做一個行業模型,也就是L2模型。你可以認為它的認知能力具備某專業的大學畢業水準。拿金融行業為例,需要把金融的知識數據灌入其中訓練一個金融模型,金融模型和通用模型訓練時候要講究數據平衡,否則可能獲得了專業能力卻忘記了通用能力。行業模型是相當于大學畢業的水平,有一定專業水準。再往上要處理很多場景,每一個場景你不要指望你訓練一個通用大模型或者行業模型能解決非常好,要針對某一個特定的場景要么做提示工程,要么需要微調。最后通過企業服務的能力,來解決客戶問題,提供相應的效果。
舉例一下,以孟子大模型來做AI Agent。比如這里有一個問題,請幫我生成瀾舟科技2023年第一季度的業績點評報告。大模型把這個任務拆解成N多個子任務,每一個子任務對應一個處理步驟。這里有如下8個步驟。這要要涉及到對問題的分解,分解成若干細小的問題,然后順序執行這些小任務得到一定的結果。這個過程涉及到對外部數據的溝通,跟外部互聯網的溝通,以及對結果進行總結歸納能力、寫作能力等等。
最近我們的模型取得很好的效果。我們的模型曾經獲得中文評測C-Eval的第一名。我們最近發布了40B企業大模型,并支持企業服務,支持行業模型訓練。我們的模型中文突出、多語言能力,具備通用寫作能力、進行了多輪算法迭代,多倫對話能力比較好。在這個通用模型繼續加入行業數據可形成一個強有力的行業模型。我們大模型跟其他現有發布的最好模型相比,在多項任務上,我們有高有低,大體上處于相仿的地位。
大模型落地時,要把場景數據分析清楚,支持各自的業務。我們最近發布了金融大模型。在訓練金融大模型的時候,要做預訓練,因此要加入各種各樣的金融數據,有些數據是互聯網公開得到的,有些可以購買,有些是從優秀外文數據翻譯成中文,當然有些是合作伙伴提供的。為了做有監督訓練,我們這里又有100多項金融中常見的任務場景加入進來,使得我們這個模型不是簡單的語言理解的能力,而且要有一定的金融行業任務的理解和執行能力。
為了評測行業模型,也要做一個非常好的設計。不是簡單評測一個語言對話、理解,還得把行業中很多的場景考慮進去做相應的評測。這是我們對模型和相應任務進行的評測結果。參與評測的模型有開源的千億模型,ChaTGPT,我們自己的通用模型。我們用70億的通用模型以后加入很多的行業知識去做預訓練,再做100多項任務微調。結果發現我們這個模型雖相對較小,但是基本可以平替掉Chatgpt模型和開源千億級大模型。說明給企業做服務的時候,不是非要做到非常大的模型,如果行業數據重組,訓練得法,小模型是可以做的可用的水準的。因為企業講究訓練成本,模型小在這些方面占有一定的優勢。
基于行業模型或者專業模型有很多應用場景。比如,做知識問答和搜索,基本思路是企業有自己的數據,可以是文本的數據或結構化的數據。一個指令來了,先查外掛企業數據,查到結果跟用戶的promt相配對生成一個回復。我們要快速接入企業的數據。這個場景非常廣泛的應用場景。
還有個場景是多模態企業搜索場景。企業可能有很多的數據,希望能加上大模型進行搜索。大模型要對企業搜索的意圖有很好的理解,搜索的結果要高效率展示。這里舉一個例子,可以金融資管企業,要搜公告、新聞、年報等各種金融行業的數據,搜索的結果要做一個總結,讓用戶看到總共搜多少東西,內容是什么,點擊不同的文章可以用不同的顏色顯示不同的觀點,把觀點做一個序列。用戶看完觀點,可能還要搜索一些具體的細節,基于大模型可以做一些多輪的問答過程。
基于這些能力我們最近發布了一個瀾舟智會是以孟子GPT大模型打造的會議平臺。用戶上傳視頻文件,系統進行ASR,然后修復識別錯誤,再抽取關鍵詞、術語、實體名、觀點等信息,在支持搜索、摘要、情感分析,也支持對文檔信息進行對話。這些都是孟子大模型支持下完成的。目前瀾舟智會也公布在瀾舟官網上供大家測試。
我們過去兩年多也得到了很多的和合作伙伴的支持,在此表示感謝,很多的模型也用在合作伙伴的業務中了。包括華為、傳神、華夏基金、同花順、中金公司、標智客等等,非常感謝他們對我們的支持。
我們把通用模型做好之后,再把行業模型做好,再跟企業數據之間的對接做到簡單容易,就可以實現規模化的交付。
我們采取了本地部署方式,也就是應客戶要求,可以用客戶的數據繼續訓練一個客戶專有模型,再把訓練得到的模型部署在用戶的本地。我們也支持模型即服務(MAAS),這是我們跟云廠商合作的。我們把我們的通用或者行業模型放進去,用戶可以根據按量調用。MASS是靈活的服務方式。
最后再一次感謝AIGC論壇。我希望跟在座的各位有進一步的交流,也期待未來更多的合作,謝謝大家。
責任編輯:梁斌 SF055
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)