GPT-4驗(yàn)證大模型進(jìn)階之路 國產(chǎn)廠商開始迎戰(zhàn)

GPT-4驗(yàn)證大模型進(jìn)階之路 國產(chǎn)廠商開始迎戰(zhàn)
2023年03月18日 04:06 媒體滾動(dòng)

  來源:中國經(jīng)營報(bào)

  本報(bào)記者 曲忠芳 李正豪 北京報(bào)道

  火爆全球的通用對(duì)話機(jī)器人ChatGPT,在上線僅三個(gè)半月后,迎來了新的“進(jìn)化”。3月15日,美國人工智能公司OpenAI推出了大型多模態(tài)模型GPT-4。相比于ChatGPT使用的GPT-3.5架構(gòu),GPT-4不僅接受文本輸入——文本輸入上限被提升到2.5萬字,更重要的是新增了支持圖像輸出;在律師考試、生物競賽等模擬測(cè)試中,GPT-4的成績大幅提升。另外,在26種語言測(cè)試中,GPT-4的表現(xiàn)也優(yōu)于GPT-3.5,其中英語的準(zhǔn)確率從70.1%上升到85.5%,中文的準(zhǔn)確率則達(dá)到了80.1%。

  OpenAI官方透露,其團(tuán)隊(duì)花了六個(gè)月時(shí)間來使GPT-4更加安全一致。在內(nèi)部測(cè)試中,相比GPT-3.5,GPT-4減少了82%對(duì)于被禁止內(nèi)容的請(qǐng)求響應(yīng),而產(chǎn)生真實(shí)響應(yīng)的可能性提高了40%。與此同時(shí),OpenAI聯(lián)合創(chuàng)始人、總裁格雷格·布洛克曼在視頻中還演示了GPT-4諸如總結(jié)文章、報(bào)稅、寫代碼、作詩等功能。

  針對(duì)GPT-4的訓(xùn)練數(shù)據(jù)規(guī)模及其用于訓(xùn)練的硬件信息等問題,《中國經(jīng)營報(bào)》記者通過電子郵件聯(lián)系OpenAI官方采訪詢問,但截至發(fā)稿,暫未得到回復(fù)。

  ChatGPT被業(yè)界稱作“大力出奇跡”——通過更大規(guī)模數(shù)據(jù)訓(xùn)練、更強(qiáng)算力支撐、基于人類反饋的強(qiáng)化學(xué)習(xí)等生成更具通用性、且智能水平前進(jìn)一大步的模型。那么,ChatGPT、GPT-4及其所驗(yàn)證的大模型之路對(duì)國產(chǎn)AI企業(yè)有哪些啟發(fā)?國產(chǎn)廠商該如何抓住新一輪AI機(jī)遇?針對(duì)這些問題,多家AI企業(yè)在接受本報(bào)記者采訪時(shí)給出了自己的回答。

  被驗(yàn)證的大模型之路

  OpenAI方面表示,GPT-4是其在擴(kuò)展深度學(xué)習(xí)領(lǐng)域的“最新里程碑”,是在微軟Azure人工智能超級(jí)計(jì)算機(jī)上訓(xùn)練的。截至目前,GPT-4僅面向ChatGPT Plus付費(fèi)訂閱用戶使用,開發(fā)人員可通過API接口(應(yīng)用程序編程接口)構(gòu)建應(yīng)用程序或服務(wù)。但同時(shí),包括語言學(xué)習(xí)軟件Duolingo、跨境支付工具Stripe、視障輔助應(yīng)用Be my eyes等App已內(nèi)置GPT-4,此外,國際金融服務(wù)公司摩根士丹利、冰島政府、非營利教育組織“Khan學(xué)院”等也與OpenAI在應(yīng)用GPT-4方面達(dá)成合作。

  OpenAI方面也表示,“GPT-4仍存在許多已知的限制,我們正在努力解決,如社會(huì)偏見、幻覺、敵對(duì)提示等?!?/p>

  需要指出的是,OpenAI最早于2018年6月推出GPT,后于2019年2月、2020年5月分別升級(jí)推出了GPT-2、GPT-3,三代GPT的參數(shù)量分別為1.17億、15億、1750億,預(yù)訓(xùn)練數(shù)據(jù)量分別為約5GB、40GB、45TB。從ChatGPT使用的GPT-3.5架構(gòu)開始,OpenAI沒有再公開參數(shù)量和預(yù)訓(xùn)練數(shù)據(jù)量,本次推出的GPT-4也僅提供了一份98頁的相關(guān)論文。OpenAI首席執(zhí)行官山姆·阿爾特曼在推特發(fā)文透露“正在開源OpenAI Evals”,這是一款用于自動(dòng)評(píng)估AI模型性能的框架,目的在于收集開發(fā)者的建議與意見。

  上海人工智能研究院技術(shù)總監(jiān)沈?yàn)嬖V記者,ChatGPT印證了大模型是一個(gè)比較明確的道路,國內(nèi)外在行業(yè)大模型領(lǐng)域都已做了一些工作,通用大模型會(huì)更難一些,但這是比較明確的戰(zhàn)略方向。

  在北京社會(huì)科學(xué)院研究員王鵬看來,大模型之所以稱之為大,主要涵蓋幾個(gè)要素:一是大模型的運(yùn)算量基礎(chǔ)非常高,能夠支撐大量數(shù)據(jù)運(yùn)算;二是大模型構(gòu)造復(fù)雜,本身要經(jīng)過多層次的學(xué)習(xí)、深度學(xué)習(xí);三是牽扯到的系統(tǒng)非常復(fù)雜,同時(shí)對(duì)算力資源的需求高。做大模型,相當(dāng)于“打好地基”,從國家社會(huì)經(jīng)濟(jì)長遠(yuǎn)發(fā)展的層面,要想支撐起大的行業(yè)、產(chǎn)業(yè),要在人工智能領(lǐng)域?qū)崿F(xiàn)長足的進(jìn)步、保持長效的競爭優(yōu)勢(shì),必然要訓(xùn)練大模型。重點(diǎn)推進(jìn)相關(guān)科研攻關(guān)方向,具有深遠(yuǎn)的影響和意義。

  “ChatGPT預(yù)訓(xùn)練語言模型的出色表現(xiàn)吸引了廣泛的關(guān)注,吸引了科技大廠的加碼布局。不過這里有一個(gè)誤區(qū),許多人認(rèn)為只要參數(shù)足夠多,模型足夠大,也能夠訓(xùn)練出與ChatGPT水平類似的AI產(chǎn)品,其實(shí)不然。如果算法存在差異,或者訓(xùn)練步驟和數(shù)據(jù)不同,結(jié)果可能也不會(huì)一樣。即使做大模型,也不代表同樣的高水平,創(chuàng)新需要差異化,不宜一哄而上。ChatGPT使用的大模型,除了參數(shù)高,還使用了微軟Azure超級(jí)計(jì)算機(jī)、英偉達(dá)先進(jìn)GPU芯片做算力支持,訓(xùn)練過程中創(chuàng)新性地引入了利用人類反饋強(qiáng)化學(xué)習(xí)機(jī)制,這是許多大模型難以超越它的原因。”深度科技研究院院長張孝榮如是說道。

  AI企業(yè)的啟示與機(jī)遇

  由ChatGPT引發(fā)的新一輪AI熱潮持續(xù),包括百度、阿里巴巴、騰訊、科大訊飛等科技大廠都在加碼推進(jìn)自己的通用大模型。多家國產(chǎn)AI企業(yè)負(fù)責(zé)人均向本報(bào)記者表示,正在密切關(guān)注ChatGPT以及AI大模型的發(fā)展及趨勢(shì),并思考如何將新的技術(shù)突破整合且應(yīng)用到自身的產(chǎn)品業(yè)務(wù)中。

  其中,3月16日百度正式推出大語言模型——文心一言。百度 CEO 李彥宏在演講中表示文心一言“不盡完美”,“大家的期望值是要對(duì)標(biāo)ChatGPT,甚至要對(duì)標(biāo)GPT-4,這個(gè)門檻還是很高的”。李彥宏介紹,文心一言有五大能力,即文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成。此外,李彥宏還表示,內(nèi)測(cè)中文心一言并不完美,但市場有需求必須要推出來。

  成立于2016年的天壤智能創(chuàng)始人兼CEO薛貴榮在接受記者采訪時(shí)指出,早在公司創(chuàng)立之初就搭建了深度強(qiáng)化學(xué)習(xí)框架,目標(biāo)是讓通用人工智能像水電一樣便捷。不過發(fā)展期間在市場及業(yè)務(wù)需求下,自研并落地了包括圖像處理、交通、蛋白質(zhì)設(shè)計(jì)等多個(gè)行業(yè)大模型。薛貴榮表示,“ChatGPT使我們更加堅(jiān)定了做大模型、多模態(tài)、強(qiáng)化學(xué)習(xí)的路徑是通的?!?/p>

  薛貴榮認(rèn)為,ChatGPT、GPT-4有望加速AI for Science的發(fā)展經(jīng)驗(yàn),尤其是在生物制藥、材料研發(fā)、能源等眾多領(lǐng)域,作為新的生產(chǎn)工具輔助科研人員進(jìn)行高效生產(chǎn),而且隨著數(shù)據(jù)越來越多、智能程度越來越高,在提供專業(yè)研究建議的同時(shí)還可能主動(dòng)探索發(fā)現(xiàn)新的理論。

  虛擬人廠商中科深智創(chuàng)始人兼CEO成維忠表示,GPT-4對(duì)虛擬人行業(yè)是“天大的好事”。這是因?yàn)椋磥淼娜藱C(jī)交互必須是多模態(tài)的,尤其是視覺信號(hào)的實(shí)時(shí)輸入輸出,最新面市的GPT-4解決了圖片輸入的問題,不久可能會(huì)解決視頻輸入的問題。聚焦在垂直領(lǐng)域生成式AI訓(xùn)練的公司跟GPT-4的結(jié)合機(jī)會(huì)很大。除此之外,成維忠認(rèn)為,GPT-4對(duì)智能客戶、視覺識(shí)別等行業(yè)產(chǎn)生沖擊,在這種情況下,“積極擁抱新技術(shù)才有出路”。

  新壹科技研發(fā)副總裁、AI項(xiàng)目負(fù)責(zé)人陳鵬告訴記者,ChatGPT的出現(xiàn)至少影響90%的NLP(自然語言處理)領(lǐng)域的從業(yè)者。從去年初,陳鵬帶領(lǐng)團(tuán)隊(duì)開始瞄準(zhǔn)圖文生成視頻這一需求,基于既往做小咖秀等視頻產(chǎn)品的經(jīng)驗(yàn)以及業(yè)務(wù)戰(zhàn)略方向,研發(fā)推出“一幀秒創(chuàng)”App。陳鵬表示,“我們并不是跟風(fēng),而是恰好被AIGC——通過AI技術(shù)生成內(nèi)容的‘大風(fēng)給刮到了’?!蔽谋疽曨l化、超視頻是一個(gè)大趨勢(shì),傳統(tǒng)的UGC(用戶生成內(nèi)容)或PGC(專業(yè)生產(chǎn)內(nèi)容)已難以滿足市場需求,通過生成式AI提高視頻的生產(chǎn)效率也就成了順理成章的事情。

  四足機(jī)器人生產(chǎn)商云深處科技產(chǎn)品負(fù)責(zé)人向記者表示,ChatGPT、GPT-4代表的跨時(shí)代AI的出現(xiàn)給腿足機(jī)器人行業(yè)帶來了進(jìn)入人類日常工作生活的希望。機(jī)器人技術(shù)與應(yīng)用受限于硬件和軟件兩條線,其中軟件層更多地受限于AI技術(shù),隨著腿足機(jī)器人實(shí)體具備越來越強(qiáng)及越來越穩(wěn)定的運(yùn)動(dòng)性能,在結(jié)構(gòu)化行業(yè)環(huán)境里有了非常多的應(yīng)用,但要更進(jìn)一步貼近人類的日常生活及服務(wù),就遇到了AI及交互的技術(shù)發(fā)展瓶頸。多年來,AI都只有比較固定模式的問答,相對(duì)沒那么智能。隨著GPT-4的出現(xiàn),腿足機(jī)器人有望獲得優(yōu)秀的語義分析和對(duì)話能力,將使人機(jī)交流不再是機(jī)械式的“查字典式問答”。同時(shí),新AI具有積累學(xué)習(xí)的能力,甚至具備個(gè)性,在陪伴、康護(hù)、服務(wù)領(lǐng)域具備非常重要的意義。值得注意的是,GPT-4增加了圖像輸入及分析,未來或會(huì)接入實(shí)時(shí)視頻、各類傳感器等更多輸入源,真正意義上的AIoT(智能物聯(lián)網(wǎng))將使機(jī)器人能勝任更多可能場景和任務(wù)。

  就在2023年全國兩會(huì)舉行前,科技部高新技術(shù)司司長陳家昌公開表示,人工智能作為一個(gè)戰(zhàn)略性新興技術(shù),日益成為科技創(chuàng)新、產(chǎn)業(yè)升級(jí)和生產(chǎn)力提升的重要驅(qū)動(dòng)力量?;谧匀徽Z言理解的人機(jī)對(duì)話是人工智能發(fā)展的一個(gè)重要方向,ChatGPT最近成為了一種現(xiàn)象級(jí)的應(yīng)用,表現(xiàn)出很高的人機(jī)交互水平,表現(xiàn)出自然語言的大模型已經(jīng)具備了面向通用人工智能的一些特征,在眾多行業(yè)領(lǐng)域有著廣泛的應(yīng)用潛力。

海量資訊、精準(zhǔn)解讀,盡在新浪財(cái)經(jīng)APP

責(zé)任編輯:李桐

AI

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財(cái)經(jīng)公眾號(hào)
新浪財(cái)經(jīng)公眾號(hào)

24小時(shí)滾動(dòng)播報(bào)最新的財(cái)經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)

7X24小時(shí)

  • 03-24 華海誠科 688535 --
  • 03-23 中科磁業(yè) 301141 --
  • 03-22 日聯(lián)科技 688531 --
  • 03-21 花溪科技 872895 6.6
  • 03-20 一諾威 834261 10.81
  • 產(chǎn)品入口: 新浪財(cái)經(jīng)APP-股票-免費(fèi)問股
    新浪首頁 語音播報(bào) 相關(guān)新聞 返回頂部