安裝新浪財(cái)經(jīng)客戶端第一時(shí)間接收最全面的市場資訊→【下載地址】
來源:中國經(jīng)營報(bào)
本報(bào)記者 秦梟 北京報(bào)道
近日,一篇來自 Google 內(nèi)部研究人員的文件流出,聲稱“我們沒有護(hù)城河,OpenAI 也沒有”,開源 AI 會(huì)擊敗 Google 與 OpenAI,獲得最終的勝利。這位研究人員認(rèn)為,雖然表面看起來 OpenAI 和谷歌在 AI 大模型上你追我趕,但真正的贏家未必會(huì)從這兩家中產(chǎn)生,因?yàn)榈谌搅α空谇娜会绕稹?/p>
不僅如此,《中國經(jīng)營報(bào)》記者統(tǒng)計(jì)發(fā)現(xiàn),截至目前,國內(nèi)已有40余家公司或者機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計(jì)劃。而在這些公司里,不乏百度、阿里巴巴、字節(jié)跳動(dòng)、華為、科大訊飛等大型互聯(lián)網(wǎng)科技企業(yè)。
而在這個(gè)大模型“百家爭鳴”時(shí)代,已有人正在努力突破OpenAI們的護(hù)城河,超越ChatGPT。
Meta是“元兇”?
上述谷歌研究員在文件中提到的第三方力量正是開源模型,其訓(xùn)練速度更快,可定制性更強(qiáng),更私密,而且比同類產(chǎn)品能力更出色。他們正在用100美元和130億的參數(shù)做一些“谷歌1000萬美元和540億的參數(shù)難以企及”的事情,而且在短短幾周內(nèi)就能做到,而不是幾個(gè)月。
而該研究員認(rèn)為,釀成這場“禍端”的元兇就是Meta的LLaMa開源模型泄露。
2月24日,Meta推出大語言模型LLaMA,按參數(shù)量分為7B(B即billion,10億)、13B、33B和65B四個(gè)版本。但僅在推出一周后,該模型就被上傳到海外論壇,此后,這個(gè)種子鏈接被發(fā)布到開源社區(qū)GitHub,被廣泛下載。
上述研究員稱:“巨大的創(chuàng)新成果接連涌現(xiàn)出來,僅僅間隔了幾天時(shí)間。現(xiàn)在,不到一個(gè)月的時(shí)間,就出現(xiàn)了指令調(diào)整、量化、質(zhì)量改進(jìn)、人類評(píng)價(jià)、多模態(tài)、RLHF等變體,許多都是相互關(guān)聯(lián)的。”
不過, 在眾多業(yè)內(nèi)人士看來,現(xiàn)實(shí)遠(yuǎn)沒有想象的那么悲觀。AI算法專家黃頌向記者表示,一項(xiàng)新技術(shù)出現(xiàn)開源替代方案一般會(huì)改善整個(gè)生態(tài)。開源項(xiàng)目為對該技術(shù)有需求的用戶提供了一種備選方案,但一般來講,這種方案是經(jīng)濟(jì)和性能上的權(quán)衡。對于大模型來說,由于其對數(shù)據(jù)、平臺(tái)算力、算法儲(chǔ)備等方面的要求都極高,即使存在開源替代方案,單一的開發(fā)商也未必能夠完全復(fù)刻頭部商業(yè)公司的最優(yōu)水準(zhǔn)。但反過來講,開源方案的存在,會(huì)令Google/OpenAI考慮差異化的研發(fā)路徑,同時(shí)在商業(yè)化的過程當(dāng)中做出一些有利于消費(fèi)者的選擇。
對此,深度研究院院長張孝榮認(rèn)為,開源AI有可能成為谷歌和OpenAI的競爭者。開源AI是小模型,參數(shù)少,運(yùn)行成本低,迭代速度快,優(yōu)秀項(xiàng)目有可能在廣泛參與下獲得更好的性能,進(jìn)而搶占更多市場份額。當(dāng)然這是理論上的,如果兩大巨頭的大模型能夠持續(xù)保持對開源AI在技術(shù)和性能上的壓倒性優(yōu)勢,開源項(xiàng)目可能會(huì)獲取一點(diǎn)份額,但未必會(huì)占到太多便宜。
在天使投資人、人工智能專家郭濤看來,Google和OpenAI擁有深厚的人工智能相關(guān)技術(shù)沉淀、海量的訓(xùn)練數(shù)據(jù)、領(lǐng)先的算法模型和豐富的應(yīng)用生態(tài)體系等突出優(yōu)勢,相關(guān)產(chǎn)品的歷史版本也在逐步進(jìn)行開源。目前來看,很長一段內(nèi)開源AI項(xiàng)目對Google和OpenAI不會(huì)構(gòu)成任何威脅,未來AI大模型市場的競爭將逐步從技術(shù)競爭轉(zhuǎn)向生態(tài)系統(tǒng)的競爭。
國內(nèi)虎視眈眈
即便Google和OpenAI不用過渡擔(dān)心開源AI 的影響,但不可否認(rèn)的是這場圍繞大型語言模型展開的“軍備”競賽正愈演愈烈。除了國外微軟、谷歌兩大豪門針鋒相對之外,國內(nèi)百度、阿里、京東等互聯(lián)網(wǎng)廠商火速跟進(jìn)。短短幾個(gè)月時(shí)間內(nèi),國內(nèi)有超過40家科技公司入局,徹底拉開了國內(nèi)人工智能戰(zhàn)場的序幕。
5月6日,科大訊飛發(fā)布了訊飛星火認(rèn)知大模型,現(xiàn)場實(shí)測大模型七大核心能力,并發(fā)布了汽車、教育、辦公、數(shù)字員工四大行業(yè)應(yīng)用成果。在現(xiàn)場,科大訊飛董事長劉慶峰表示,“當(dāng)前,在文本生成、知識(shí)問答、數(shù)學(xué)能力三大能力上,訊飛星火認(rèn)知大模型已超ChatGPT。”
與此同時(shí),劉慶峰還給出了訊飛星火的迭代時(shí)間表及每階段目標(biāo):第一階段,在6月9日,突破開放性問答,如實(shí)時(shí)問答;多輪對話能力再次升級(jí);數(shù)學(xué)能力再上臺(tái)階。第二階段,在8月15日,突破代碼能力;多模態(tài)交互能力正式開放給客戶。第三階段:10月24日,在通用大模型領(lǐng)域?qū)?biāo)ChatGPT,其中中文能力超越后者,英文能力與后者相當(dāng)。
不僅是劉慶峰,百度CEO李彥宏曾表示,百度文心一言與ChatGPT的差距大約是兩個(gè)月。隨后李彥宏表示,重點(diǎn)是這兩個(gè)月的差距我們要用多長時(shí)間才能趕上,也許很快,也許永遠(yuǎn)也趕不上。這也在業(yè)內(nèi)引起了爭議。
騰訊集團(tuán)顧問王小川認(rèn)為,ChatGPT比國內(nèi)領(lǐng)先三年時(shí)間,用一年時(shí)間追上GPT-3.5可能是有機(jī)會(huì)的,但目前ChatGPT已經(jīng)達(dá)到GPT-4的級(jí)別,GPT-5也在訓(xùn)練過程中了,因此要追上ChatGPT至少需要三年時(shí)間。
張孝榮也認(rèn)為,國產(chǎn)大模型與國外技術(shù)水平差距至少三年。GPT已經(jīng)實(shí)現(xiàn)4.0版本正在向5.0發(fā)展,而國內(nèi)大模型好比從GPT2.0起步訓(xùn)練,尚未達(dá)到3.0版本的水平,超越一說是不成立的。如果實(shí)現(xiàn)了超越,那么可以讓該公司需要進(jìn)一步披露自身擁有的算法、訓(xùn)練機(jī)制、數(shù)據(jù)規(guī)模和來源,以及解釋如何在短短幾個(gè)月內(nèi)取得了超越ChatGPT幾年的技術(shù)積累效果。
黃頌認(rèn)為,聲稱在部分能力或者某些方面上超越ChatGPT,這樣的說法沒有太大意義。可信的應(yīng)該是在更全面無偏的第三方數(shù)據(jù)基準(zhǔn)和評(píng)估標(biāo)準(zhǔn)上得到結(jié)論。但目前還沒有公認(rèn)的這樣基準(zhǔn),現(xiàn)在還是自說自話的局面。
而三六零創(chuàng)始人周鴻祎則更加直接地表示:“上來就說能超越,那才叫吹牛。”他認(rèn)為,針對ChatGPT的技術(shù)開始肯定是采取的是模仿與“抄襲”,但隨著市場化、場景化、以及用戶拓寬,在未來可能實(shí)現(xiàn)后來居上。
立足本土
“國內(nèi)互聯(lián)網(wǎng)公司都該去做大模型,這是因?yàn)闊o法篤定其中某一家就能做好。”周鴻祎認(rèn)為。而隨著眾多企業(yè)的紛紛涌入,大模型賽道迎來“百家爭鳴”時(shí)代,市場競爭將會(huì)空前加劇。然而,當(dāng)大模型不再稀缺,接下來就是質(zhì)的競爭。
對此,郭濤建議,對國產(chǎn)大模型企業(yè)來說,應(yīng)立足本土市場,發(fā)揮對中文的語言特點(diǎn)和文化背景的深入理解和適應(yīng)的優(yōu)勢,積極探索全新的商業(yè)模式和發(fā)展路徑,深耕垂直行業(yè)或細(xì)分場景,快速實(shí)現(xiàn)商業(yè)化落地應(yīng)用,持續(xù)提高企業(yè)競爭力。積極構(gòu)建跨行業(yè)、跨領(lǐng)域的商業(yè)生態(tài)系統(tǒng),政府有關(guān)部門也要應(yīng)積極引導(dǎo)企業(yè)共同打造大模型,構(gòu)建開源框架和通用大模型的應(yīng)用生態(tài)。
而在張孝榮看來,國產(chǎn)大模型項(xiàng)目數(shù)量雖多但體質(zhì)較差,除了少數(shù)幾個(gè)有底層算法設(shè)計(jì)之外,大部分跟風(fēng)而上的項(xiàng)目只是基于對國外開源項(xiàng)目的改造,甚至僅是簡單的接入國外項(xiàng)目API的套殼做應(yīng)用開發(fā),由于技術(shù)成熟度有限和自身實(shí)力差距,很多項(xiàng)目不會(huì)持續(xù)太久就會(huì)陷入困境,只會(huì)有少量幾個(gè)項(xiàng)目存留下來繼續(xù)探索。
部分學(xué)者認(rèn)為,各個(gè)企業(yè)也不要只關(guān)注把模型做大,還要思考怎么樣把大模型做小。
中國科學(xué)院自動(dòng)化研究所副所長曾大軍表示,大模型就像一個(gè)人類大腦的雛形,通過喂養(yǎng)各種數(shù)據(jù),實(shí)現(xiàn)各種智能能力,大模型正在重新定義人和計(jì)算機(jī)的互動(dòng)關(guān)系,有望成為計(jì)算機(jī)和人今后主要的接口。他著重強(qiáng)調(diào)了大模型小型化和領(lǐng)域化的發(fā)展。“現(xiàn)有大模型的算力和能耗挑戰(zhàn)會(huì)促使很多工作向領(lǐng)域?qū)S没⑤p量化的小模型或大小模型混搭的方向發(fā)展,特別是金融、教育、醫(yī)療、交通等領(lǐng)域,大量的工作在試圖降低大模型的成本。”
廈門大學(xué)南強(qiáng)特聘教授、人工智能研究院負(fù)責(zé)人紀(jì)榮嶸也認(rèn)為,大模型最終要用到車載、機(jī)載、電載等應(yīng)用上,在無人機(jī)等設(shè)備中,硬件大一些,成本就以倍數(shù)上漲,多一點(diǎn)計(jì)算空間就會(huì)增加巨額的硬件成本,所以“各個(gè)企業(yè)也不要只關(guān)注將模型做大,還要思考怎么樣把大模型做小”。
責(zé)任編輯:李桐
VIP課程推薦
APP專享直播
熱門推薦
收起24小時(shí)滾動(dòng)播報(bào)最新的財(cái)經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)