股市瞬息萬變,投資難以決策?來#A股參謀部#超話聊一聊,[點擊進(jìn)入超話]
作者: 李娜
[ 在盧言霞看來,將大模型部署到手機(jī)端進(jìn)行推理主要有兩種方式:一種是通過云端進(jìn)行推理,一種是在手機(jī)端直接進(jìn)行推理。如果選擇回傳云端推理,則對手機(jī)的通信能力要求較高;而如果選擇在手機(jī)端推理,則對算力有一定的要求。 ]
盡管大模型算力消耗驚人,但這并沒有阻止各大科技公司將AI應(yīng)用于其他設(shè)備,比如智能手機(jī)。
一個月內(nèi),已有多家科技廠商對AI大模型在手機(jī)上的應(yīng)用作出公開表態(tài),以自研或者合作的方式進(jìn)入這一狂熱的賽道。
“手機(jī)上的對話助手、智能相冊和地圖等都可以基于AI大模型升級。”IDC中國研究總監(jiān)盧言霞對第一財經(jīng)記者表示,生成式AI的應(yīng)用,例如語音修圖、智能對話、文生圖等也將逐步得到落地。
“但預(yù)訓(xùn)練大模型的進(jìn)展和手機(jī)端算力的不斷提升是實現(xiàn)這些應(yīng)用的關(guān)鍵因素。大模型的成敗高度依賴于算力的支持,而一個大型的人工智能大模型通常需要使用數(shù)萬億個單詞進(jìn)行訓(xùn)練,其參數(shù)量也達(dá)到了上萬億級別,這對于手機(jī)終端來說仍是一個巨大的挑戰(zhàn)。”盧言霞說。
“大模型手機(jī)”要來了?
ChatGPT引發(fā)的全球AI領(lǐng)域軍備賽,已經(jīng)從互聯(lián)網(wǎng)蔓延至手機(jī)端。
今年5月,OpenAI發(fā)布了ChatGPT應(yīng)用程序的iOS版本。不到三周,市場下載量便高達(dá)500萬次。在那前后,與AI大模型相關(guān)的APP已充斥在iOS與安卓應(yīng)用商店中。
在互聯(lián)網(wǎng)廠商還在討論“中國版ChatGPT”何時誕生的時候,手機(jī)廠商以及產(chǎn)業(yè)鏈玩家也在尋找大模型為手機(jī)產(chǎn)業(yè)帶來的新機(jī)會,試圖從中分得一杯羹。
“我們內(nèi)部正在就網(wǎng)絡(luò)大模型方面的需求跟互聯(lián)網(wǎng)公司進(jìn)行合作,目前已(和意向公司)有所接觸。”榮耀CEO趙明在此前舉行的上海世界移動通信大會上對記者表示,正在把AI大模型的能力引入終端。
在趙明看來,智能手機(jī)行業(yè)正處在一個AI、5G+開啟的新一輪創(chuàng)新周期中,而智能手機(jī)是計算平臺、通信平臺、顯示平臺、AI平臺的集合,智能手機(jī)的發(fā)展就是不斷打破邊界、集成新技術(shù)、融合新品類的過程。AI、通信技術(shù)的持續(xù)演進(jìn),以及新形態(tài)的發(fā)展為智能手機(jī)打開了機(jī)會大門,利于行業(yè)重回千帆競渡態(tài)勢,共同開啟下一個黃金周期。
除了榮耀外,國內(nèi)廠商方面,華為以及OPPO也在低調(diào)部署。
目前,華為則基于多模態(tài)大模型技術(shù),通過在手機(jī)端側(cè)對模型進(jìn)行小型化處理,完善了手機(jī)在海量圖片中的搜索能力。
OPPO研究院6月初則在一篇論文中介紹了一款專注圖片標(biāo)記的基礎(chǔ)模型“Recognize Anything Model”,而在此前更是與阿里大模型展開深度合作。中國區(qū)總裁劉波對記者表示,內(nèi)部也在思考大模型在手機(jī)端的應(yīng)用,未來AI或?qū)⒏淖冋麄€手機(jī)產(chǎn)業(yè)鏈。
以語音助手為例,該技術(shù)采用的也是深度學(xué)習(xí)模型,但語音大模型可以替代語音助手工作模塊中對語義理解的功能,修復(fù)此前因為喚醒和識別錯誤帶來的不便。
微軟CEO納德拉曾直言不諱地指出語音助手的“愚蠢”:“無論是Cortana、Alexa、Google Assistant還是Siri,這些語音助手笨得像塊石頭。”但在未來,語音助手或許可以真正像個人助理一樣,精準(zhǔn)地幫助用戶實現(xiàn)預(yù)訂機(jī)票、網(wǎng)上購物等功能。
趙明對記者表示,現(xiàn)階段榮耀以MagicOS中“YOYO建議”已經(jīng)可以提供基于地理圍欄、用戶習(xí)慣等數(shù)據(jù)的多場景個人化提醒。“Magic V2上將會部署AI功能,在未來可以通過在端側(cè)引入AI大模型賦能語音智慧助手,提供更自然的交互與更精準(zhǔn)的意圖識別服務(wù)。”
算力與成本下的挑戰(zhàn)
但和其他大模型公司所遇到的一樣,在手機(jī)端側(cè)上實現(xiàn)這一技術(shù)的最大挑戰(zhàn)來自兩方面:其一是算力,其二是成本。
在盧言霞看來,將大模型部署到手機(jī)端進(jìn)行推理主要有兩種方式:一種是通過云端進(jìn)行推理,一種是在手機(jī)端直接進(jìn)行推理。如果選擇回傳云端推理,則對手機(jī)的通信能力要求較高;而如果選擇在手機(jī)端推理,則對算力有一定的要求。盡管技術(shù)提供商會對模型進(jìn)行剪枝和壓縮等優(yōu)化,但仍然需要一定的算力。
例如,ChatGPT這樣的超大模型需要1000張主流卡容量的獨立計算集群,以及對應(yīng)的模型并行算法框架來支持訓(xùn)練。在成本方面,超大模型的訓(xùn)練需要大規(guī)模計算集群以及對應(yīng)的模型并行算法框架的支撐,因此訓(xùn)練成本通常很高。ChatGPT單次模型訓(xùn)練耗時1個月,訓(xùn)練成本達(dá)1200萬美元。
CounterpointResearch分析師FloraTang對第一財經(jīng)記者表示,手機(jī)公司的軟件工程團(tuán)隊相較于互聯(lián)網(wǎng)公司而言,人力較少,所以從大模型的自研角度是不現(xiàn)實的。但可以選擇一些已有的合作方進(jìn)行大模型領(lǐng)域的技術(shù)優(yōu)化。
但從手機(jī)產(chǎn)業(yè)鏈來看,上游芯片廠商正在做出努力,試圖在英偉達(dá)統(tǒng)治的算力江湖下找到縫隙,以減少成本并且實現(xiàn)對AI芯片的把控能力。
高通前不久提出了一個云邊一體“混合AI”的概念,并計劃在今年下半年對外展示在手機(jī)上運行100億個參數(shù)的大語言模型。從高通已有的模型落地案例來看,其邊緣大模型相當(dāng)于云端大模型的“感知器官”,從而實現(xiàn)AI功能在終端設(shè)備的實現(xiàn)。
同時,雖然蘋果并沒有直接表態(tài),但從其芯片布局來看,蘋果已經(jīng)公開進(jìn)入生成式AI訓(xùn)練硬件領(lǐng)域。“M2芯片家族的最新成員M2 Ultra是蘋果在AI領(lǐng)域一個值得關(guān)注的地方,這種能力可能會在訓(xùn)練大模型上派上用場。”FloraTang對記者說。
值得注意的是,今年6月,iOS 17發(fā)布的開發(fā)者版本中,其中一個改動是“Hey Siri”去掉了前綴,用戶僅需說“Siri”就能喚醒語音助手。這一變動背后也有來自語音大模型的支撐。
國內(nèi)廠商方面,榮耀在上海所布局的一家芯片公司也受到了行業(yè)內(nèi)的關(guān)注。在隨后的回應(yīng)中,榮耀表示,上海榮耀智慧科技開發(fā)有限公司主要進(jìn)行的是終端側(cè)核心軟件、圖形算法、通信、拍照等方面研究開發(fā)工作。
結(jié)合趙明此前在采訪中提及的“將在算力中心進(jìn)行端側(cè)大模型的前置算法訓(xùn)練”,上述芯片公司的定位或與榮耀端側(cè)AI大模型布局有關(guān)。
在業(yè)內(nèi)看來,不管是自身技術(shù)實力的積累還是與未來與蘋果在AI上的競爭,擁有處理AI數(shù)據(jù)的能力變得越來越重要。
“大型模型將在云中進(jìn)行訓(xùn)練,但真正的價值在于更小、更高效的模型,這些模型經(jīng)過調(diào)整,可以在手機(jī)終端設(shè)備上運行。”FloraTang說。
但對于何時能真正迎來手機(jī)端的“ChatGPT”時刻,盧言霞則對記者表示,這取決于大模型本身的進(jìn)展。一些小的應(yīng)用,例如對話式應(yīng)用,很快就可以落地。然而,對于一些具有挑戰(zhàn)性的應(yīng)用,例如文生圖或者在現(xiàn)有APP中嵌入這些應(yīng)用,可能還需要一定的時間。
責(zé)任編輯:周唯
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)