安裝新浪財經客戶端第一時間接收最全面的市場資訊→【下載地址】
撰文 | 趙晉杰
編輯 | 王靖
來源 | 盒飯財經(ID:daxiongfan)
“所有應用都值得用大模型重做一遍”的風刮了幾個月后,所有終端也想要借助大模型來重塑競爭力。
華為成為手機行業中首個給出大模型具體落地時間表的廠商。近期,隨著HarmonyOS 4.0接入盤古大模型能力,華為手機內置的語音助手小藝,成為首個具備AI大模型能力的智能助手,并將在8月下旬開放測試。
按照上述進度,即將在下半年發布的華為Mate 60系列,也將順利搭載大模型能力,并有望成為對抗蘋果iPhone 15系列的一大賣點。
大模型之前,5G芯片,一度被外界視為華為對抗iPhone 15新品的秘密武器。根據網絡爆料,華為5G手機有望在今年10月份回歸。但與預期中的大模型能力相比,華為5G手機的推出時間,仍面臨諸多不確定性。
目前,高通和聯發科已經相繼表態,稱尚未獲得美國政府批準向華為出售芯片組。即便華為5G手機回歸消息成真,其競爭力也不容樂觀,因為其更大概率將是聯手中芯實現徹底的國產化替代方案,其代價則是在芯片制程上最多只能做到7nm水平,相比iPhone 15搭載的3nm,在技術迭代上差了兩個時代。
與落后的5G芯片現狀相比,在大模型上,眼下的華為卻是實實在在領先了蘋果一籌。
盡管蘋果CEO庫克同樣將iPhone等硬件作為公司向外展示AI技術的載體,并認可人工智能掀起的巨大變革浪潮,但蘋果對大模型的開發卻顯得頗為謹慎,按照庫克的說法,“我們將繼續在非常深思熟慮的基礎上,在我們的產品中編織運用它。”
彭博科技記者馬克·古爾曼爆料,蘋果內部正在悄悄研發AI產品,并建立了自己的大模型框架“Ajax”,且已經嘗試將其應用在地圖、Siri等產品功能上,但蘋果暫時還沒有向消費者發布“蘋果GPT”的計劃。
過去近十年間,國產手機廠商領導了兩次大的產品變革:2016年開啟的全面屏浪潮,一度將iPhone擠出中國市場前五;2019年開啟的折疊屏浪潮,卻尚未能撼動iPhone基礎。
作為又一個新的產品變革機遇,大模型會是推動國產手機廠商走向大眾化的“全面屏時刻”,還是囿于小眾的“折疊屏困境”呢?
相比已經登錄手機的ChatGPT、文心一言等第三方APP,直接內置在手機系統中的大模型產品,最直接的優勢在于更強的隱私安全保障。
相比在云端處理數據的ChatGPT等APP,來自智能終端的本地化部署,可以最大程度消除用戶對隱私泄露的擔憂。
今年3月,ChatGPT就曾因為一個開源庫的bug漏洞,造成了一個緩存問題,最終導致上億ChatGPT付費版本——ChatGPT Plus用戶的支付信息被泄露,包括姓名、電子郵件地址、信用卡號碼的后四位數字和信用卡過期日期等。
受此影響,美國聯邦貿易委員會還在7月份開始追查OpenAI是否違反消費者保護法,并要求OpenAI提供有關其處理個人數據、向用戶提供不準確信息的可能性以及“對消費者造成損害(包括聲譽損害)的風險”的大量記錄。
借助手機端的本地化部署打消信息泄露擔憂后,用戶才能更放心大膽地將更多個人數據喂給大模型。這也就有了手機自帶大模型產品的第二重優勢,即打造真正的個性化私人助理。
除此之外,手機自帶的大模型產品,還有著比ChatGPT們更加穩定的運行環境。
今年4月份,ChatGPT Plus被爆暫停付費,OpenAI給出的理由便是“需求量過大”,導致算力資源出現缺口。借助本地化部署,手機自帶的大模型將大大削弱對云端算力資源的依賴程度,從而避免“宕機”事件的發生,甚至還可以做到在斷網情況下,離線運行。
語音助手,成為一眾手機廠商落地大模型能力的優先級入口。在大模型能力加持下,語音助手可以幫助用戶自動生成文案、自動編寫回復郵件、自動生成文章摘要、自動翻譯……
甚至借助插件功能,大模型加持下的語音助手,還能完成跨APP的功能調用,如調動地圖類應用、旅游類應用和天氣類應用等,幫助用戶制定一個出行計劃或者預定餐廳等。
相比十多年前誕生的一批語音助手,大模型仿佛一針催化劑,直接帶領Siri們進化到了2.0版本,并有望解決人語音助手屢屢被詬病為“人工智障”的難題。
ChatGPT問世后,微軟CEO薩蒂亞·納德拉曾吐槽道:“無論是Cortana、Alexa、Google Assistant還是Siri,這些語音助手笨得像塊石頭。”
據媒體爆料,蘋果工程師希望將大模型與Siri結合,也是寄希望于推出更聰明的Siri。
在人工智能專家丁磊博士看來,造成上一代語音助手不智能的一大原因,在于其背后的技術體系不同。
Siri 1.0版本可以視為是決策式AI,主要工作是對已有數據“打標簽”,對不同類別的數據做區別,干的主要是“判斷是不是”和“區分是這個還是那個”的活兒。一旦外部請求超出既有標簽庫,語音助手就會回復“我回答不了”“我還在學習”等托底式回答,以延續對話。
Siri 2.0版本則是生成式AI,會在歸納分析已有的數據后,再“創作”出新的內容,實現“舉一反三”的效果,在延續對話的同時,還能兼顧用戶的使用體驗。
對大模型登錄手機上心的廠商,不只有華為和蘋果。
國產手機廠商方面,小米是除華為之外對大模型最為重視的一家。今年4月份,小米正式組建大模型團隊,規模達30余人,并表示有望在今年三季度將產品落地。
OPPO被爆出正在基于阿里大模型,打造手機端大模型產品。榮耀CEO趙明也頻頻對外表示,“未來將率先將大模型引入手機端。”
三星更是為了搶先在手機上搭載大模型產品,被爆出有考慮將其手機默認搜索引擎從谷歌更改為微軟必應的計劃。
為了盡可能挽回三星的出逃之心,谷歌一方面嘗試對現有搜索引擎升級,加入大模型能力,另一方面,開始從系統底層融入大模型產品。
今年5月份,谷歌對外發布的新一代大模型PaLM 2中,就包括了一個最小參數級的壁虎(Gecko)方案。按照谷歌CEO皮查伊說法,“壁虎”將能夠在手機上運行,且速度足夠快。
今年下半年,谷歌旗下新款Pixel機型中,就將融入最新的PaLM2大模型壁虎版。Pixel一向是谷歌試驗新安卓功能的前沿陣地。屆時,無論國產手機廠商是否具備自研大模型的能力,將都可以直接從谷歌安卓系統中獲取大模型加持的魔力。
除了來自系統開發商的努力外,芯片廠商也在為手機用上大模型操心。
聯發科預計,今年10月發布的天璣9300,將支持大模型運行;高通則稱,年內將能夠支持參數達100億的生成式AI模型在手機上運行。
據高通高管介紹,“100億-150億參數級別的模型可以覆蓋絕大多數生成式AI的用例。如果終端已經可以支持這一參數級別,那么運算可全部在終端上進行,無需云端處理運算。屆時手機會成為真正的個人助理。”
除此之外,在Meta推出開源大模型Llama 2之后,高通還進一步表示,將和Meta合作,在2024年推出 “手機版Llama 2”,幫助客戶構建智能虛擬助手、生產力應用、內容創作工具和娛樂等用例。
相比云端千卡、萬卡并行的集群服務器算力,智能手機本地化部署的優勢反過來卻成了束縛算力擴張的劣勢。
Meta開源的Llama大模型最小版本也有70億參數,以目前智能手機的配置,完全無法在現有內存中順暢運行,只能部分放在手機閃存中運行,但這也導致了大模型反應速度緩慢。
此前在開源社區上,有開發者將Llama大模型移植到了手機上,但等待一次反饋的過程,最長要等上十分鐘以上。
為了提升反饋效率,在補強芯片、內存等硬件配置之余,開發商開始給手機端大模型進行瘦身計劃,包括但不限于剪枝、量化、蒸餾等手段,目的是在盡可能少地減損精度的前提下,降低手機端大模型所需的資源和能耗:剪枝,即將模型中對精度影響非常小的參數裁剪掉;量化,是使用更低精度的數據類型進行推理;蒸餾,則是從復雜的模型中,提取出效果相近但更加簡單的模型。
但在高達萬億參數的GPT-4仍然無法解決大模型胡說八道情況下,瘦身后主動降低精度、參數量只有GPT-4百分之一的手機端大模型,如何減少虛假內容的生成,則要打上一個問號。
丁磊博士表示,ChatGPT等大模型產品,生成的內容仍存在很多的錯誤和邏輯不清的情況,部分場景下無法精確到執行層面被直接應用。
如果手機端大模型幫助用戶制定的出行計劃或者預定餐廳信息,頻頻出錯,勢必直接影響到用戶的使用頻率。這方面,ChatGPT已經是前車之鑒。
在連續增長半年后,第三方網站SimilarWeb監測數據顯示,今年6月份,ChatGPT的網站與移動客戶端的全球流量環比下降9.7%,這是自2022年11月30日發布以來,ChatGPT首次出現流量負增長。
在前OpenAI科學家肯尼斯·斯坦利看來,當下的大模型產品還沒有進化到iPhone時刻。“生成式人工智能無疑已經席卷了世界,的確一些人每天都在使用它,但我認為我們仍然處于探索階段,正在弄清楚我們如何個體地使用它。如果我們都找到了一個非常強烈的理由去隨時使用它,那應該將會是iPhone時刻。”
參考資料:
《大模型走向終端,芯片怎么辦?》半導體行業觀察
《Google 的 AI 大計劃:讓大模型變小、嵌入每一個產品》
《專訪高通AI負責人:年內有望支持百億參數規模大模型在手機上運行》澎湃新聞
《大模型“瘦身”進手機,下一個iPhone時刻將至?》元宇宙日爆
《對話OpenAI科學家:iPhone時刻還沒有到來》經濟觀察報
責任編輯:郭明煜
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)