(報(bào)告出品方/作者:國泰君安證券,李博倫、伍?。?/p>
1. 投資分析
隨著 AI 應(yīng)用進(jìn)程提速以及場景落地案例持續(xù)涌現(xiàn),疊加云端應(yīng)用與終端智 能雙輪驅(qū)動產(chǎn)業(yè)升級,AI 賽道公司迎來重要發(fā)展機(jī)遇。建議重點(diǎn)關(guān)注以下 方向:具備產(chǎn)品力驅(qū)動的頭部應(yīng)用企業(yè),尤其是在既有領(lǐng)域已形成技術(shù)壁 壘和用戶粘性的公司;在云端應(yīng)用創(chuàng)新和終端智能升級方面具備先發(fā)優(yōu)勢 的企業(yè),以及在醫(yī)療、金融、教育等高壁壘場景已實(shí)現(xiàn)商業(yè)化落地的公司; 在中文語料建設(shè)領(lǐng)域具備核心技術(shù)和資源積累的企業(yè)。這些公司將在 AI 應(yīng) 用生態(tài)完善過程中獲得持續(xù)性競爭優(yōu)勢。
2. 國內(nèi) AI 應(yīng)用加速崛起,AI 出海勢頭強(qiáng)勁
2.1. 創(chuàng)新賽道蓄勢待發(fā),垂類 AI 應(yīng)用仍處于快速擴(kuò)張期
中國 AI 軟件在全球前十榜單占據(jù)二席。以豆包為代表的頭部應(yīng)用月活超 5000 萬,顯示出較強(qiáng)的用戶規(guī)模優(yōu)勢。從 AI 產(chǎn)品榜發(fā)布的 10 月 AI 應(yīng)用 MAU 數(shù)據(jù)看,ChatGPT 以 2.58 億月活穩(wěn)居全球榜首,但中國 AI 企業(yè)產(chǎn)品 同樣表現(xiàn)突出。具體來看:字節(jié)跳動旗下豆包以 5130 萬月活位居全球第二, 月環(huán)比增長 9.10%,領(lǐng)先 Nova 等其他國際競品;在全球前十榜單中,除豆 包外,Talkie AI(2062 萬月活)也成功入榜。在出海賽道,字節(jié)跳動布局的 Gauth 表現(xiàn)最為亮眼,月活 1626 萬、環(huán)比增長 69.22%,體現(xiàn)出中國 AI 企 業(yè)在海外市場的強(qiáng)勁拓展勢頭。
海外 AI 市場創(chuàng)意工具高速增長,頭部產(chǎn)品月環(huán)比增速超 400%。根據(jù) AI 產(chǎn) 品榜 10 月數(shù)據(jù),海外 AI 創(chuàng)意工具賽道呈現(xiàn)爆發(fā)式增長:Artrix(AI 藝術(shù)生成) 環(huán)比增長 401.82%,下載量突破 300 萬;SelfyzAI(AI 照片舞蹈)環(huán)比增長 183.18%,全球活躍用戶達(dá) 150 萬;Donna(AI 音樂制作)環(huán)比增長 136.29%, 月活躍度超 80 萬。這一增長態(tài)勢表明,海外 AI 市場在經(jīng)過 ChatGPT 等產(chǎn) 品培育后已趨于穩(wěn)定,用戶需求正加速向垂直細(xì)分領(lǐng)域延伸。
中國 AI 市場仍處通用平臺競爭階段,頭部企業(yè)優(yōu)勢明顯。AI 產(chǎn)品榜國內(nèi) 10 月增速數(shù)據(jù)中,通用 AI 平臺主導(dǎo)著國內(nèi)市場增長,月之暗面的 Kimi 智 能助手以 36.45%的月環(huán)比增速位居增長榜首,日活躍用戶突破 500 萬;緊 隨其后的是騰訊元寶(增速 34.39%)和智譜清言(增速 20.59%)。值得注意的 是,抖音系 AI 產(chǎn)品矩陣有星繪、貓箱、豆包三個產(chǎn)品全部進(jìn)入增速前十, 體現(xiàn)出在國內(nèi) AI 市場快速普及階段,大型科技公司正通過產(chǎn)品創(chuàng)新和規(guī)模優(yōu)勢持續(xù)擴(kuò)大市場份額。
AI 應(yīng)用獲客效率呈現(xiàn)明顯分化,垂直賽道轉(zhuǎn)化率顯著領(lǐng)先。根據(jù) AI 產(chǎn)品 榜最新數(shù)據(jù),盡管 ChatGPT 以 4685 萬的月新增下載量位居全球榜首,但其 下載量/MAU 比值僅為 18.15%。相比之下,字節(jié)跳動旗下 AI 教育產(chǎn)品 Gauth 表現(xiàn)突出,新增下載量/MAU 比值高達(dá) 82.29%,充分展現(xiàn)了垂直賽道的高 效獲客能力。此外,Remini(41.72%)、Genius(43.55%)等創(chuàng)意工具產(chǎn)品也都 實(shí)現(xiàn)了較高的轉(zhuǎn)化效率。
國內(nèi) AI 市場呈現(xiàn)雙軌發(fā)展態(tài)勢,垂類應(yīng)用顯示出更強(qiáng)勁的增長潛力。 AI 產(chǎn)品榜數(shù)據(jù)顯示,豆包憑借 1611 萬新增下載量領(lǐng)跑國內(nèi)市場,但在轉(zhuǎn)化效 率方面,騰訊元寶(55.43%)、星繪(55.22%)等垂類應(yīng)用表現(xiàn)更為出色。值得 注意的是,國內(nèi)前十產(chǎn)品中有半數(shù)下載量/MAU 比值高于 30%,其中 Kimi 智能助手達(dá)到 45.91%,智譜清言達(dá)到 36.62%,表明國內(nèi)垂類 AI 應(yīng)用市場 正處于快速擴(kuò)張期。
2.2. AI 網(wǎng)站出海呈差異化布局,爆款頻出
在以 AI 為核心驅(qū)動的網(wǎng)站中,ChatGPT 以 37.8 億月訪問量獨(dú)占鰲頭。從 AI 產(chǎn)品榜 10 月數(shù)據(jù)看,市場呈現(xiàn)明顯的分層特征:第一梯隊(duì)是以 ChatGPT 為代表的純 AI 對話產(chǎn)品,ChatGPT 月訪問量達(dá) 37.8 億,環(huán)比增長 17.16%; 第二梯隊(duì)是搜索引擎的 AI 升級版本,New Bing 以 18.6 億訪問量位居次席, 但需要注意其流量可能包含傳統(tǒng)搜索請求;第三梯隊(duì)包括 Canva(8.17 億)、 Salesforce(1.14 億)等傳統(tǒng) SaaS 服務(wù)商,但其 AI 功能僅作為附加特性,實(shí)際 AI 業(yè)務(wù)規(guī)模需要謹(jǐn)慎評估,榜單中的純 AI 產(chǎn)品數(shù)據(jù)更能反映實(shí)際的服務(wù) 滲透水平。
ChatGPT 憑借產(chǎn)品創(chuàng)新實(shí)現(xiàn)了純 AI 應(yīng)用領(lǐng)域的重要突破。2024 年 5 月, OpenAI 重磅發(fā)布了具備音頻和視覺理解能力的 AI 語音助手,同時推出了 最新的旗艦 AI 模型 ChatGPT 4o。在當(dāng)月,ChatGPT 的訪問量出現(xiàn)了顯著提 升,一舉超越 Bing 成為訪問量第一的 AI 相關(guān)網(wǎng)站。考慮到 Bing 的訪問量 中包含大量傳統(tǒng)搜索引擎的流量貢獻(xiàn),ChatGPT 作為純 AI 原生應(yīng)用卻能實(shí) 現(xiàn)對 Bing 的超越,并在此后繼續(xù)持續(xù)增長,快速拉開了與其他產(chǎn)品間的差 距,充分證明了其產(chǎn)品實(shí)力和當(dāng)下無可撼動的市場競爭力。
豆包 AI 憑借強(qiáng)勁增長勢頭步入國內(nèi) ChatBots 第一梯隊(duì)。根據(jù) AI 產(chǎn)品榜的10 月數(shù)據(jù),作為字節(jié)跳動旗下的 AI 對話產(chǎn)品,豆包實(shí)現(xiàn)了 25.01%的環(huán)比 增長,訪問量達(dá)到 17.13M,增速在頭部 AI 產(chǎn)品中位居前列。此前以 Kimi 和文心一言為代表的頭部產(chǎn)品分別以 29.28M 和 21.25M 的月訪問量占據(jù)領(lǐng) 先地位,但其增速分別為 16.63%和 2.86%,相比之下,豆包憑借更快的增 長速度正在快速縮小與頭部產(chǎn)品的差距已經(jīng)成為國內(nèi)AI對話市場新的重要 競爭者。
中國 AI 企業(yè)在出海賽道呈現(xiàn)差異化布局,其中視頻生成領(lǐng)域出現(xiàn)突破性增 長。從 AI 產(chǎn)品榜 10 月的 AI 網(wǎng)站出海數(shù)據(jù)來看,教育和創(chuàng)意工具是中國企 業(yè)主攻的兩大方向,其中字節(jié)跳動旗下 Gauthmath 以 1938 萬月訪問量位居 榜首。特別值得關(guān)注的是視頻生成賽道的快速崛起:MiniMax 旗下海螺 AI 憑借生成式視頻技術(shù)實(shí)現(xiàn)環(huán)比增長 2772.92%,遠(yuǎn)超其他出海產(chǎn)品,與同賽 道的 Pika Art(增長 787.65%)一起,顯示出 AI 視頻生成工具正迎來爆發(fā) 期。這一增長態(tài)勢也反映出海外市場對高質(zhì)量 AI 視頻內(nèi)容的強(qiáng)勁需求,以 及中國企業(yè)在視頻生成技術(shù)上的競爭優(yōu)勢。不過從整體訪問量看,出海產(chǎn)品 的規(guī)模仍相對有限,單個產(chǎn)品月訪問量均未突破 2000 萬,表明市場仍處于 培育期。
MiniMax 通過海螺 AI 在文生視頻領(lǐng)域?qū)崿F(xiàn)技術(shù)突破,進(jìn)軍國際第一梯隊(duì)。 MiniMax 由前字節(jié)跳動 AI 實(shí)驗(yàn)室負(fù)責(zé)人創(chuàng)立,核心團(tuán)隊(duì)來自 Google、微 軟、字節(jié)跳動等科技巨頭。截至目前已完成多輪融資,投資方包括高瓴創(chuàng)投、 五源資本等知名機(jī)構(gòu)。海螺 AI 依托自研的萬億參數(shù) MoE(混合專家)架構(gòu) 模型 abab 6.5,實(shí)現(xiàn)了 200k tokens 的超長文本處理能力。其視頻生成模型 abab-video-1 能夠生成 1280×720 分辨率、25 幀每秒、時長 6 秒的高質(zhì)量視 頻,尤其在復(fù)雜動態(tài)場景渲染和人物動作細(xì)節(jié)方面表現(xiàn)卓越。在第三方機(jī)構(gòu) 進(jìn)行的全球獨(dú)立測試中,海螺AI的畫質(zhì)、流暢性和連貫性評分均位居前列, 標(biāo)志著中國企業(yè)在高端 AI 視頻生成領(lǐng)域?qū)崿F(xiàn)重要突破。公司已開放海螺 AI 的 API 接口,支持開發(fā)者將其視頻生成和多模態(tài)處理能力集成到應(yīng)用中。
全球市場正經(jīng)歷多個細(xì)分賽道的突破性增長。除視頻生成工具外,客服機(jī) 器人(Chaport,290.76%)、SEO 工具(AISEO,212.29%)等垂直應(yīng)用也 實(shí)現(xiàn)了超 200%的環(huán)比增速。相比之下,國內(nèi)市場呈現(xiàn)出不同的增長特征: 一是增速普遍較低,排名第一的百度搜索 AI 助手增速為 49.94%;二是細(xì)分 賽道更加多元,從代碼輔助(Marscode,47.13%)到金融服務(wù)(同花順問財(cái), 16.65%)再到設(shè)計(jì)工具(Pixso AI,12.98%),呈現(xiàn)出場景深耕的發(fā)展趨勢; 三是頭部產(chǎn)品體量普遍較大,如 360AI 搜索(2.88 億)、Kimi(2928 萬) 等,表明國內(nèi)市場已形成相對穩(wěn)定的用戶規(guī)模。
AI 應(yīng)用的用戶粘性與市場規(guī)模呈現(xiàn)顯著解耦,表明產(chǎn)品力而非用戶規(guī)模是 決定用戶深度參與的關(guān)鍵。從 AI 產(chǎn)品榜發(fā)布的 10 月人均時長數(shù)據(jù)可見, 訪問量與用戶粘性之間并不存在明顯的正相關(guān)關(guān)系。以 Character AI 為例, 其 2.15 億月訪問量配合 14 分 25 秒的人均使用時長,顯示出規(guī)模與粘性的 良好平衡;而 Superhuman 雖然月訪問量僅為 225 萬,卻實(shí)現(xiàn)了 20 分 53 秒 的高使用時長,位居榜單第二。這種"小而美"與"大而強(qiáng)"并存的現(xiàn)象說明: 第一,AI 應(yīng)用市場已進(jìn)入差異化競爭階段,單一賽道內(nèi)可以同時存在規(guī)模 導(dǎo)向與精品路線;第二,用戶規(guī)模增長不會自然帶來使用時長的提升,產(chǎn)品 是否能提供差異化價值才是核心;第三,某些細(xì)分場景(如郵件助手 Superhuman)雖然總盤子較小,但用戶需求強(qiáng)度高,更容易培養(yǎng)出高粘性的 核心用戶群。
2.3. AI 應(yīng)用場景各具特色,市場表現(xiàn)懸殊
AI 應(yīng)用的使用場景決定了其設(shè)備端口的流量分布特征。根據(jù) SimilarWeb 數(shù) 據(jù),以文檔協(xié)作和設(shè)計(jì)為主的 AI 工具如 Notion 和 Canva 呈現(xiàn)出顯著的桌 面端偏好,其桌面端占比分別高達(dá) 93.5%和 87.3%,這反映了專業(yè)生產(chǎn)力工 具對大屏操作和精確控制的剛性需求。相比之下,以社交陪伴為主的 Character AI 則呈現(xiàn)出截然相反的分布特征,其移動端占比達(dá)到 80%,說明 休閑娛樂場景更依賴移動設(shè)備的便攜性和即時性。而 ChatGPT 和 Bing 作為綜合性 AI 搜索工具,則在桌面端和移動端之間保持相對均衡的分布,這體 現(xiàn)了通用型 AI 工具需要同時滿足用戶在不同場景下的使用需求。
AI 搜索引擎中,360AI 搜索依靠持續(xù)的技術(shù)創(chuàng)新和產(chǎn)品優(yōu)化確立了行業(yè)領(lǐng) 先地位。從 2024 年 1 月公測開始,該產(chǎn)品經(jīng)歷了快速發(fā)展,通過不斷完善 搜索功能和用戶體驗(yàn),在 7 月份首次超越 Perplexity AI 成為全球 AI 原生搜 索引擎流量第一。產(chǎn)品采用"AI+搜索引擎"而非傳統(tǒng)的"搜索引擎+AI"模式, 在專業(yè)搜索能力方面建立了明顯優(yōu)勢。到 2024 年 8 月,其搜索服務(wù)已支持 識別超過 1 億種意圖分類,涵蓋 4000 種基礎(chǔ)分類和 1000 多種專業(yè)領(lǐng)域, 為其保持行業(yè)領(lǐng)先地位奠定了堅(jiān)實(shí)基礎(chǔ)。
360AI 搜索全新的 CoE 架構(gòu)部署和多項(xiàng)重要功能升級助力其在 8 月份實(shí)現(xiàn) 超 120%的訪問量提升。AI 產(chǎn)品榜顯示,8 月訪問量達(dá)到 208.1M,環(huán)比增 長 122.26%,月獨(dú)立訪客量(MAU)突破 8000 萬。這一增長可能源于兩個 關(guān)鍵變化:第一,360AI 搜索于 8 月 1 日宣布與包括智譜 AI、商湯科技等 15 家主流大模型廠商建立合作,構(gòu)建 CoE 專家網(wǎng)絡(luò)架構(gòu),實(shí)現(xiàn)了精準(zhǔn)的模 型調(diào)度機(jī)制;第二,8 月 20 日推出了"簡潔回答"、"標(biāo)準(zhǔn)回答"、"深入回答 "三種搜索模式,并支持用戶自主選擇不同大模型重新生成答案;這些舉措 使其進(jìn)一步拉大與競品的差距,比如同期秘塔 AI 搜索的 MAU 僅為 2000 萬。
虛擬角色類AI產(chǎn)品展現(xiàn)出顯著的贏家通吃效應(yīng)。AI產(chǎn)品榜10月數(shù)據(jù)顯示, 行業(yè)龍頭 Character AI 以 214.67M 的月訪問量遙遙領(lǐng)先于第二名 JanitorAI 的 63.89M,領(lǐng)先優(yōu)勢超過 3 倍。訪問量前三名產(chǎn)品(Character AI、JanitorAI 和 SpicyChat AI)的訪問量合計(jì)占據(jù)了該品類前十總流量的 88%,而排名第 6 到第 10 位的產(chǎn)品月訪問量均不足 5M,且多數(shù)呈現(xiàn)負(fù)增長態(tài)勢。這種極度 集中的流量分布特征表明,AI 角色扮演賽道已經(jīng)進(jìn)入存量競爭階段,頭部 效應(yīng)日益凸顯。用戶在選擇時表現(xiàn)出明顯的羊群效應(yīng),更傾向于選擇用戶基 數(shù)大、互動體驗(yàn)更豐富的平臺,這使得頭部產(chǎn)品能夠通過規(guī)模效應(yīng)持續(xù)擴(kuò)大 其競爭優(yōu)勢。
AI PPT賽道呈現(xiàn)出獨(dú)特的地域多元化競爭格局。AI產(chǎn)品榜10月數(shù)據(jù)顯示, 該賽道前五名產(chǎn)品的公司分別來自美國(Gamma)、匈牙利(Prezi)、西班牙 (Slidesgo)、中國(AiPPT)和德國(Pitch)。這種分散的市場格局很可能源于辦 公軟件的深度本地化需求——不同地域的用戶在演示文稿的風(fēng)格偏好、內(nèi) 容結(jié)構(gòu)和表達(dá)方式上存在顯著差異。這一特征使得本地化公司能夠依托對 本土文化的深度理解建立差異化優(yōu)勢,從而在全球市場中占據(jù)重要位置。這 種多元化的競爭格局表明,AI 辦公賽道的成功不僅取決于技術(shù)實(shí)力,更需 要對用戶文化習(xí)慣的深度理解。
AI 圖片生成市場正上演反直覺的藍(lán)海困局,功能趨同將市場推向紅海化。 根據(jù) SimilarWeb 提供的過去半年來的數(shù)據(jù),AI 圖片生成作為新興技術(shù)市場, 頭部平臺的競爭卻日趨白熱化。從頭部網(wǎng)站的流量總量看,在過去 6 個月 時間里,AI 圖片生成的總量幾乎沒有增長。產(chǎn)品層面,各平臺的功能和應(yīng) 用場景卻在不斷趨同,將一個本應(yīng)充滿創(chuàng)新的市場推向紅海化。Yodayo 在 5 月初周度 310 萬的流量如今只剩 50 萬左右,恰恰印證了在缺乏差異化創(chuàng) 新的情況下,即便是處于爆發(fā)期的市場,也會對同質(zhì)化競爭者進(jìn)行殘酷的淘 汰,而過度聚焦用戶爭奪也可能抑制了根本性創(chuàng)新的動力。
AI 文生視頻領(lǐng)域新興平臺異軍突起,但產(chǎn)品生命周期短暫、后勁不足的特 征也日益凸顯。根據(jù) SimilarWeb 的數(shù)據(jù),進(jìn)入者如 KlingAI 和 HailuoAI 展 現(xiàn)出驚人的增長速度,尤其是 HailuoAI,從 9 月中旬開始迅速崛起,到 11 月初已超越 Loom 成為行業(yè)流量冠軍,周流量突破 370 萬。與此同時,從數(shù) 據(jù)中可以觀察到AI文生視頻產(chǎn)品往往在一個大幅提升后容易陷入頹勢的特 點(diǎn),這種現(xiàn)象可能源于 AI 文生視頻的商業(yè)化價值尚未被充分挖掘,目前用 戶多出于追求新鮮感而使用,缺乏持續(xù)的使用動力,AI 文生視頻在用戶留 存和商業(yè)化方面仍需進(jìn)行更深入的探索。
3. AI 場景落地百花齊放,爆款應(yīng)用異軍突起
3.1. 頭部玩家齊發(fā)力 AI 軟件應(yīng)用,云端應(yīng)用創(chuàng)新步入快車道
云端 AI 應(yīng)用在 2024 年迎來重要突破,全球科技巨頭紛紛推出創(chuàng)新產(chǎn)品與 解決方案。從產(chǎn)品形態(tài)來看,呈現(xiàn)出明顯的區(qū)域化特征:北美企業(yè)專注通用 性能力的突破,如 Microsoft、Anthropic 等推出的新一代企業(yè) AI 工具;歐 洲企業(yè)強(qiáng)調(diào)合規(guī)與安全,以 SAP 為代表的解決方案深度整合行業(yè)需求;而 亞太企業(yè)則在場景適配方面展現(xiàn)優(yōu)勢,阿里云、字節(jié)跳動等在本土化應(yīng)用層 面取得突破。這種差異化發(fā)展趨勢,不僅體現(xiàn)在技術(shù)路線的選擇上,更反映 在商業(yè)模式和市場策略的制定中,推動全球云端 AI 應(yīng)用形成獨(dú)特的區(qū)域競 爭格局。 歐美與中國企業(yè)在 AI 辦公工具上呈現(xiàn)差異化創(chuàng)新路徑,全面重塑企業(yè)生產(chǎn) 效率。微軟 2024 年 2 月推出的 Microsoft 365 Copilot for Sales 實(shí)現(xiàn)了全流程 銷售智能化,包括客戶意向分析、銷售文檔生成、商機(jī)預(yù)測等功能,并通過 與 Dynamics 365 深度整合,打通了銷售全鏈路數(shù)據(jù),每用戶 50 美元/月的 年費(fèi)定價反映了其在提升銷售效率方面的實(shí)際價值。2024 年 10 月 Anthropic 發(fā)布的 Claude 3.5 Sonnet 引入了新的計(jì)算機(jī)使用功能,使得用戶能夠通過 API 指導(dǎo) Claude 像人類一樣操作計(jì)算機(jī),包括查看屏幕、移動光標(biāo)和輸入 文本。
頭部玩家紛紛在自身優(yōu)勢領(lǐng)域發(fā)力 AI 革新應(yīng)用。在中國市場,2024 年 5 月發(fā)布的阿里云通義千問 2.5 重點(diǎn)解決了中文語境下的商務(wù)寫作和數(shù)據(jù)分析 問題,特別是在財(cái)務(wù)報(bào)表解讀、商業(yè)計(jì)劃書撰寫等場景中展現(xiàn)出獨(dú)特優(yōu)勢。 字節(jié)跳動火山引擎·云雀則創(chuàng)新性地將 AI 融入?yún)f(xié)同辦公流程,實(shí)現(xiàn)了跨部 門文檔智能流轉(zhuǎn)、多語言實(shí)時協(xié)作等功能。歐洲市場的 SAP AI Core 著重于 解決企業(yè)數(shù)據(jù)安全問題,在保護(hù)企業(yè)數(shù)據(jù)隱私的同時,實(shí)現(xiàn)了 ERP 系統(tǒng)的 智能化升級,包括采購預(yù)測、庫存優(yōu)化等具體應(yīng)用場景。
騰訊 ima 將 RAG 技術(shù)與個性化知識管理相結(jié)合,開創(chuàng)了 AI 助手從通用工 具向個人專屬智能助理演進(jìn)的新范式。2024年10月發(fā)布的騰訊ima Copilot, 通過"全網(wǎng)信源+個人知識庫"的雙層數(shù)據(jù)架構(gòu),實(shí)現(xiàn)了個性化的知識獲取與 應(yīng)用。特別是在知識庫層面,其采用 RAG 技術(shù)將用戶個人知識進(jìn)行向量化 存儲并掛載到大模型上,這種設(shè)計(jì)實(shí)現(xiàn)了 AI 助手的記憶功能,使其能夠隨 著用戶使用逐步形成個性化的知識體系和表達(dá)風(fēng)格。這種進(jìn)化式的學(xué)習(xí)模 式,使 AI 助手從通用型工具轉(zhuǎn)變?yōu)檎嬲斫庥脩魧I(yè)背景和思維方式的智 能伙伴,為 AI 助手的發(fā)展開創(chuàng)了新方向。AI 助手的競爭正從單純的模型能 力比拼,轉(zhuǎn)向更注重用戶個性化體驗(yàn)和長期價值積累的方向發(fā)展。
3.2. 體驗(yàn)全模態(tài)輸入自由,生態(tài)融合是 AI 應(yīng)用的重要方向
多模態(tài) AI 創(chuàng)作工具進(jìn)入革新階段,百度自由畫布打通公私域數(shù)據(jù),預(yù)計(jì)帶 動行業(yè)進(jìn)入生態(tài)融合新賽道。2024 年 11 月,百度在世界大會上發(fā)布的"自 由畫布"標(biāo)志著 AI 創(chuàng)作工具進(jìn)入新階段。該產(chǎn)品通過打通百度文庫和網(wǎng)盤(用戶超 10 億)兩大應(yīng)用,首次實(shí)現(xiàn)了公域知識與私域數(shù)據(jù)的融合創(chuàng)作。 目前產(chǎn)品已進(jìn)入邀測階段,根據(jù)百度官方數(shù)據(jù),該產(chǎn)品首日獲得 20 萬用戶 預(yù)約。從商業(yè)模式看,自由畫布的推出將帶動整個 AI 生產(chǎn)力工具賽道向生 態(tài)融合方向發(fā)展。
自由畫布的一站式全模態(tài)創(chuàng)作能力顯著降低了用戶使用門檻。該產(chǎn)品支持 100 多種格式的文件輸入,包括文本類(doc、pdf、excel)和多模態(tài)類(jpg、 mp3/mp4 等)素材,用戶只需通過拖拽或圈選即可完成素材導(dǎo)入。在內(nèi)容創(chuàng) 作環(huán)節(jié),平臺采用直觀的可視化操作方式,用戶通過簡單的鼠標(biāo)圈選和提示 詞輸入即可完成復(fù)雜的創(chuàng)作任務(wù)。這種簡化的操作流程顯著降低了 AI 創(chuàng)作 工具的使用門檻,讓普通用戶也能輕松駕馭 AI 創(chuàng)作。 自由畫布的多層次調(diào)用機(jī)制體現(xiàn)了深度的 AI 理解能力。產(chǎn)品支持對素材進(jìn) 行預(yù)處理標(biāo)記和分層利用,AI 系統(tǒng)能夠理解并記住用戶的標(biāo)記偏好,在后 續(xù)創(chuàng)作中精準(zhǔn)調(diào)用相關(guān)內(nèi)容。這種基于深度理解的智能調(diào)用機(jī)制,讓 AI 創(chuàng) 作突破了簡單的內(nèi)容拼接和生成,實(shí)現(xiàn)了更符合用戶意圖的精準(zhǔn)創(chuàng)作,推動 了 AI 創(chuàng)作工具向更智能化的方向發(fā)展。
產(chǎn)品的閉環(huán)設(shè)計(jì)彰顯了面向未來的產(chǎn)品思維。自由畫布不僅整合了從素材 輸入到內(nèi)容創(chuàng)作的全流程功能,還提供了與主流社交平臺的分享接口和云 端存儲能力。這種端到端的閉環(huán)設(shè)計(jì)滿足了創(chuàng)作者一站式的需求,更重要的 是為未來更多場景的拓展預(yù)留了空間。通過持續(xù)積累用戶創(chuàng)作數(shù)據(jù)和使用 習(xí)慣,產(chǎn)品可以不斷優(yōu)化和進(jìn)化,形成良性的數(shù)據(jù)增長閉環(huán),這種面向未來的產(chǎn)品設(shè)計(jì)思路為 AI 創(chuàng)作工具指引了新的發(fā)展方向。
3.3. 深耕垂直領(lǐng)域的資深玩家搶占 AI 時代變現(xiàn)的先發(fā)優(yōu)勢
AI 在垂直領(lǐng)域?qū)崿F(xiàn)從通用能力到場景深耕的轉(zhuǎn)變,各地頭部企業(yè)圍繞行業(yè) 痛點(diǎn)推出創(chuàng)新解決方案。
3.3.1. 醫(yī)療 AI 加速產(chǎn)業(yè)化落地,診療服務(wù)全面升級
全球醫(yī)療 AI 加速產(chǎn)業(yè)化落地,醫(yī)療保健領(lǐng)域的 AI 應(yīng)用得到更多重視。2024 年,全球大量 AI 醫(yī)療應(yīng)用落地,IBM Watson Health 推出的 AI 藥物研發(fā)平 臺顯著加速新療法開發(fā)流程;微軟 Azure AI Health Insights 平臺強(qiáng)化了醫(yī)療 預(yù)測分析能力;飛利浦 HealthSuite 平臺則通過實(shí)時數(shù)據(jù)整合提升患者管理 效率。在診斷領(lǐng)域,谷歌 Health 發(fā)布的乳腺癌檢測 AI 工具較傳統(tǒng)鉬靶檢查 展現(xiàn)出更高準(zhǔn)確率,西門子醫(yī)療推出的 AI 增強(qiáng)型影像軟件大幅提升了放射 診斷精度。醫(yī)療 AI 正從實(shí)驗(yàn)室走向規(guī)?;虡I(yè)應(yīng)用階段。 潤達(dá)醫(yī)療"CDx 良醫(yī)小慧"通過突破數(shù)據(jù)處理和模型精度兩大技術(shù)難點(diǎn),實(shí) 現(xiàn)了醫(yī)療場景的全方位 AI 賦能。2024 年 9 月,潤達(dá)醫(yī)療基于 6 年積累的 近 10 萬條數(shù)據(jù)標(biāo)注和治理規(guī)則,成功開發(fā)了 CDx 醫(yī)療數(shù)據(jù)基座,可將臨床 文本記錄轉(zhuǎn)化為全結(jié)構(gòu)化數(shù)據(jù),目前已支持檢驗(yàn)、超聲、CT、核磁、病理 等近百個維度的醫(yī)療數(shù)據(jù)處理。在模型研發(fā)方面,該公司通過在盤古通用大 模型基礎(chǔ)上構(gòu)建醫(yī)療垂域大模型,并邀請北京阜外、華山等多家知名醫(yī)院的 臨床專家參與模型優(yōu)化,有效解決了 AI 在醫(yī)療場景中的"幻覺"問題,確保 了模型輸出結(jié)果的專業(yè)性和可靠性。
潤達(dá)醫(yī)療的 AI 解決方案已在多個醫(yī)療細(xì)分場景實(shí)現(xiàn)商業(yè)落地。"CDx 良醫(yī) 小慧"已在體檢、藥房、檢驗(yàn)等多個醫(yī)療場景實(shí)現(xiàn)規(guī)?;瘧?yīng)用。在美年大健 康的體檢場景中,該方案通過 AI 機(jī)器人"健康小美"將服務(wù)模式升級為"體檢 2 小時,健康服務(wù) 365 天";在智慧檢驗(yàn)領(lǐng)域,通過與生物梅里埃合作打造 智慧微生物檢測和管理體系;在藥房場景中,已與廣西柳藥集團(tuán)啟動"桂中 大藥房智慧升級計(jì)劃"。
3.3.2. 金融大模型專注領(lǐng)域內(nèi)知識,驅(qū)動行業(yè)能力躍遷
金融行業(yè)大模型應(yīng)用進(jìn)入產(chǎn)業(yè)化階段,頭部金融機(jī)構(gòu)自研模型將重塑行業(yè) 競爭格局。全球領(lǐng)先金融機(jī)構(gòu)正在加速布局專業(yè)金融大語言模型。彭博社 2023 年推出的 BloombergGPT 擁有 500 億參數(shù)規(guī)模,專注于金融數(shù)據(jù)分析 和市場研究。2024 年 1 月,摩根大通發(fā)布 DocLLM,專門用于處理復(fù)雜的 金融文檔。在開源領(lǐng)域,AI4Finance 社區(qū)推出的 FinGPT 為中小金融機(jī)構(gòu)提 供了可定制化的解決方案。這些專業(yè)模型的出現(xiàn)標(biāo)志著金融科技正從通用 AI 應(yīng)用向行業(yè)專用模型演進(jìn),預(yù)計(jì)將在投研、風(fēng)控、客服等場景率先實(shí)現(xiàn) 商業(yè)化落地。
恒生電子的 LightGPT 通過建立分層評測體系和場景化應(yīng)用,形成了金融 大模型從通用能力向?qū)I(yè)場景深度應(yīng)用的系統(tǒng)性解決方案。2023 年 10 月 發(fā)布的 LightGPT 采用"L0-L1-L2"三層能力評測體系,將金融大模型的能力 劃分為通用能力、金融領(lǐng)域能力和金融場景能力,這種分層設(shè)計(jì)確保了模型 在基礎(chǔ)能力和專業(yè)應(yīng)用之間的平衡。特別是在 L2 層面,模型覆蓋了投顧、 投研、運(yùn)營、合規(guī)等五大場景的 80 種金融專屬任務(wù),體現(xiàn)出顯著的垂直領(lǐng) 域優(yōu)勢。在落地層面,恒生電子通過"重塑+嵌入"雙模式推進(jìn)大模型應(yīng)用, 既打造了光子·文曲等獨(dú)立產(chǎn)品,又通過插件形式將 AI 能力嵌入現(xiàn)有業(yè)務(wù) 系統(tǒng),實(shí)現(xiàn)了技術(shù)創(chuàng)新與業(yè)務(wù)場景的深度融合。 金證股份通過 K-GPT 提供了自主研發(fā)的金融領(lǐng)域 AI 解決方案。金證股份 在 AI 領(lǐng)域的布局始于 2018 年,通過五年持續(xù)迭代,于 2023 年 12 月發(fā)布 了 K-GPT。K-GPT 基于 Transformer 架構(gòu),通過領(lǐng)域預(yù)訓(xùn)練和場景化精調(diào), 將智能語義檢索引擎與文檔處理平臺(IDP)緊密結(jié)合,形成了完整的金融 知識體系。其應(yīng)用已實(shí)現(xiàn)從早期的單點(diǎn)智能監(jiān)管突破,到如今覆蓋營銷、投 研、風(fēng)控等多個核心金融場景的全面布局。
同花順 HithinkGPT 通過強(qiáng)大的數(shù)據(jù)積累和技術(shù)創(chuàng)新,在金融垂域?qū)崿F(xiàn)了 突破性進(jìn)展。根據(jù)同花順信息,2024 年 1 月發(fā)布的 HithinkGPT 基于萬億級 金融語料訓(xùn)練,在 17 個金融行業(yè)考試中平均得分達(dá) 75.9 分,顯著優(yōu)于主流 開源模型。問財(cái)產(chǎn)品基于 HithinkGPT 實(shí)現(xiàn)了五大能力升級,覆蓋 15 個業(yè) 務(wù)矩陣和 50 余類技能,特別是在實(shí)時數(shù)據(jù)獲取、專業(yè)投顧建議和風(fēng)險控制 等方面形成獨(dú)特優(yōu)勢,其 99.5%的風(fēng)險召回率體現(xiàn)了金融場景下的高可靠 性,并成為首個通過網(wǎng)信辦備案的金融對話大模型。
3.3.3. 法律大模型縱深發(fā)展,賦能司法效率提升
法律領(lǐng)域的垂直大模型呈現(xiàn)出專業(yè)化、安全性和實(shí)用性的特征。2023 年初 Harvey AI 發(fā)布的大模型和 Thomson Reuters 旗下 Casetext 發(fā)布的 CoCounsel 兩大法律大模型的成功應(yīng)用,展現(xiàn)了 AI在專業(yè)領(lǐng)域的突破。在專業(yè)性方面, 這些模型通過法律文獻(xiàn)訓(xùn)練和律所實(shí)踐數(shù)據(jù)的持續(xù)優(yōu)化,能夠勝任合同分 析、盡職調(diào)查等核心業(yè)務(wù);在安全性方面,兩者都采用專用服務(wù)器和加密技 術(shù)保護(hù)客戶數(shù)據(jù),確保法律信息的私密性;在實(shí)用性方面,Harvey AI 經(jīng)過 全球最大律所之一 Allen & Overy 的 4 萬次測試,證明 AI 在法律領(lǐng)域的應(yīng) 用能顯著提升律師工作效率。
華宇萬象法律大模型在多個法律服務(wù)場景實(shí)現(xiàn)落地應(yīng)用。產(chǎn)品于 2023 年 7 月的法律科技大會發(fā)布,已為法官提供智慧閱卷、庭審輔助等功能,為檢察 官、律師提供文書寫作輔助,同時在企業(yè)法務(wù)領(lǐng)域?qū)崿F(xiàn)規(guī)章制度智能解讀和 風(fēng)險預(yù)警等應(yīng)用。憑借與大模型獨(dú)角獸企業(yè)智譜 AI 的戰(zhàn)略合作關(guān)系,華宇 軟件在 AI 法律應(yīng)用領(lǐng)域的創(chuàng)新發(fā)展將獲得堅(jiān)實(shí)的技術(shù)保障。
通達(dá)海聯(lián)合基層法院共建大模型,展現(xiàn)出法律科技公司服務(wù)基層的新路徑。 2024 年 10 月,通達(dá)海與香洲法院共建的香法 AI 入駐珠海模數(shù)空間,該產(chǎn) 品實(shí)現(xiàn)了標(biāo)準(zhǔn)化法律業(yè)務(wù)指引、精準(zhǔn)化法律知識推送、智能化司法決策輔助 等功能,并已在審判實(shí)務(wù)中顯著提升效率。 通達(dá)海構(gòu)建了"感知智能+認(rèn)知智能"雙引擎的法律人工智能架構(gòu)。感知智能 引擎通過圖像識別、OCR 識別等技術(shù),對卷宗、證據(jù)等實(shí)體材料進(jìn)行智能 分析,實(shí)現(xiàn)材料類型識別、內(nèi)容識別和精細(xì)化編目,其中 OCR 綜合識別正 確率達(dá) 95.5%,證據(jù)材料綜合識別率達(dá) 98.5%;認(rèn)知智能引擎則基于自然語 言理解和法律大模型技術(shù),構(gòu)建了 280 多個要素化信息抽取模型,在法律 咨詢、量刑預(yù)測、智能文書生成、案件事實(shí)歸納等九大核心場景實(shí)現(xiàn)了 95% 的模型準(zhǔn)確率和召回率。
3.3.4. AI 教育工具轉(zhuǎn)向深度學(xué)科訓(xùn)練,多場景互動重塑學(xué)習(xí)體驗(yàn)
ChatGPT 正在顛覆傳統(tǒng)教育科技企業(yè)的商業(yè)模式,在線搜題平臺 Chegg 的 衰落就是典型案例。據(jù)《華爾街日報(bào)》2024 年 11 月報(bào)道,Chegg 面臨用戶 需求轉(zhuǎn)變的嚴(yán)峻挑戰(zhàn):Needham 的調(diào)查顯示,2024 年秋季使用 Chegg 的大 學(xué)生比例降至 30%,而選擇 ChatGPT 的比例上升至 62%。這一轉(zhuǎn)變的核心 在于用戶不再滿足于獲取簡單答案,而是希望通過 AI學(xué)習(xí)完整的解題思路。 盡管 Chegg 已與 Scale AI 合作開發(fā) AI 系統(tǒng),將服務(wù)重心轉(zhuǎn)向提供更豐富的 解題幫助,但其收入持續(xù)下滑,反映出傳統(tǒng)教育科技企業(yè)在 AI 時代轉(zhuǎn)型的 困境。 教育領(lǐng)域的 AI 應(yīng)用實(shí)現(xiàn)了從通用助教工具向?qū)I(yè)學(xué)科輔導(dǎo)轉(zhuǎn)變,頭部產(chǎn)品 開始深耕學(xué)科能力訓(xùn)練場景。以專業(yè)領(lǐng)域切入為代表的是 Microsoft 推出的 Reading Coach,該產(chǎn)品專注于提升學(xué)生的英語閱讀理解能力,通過 AI 生成 個性化故事內(nèi)容來訓(xùn)練學(xué)生的閱讀技能。在中國市場,好未來發(fā)布了九章大 模型,面向全球科研機(jī)構(gòu),以解題和講題算法為核心。Coursera 正式在其所 有付費(fèi)課程中引入 AI 輔導(dǎo)助手"Coach"功能,該功能可以根據(jù)學(xué)習(xí)者的課 程進(jìn)度提供個性化的知識講解。從交互方式看,這些產(chǎn)品均采用了實(shí)時對話 模式,并結(jié)合了知識圖譜技術(shù)來保證答案的準(zhǔn)確性。另外,后續(xù) o1 思維鏈 模式的發(fā)展也將進(jìn)一步拓寬教育 AI 的邊界。
多鄰國的 AI 布局展現(xiàn)出長期深耕的戰(zhàn)略思維。早在 2021 年,公司就開始與 OpenAI 展開合作,將 GPT-3 應(yīng)用于英語測試業(yè)務(wù);后續(xù)又在 GPT-4 發(fā) 布首日推出 Max 訂閱服務(wù),提供 AI 解答和角色互動功能。公司通過自研 Birdbrain 模型優(yōu)化教學(xué)內(nèi)容,同時借助 OpenAI 模型提升對話生成能力,這 種"自研+合作"的雙輪驅(qū)動模式,讓多鄰國在保持教學(xué)專業(yè)性的同時不斷提 升用戶體驗(yàn)。 多鄰國在 2024 年 9 月底推出重要產(chǎn)品創(chuàng)新,通過 AI 視頻通話及冒險功能 重構(gòu)語言學(xué)習(xí)體驗(yàn)。新功能基于 OpenAI 及自研大模型支持,推出了 AI 角 色"拽姐",能實(shí)現(xiàn)接近真人的對話體驗(yàn),包括自然的語氣變化、思考停頓等 細(xì)節(jié)。用戶可以與"拽姐"進(jìn)行視頻通話練習(xí),也能在學(xué)校、商店、派對等多 個生活場景中共同探索和解決問題,將語言學(xué)習(xí)融入具體情境,實(shí)現(xiàn)從單向 練習(xí)到沉浸式學(xué)習(xí)的躍升。
3.3.5. AI 技術(shù)重構(gòu)商業(yè)變現(xiàn),數(shù)字營銷加速落地
AppLovin 的 AI 廣告引擎 AXON 2.0 憑借卓越的廣告匹配效率,正引領(lǐng)數(shù) 字廣告領(lǐng)域的技術(shù)革新。該產(chǎn)品于 2024 年第三季度展現(xiàn)出強(qiáng)勁的市場表現(xiàn), 基于 AXON 2.0 開發(fā)的智能廣告方案 eDiscovery 安裝率從 2023 年的 17%顯 著提升至目前的平均 82%,充分證實(shí)了 AI 在提升廣告投放精準(zhǔn)度方面的突 出優(yōu)勢。作為 AppLovin 轉(zhuǎn)型的核心產(chǎn)品,AXON 2.0 不僅推動公司從游戲 發(fā)行商成功轉(zhuǎn)變?yōu)?AI 廣告技術(shù)先驅(qū),更是通過其高效的應(yīng)用內(nèi)廣告變現(xiàn) (IAA)能力,提供了一條可靠的商業(yè)化路徑。
3.3.6. 數(shù)字人技術(shù)賦能,情感與商業(yè)價值雙向突破
數(shù)字人技術(shù)展現(xiàn)出情感陪伴和商業(yè)營銷的雙重應(yīng)用價值。娛樂層面,數(shù)字 人可作為虛擬形象進(jìn)行互動,或展開數(shù)字人直播;情感層面,數(shù)字人通過多 模態(tài)交互和專業(yè)知識庫的支持,為用戶提供個性化的心理陪伴服務(wù);商業(yè)層 面,數(shù)字人降低了內(nèi)容制作門檻,讓營銷視頻的生產(chǎn)更高效且成本更低。這 種技術(shù)與場景的深度融合,正推動數(shù)字人從概念創(chuàng)新走向規(guī)?;瘧?yīng)用。 科大訊飛在數(shù)字人技術(shù)上實(shí)現(xiàn)多維度突破,展現(xiàn)出數(shù)字人交互的新范式。 2024 年 1024 開發(fā)者節(jié)發(fā)布的星火超擬人數(shù)字人率先實(shí)現(xiàn)了語義貫穿的"口 唇-表情-動作"生成,使數(shù)字人的表現(xiàn)更加自然流暢。該產(chǎn)品通過統(tǒng)一的神 經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)端到端建模,支持語音視頻實(shí)時對話,能精準(zhǔn)匹配語音內(nèi)容與肢 體動作,還具備場景識別能力,可以辨識攝像頭中的具體物體和狀態(tài)。更重 要的是,用戶能夠創(chuàng)建個性化的數(shù)字分身,自定義包括性格、背景在內(nèi)的多 個維度,體現(xiàn)出數(shù)字人技術(shù)從標(biāo)準(zhǔn)化向個性化的演進(jìn)。
魔琺科技推出了全棧式數(shù)字人解決方案。魔琺通過"有言"、"有光"、"有靈" 三款產(chǎn)品覆蓋了數(shù)字人應(yīng)用的主要場景:其中"有言"平臺能夠?qū)崿F(xiàn) 3D 視頻 一鍵生成,集成了 AIGC 三維動畫、超寫實(shí)形象、運(yùn)鏡和聲音等技術(shù),顯著 提升視頻制作效率;"有光"專注于 AI 驅(qū)動的 3D 超寫實(shí)數(shù)字人直播,支持 實(shí)時語音驅(qū)動和智能互動;"有靈"則面向企業(yè)級應(yīng)用,通過 AIGC 技術(shù)規(guī)模 化復(fù)刻"金牌員工"能力,支持全域多端的 7×24 小時專業(yè)服務(wù)。這些應(yīng)用已 在培訓(xùn)、電商、金融、快消、廣電等領(lǐng)域得到廣泛應(yīng)用,展現(xiàn)了 AI 數(shù)字人 技術(shù)的商業(yè)化落地潛力。
出門問問 WetaAvatar 4.0 數(shù)字人取得引擎技術(shù)突破。引擎采用"運(yùn)動預(yù)測+ 人臉驅(qū)動"雙模塊架構(gòu),運(yùn)動預(yù)測模塊通過語音分析技術(shù)提取關(guān)鍵參數(shù),實(shí) 現(xiàn)嘴型動畫與語音的精準(zhǔn)同步;人臉驅(qū)動模塊則結(jié)合預(yù)生成驅(qū)動視頻和靜 態(tài)圖片,生成包含嘴型變化、面部表情和肌肉運(yùn)動的全面運(yùn)動場,顯著提升了數(shù)字人的表現(xiàn)力。新一代引擎在視頻合成速度、背景渲染、人物分離等方 面均實(shí)現(xiàn)優(yōu)化,其音畫同步性指標(biāo) Sync-C 普遍高于上一代產(chǎn)品。目前引擎 已經(jīng)應(yīng)用于國內(nèi)產(chǎn)品奇妙元和國際產(chǎn)品 DupDub。
萬興科技發(fā)布的萬興播爆展現(xiàn)了 AIGC 在商業(yè)領(lǐng)域的突破性應(yīng)用價值。 2023 年 3 月發(fā)布的萬興播爆基于 AI 技術(shù)實(shí)現(xiàn)了真人視頻的一鍵生成,通 過內(nèi)置的百余套專業(yè)級場景模板和超逼真多國籍 AI 數(shù)字人,支持中英西法 德意日韓等 120 多個國家的語種和口音,可在幾分鐘內(nèi)完成傳統(tǒng)需要數(shù)周 的視頻制作流程。這一產(chǎn)品顯著降低了出海營銷門檻,相比傳統(tǒng)外籍演員拍 攝方式可節(jié)省 80%以上預(yù)算,特別適合電商帶貨、產(chǎn)品介紹等場景。
4. 端側(cè) AI 應(yīng)用加速普及,推動智能化生活升級
AI 端側(cè)應(yīng)用通過本地處理實(shí)現(xiàn)快速響應(yīng)與隱私保護(hù),引領(lǐng)智能終端的下一 代技術(shù)革新。端側(cè) AI 應(yīng)用通過在本地設(shè)備(智能手機(jī)、IoT 終端、車載系統(tǒng) 等)直接運(yùn)行 AI 算法,將傳統(tǒng)依賴云端的圖像識別、語音交互等功能轉(zhuǎn)移到 設(shè)備端實(shí)現(xiàn)。這種架構(gòu)在降低網(wǎng)絡(luò)延遲的同時確保數(shù)據(jù)隱私安全,使設(shè)備即 使在離線狀態(tài)下也能持續(xù)提供智能服務(wù)。隨著算力提升和模型優(yōu)化,端側(cè) AI 正從簡單的感知智能向復(fù)雜決策能力演進(jìn),在更多應(yīng)用場景持續(xù)拓展。
4.1. AI AGENT 和機(jī)器人引領(lǐng) AI 產(chǎn)業(yè)革命
AI Agent 作為新一代數(shù)字化員工,憑借理解、規(guī)劃、執(zhí)行的全鏈路能力, 正加速融入企業(yè)運(yùn)營體系。AI Agent 不僅是簡單的工具,更像是需要系統(tǒng)性 培養(yǎng)的數(shù)字員工,企業(yè)需要通過專業(yè)數(shù)據(jù)構(gòu)建和技能訓(xùn)練,使其深度理解企 業(yè)文化和業(yè)務(wù)流程。這些數(shù)字員工可以執(zhí)行營銷活動、支持客戶、優(yōu)化芯片、 協(xié)助軟件編寫,甚至是作為實(shí)驗(yàn)室助理或首席執(zhí)行官導(dǎo)師。為此,英偉達(dá)創(chuàng) 建了生命周期平臺 nemo,讓生態(tài)系統(tǒng)能夠更容易地構(gòu)建人工智能代理,能 夠創(chuàng)建、交付、持續(xù)改進(jìn)人工智能代理。nemo 為每個階段提供庫,從數(shù)據(jù) 創(chuàng)建、訓(xùn)練、微調(diào)、合成數(shù)據(jù)生成、評估到護(hù)欄。關(guān)于人和人工智能的關(guān)系, 英偉達(dá)認(rèn)為人工智能不會取代 50%人的工作,而是人工智能將為 100%的人 完成 50%的工作。
人工智能為機(jī)械系統(tǒng)注入新動能,智能機(jī)器人有望成為世界上最重要的產(chǎn) 業(yè)之一。盡管機(jī)器人已顯著提升制造業(yè)生產(chǎn)力,但機(jī)器人行業(yè)長期發(fā)展停 滯,擴(kuò)張困難。主要原因在于傳統(tǒng)機(jī)器人過于專用化、缺乏靈活性,難以適 應(yīng)不同場景。相比之下,人工智能具備自適應(yīng)和學(xué)習(xí)能力,靈活性更強(qiáng)。因 此,現(xiàn)在可以將這種通用人工智能技術(shù)應(yīng)用到具身人工智能或物理機(jī)器人 領(lǐng)域,推動機(jī)器人技術(shù)實(shí)現(xiàn)突破。這一過程需要構(gòu)建三個計(jì)算系統(tǒng):首先是 傳統(tǒng)的人工智能系統(tǒng);第二是模擬訓(xùn)練系統(tǒng),為 AI 提供學(xué)習(xí)環(huán)境和合成數(shù) 據(jù);最后,經(jīng)過驗(yàn)證、訓(xùn)練和評估后,將模型部署到物理機(jī)器人中。為此, 英偉達(dá)專門開發(fā)了面向機(jī)器人的 Jetson 處理器。借助這一技術(shù),機(jī)器人不 僅能感知周圍環(huán)境,還能將文本指令轉(zhuǎn)化為關(guān)節(jié)運(yùn)動,從而實(shí)現(xiàn)更靈活的操 作。
英偉達(dá)發(fā)布強(qiáng)化學(xué)習(xí)虛擬系統(tǒng) IsaacLAB,致力于為人類和機(jī)器人提供系統(tǒng) 化訓(xùn)練方案。英偉達(dá)在該系統(tǒng)中構(gòu)建了三個核心工作流程:第一個是群組模 仿,通過采集人類示范動作,并利用域隨機(jī)化技術(shù)生成數(shù)百個類似場景,幫 助機(jī)器人掌握泛化能力;第二個是分組,運(yùn)用生成式 AI 技術(shù)創(chuàng)建大量隨機(jī) 化的環(huán)境和任務(wù)場景,豐富機(jī)器人的訓(xùn)練樣本;第三個是群組控制,這是一 個模型提煉框架,能夠?qū)⑺幸蚜?xí)得的任務(wù)和技能整合到統(tǒng)一模型中,使機(jī) 器人實(shí)現(xiàn)多樣化的運(yùn)動技能。 AI 將賦能機(jī)器人引領(lǐng)工廠革命。傳統(tǒng)軟件一直扮演工具角色,而 AI 突破 了這一定位,成為具備技能、能夠自主執(zhí)行任務(wù)的智能主體。未來工廠將會 有兩個 AI 系統(tǒng),其一是數(shù)字化 AI Agent,與辦公室員工協(xié)同工作;其二是 實(shí)體化的 AI 機(jī)器人系統(tǒng),承擔(dān)物理世界的生產(chǎn)任務(wù)。許多企業(yè)、媒體認(rèn)為 制造實(shí)體產(chǎn)品才有真正的價值和意義,而軟件是虛擬的東西,因此不信任軟 件的價值。但未來機(jī)器人和 AI 的結(jié)合將會更加釋放軟件的價值。 英偉達(dá)宣布將與軟銀合作,為日本帶來并建立人工智能基礎(chǔ)設(shè)施,共同建 設(shè)日本最大的人工智能工廠。英偉達(dá)和軟銀計(jì)劃整合無線通信、計(jì)算機(jī)和 5G-RAN 基帶,將傳統(tǒng)電信網(wǎng)絡(luò)升級改造為 AI-RAN 系統(tǒng),實(shí)現(xiàn)語音、數(shù) 據(jù)、視頻的承載。未來雙方還會將新型人工智能分布在軟銀的上萬個站點(diǎn)中。 這一布局最終將形成覆蓋全日本的 AI 智能網(wǎng)絡(luò)。隨著 AI 基礎(chǔ)設(shè)施的建立, 新行業(yè)和新公司有望會孕育新的商機(jī)。 過去基站主要用于傳輸電信和互聯(lián)網(wǎng)瀏覽等服務(wù),但現(xiàn)在隨著緊密相連的 智能網(wǎng)絡(luò)的發(fā)展,AI 網(wǎng)絡(luò)將成為日本基礎(chǔ)設(shè)施的核心。英偉達(dá)和軟銀展望 未來,認(rèn)為個人 AI 助手將如同 PC 和智能手機(jī)一樣普及,成為個人生活的 智能伴侶,在旅行規(guī)劃、教育指導(dǎo)等方面提供全方位服務(wù),并通過深度了解 用戶的健康、教育等狀況,成為他們的“雙胞胎 AI 助手”。因而,這也對每 個主權(quán)國家、政府都建立自己的主權(quán)數(shù)據(jù)中心提出了要求和挑戰(zhàn)。
4.2. AI 手機(jī):硬件升級提速,終端智能邁入新階段
三星率先發(fā)布搭載端側(cè) AI 的 Galaxy S24 系列,帶動 2024 年 AI 手機(jī)市場 快速起步。三星 Galaxy S24 系列于 2024 年 1 月首次實(shí)現(xiàn)了端云結(jié)合的 AI 架構(gòu),在通話翻譯、圖像處理和語音轉(zhuǎn)寫三大場景實(shí)現(xiàn)純端側(cè)處理。該系列 搭載高通驍龍 8 Gen3 處理器,通過端側(cè)模型預(yù)處理確保個人信息不出設(shè)備, 同時實(shí)現(xiàn)毫秒級響應(yīng)。其中,實(shí)時通話翻譯功能完全在本地進(jìn)行,無需聯(lián)網(wǎng) 即可實(shí)現(xiàn)多語言實(shí)時對話;本地 AI 還能進(jìn)行照片智能修復(fù)和多人會議實(shí)時 轉(zhuǎn)寫,體現(xiàn)了端側(cè) AI 在提升用戶體驗(yàn)同時保護(hù)隱私的典型優(yōu)勢。
端側(cè) AI 應(yīng)用成為 2024 年手機(jī)行業(yè)創(chuàng)新重點(diǎn)。小米在 2024 年 2 月發(fā)布的14 Ultra 搭載首個 AI 大模型計(jì)算攝影平臺 Xiaomi AISP,通過整合 CPU、 GPU、NPU 和 ISP 實(shí)現(xiàn) 60TOPS 算力,首次將 AIGC 技術(shù)應(yīng)用于 100 倍數(shù) 碼變焦的實(shí)時處理;OPPO 在 2024 年 1 月的 Find X7 系列中率先集成了端 側(cè) AIGC 消除、AI 通話摘要功能;vivo 則在 2023 年底推出了從 10 億到 1750 億參數(shù)的五款不同規(guī)模端側(cè)模型,構(gòu)建起較為完整的 AI 能力矩陣。 終端廠商基于端云混合架構(gòu)探索 AI 落地路徑,行業(yè)共識逐步形成。根據(jù)聯(lián) 發(fā)科、IDC、OPPO 在 2024 年 2 月發(fā)布的《AI 手機(jī)白皮書》,AI 手機(jī)需具 備高效算力調(diào)度、環(huán)境感知、自學(xué)習(xí)和創(chuàng)作四大核心能力。目前各大廠商采 用端側(cè)預(yù)處理與云端協(xié)同的技術(shù)路線,在保護(hù)用戶隱私的同時確保功能實(shí) 時性。根據(jù) Counterpoint Research 預(yù)測,2024 年生成式 AI 手機(jī)出貨量將突 破 1 億部,到 2027 年市場占比有望達(dá)到 40%,顯示出強(qiáng)勁的增長潛力。 華為在 HarmonyOS NEXT 中首次實(shí)現(xiàn) AI 能力操作系統(tǒng)級下沉,開創(chuàng)端側(cè) 智能新范式。根據(jù) IT 之家 2024 年 6 月信息,華為不同于市面上簡單集成 大模型的 AI 產(chǎn)品,而是通過軟硬芯云整合構(gòu)建了鴻蒙原生智能架構(gòu),使 AI 與操作系統(tǒng)深度融合。這種系統(tǒng)級融合使得小藝智能體能夠常駐導(dǎo)航條,用 戶可通過全局拖拽方式直接處理文字、圖片、文檔,實(shí)現(xiàn)摘要、潤色、提取 表格等功能;同時,搭載盤古大模型的小藝具備 23 類 TOP 場景的記憶感知 能力,任務(wù)成功率達(dá) 90%,已實(shí)現(xiàn)與 300 多個重點(diǎn)服務(wù)的無縫對接。這種 將 AI 能力下沉到系統(tǒng)層的架構(gòu)創(chuàng)新,極大提升了端側(cè) AI 的應(yīng)用效率。
蘋果通過 Apple Intelligence 構(gòu)建全方位端側(cè) AI 架構(gòu)。蘋果在 iOS 18 中推 出了 Apple Intelligence 系統(tǒng)?;A(chǔ) AI 能力通過設(shè)備端處理實(shí)現(xiàn),包括文本 校對、圖像清理和自然語言理解等,對于更復(fù)雜的計(jì)算需求,系統(tǒng)會調(diào)用基 于 Apple Silicon 的服務(wù)器集群進(jìn)行 Private Cloud Compute,確保數(shù)據(jù)隱私不 被收集存儲。這一架構(gòu)支持多樣化的端側(cè)應(yīng)用場景:在寫作工具方面,能夠 進(jìn)行文本校對、重寫和摘要;在圖像處理上,支持移除干擾元素和自然語言 搜索;在個人助理方面,全新設(shè)計(jì)的 Siri 可通過設(shè)備端上下文理解實(shí)現(xiàn)更自 然的交互,并能跨應(yīng)用執(zhí)行復(fù)雜任務(wù)。
Agent 類 AI 應(yīng)用迎來落地關(guān)鍵期,智譜 Phone Use 通過語音交互打開手機(jī) 控制新場景。2024 年 11 月,智譜 AI 基于 AutoGLM 智能體和 GLM-4-Voice 將AI應(yīng)用擴(kuò)展至"Phone Use"領(lǐng)域,可以模擬人類完成微信點(diǎn)贊、淘寶購物、 訂票等復(fù)雜操作。目前這一 Phone Use 能力已適配微信、淘寶、美團(tuán)等 8 款 主流應(yīng)用。在交互效率方面,Phone Use 突破了傳統(tǒng)語音助手的單一指令模 式,支持多輪對話和復(fù)雜任務(wù)執(zhí)行,為用戶提供更自然的操作體驗(yàn)。相比傳 統(tǒng) AI 助手僅能通過 API 調(diào)用的方式,AutoGLM 的 Phone Use 技術(shù)為端側(cè) AI Agent 在手機(jī)市場的拓展提供了參考方向。
端側(cè) AI 手機(jī)的競爭焦點(diǎn)已從功能堆砌轉(zhuǎn)向用戶隱私與體驗(yàn)的平衡突破。傳 統(tǒng)云端 AI 模式雖然算力充沛,但隱私風(fēng)險和網(wǎng)絡(luò)依賴限制了其發(fā)展空間。 新一代手機(jī)廠商通過端云結(jié)合架構(gòu),既確保個人信息不出設(shè)備,又能實(shí)現(xiàn)毫 秒級響應(yīng),標(biāo)志著終端智能已找到兼顧隱私與體驗(yàn)的最優(yōu)解。這種基于用戶 核心需求的創(chuàng)新,將成為未來 AI 手機(jī)競爭的關(guān)鍵砝碼。 終端智能正從單一功能走向全場景協(xié)同,AI 手機(jī)的競爭邏輯已轉(zhuǎn)向生態(tài)構(gòu) 建。目前各大手機(jī)廠商紛紛布局系統(tǒng)級 AI 架構(gòu),不再局限于簡單的功能集 成,而是著眼于打造端側(cè)智能生態(tài)。這種轉(zhuǎn)變意味著,手機(jī)廠商的競爭重點(diǎn) 將從硬件規(guī)格轉(zhuǎn)向場景生態(tài),誰能率先構(gòu)建起完整的智能場景閉環(huán),誰就能 在下一輪行業(yè)變革中占據(jù)先機(jī)。
4.3. AI PC:全場景智慧加速,應(yīng)用生態(tài)革新
英特爾酷睿 Ultra 處理器為 AI PC 帶來革命性突破。2024 年 9 月,英特爾 發(fā)布 Ultra 200V 系列處理器,為 AI PC 帶來突破性的性能提升和能效優(yōu)化。 這一新品在三大 AI 引擎架構(gòu)上實(shí)現(xiàn)全面突破:CPU 整體功耗較上代降低 50%,NPU 性能提升 4 倍,GPU 首次采用 Xe2 圖形微架構(gòu)帶來平均 30%的 性能提升,整體平臺算力高達(dá) 120 TOPS。通過與 100 多家 ISV 和開發(fā)者的 合作,該處理器已支持超過 300 個 AI 加速功能,并針對 500 多種 AI 大模 型進(jìn)行了優(yōu)化。
聯(lián)想新一代 ThinkPad 將端側(cè) AI 延伸至智能場景交互,開創(chuàng)商用電腦新形 態(tài)。聯(lián)想于 2024 年 9 月推出的 ThinkPad X1 Carbon Gen 13 等新品,突破了 傳統(tǒng)的 AI 應(yīng)用方式,搭載高通驍龍 X Elite,支持 Copilot,新增 Smart Modes 智能模式可根據(jù)場景自動調(diào)整性能,如檢測到背后有人時自動為屏幕打碼; Smart Share 功能通過 AI 虛擬傳感器實(shí)現(xiàn)手機(jī)與 PC 的觸碰傳輸。聯(lián)想還將 在 Yoga Pro 9i 等機(jī)型上率先搭載 Creator Zone 軟件套件,基于 Stable Diffusion 模型提供自然語言生成視覺內(nèi)容的能力。
鴻蒙生態(tài)春季溝通會上,華為首次將自研的盤古大模型引入 PC 端。華為 2024 年新發(fā)布的 MateBook X Pro 搭載了 AI 概要功能,通過盤古大模型可 實(shí)現(xiàn)會議實(shí)時轉(zhuǎn)寫、音視頻快速總結(jié)等智能應(yīng)用;同時還首發(fā)推出AI空間, 作為一站式 AI 能力聚合入口,不僅集成了文心一言、訊飛星火、智譜清言 等第三方大模型,還精選了超過 100 個 AI 智能體,覆蓋辦公、學(xué)習(xí)、創(chuàng)作 等多個場景。
華為 MateBook X Pro AI 算力在硬件層面得到突破,實(shí)現(xiàn)了多項(xiàng)智能體驗(yàn) 的升級。MateBook X ProAI 搭載英特爾酷睿 Ultra 9 處理器,在僅 980g 的 輕量機(jī)身中實(shí)現(xiàn)了 40W 的持續(xù)性能釋放。通過 AI 賦能,該產(chǎn)品帶來了多 項(xiàng)智能體驗(yàn)升級:AI 慧眼讓視頻會議中的人像清晰度提升 50%,AI 音效提 供三種智能降噪模式,AI 字幕支持實(shí)時翻譯和會議記錄導(dǎo)出,此外華為 AI 還積極賦能第三方應(yīng)用,例如首發(fā)支持 WPS AI、與萬興喵影的合作,成為 市場首款支持 AI 特效調(diào)用 NPU 的筆記本。
華勤技術(shù)與榮耀深度合作,積極參與 AI PC 市場。2024 年 2 月的 MWC 2024 巴塞羅那發(fā)布會上,榮耀推出 MagicBook Pro 16,該產(chǎn)品由華勤提供 研發(fā)制造服務(wù),搭載英特爾酷睿 Ultra 處理器,支持本地 AI 智能搜圖、文 檔總結(jié)等 AI 功能。作為聯(lián)想等品牌的長期 ODM 合作伙伴,華勤依托 "2+N+3"產(chǎn)品線布局和在智能硬件領(lǐng)域的深厚經(jīng)驗(yàn),已具備從產(chǎn)品設(shè)計(jì)、硬 件配置到軟件生態(tài)的全方位研發(fā)能力,有望在 AIPC 快速發(fā)展的浪潮中占據(jù) 重要位置。
AI PC 的差異化競爭已從硬件轉(zhuǎn)向場景創(chuàng)新與生態(tài)構(gòu)建的深水區(qū)。傳統(tǒng) PC 廠商曾依靠處理器性能和輕薄程度獲取溢價,但在 AI 時代,聯(lián)想通過 Smart Modes 等場景感知功能、華為通過 AI 空間生態(tài)平臺的路徑顯示,未來的競 爭優(yōu)勢將更多來自對用戶場景的深度理解和生態(tài)資源的整合能力。這意味 著 PC 行業(yè)的競爭模式正在發(fā)生根本性轉(zhuǎn)變。 ODM 廠商有望通過 AI PC 浪潮實(shí)現(xiàn)向產(chǎn)業(yè)鏈上游的突破。華勤從單純代 工向全方位研發(fā)服務(wù)轉(zhuǎn)型的案例表明,AI PC 帶來的不僅是終端形態(tài)的革 新,更是整個產(chǎn)業(yè)鏈重構(gòu)的契機(jī)。在這輪變革中,具備深厚硬件積累和靈活 創(chuàng)新能力的 ODM 廠商,有機(jī)會突破傳統(tǒng)代工模式的天花板,在產(chǎn)業(yè)鏈中獲 得更大的話語權(quán)。
4.4. 智能駕駛:端到端模型破局,多模態(tài)感知提速
2024 年端到端 AI 駕駛模型成為技術(shù)發(fā)展主流,降低系統(tǒng)開發(fā)復(fù)雜度。端 到端大模型的引入使得智能駕駛功能更加接近真實(shí)的人類駕駛體驗(yàn),減少 了人工規(guī)則的介入。從落地產(chǎn)品看,特斯拉 FSD V12.4 于 2024 年 6 月已開 始向首批用戶推送測試,采用端到端神經(jīng)網(wǎng)絡(luò)架構(gòu);小鵬推出的 XNet+規(guī)控大模型 XPlanner 及大語言模型 XBrain 等端到端方案已在 2024 年 5 月實(shí)現(xiàn) 量產(chǎn);華為 ADS 3.0 端到端類人駕駛技術(shù)也已發(fā)布,計(jì)劃于 2025 年開始商 用。 多模態(tài) AI 模型在端側(cè)實(shí)現(xiàn)感知決策能力提升,推動 ADAS 功能進(jìn)化。AI 技術(shù)在智能駕駛中的應(yīng)用范圍不斷擴(kuò)大,多模態(tài) AI 模型在端側(cè)實(shí)現(xiàn)了圖像 識別、雷達(dá)和激光雷達(dá)數(shù)據(jù)處理等核心功能。華為推出的 ADS 3.0 系統(tǒng)采 用端云協(xié)同架構(gòu),將基礎(chǔ)感知、預(yù)警等高頻任務(wù)放在本地處理,有效提升了 系統(tǒng)響應(yīng)速度。生成式 AI 技術(shù)也在 ADAS 領(lǐng)域得到應(yīng)用,用于提升自適應(yīng) 巡航、車道保持等功能的智能化水平。在視覺處理方面,飛凌微等企業(yè)推出 的車載視覺處理芯片,為端側(cè)智能駕駛視覺解決方案提供了支持。 特斯拉 FSD V12 作為端到端 AI 應(yīng)用的重要里程碑,在 2024 年持續(xù)迭代。 最新發(fā)布的 FSD 12.4.1 版本實(shí)現(xiàn)了從方向盤扭力監(jiān)測向基于神經(jīng)網(wǎng)絡(luò)的攝 像頭駕駛員監(jiān)測系統(tǒng)的轉(zhuǎn)變,通過 AI 技術(shù)實(shí)時分析駕駛員眼睛狀態(tài)、視線 方向等行為數(shù)據(jù),大幅提升了駕駛安全性。根據(jù)馬斯克介紹,F(xiàn)SD V12.4 相 比 12.3 版本的接管率改善了 5-10 倍,且整合了此前割裂的 FSD 和非 FSD 分支,其改進(jìn)幅度堪稱 FSD V13,特斯拉預(yù)計(jì)通過持續(xù)的版本更新,有望實(shí) 現(xiàn)用戶幾乎無需手動接管的智能駕駛體驗(yàn)。
小鵬汽車率先推出了國內(nèi)首個量產(chǎn)上車的端到端大模型。根據(jù)小鵬 520 AI DAY 披露,其端到端解決方案包含深度視覺感知神經(jīng)網(wǎng)絡(luò) XNet、規(guī)劃大模 型 XPlanner 和大語言模型 XBrain 三個核心組件,通過超過 10 億里程的視 頻訓(xùn)練數(shù)據(jù)支持,實(shí)現(xiàn)每兩天一次的快速迭代。這套系統(tǒng)顯著提升了智能駕 駛性能,使前后頓挫減少 50%、違停卡死減少 40%、安全接管減少 60%。 特別值得注意的是,基于這套端到端架構(gòu),XNet 能通過 200 萬個網(wǎng)格實(shí)現(xiàn) 對現(xiàn)實(shí)世界的 3D 重構(gòu),感知范圍擴(kuò)大至 1.8 個足球場,而 XPlanner 則通過 海量數(shù)據(jù)(維權(quán))訓(xùn)練實(shí)現(xiàn)更接近人類的駕駛策略。
地平線最新發(fā)布的 SuperDrive 方案展現(xiàn)了端到端架構(gòu)的創(chuàng)新應(yīng)用。根據(jù)地 平線披露,該方案采用動態(tài)、靜態(tài)、OCC(Occupancy 占用網(wǎng)絡(luò))三網(wǎng)合一 的端到端感知架構(gòu),顯著提升了系統(tǒng)性能,使遮擋準(zhǔn)召率提升 70%,同時將 動態(tài)代碼行數(shù)降低 90%、網(wǎng)絡(luò)負(fù)載降低 50%。特別是在數(shù)據(jù)驅(qū)動的交互博 弈算法支持下,系統(tǒng)在復(fù)雜交通場景中展現(xiàn)出更接近人類駕駛員的決策能 力,使擁堵場景下的變道成功率提升 50%,路口通過率提升 67%。
黑芝麻智能發(fā)布第三代 DynamAI NN 神經(jīng)網(wǎng)絡(luò)處理器,在 AI 芯片端側(cè)計(jì) 算進(jìn)行創(chuàng)新。2024 年 5 月發(fā)布的該處理器通過原生支持 Transformer 架構(gòu)強(qiáng) 化了對高階自動駕駛算法的處理能力,同時采用新型存取架構(gòu)在保證大模 型所需高帶寬的前提下顯著降低了 DDR 成本。可見車載端 AI 芯片已經(jīng)開 始突破帶寬瓶頸,向支持更復(fù)雜 AI 模型的方向演進(jìn)。
端到端 AI 模型正在顛覆傳統(tǒng)的智能駕駛技術(shù)路線。與傳統(tǒng)的"感知-規(guī)劃-控 制"分層架構(gòu)不同,端到端模型通過直接從輸入到輸出的映射大幅簡化了系 統(tǒng)架構(gòu),如小鵬 XNet 將違停卡死減少 40%、特斯拉 FSD V12 提升接管率 5-10 倍的數(shù)據(jù)都驗(yàn)證了這一路徑的優(yōu)勢。這種范式轉(zhuǎn)變不僅降低了開發(fā)復(fù) 雜度,更重要的是開創(chuàng)了一種更接近人類駕駛認(rèn)知的技術(shù)方向,預(yù)示著智能 駕駛的發(fā)展將進(jìn)入新階段。
4.5. 從單一設(shè)備演進(jìn)到智能助手,AI 賦能新型智能終端創(chuàng)新
小米小愛音箱 Pro 將 AI 在應(yīng)用于智能音箱領(lǐng)域,實(shí)現(xiàn)更精準(zhǔn)的空間感知。 新一代產(chǎn)品通過六麥陣列式聲源定位和波束成型技術(shù),結(jié)合 AI 深度學(xué)習(xí)算 法,實(shí)現(xiàn)了在復(fù)雜噪聲環(huán)境下的精準(zhǔn)空間感知。在多設(shè)備部署環(huán)境中,系統(tǒng) 能夠基于說話人的朝向和距離自動判斷最優(yōu)響應(yīng)設(shè)備,使聲音交互更加自 然流暢。這些技術(shù)升級使智能音箱在實(shí)際應(yīng)用場景中的識別準(zhǔn)確率和響應(yīng) 效率得到顯著提升。
智能眼鏡迎來 AI 賦能拐點(diǎn),百度布局高端市場并帶動供應(yīng)鏈變革,新一輪 AIoT 創(chuàng)新周期顯現(xiàn)。小度 AI 眼睛于 2024 年 11 月發(fā)布,產(chǎn)品整機(jī)重量 45g, 集成了 1600 萬像素超廣角攝像頭、四陣列麥克風(fēng)和防漏音揚(yáng)聲器單元,能 夠?qū)崿F(xiàn)第一視角拍攝、邊走邊問、視聽翻譯等多模態(tài)交互功能。基于文心大 模型和重構(gòu)的 DuerOS AI 原生操作系統(tǒng),小度 AI 眼睛使設(shè)備的多輪交互能 力提升 7 倍。此外,其創(chuàng)新電路架構(gòu)實(shí)現(xiàn)了 56 小時待機(jī)、5 小時以上連續(xù) 聆聽,并支持 30 分鐘快充,為其作為 AI Agent 的持續(xù)服務(wù)提供了堅(jiān)實(shí)保 障。
科大訊飛 iFLYBUDS 耳機(jī)通過多項(xiàng) AI 技術(shù)的融合應(yīng)用,推動辦公體驗(yàn)變 革。在硬件層面,產(chǎn)品搭載雙麥克風(fēng)拾音系統(tǒng),結(jié)合 CVC 通話降噪技術(shù), 確保了清晰的語音質(zhì)量。在軟件層面,耳機(jī)采用語音活動檢測和通道降噪算 法,顯著提升了語音指令識別的準(zhǔn)確性。產(chǎn)品支持實(shí)時錄音轉(zhuǎn)寫功能,可無 縫對接微信、Skype、釘釘和騰訊會議等主流會議平臺。在會議過程中,內(nèi) 置的生成式 AI 能夠自動過濾通話中的語氣詞和冗余內(nèi)容,智能提煉重要信 息,幫助用戶把握會議要點(diǎn)。 字節(jié)跳動 Ola Friend 耳機(jī)展現(xiàn) AI 耳機(jī)多場景應(yīng)用潛力。字節(jié)跳動推出的 Ola Friend 耳機(jī)通過接入豆包 AI 大語言模型,在多個生活場景中實(shí)現(xiàn)了 AI輔助功能的創(chuàng)新應(yīng)用。在旅游場景中,耳機(jī)可以提供實(shí)時語言翻譯和當(dāng)?shù)匦?息查詢服務(wù);在英語學(xué)習(xí)場景下,能夠進(jìn)行發(fā)音糾正和口語練習(xí)指導(dǎo);在日 常社交中,則可以通過 AI 助手提供實(shí)時交流建議。產(chǎn)品在音質(zhì)方面也進(jìn)行 了優(yōu)化,滿足用戶在不同場景下的聽音需求。
多模態(tài)感知技術(shù)正在重塑智能終端的交互邊界。新一代終端通過集成先進(jìn) 的感知硬件和 AI 算法,顯著提升了環(huán)境理解能力。這種感知能力的躍升不 僅提升了產(chǎn)品體驗(yàn),更重要的是拓展了人機(jī)交互的新維度,使設(shè)備能更好地 適應(yīng)和響應(yīng)復(fù)雜的現(xiàn)實(shí)場景需求。 AI 正在讓智能終端從固定場景突圍走向全場景融合。傳統(tǒng)智能硬件往往囿 于單一功能定位,如音箱主打語音控制、耳機(jī)專注音頻體驗(yàn)。而新一代終端 通過 AI 賦能實(shí)現(xiàn)了跨場景能力,從字節(jié) OlaFriend 集成翻譯、學(xué)習(xí)、社交 功能,到百度 AI 眼鏡支持視聽、導(dǎo)航、交互等多模態(tài)應(yīng)用,都展現(xiàn)出智能 終端正從專用工具向全能助手演進(jìn)。這種融合趨勢將給智能終端市場帶來 新一輪創(chuàng)新周期。 端側(cè) AI 的發(fā)展已從單一功能創(chuàng)新走向全方位突破。在手機(jī)、PC、智能駕駛 和新型智能終端等領(lǐng)域,廠商正通過端云協(xié)同架構(gòu)和多模態(tài)技術(shù)提升用戶 體驗(yàn),通過場景創(chuàng)新和生態(tài)布局構(gòu)筑競爭優(yōu)勢,只有搶占技術(shù)高地的廠商才 能夠搶占市場先機(jī)。
5. 多方協(xié)力推動中文語料積累,AI 應(yīng)用生態(tài)日益完善
5.1. 中文語料匱乏成發(fā)展瓶頸,數(shù)據(jù)共享與合規(guī)問題亟待解決
數(shù)據(jù)質(zhì)量直接決定 AI 模型性能上限,成為產(chǎn)業(yè)發(fā)展瓶頸。GPT-3 在訓(xùn)練前 有 45TB 的純文本數(shù)據(jù),經(jīng)過質(zhì)量過濾后,有效數(shù)據(jù)僅占 1.27%,這種低效 率正在加劇算力資源的緊張。特別是在預(yù)訓(xùn)練+微調(diào)成為新范式的背景下, 高質(zhì)量數(shù)據(jù)對模型性能的影響更為關(guān)鍵,這促使產(chǎn)業(yè)界從以模型為中心加 速轉(zhuǎn)向以數(shù)據(jù)為中心。 高質(zhì)量數(shù)據(jù)面臨耗盡危機(jī),亟需尋找新的突破路徑。《Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning》預(yù)測顯示, 高質(zhì)量語言數(shù)據(jù)將于 2026 年耗盡,這種稀缺性正在重塑產(chǎn)業(yè)格局。特別是 在中國 AI 領(lǐng)域,數(shù)據(jù)供給生態(tài)不完善、獲取成本高等問題更為突出。面對 這一挑戰(zhàn),采用技術(shù)手段自動合成數(shù)據(jù)正成為重要解決方案,Gartner 預(yù)計(jì) 到 2024 年,用于訓(xùn)練大模型的數(shù)據(jù)中將有 60%來自合成數(shù)據(jù)。 中文數(shù)據(jù)短板讓數(shù)據(jù)緊缺進(jìn)一步加劇,制約著國產(chǎn)大模型的突破。根據(jù)阿 里研究院 2024 年 5 月的數(shù)據(jù),目前全球網(wǎng)站中,中文語料內(nèi)容占比僅為1.3%,遠(yuǎn)低于英文的 59.8%。特別是在金融、醫(yī)療、法律等專業(yè)領(lǐng)域,高質(zhì) 量中文訓(xùn)練數(shù)據(jù)更為稀缺。這些問題不僅限制了國產(chǎn)大模型的性能提升,也 在一定程度上影響了中國AI技術(shù)在國際市場的競爭力。從產(chǎn)業(yè)發(fā)展趨勢看, 中文語料建設(shè)的短板正催生巨大的市場機(jī)會,預(yù)計(jì)未來將有更多資本和技 術(shù)力量投入這一領(lǐng)域。
數(shù)據(jù)孤島和共享障礙成為產(chǎn)業(yè)發(fā)展的掣肘,數(shù)據(jù)共享平臺、提供數(shù)據(jù)中間 件服務(wù)等新型業(yè)態(tài)有望成為重要方向。與英語世界的 Common Crawl 等開 放數(shù)據(jù)機(jī)構(gòu)相比,中文世界缺乏有效的數(shù)據(jù)共享機(jī)制。各大平臺基于商業(yè)競 爭考慮,對數(shù)據(jù)共享持謹(jǐn)慎態(tài)度,這種封閉生態(tài)不利于行業(yè)整體發(fā)展。當(dāng)前 中文數(shù)據(jù)的割裂狀態(tài)不僅增加了數(shù)據(jù)獲取成本,也影響了語料的整體質(zhì)量 和覆蓋面。特別是在用戶行為數(shù)據(jù)、交互場景數(shù)據(jù)等高價值數(shù)據(jù)領(lǐng)域,行業(yè) 壁壘更為明顯。開源共訓(xùn)模式的興起有望改變這一現(xiàn)狀,特別是在中國有望 成為全球最大數(shù)據(jù)圈的背景下,數(shù)據(jù)開放共享的價值更為突出。 語料建設(shè)從重規(guī)模向重質(zhì)量轉(zhuǎn)型,催生新的商業(yè)機(jī)遇。"大力出奇跡"的發(fā)展 模式已經(jīng)難以為繼,從數(shù)據(jù)清洗、標(biāo)注到合規(guī)咨詢,從中間件服務(wù)到數(shù)據(jù)交 易平臺,一系列新型數(shù)據(jù)服務(wù)業(yè)態(tài)正在形成。特別是在構(gòu)建合成數(shù)據(jù)和專業(yè) 數(shù)據(jù)集方面,具備相關(guān)能力的企業(yè)將獲得更大的發(fā)展空間。 版權(quán)與監(jiān)管約束限制數(shù)據(jù)開放,體系建設(shè)亟待完善。中文數(shù)據(jù)在開放共享 方面面臨諸多法規(guī)政策限制,大量高價值公共數(shù)據(jù)因版權(quán)和合規(guī)問題難以 轉(zhuǎn)化為訓(xùn)練語料。雖然政府部門和國有企業(yè)掌握著豐富的數(shù)據(jù)資源,但受制 于數(shù)據(jù)安全、隱私保護(hù)等監(jiān)管要求,開放程度仍然有限。同時,現(xiàn)有中文大 模型過度依賴英文數(shù)據(jù)訓(xùn)練的問題也日益凸顯,導(dǎo)致模型輸出存在明顯的 文化語境缺失,對本地化應(yīng)用形成掣肘。這一現(xiàn)狀催生了對合規(guī)數(shù)據(jù)服務(wù)的 迫切需求,專業(yè)的數(shù)據(jù)合規(guī)咨詢、治理服務(wù)有望成為新的業(yè)務(wù)增長點(diǎn)。
5.2. 中文語料資源加速累積,行業(yè)聯(lián)盟協(xié)同發(fā)力
中文語料建設(shè)進(jìn)入快速發(fā)展期,產(chǎn)業(yè)化進(jìn)程明顯提速。2024 年上半年,中 國 AI 語料建設(shè)迎來多個具有里程碑意義的重大項(xiàng)目。其中最具代表性的是 智源研究院 4 月發(fā)布的中文互聯(lián)網(wǎng)語料庫 CCI 2.0,該項(xiàng)目總規(guī)模達(dá) 500GB, 涵蓋 1.25 億個網(wǎng)頁的高質(zhì)量數(shù)據(jù)內(nèi)容,為大模型訓(xùn)練提供了可靠的中文語 料支撐。CCI 2.0 的重要性不僅體現(xiàn)在其規(guī)模上,更在于其建立了嚴(yán)格的數(shù) 據(jù)質(zhì)量管理體系,通過多輪清洗和質(zhì)量把控,確保了語料的準(zhǔn)確性和可用性。 同期,中國互聯(lián)網(wǎng)協(xié)會召開的"大模型中文語料庫的發(fā)展現(xiàn)狀與高質(zhì)量發(fā)展 路徑"研討會,深入探討了數(shù)據(jù)清洗和合規(guī)操作的標(biāo)準(zhǔn)化問題,為行業(yè)發(fā)展 指明了方向。 多方聯(lián)動構(gòu)建數(shù)據(jù)生態(tài),產(chǎn)業(yè)協(xié)同效應(yīng)逐步顯現(xiàn)。2024 年 7 月世界人工智 能大會期間,語料主題論壇的召開成為行業(yè)發(fā)展的重要催化劑。會上發(fā)起的 "語料生態(tài)服務(wù)大模型可持續(xù)發(fā)展倡議"獲得 50 余家企業(yè)響應(yīng),展現(xiàn)了產(chǎn)業(yè) 各方協(xié)同推進(jìn)的決心。該倡議著重強(qiáng)調(diào)構(gòu)建數(shù)據(jù)共享、資源合作和第三方服 務(wù)的生態(tài)機(jī)制,為打破數(shù)據(jù)孤島提供了可行路徑。特別值得關(guān)注的是論壇上 推出的語料運(yùn)營平臺 1.0,該平臺集成了數(shù)據(jù)采集、清洗、標(biāo)注、測試和應(yīng) 用的全流程工具鏈,極大提升了語料供給的效率和質(zhì)量。通過產(chǎn)業(yè)聯(lián)盟的方 式推動技術(shù)創(chuàng)新和標(biāo)準(zhǔn)制定,不僅降低了單個企業(yè)的研發(fā)成本,也加快了行 業(yè)整體的進(jìn)步速度。
數(shù)據(jù)交易與開源項(xiàng)目雙輪驅(qū)動,市場空間持續(xù)擴(kuò)大。伴隨行業(yè)發(fā)展提速,中 文 AI 語料的基礎(chǔ)設(shè)施建設(shè)也在加快推進(jìn)。上海數(shù)據(jù)交易所 2023 年 9 月推 出的語料交易掛牌項(xiàng)目,為數(shù)據(jù)的規(guī)范化流通提供了重要渠道。云測數(shù)據(jù)、 浪潮信息等企業(yè)通過共建機(jī)制積極參與語料生態(tài)建設(shè),形成了良性的市場 格局。在開源領(lǐng)域,多模態(tài)語料庫"書生·萬卷"和騰訊的"AI 向善語料庫"為 行業(yè)發(fā)展注入了新的活力?;A(chǔ)設(shè)施的完善為新型商業(yè)模式的發(fā)展創(chuàng)造了 條件,特別是在垂直領(lǐng)域應(yīng)用中,專業(yè)化的數(shù)據(jù)服務(wù)平臺開始嶄露頭角,圍 繞特定場景提供定制化的語料解決方案。從產(chǎn)業(yè)鏈角度看,基礎(chǔ)設(shè)施的完善 將賦能整個生態(tài)的升級,為上下游企業(yè)創(chuàng)造更大的發(fā)展空間。
5.3. 語料產(chǎn)業(yè)鏈上下游協(xié)同發(fā)力,推動中國語料生態(tài)建設(shè)
5.3.1. 多元數(shù)據(jù)源構(gòu)建 AI 語料上游基礎(chǔ),驅(qū)動模型專業(yè)化發(fā)展
數(shù)據(jù)供給正在從量變走向質(zhì)變,合規(guī)授權(quán)成為重要分水嶺。從供給端看,互 聯(lián)網(wǎng)公司、媒體平臺和專業(yè)出版機(jī)構(gòu)通過多渠道采集構(gòu)建了龐大的多模態(tài) 數(shù)據(jù)庫,其中,中文在線等頭部企業(yè)已累積超 60TB 高質(zhì)量正版數(shù)據(jù),并與 多家 AI 模型公司建立深度合作關(guān)系。數(shù)據(jù)授權(quán)和合規(guī)建設(shè)正成為產(chǎn)業(yè)鏈上 游的新焦點(diǎn),這種趨勢將加速淘汰不合規(guī)的數(shù)據(jù)供應(yīng)商,推動市場向規(guī)范化 方向發(fā)展,具備優(yōu)質(zhì)數(shù)據(jù)源和完整授權(quán)體系的企業(yè)將在行業(yè)競爭中占據(jù)有 利地位。 隨著 AI 應(yīng)用向各行業(yè)滲透,垂直領(lǐng)域的專業(yè)數(shù)據(jù)價值日益突出。在金融領(lǐng) 域,同花順、恒生電子等專業(yè)機(jī)構(gòu)積累了大量交易和金融數(shù)據(jù);消費(fèi)領(lǐng)域中 的值得買、匯納科技等機(jī)構(gòu)在零售和電商場景數(shù)據(jù)方面具有優(yōu)勢;大宗商品 領(lǐng)域的上海鋼聯(lián)、卓創(chuàng)資訊等機(jī)構(gòu)則在能源、物流等數(shù)據(jù)積累上占據(jù)重要地 位;航運(yùn)領(lǐng)域以中遠(yuǎn)海科為代表的企業(yè)在交通運(yùn)輸數(shù)據(jù)方面也形成了獨(dú)特 優(yōu)勢。這些專業(yè)數(shù)據(jù)的價值主要體現(xiàn)在三個方面:一是具有極強(qiáng)的時效性, 能支撐實(shí)時決策;二是專業(yè)性強(qiáng),涉及核心業(yè)務(wù)流程;三是獲取門檻高,需 要長期積累和專業(yè)處理。隨著 AI 應(yīng)用從通用場景向?qū)I(yè)領(lǐng)域滲透,具備深 度行業(yè)積累的專業(yè)數(shù)據(jù)服務(wù)商有望在細(xì)分市場中獲得更大發(fā)展空間。
5.3.2. 中游環(huán)節(jié)平臺升級,寡頭構(gòu)建技術(shù)和數(shù)據(jù)的雙重壁壘
AI 數(shù)據(jù)產(chǎn)業(yè)鏈中游呈現(xiàn)寡頭競爭格局,技術(shù)和數(shù)據(jù)的雙重壁壘強(qiáng)化了頭部 企業(yè)的優(yōu)勢地位。核心企業(yè)普遍具備兩大特征:一是擁有大規(guī)模專有數(shù)據(jù)資 產(chǎn),如拓爾思積累的 2000 億條高質(zhì)量公開數(shù)據(jù);二是掌握深厚的技術(shù)積累, 如科大訊飛在語音技術(shù)領(lǐng)域的領(lǐng)先優(yōu)勢。既掌握核心技術(shù),又擁有大規(guī)模的 專有數(shù)據(jù)資產(chǎn)的雙重壁壘將使企業(yè)在市場競爭中具備持續(xù)領(lǐng)先優(yōu)勢。此外, 這些企業(yè)正從單一技術(shù)服務(wù)商向整體解決方案提供商轉(zhuǎn)型,通過"技術(shù)+數(shù) 據(jù)+服務(wù)"的深度整合提升市場壁壘。
5.4. 國產(chǎn)語料建設(shè)新銳,夯實(shí)語料根基
拓爾思已在 AI 語料建設(shè)領(lǐng)域形成全方位競爭優(yōu)勢,依托超 2000 億條高質(zhì) 量公開數(shù)據(jù)和強(qiáng)大的數(shù)據(jù)處理能力確立了領(lǐng)先地位。拓爾思擁有 40 多項(xiàng)發(fā) 明專利和 1000 多項(xiàng)軟件著作權(quán),特別是在自然語言處理領(lǐng)域,通過持續(xù)創(chuàng) 新已實(shí)現(xiàn)文本的語義理解、分類、情感分析等核心功能,為智能客服、智能 寫作等應(yīng)用場景提供了有力支撐。在多模態(tài)內(nèi)容處理方面,公司掌握自主可 控的底層技術(shù),能夠同時處理文本、音視頻等多種類型數(shù)據(jù),并在虛擬人智 能對話、內(nèi)容生成等新興領(lǐng)域取得突破。 2023 年 6 月發(fā)布的拓天大模型在媒體、政務(wù)、金融等領(lǐng)域取得顯著成果。 拓天大模型基于超過 10 年的高質(zhì)量數(shù)據(jù)積累,以及萬家以上企業(yè)級用戶實(shí) 踐,具備內(nèi)容生成、多輪對話、語義理解等十大基礎(chǔ)能力。2024 年 5 月拓 爾思與華為簽署全面合作協(xié)議,共同推進(jìn)數(shù)智化轉(zhuǎn)型,這一戰(zhàn)略合作有望進(jìn) 一步提升公司的市場競爭力。同時,公司通過"海貝"數(shù)據(jù)庫的數(shù)據(jù)資產(chǎn)平臺, 已在政府、媒體、金融等行業(yè)積累了大量優(yōu)質(zhì)客戶,持續(xù)鞏固其行業(yè)領(lǐng)先地 位。
海天瑞聲成為國內(nèi)首批完成大模型全流程語料布局的企業(yè)。根據(jù)接待調(diào)研 公告,公司已構(gòu)建包括預(yù)訓(xùn)練、指令微調(diào)和偏好對齊的全鏈條語料體系,涵 蓋"中文對話預(yù)訓(xùn)練數(shù)據(jù)集"、"多語種語音模型預(yù)訓(xùn)練及微調(diào)數(shù)據(jù)集"、"視覺 模型預(yù)訓(xùn)練及微調(diào)數(shù)據(jù)集(圖像-文本、視頻-文本)"等核心產(chǎn)品。特別是在垂 直領(lǐng)域,公司重點(diǎn)開發(fā)了醫(yī)療、金融、法律、藝術(shù)等專業(yè)領(lǐng)域標(biāo)注資源庫, 截至 2024 年三季度已為近 20 家境內(nèi)外大模型企業(yè)、科研機(jī)構(gòu)提供訓(xùn)練語 料服務(wù)。
海天瑞聲在多語種語料資源積累方面確立領(lǐng)先優(yōu)勢。截至 2024 年三季度, 海天瑞聲已沉淀超過 205 個語種/方言的語料覆蓋能力,特別是在一帶一路 沿線國家的小語種資源建設(shè)上顯著領(lǐng)先同業(yè);同時構(gòu)建了 130 個多語種發(fā) 音詞典,積累詞條超 1200 萬條。2024 年公司聯(lián)合清華大學(xué)啟動多語種語音 大模型研發(fā)計(jì)劃,通過自研數(shù)據(jù)清洗技術(shù),進(jìn)一步提升多語種語料處理效率, 強(qiáng)化了公司在語料建設(shè)領(lǐng)域的核心競爭力。
博彥科技通過"數(shù)據(jù)+技術(shù)+生態(tài)"的融合模式構(gòu)建差異化優(yōu)勢。公司自主研 發(fā)的"人工智能計(jì)算平臺"提供從數(shù)據(jù)樣本標(biāo)注、模型部署到推理服務(wù)的一站 式 AI 開發(fā)能力,通過"可視化"操作和"零代碼"開發(fā)大幅降低了 AI 應(yīng)用的開 發(fā)門檻。2024 年 7 月推出的"企業(yè)數(shù)據(jù)價值運(yùn)營方案"致力于消除數(shù)據(jù)孤島, 通過匯聚行業(yè)數(shù)據(jù)構(gòu)建專業(yè)化語料庫。特別是在醫(yī)藥等垂直領(lǐng)域,公司通過 系統(tǒng)性的數(shù)據(jù)整合,打造了專業(yè)度極高的 AI 模型訓(xùn)練體系。另外,公司擁 有全方位生態(tài)合作體系,創(chuàng)新驅(qū)動能力強(qiáng)勁。公司與百度、華為、阿里、科 大訊飛等國內(nèi)外大模型廠商建立了深度的生態(tài)及技術(shù)合作關(guān)系,成為文心 一言等產(chǎn)品的首批生態(tài)合作伙伴。
(轉(zhuǎn)自:金融小博士)
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報(bào)最新的財(cái)經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)