文|戴菁?
一年一度的百度世界大會,已經成為觀察百度AI戰略動向以及行業趨勢的一個窗口。
在2024百度世界大會上,李彥宏看起來比去年更為篤定。他說,基礎模型能力就緒,我們即將迎來AI應用的群星閃耀時刻。
當2023年下半年大模型混戰逐漸出現分野,李彥宏就提出「卷模型不如卷應用」。但從隨后的行業發展動態來看,國內應用之「卷」集中在了類ChatGPT的AI助手層面,其他領域出現顛覆式創新的AI應用鳳毛麟角。
其中一個原因,創新是有認知門檻的,開發AI應用也是有技術門檻的。
或許是意識到了這一點,李彥宏和百度今年進一步向大模型戰略聚焦,押注智能體的爆發。
如果現在要問百度的第一性原理是什么,答案越來越清晰——應用驅動。李彥宏還給這個「應用驅動」加了一個有別于移動互聯網時代的注解,「不是要推出一個‘超級應用’,而是要不斷地幫助更多人、更多企業打造出數百萬‘超級有用’的應用。」
01
「做工程不丟人」
過去24個月,萬眾期待的AI超級應用還是沒有蹤影。一些人不禁懷疑:全球性的大模型狂熱究竟是一場新的技術革命,還是新一輪泡沫?
但如果默念茨維格在《人類群星閃耀時》中所寫的:「那些歷史的尖峰時刻都需要太長的醞釀時間,每一樁影響深遠的事件都需要一個發展的過程」,旁觀者或許會更篤定一些。
作為這股AI浪潮最早和最深的參與者,李彥宏提前看到那個「尖峰時刻」。他對AI應用即將爆發的判斷,主要依據有兩個:
其一,底層技術突破。過去24個月,AI行業最大的變化是大模型基本消除了幻覺,回答問題的準確性大幅提升。基于檢索增強技術的進展,百度年初切入iRAG(image based RAG)——即檢索增強的文生圖技術,進一步讓文生圖也能消除幻覺,從而讓AI在影視、漫畫、連續畫本、海報制作等領域落地。
▲根據「愛因斯坦在天壇」提示詞生成的圖片
左為文心iRAG作品? 右四均為其他大模型生成作品
其二,大模型調用量爆發,開發者覺醒。今年5月,文心大模型API日調用量達到2億。當時百度高管們在會上討論一個問題,大模型怎么就算「成了」?李彥宏給出的量化指標是,日均API調用量一年內漲10倍。這說明大家是真需要。到11月初,文心大模型的API日調用量超過15億,比預期發展快了不少。
還有一個現實原因是李彥宏會上并未展開的——調用成本。過去兩年內,大模型每個Token的使用成本下降了超過 99%。以美國為例,現在大模型處理100萬個Token的成本僅為60美分。在國內,百度的一些模型甚至免費提供。
從會上傳遞的信息來看,百度目前重點押注兩大應用方向:面向to C端的智能體,以及面對to B端的產業應用。
據我們觀察,在to C端,大模型技術應用的廣度可能比技術樂觀派的預期還要高,因為許多使用場景并不局限于App等傳統產品形態。
比如我的一名律師朋友,有時會讓AI幫著做一個簡單的法律協議,他自己改改就能交給客戶。如果是其本人擬這份協議,最起碼要用半小時。完成這一交互,他甚至不用專門下載AI工具類App,只通過一個法律行業公眾號就能輕松獲取。
可以說,AI應用場景無處不在,但產品形態未必跟從前一樣。去年在大模型爆發之初,人們就憧憬著AI的iPhone時刻將在大模型領域復刻,諸如移動互聯網時代的《憤怒的小鳥》、Instagram等超級應用,也會很快在大模型領域出現。
一年后,超級AI原生應用還沒有出現,但新的共識逐漸形成:智能體將會成為AI應用的主流形態——
數月前,OpenAI發文稱,在谷歌、蘋果等科技巨頭的帶動下,2025年將是AI Agent最終成為主流的一年。在百度世界大會上,李彥宏再次給出智能體的判斷:智能體是大模型最重要的發展方向,即將迎來它的爆發點。
按照AGI的進化順序框架,智能體被視為Copilot的下一個階段,它們具備一定自主性,能夠執行長期任務,比如與環境進行多次交互、協同工作等,并且擁有自我進化能力。
目前全球很多頂尖科技公司都在關注智能體,但李彥宏在會上透露,百度已經把智能體作為大模型的最重要戰略方向。
理由就在于,智能體的門檻足夠低,天花板又足夠高。去年行業已經意識到應該卷應用,但具體怎么做、怎么從模型變成應用,這里面有太多不確定性,也讓很多人望而卻步。從移動互聯網時代的產品形態變化來看,每一次降低產品門檻,都會帶來一個應用范式的爆發。最典型的是從App到小程序的遷移,微信生態從中受益匪淺。
智能體也有相似之處。當平臺為開發者提供了一個高效、簡單的路徑,在大模型上構建智能體越來越方便,「勢」就會匯聚起來。像文心智能體平臺上,目前已吸引了15萬家企業和80萬名開發者,每周都有上萬個新的智能體被創造出來,其中還有11歲小學生創造的智能體,然后通過搜索和其他渠道分發出去。
不過從李彥宏的發言來看,百度不是要推出一個超級應用,而是要幫助更多人、更多企業打造數以百萬「超級有用」的應用。
言外之意,百度在AI時代的生態護城河寬度,未來要靠這些應用來構建了。
由此就不難理解,為什么AI領軍人物中沒有比李彥宏更著力于應用落地的人了。百度的AI優勢,更多體現在底層技術和模型層。而技術的成功與否,最終取決于它在真實生活中的應用。就像DeepMind 創始人、微軟AI CEO蘇萊曼在最近的一次交流中所強調的,一個沒有明確用途的AI模型,不過是一個引人入勝的計算機科學展示。
02
「自由畫布」式的智能體
開始涌現
智能體的爆發離不開「有用」。
李彥宏此前提醒,要避免掉入「超級應用」的陷阱。在AI時代,「超級能干」的應用恐怕比只看DAU的「超級應用」更重要。
結合國內主要智能體平臺上的案例來看,目前公司類智能體、角色智能體、工具類智能體、行業智能體是幾個主要發展方向。
這其中,公司類智能體被認為是于AI時代的公司官網。結合百度的搜索引擎底色,我們認為,這一類智能體是百度搜索的增量機會所在,公司類智能體是百度升級與KA客戶關系、提供更多價值的一個觸點。
據百度官方數據,比亞迪的官方智能體上線后,銷售線索轉化率提升了119%。
不過在整場世界大會中,參會者最感興趣、最能讓人眼前一亮的當屬工具類智能體「自由畫布」。這個由百度文庫和百度網盤聯合發布的AI創作新物種,在面向公眾開啟邀測首日,已吸引超20萬人排隊預約。?
根據現場演示,「自由畫布」就是一個由文心多模態大模型加持的萬能白板,是百度文庫、百度網盤行業首創的內容操作系統。
通過大模型技術,「畫布」打通了公域與個人授權的私域內容,通過「一拖一圈」的極簡操作,實現對多格式、全模態文件的混合理解、生成、創作,并支持對富媒體文檔的一鍵分享和存儲,實現了輸入、編輯、創作、分享自由。?
今年9月,百度集團宣布,網盤C端業務重新劃歸移動生態事業群組(MEG),并由百度副總裁、文庫事業部負責人王穎接管。如果當時不少人還對這一決策邏輯感到不解。如今「畫布」揭幕,通過AI能力進一步打通和重構,文庫和網盤已經成為全新的智能生產力。
在上述四類智能體中,從商業化角度,《降噪NoNoise》同樣關注行業智能體的前景。僅以保險行業為例,此前有專注大模型to B方向的AI創業者告訴我們,在這個30萬億規模的市場,部分保險經紀人的傭金能占到客戶投保金額的20%-40%。如果大模型將保險專業知識沉淀為AI產品,繼而能在一些簡單險種上為客戶制定投保方案,會非常有前景。
比如號稱「免費AI律師」的法律智能體「法行寶」,上線半年已經回答超1660萬個法律問題。產品信息顯示,該智能體由百度自己下場創造的,主界面提供對話交互以及法律計算器、智能法律文書、在線法律意見書等免費工具,還有相似判決案例鏈接可以查閱。
比如用戶可以就一起交通事故、一次工傷,詢問賠償方案、如何計算索賠金額,也可以請智能體代寫一份起訴書。以往有這些法律咨詢方面的需求時,普通人要么付費求助于專業律師,要么自己在繁雜的互聯網中搜索,但要同時承擔信息不全或者不準確的風險。
當然也有律師指出,基于專業知識積累和個人經驗而提出的法律策略、分析判斷等專業法律服務,是AI目前還很難做到的地方。
換個角度想,這或許正是智能體未來的想象空間,因為智能體本身是一個有自主性、會持續學習和進化的產品形態。
不過有必要指出的是,并非基礎設施齊備了,就會出現智能體的涌現。一個應用方向的爆發,離不開清晰的商業化刺激。2012年,當《憤怒的小鳥》登陸iOS平臺并且大獲成功后,通過iOS端的下載付費和安卓端的廣告植入,其背后的游戲開發公司當年收入較上一年增長101%,達到1.5億歐元。
關于這一點,OpenA聯合創始人山姆·奧特曼也有預警。在最近一次專訪中,他不忘提醒創業者:通過更快地擁抱新技術,你可能會獲得短期的爆發式增長,但長期來看,你仍然需要構建一個能持續提供價值的產品或服務。「每個人現在都能做出非常棒的演示,但要真正構建一個成功的商業,那才是關鍵所在。那是最艱難的部分,而商業規則仍然適用。」
據我們了解,目前文心智能體平臺已經逐步跑通商業閉環,實現智能體從開發,到分發,再到變現。單個智能體的單次轉化最高收入達到了10萬元,其背后是鏈接掛載、商品轉化、線索轉化、聯盟廣告和膠囊位等商業組件的全方位支持。
03
長期主義、理想主義、現實主義
缺一不可
中美AI巨頭經常被拿來對比。相比美國AI同行對于AGI的宏大愿景、以科學研究和底層突破為驅動的做法,從世界大會上的表態來看,百度是典型的工程思路、應用驅動。
會后接受《甲子光年》專訪時,李彥宏直言,「做工程不丟人。做工程很有可能是比科學更早發現機會、發現規律的。」就像飛機是先飛上天了,人們才開始研究,原來有一個東西叫空氣動力學。所以百度的AI路線是優先解決大家在場景和應用中遇到最多的技術問題。
乍看上去,這與李彥宏的社會標簽有一定反差。百度10年1700億研發投入的故事已經為公眾所熟知,李彥宏的「長期主義」、「未來主義」標簽也早已得到業內認可。
比如去年9月,李彥宏同馬斯克、黃仁勛、奧特曼一起入選《時代》周刊全球AI領袖時,《時代》的評語就是,「李彥宏是中國最杰出的未來主義者,長期投身于AI發展的浪潮。」在近期沙利文發布的《2024年全球AI生態全景概覽》報告中,百度被列入AI-Native Giant,與谷歌、OpenAI位于同一象限。
未來主義少不了理想色彩,但應用驅動的策略看起來又很現實。
看似矛盾的地方,或許取決于參與者如何看待人工智能革命的本質。如果AI會帶來一次新的工業革命,那這場變革不是三五年就能結束的,可能會在未來幾十年持續向社會的方方面面去滲透。作為置身其內的變革參與者,既需要耐心,也少不了源源不斷的、真金白銀的投入,然后以商業上的成功、生態上的高墻,保持在全球競爭中的頭部位置。
正如李彥宏在此前受訪時所預判的:未來兩到三年,AI競爭會非常激烈,「至于說誰會是最后的贏家,我的看法是誰賺錢誰就能活下來。」
這或許是李彥宏不厭其煩的布道、呼吁大家做智能體、把AI用起來的一個初衷;也是百度一邊自己下場做「自由畫布」「法行寶」等智能體應用,一邊做工具、做基礎平臺,不斷去降低開發者應用開發門檻的動機。
比如世界大會上的另一個重磅發布——無代碼開發工具「秒噠」,這個被李彥宏稱為「迄今為止人類歷史上最復雜的多智能體協作工具」,為的就是讓每個人都具備程序員的能力,會說話就能做出應用。此前在設計領域,海外的Cursor和Replit等產品已經實現在不敲代碼的情況下,只靠用戶的自然語言指令就能生成應用界面。
▲百度發布的無代碼工具「秒噠」,只要用中文描述需求,并補充一份帶有大會時間地點主題的文檔,就可以指揮多個智能體協作,完成報名系統的開發。
這類工具又個共通的底層邏輯——讓普通人靠創意就能賺錢。如果類似想法能夠落地,AI應用無疑距離大規模爆發更近一步。我們也注意到,盡管「秒噠」明年一季度才會上線,據悉已經吸引超過5000家企業排隊測試。
沿著前面的思路,同樣可以理解百度為什么沒在OpenAI的Sora驚艷出場后,投入到中國版Sora的競爭當中。在李彥宏看來,Sora和多模態是兩回事。Sora本質上是任意場景下的視頻生成能力,這件事非常有意義,但真正做到需要長期燒錢。
但這并不意味著百度不做多模態,「我們非常非常看好多模態,也在多模態上有非常長期的投入,在真正有應用場景的地方,我們的多模態能力是非常強的。」?百度只是選擇更落地的方向推進。比如「自由畫布」,便是多模態AI功能all in one的平臺。
李彥宏在大會當日的專訪尾聲被問及有何寄語,他談到,人工智能的革命不是三五年就結束,它更像是三五十年對于社會的全方位重構。需要長期主義、理想主義和現實主義三者相結合。
對于百度來說,未來與現實,或許正是AI戰略的一體兩面。
參考資料:
[1]《對話李彥宏:應用驅動是百度的第一性原理,基礎模型兩年一個大版本就夠了》,甲子光年
(聲明:本文僅代表作者觀點,不代表新浪網立場。)