2022年年末,聊天機器人ChatGPT一炮走紅后,2023年國內涌現出兩百多個大模型,被稱為大模型元年,一時間掀起“百模大戰”。而從今年5月開始,在幾家大型廠商的帶領下,大模型價格戰愈演愈烈,國內“百模大戰”步入新階段。
6月3日,澎湃新聞正式推出一線財經大調研直播——《超級公司》。首期走進國內一線人工智能公司商湯科技,商湯科技聯合創始人、大裝置事業群總裁楊帆告訴澎湃新聞記者,各家廠商都是在盡可能多地去獲取用戶,“大家的一個共識是,兩三年之后這一輪大模型應用的用戶可能是今天的10倍、100倍。
時間回到半個月前。
5月15日,字節跳動在火山引擎原動力大會上正式發布豆包大模型,被認為是吹響了大廠大模型價格戰的號角。隨后,阿里、百度、科大訊飛、騰訊紛紛加入降價行列,甚至直接宣布主力模型免費。
據字節方面介紹,豆包主力模型在企業市場的定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業便宜99.3%。根據火山引擎公布的價格計算,一元錢就能買到豆包主力模型的125萬Tokens,大約是200萬個漢字,相當于三本《三國演義》。
一周后,5月21日,阿里云宣布,通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味著,一元可以買200萬tokens,相當于五本《新華字典》的文字量。同一天,百度智能云在幾小時后宣布,文心大模型兩大主力模型全面免費。
5月22日,科大訊飛跟進降價,宣布訊飛星火API能力正式免費開放,訊飛星火Lite API永久免費開放,頂配版(Spark3.5 Max)API價格為0.21元/萬Tokens。騰訊云也在當天宣布,混元大模型全面降價,其主力模型之一的混元-lite模型價格從0.008元/千tokens調整為全面免費。
而在更早之前,國內大模型公司智譜AI宣布,個人版/入門版GLM-3 Turbo模型調用價格由5元/百萬tokens降為1元/百萬tokens,相當于0.001元/千tokens。幻方量化旗下DeepSeek(深度求索)也在發布第二代MoE模型DeepSeek-V2時,稱其“性能比肩GPT-4”,并報出每百萬token輸入1元、輸出2元(32K上下文)的低價。
大模型價格戰,到底在“打”什么?
免費的只是基礎版。科大訊飛就曾在投資者關系活動上表示,訊飛人工智能開放平臺面向全行業提供人工智能能力和整體解決方案,以免費+扶持的策略為主,基本能力免費,對于其他企業做不了的、性能更高的、個性化的定制服務收費。
在大模型“開卷”低價的背后,有技術進步的支持、爭奪市場的需求,也有更加現實和長期的考量。
百度智能云也有千帆·行業增強版,在大模型服務方面,企業可以在千帆平臺上自由選擇不同參數規模、不同上下文長度、不同細分領域的大模型,然后按需擴展行業模型、行業知識、行業智能體。不過,百度并未公布千帆·行業增強版的具體價格。
宣布降價后,火山引擎總裁譚待在接受澎湃新聞等媒體采訪時,談到了大模型的定價策略:“背后主要有兩個原因:第一點是我們能做到,第二點是我們需要這么做。”他介紹,火山引擎在技術上有非常多優化手段,可以降低大模型成本,在工程上可以通過分布式推理的形式將底層算力使用得更好;另外,在混合調度方面,可以把不同負載作為混合調度,這樣的成本也大幅下降。
阿里云相關人士也對澎湃新聞記者表示,能夠推出低價大模型“主要靠技術層面”。
據研究機構IDC預計,2026年中國AI市場的規模將達到264.4億美元,2021年至2026五年復合增長率(CAGR)將超20%。有了技術的支持,在競爭激烈的市場內,廠商開始“卷”起低價。
楊帆向澎湃新聞記者表示,各家廠商都是在盡可能多地去獲取用戶,“大家的一個共識是,兩三年之后這一輪大模型應用的用戶可能是今天的10倍、100倍。如果是這樣,今天花多少錢去獲客都是不虧的,這意味著你占據了先手。所以從這點上來講,很多C端(客戶端)的應用和互聯網早期有一定的類似性”。
順福資本創始人、行行AI董事長李明順也指出,為了爭奪市場占有率,大模型價格戰的到來是“必然的”。隨著規模效應的展開,“笑到最后的肯定能賺錢,這個就是定價策略的問題”。
此外,有多位業內人士對澎湃新聞記者談到,價格戰也是一種促進AI應用發展、培養行業生態,并為廠商收集數據的手段。
在宣布降價的阿里云武漢AI智領者峰會現場,阿里云智能集團資深副總裁、公共云事業部總裁劉偉光坦言:“阿里云這次大幅降低大模型推理價格,就是希望加速AI應用的爆發。我們預計2024年大模型API的日調用次數有望突破100億。”
作為基礎大模型與用戶端之間的“中間廠商”,瀾碼科技的CEO周健表示,價格戰出現的本質原因其實是各大廠商之間在競爭數據,“大模型廠商實際上在燒錢進行大量的投入,有點類似于當年‘百團大戰’、滴滴和快的打車競爭的格局。我認為,大模型廠商并沒有太考慮定價能否cover(覆蓋)成本或帶來利潤,從大模型廠商的商業策略講,現在降價的主要目的更多還是收集數據,在投入期,沒到能夠賺錢的地步。”
周健進一步指出,大模型企業希望能有更多的C端,找到不同的場景,而不再去強調做了多少億參數的模型、是GPT-4的七成、八成還是九成。
步入新階段后,大模型如何成為“剛需”
不過,對于價格戰是否意味著百模大戰已經進入下半場,業內人士有不同的觀點。
李明順認為,價格戰意味著大模型進入一個新的局面,但并不是大模型的下半場,“現在僅僅是大模型企業在C端競爭過程中,進入到肉搏階段。”
作為大模型行業內的初創企業,制作API集合工具包的藍雨AI聯合創始人北山也對澎湃新聞記者表示,這次價格戰或許只是一次“比較小的波瀾”,對于C端客戶來說感受并不強烈。但在資本要素等多種因素的影響下,大模型價格戰“可能會一直持續到出現一個壟斷式的爆款”。
經歷過價格戰之后,競爭激烈的大模型賽道究竟會走向何方?
據億歐智庫發布的《2024中國“百模大戰”競爭格局分析報告》,通用大模型歷經創業爆發期,預計市場將于2025至2026年逐漸出清,優勢企業堅守戰場,剩余企業陸續退出競爭;2027至2028年,通用大模型市場將呈現寡頭競爭格局。垂類賽道則將成為大模型產業激烈競爭的領域,預計在2023至2024年,部分行業場景率先落地;2029年以后初步市場出清,各細分行業呈現碎片化競爭格局,應用層獲取的市場價值日趨增長。
目前看來,不管是對企業用戶還是對個人用戶來說,大模型都尚未成為一種“剛需”,這或許是最需要廠商攻克的一大難題。
北山強調:“這個行業目前遇到的一個最大的卡點,其實不在于成本,而是沒有一個大模型或者應用,能夠讓大部分用戶不用不行。”
楊帆也對澎湃新聞記者表示,中國很多的應用還沒有被真正激活和打開,“更多的熱潮其實是來自媒體、投資圈的關注,90%甚至99%的人,可能都沒有真正的日常地去使用體驗或者感受到這樣的技術。”
楊帆認為,技術的進步只是一個維度,更多的維度是怎么樣去跟進、去保持,以及怎樣讓這些技術真正的成為應用,成為每一個場景中和每個人日常生活息息相關的東西,“技術的進步如果不能夠解決現實問題,它就是炫技的‘屠龍之術’,沒有意義”。而對中國而言,更有意義和更有價值的,就是應用落地的優勢,以實用為本。
騰訊云副總裁、騰訊混元大模型負責人劉煜宏在接受澎湃新聞等媒體采訪時,曾談及對于大模型“內卷”的看法,稱現在的大模型能力還遠遠達不到高頻的用戶需求,和場景匹配度較低,導致滲透率還不足。
此外,如何找到適合自己的商業模式,也是大模型廠商要面對的長期問題。
李明順表示,目前,尤其在C端(客戶端),大模型還沒有找到最佳的商業模式,通過會員收費(的模式)已經被價格戰削弱。但從長遠來說,這也許是可行的,因為人工智能可以結合一些應用,比如說C端的社交,還有各種平臺的娛樂屬性,打造出新型產品。
李明順進一步指出,目前的價格戰,有利于有流量的公司,而一旦有了市場占有率之后,不管是什么樣的產品形態,都可以像互聯網模式那樣進行收費。在B端,也可以搶占更多的產業的場景,把自家的大模型嵌入進去,但大模型企業也正面臨和互聯網一樣的問題,也就是“在產品技術沒有絕對領先、產品同質化的情況下,如何獲取用戶”。
關于大模型企業是否已經突破之前的算力問題,周健向澎湃新聞記者表示:“算力瓶頸實際上是在訓練端,不是在推理端,推理端可以通過小型化之類的方法解決。除了算力,大模型企業現在面臨的是場景問題,也是產品本身定義的差異化問題。通過降價的方式去收集數據,也是為了確認什么樣的場景適合誰,進而做差異化競爭。”
責任編輯:王若云
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)