財經科技創事記

大模型價格戰，還能再狠一點

2024-05-30 21:30:49 創事記作者：

來源：遠川研究所

誰也不曾想到，大模型產業的首次“集體會戰”，居然圍繞價格展開。

5月6日，私募巨頭幻方旗下的深度求索，打響了降價第一槍。深度求索發布的模型DeepSeek-V2（32k），在數學、編程、中英文等能力上已逼近GPT-4；然而，DeepSeek-V2的使用價格僅約為GPT-4o的1/35。

DeepSeek-V2的輸入與輸出價格分別為1元/百萬tokens和2元/百萬tokens，遠低于市場價。

比拼多多砍一刀還便宜的價格，驚動了不少美國專家。知名分析師Dylan Patel讀完DeepSeek-V2的論文后，激動地表示，“這可能是今年最好的一篇。[1]”

DeepSeek-V2的論文

一周后，“卷王”字節跳動又添一把火。

豆包通用模型Pro-32k的輸入價格，被一刀砍到了更低的0.8元/百萬tokens。火山引擎總裁譚待表示，“豆包比行業價格低了99.3%，大模型從此以厘計價。”

眼看友商如此不講武德，其他科技公司再也坐不住了。

阿里率先回擊，一狠心，大舉下調了所有模型的價格。

幾個小時后，百度干脆沖向競價終點：宣布兩款輕量級模型全面免費。緊接著，科大訊飛星火Lite API、騰訊混元大模型lite 256k也相繼宣布免費。

如此盛況，很難不讓人夢回那段滴滴大戰快的、ofo摩拜互扯頭發的激情歲月。

然而，圍繞大模型的價格戰，遠不如網約車、共享單車那般直觀，各種專業名詞讓人摸不著頭腦。所以，這些大模型公司，到底在熱鬧些什么？

價格戰的B面

想要理解這點，首先得知曉大模型的商業模式。以阿里云為例，它所提供的大模型服務，共有3種[2]：

（1）基礎服務：模型推理。

模型推理，指的是根據輸入的信息內容，給出回答的過程。換句話說，推理就是“實際使用”模型的過程。

阿里云預置了多個性能不同的“標準版模型”，供用戶推理。該服務的計費方式很簡單，即“以量計價”：以消耗的token數量為單位，用得越多，費用越高。并且性能越好的模型，收費越貴。

token是大模型用來衡量文本長度的一種計數單位，可以簡單理解為“字數”。3本篇幅為75萬字的《三國演義》，大約需要125萬個token。

（2）進階服務：模型微調。

如果覺得“標準版模型”不好用，阿里云還提供了“定制研發”服務，即模型微調。具體收費，則取決于“定制研發”消耗的計算資源與開發周期。

（3）超進階服務：模型部署。

當用戶需要長期使用大模型時，最好的方式是將它部署到獨占實例中。

獨占實例，指的是直接承包一個或多個物理服務器的全部資源。翻譯成人話就是，不再只是租一個商鋪，而是將整個商業廣場都租下來。

這么做的好處在于，沒有別的商戶和你搶計算資源，響應速度更快。

其收費模式，也是以量計價，但有兩種形式：阿里是直接按照“商業廣場”消耗的計算資源計費；除此之外，百度還支持按照模型推理的token數量計費。

這3種收費模式，面向的是企業與個人開發者，代表了大模型開發由淺入深的過程。而各大科技公司瘋狂砍價的，其實是上文提到的“基礎服務”，即“標準版模型”的推理費用。

推理費用的具體定價，又分成了“輸入”和“輸出”兩部分。

簡單來說，輸入就是用戶提問的內容，而輸出則是大模型的回答。科技公司往往會根據輸入和輸出的token數量（字數），進行兩次計費。

這種復雜又細微的差異，很容易成為科技公司的套路。

例如字節跳動的“0.8元/百萬tokens”“比行業價格低99.3%”，其實只是輸入價格。豆包通用模型Pro-32k的輸出價格仍是2元/百萬tokens，與DeepSeek-V2等同行持平。

由此可見，別看大模型價格戰打得火熱，背后實則另有洞天。

降價的千層套路

可以發現，本輪價格戰最為活躍的，基本上都是云計算公司，代表廠商是BAT和字節跳動。

它們之所以敢如此降價，還是因為能從別的地方彌補損失，羊毛出在羊身上。

正如前文提到，降價乃至免費的，其實只是基礎服務。

毫無疑問，這可以幫助中小開發者以更低的成本構建應用。然而，當開發者或者企業，需要更貼合自身業務，深入使用大模型時，往往繞不開進階的模型微調和模型部署——這兩項服務，可不是本次價格戰的主角。

例如百度宣布免費的ERNIE-Speed-8K，如果實際部署，收費就變成了5元/百萬tokens[3]。

與此同時，各家降價最狠的，其實都是輕量級的預置模型；相比之下，性能更強悍的“超大杯”模型，實際降價幅度沒有那么夸張。

例如阿里的Qwen-Max，實際與字節跳動的豆包通用模型Pro-32k一樣，只是降低了輸入的價格；而隔壁的百度，壓根沒提超大杯模型。

云計算廠商的價格戰，更像是用“免費游戲”的形式吸引更多玩家加入；但若想繼續“升級變強”，該氪金還得氪金。

當然，云計算廠商并非唯一的參與者。

以深度求索與智譜AI為代表的明星初創公司，之所以也敢跟進內卷，很大程度上是因為有充足的彈藥，尤其是算力資源。

早在大模型尚未爆發的2020年，背靠私募巨頭幻方的深度求索，就投資了上億元籌建AI超級計算機。

目前，幻方是除BAT、商湯、字節跳動外，第六家擁有1萬張以上英偉達A100 GPU儲備的中國公司[4]。

而智譜AI則背靠阿里和騰訊，是估值過百億的AI獨角獸公司。

2020年時，智譜AI也碰巧囤積了不少GPU資源。其CEO張鵬曾在接受《中國企業家》采訪時提到：

當時，他認識的一家云計算廠商，有一批GPU積灰了。這批GPU原本是供應給游戲公司的，但陰差陽錯之下，對方又不買了。張鵬知道這個消息后，順勢接盤了這批計算資源[5]。

現金流、算力資源都充足的情況下，即便燒錢換市場，這些初創公司也能扛得住。

那么問題來了：當年移動互聯網補貼換市場，尚可以簡單粗暴地歸因為“技術門檻低”；主打一手高科技的大模型，怎么也沒走出價格戰的怪圈？

必經之路

大模型智能化帶給世人的震撼，往往讓人忽視它的本質，其實是一種基礎設施。

去年，知名計算機科學家吳恩達曾在公開演講中提到：

AI其實是一系列工具的集合。這些工具包括了監督學習、非監督學習、強化學習，以及現在的生成式人工智能。所有這些都是通用技術，意味著它與電力和互聯網等其他通用技術，并沒有什么區別[6]。

電力與互聯網，并沒法直接創造價值；真正改變世界的，其實電燈、電腦、電商、電子游戲。

然而，應用的爆發其實有一個前提：即基礎設施足夠便宜。此前，大模型應用沒能快速鋪開的一個主要困境，正是使用成本過高。

哄哄模擬器就是一個典型的案例。

今年年初，一位名叫王登科的獨立開發者，開發了一款模擬“生氣女朋友”形象的AI應用。該應用的玩法很簡單，用戶必須斗智斗勇哄好對話窗口里的AI女友。

因為交互簡單和立意頗有情趣，哄哄模擬器上線第一天就吸引了60多萬用戶。

突然的爆紅，卻讓王登科哭笑不得。哄哄模擬器使用了預置的GPT-3.5模型，運營一早上就花了他2000多美金的推理費用。

這就相當于，開發了個App，還沒想到咋賺錢，先交了1萬塊錢電費。

縱觀歷史可以發現，當年移動互聯網的大規模普及，也是建立在基礎設施降本之上的。

2014年的一份調查報告顯示，當時由于流量費用高昂，手機用戶每天使用流量不會超過3小時。且不使用移動網絡時，很多用戶會選擇將其關閉，以防止手機應用在后臺消耗流量[7]。

彼時，大多數用戶，都曾做過“一覺醒來房子歸中國移動”的噩夢。

2013年的時候，快手就明確了“短視頻社區”的定位，但增長相對緩慢。這背后，很難說沒有大環境的原因。

事實上，直到電信運營商開始大搞“降費提速”，短視頻行業才真正開始爆發。

2019年，手機上網流量資費較2014年時已下降了超90%[8]。至此，手機淘寶、微信、抖音等才逐漸成為字面意義上的“國民應用”。

由此可見，降價其實是大模型產業發展的必經之路。

也許在這輪價格戰中，云計算廠商與初創公司，各有各的小九九；但對開發者和普通用戶來說，建議可以打得再狠一點。

參考資料

[1] OpenAI Is Doomed，SemiAnalysis

[2] 阿里云大模型服務平臺百煉

[3] 千帆大模型平臺

[4] 量化巨頭發布第一代大模型：免費商用，完全開源，澎湃新聞

[5] 智譜AI CEO張鵬：中國大模型創業者，不再追隨OpenAI，中國企業家

[6] Andrew Ng: Opportunities in AI - 2023，Stanford Online

[7] 2014年中國手機流量使用報告：近四成用戶流量不夠用，中國新聞網

[8] 工業和信息化部組織召開“提速降費”用戶面對面座談會

編輯：陳彬

視覺設計：疏睿

責任編輯：陳彬

（聲明：本文僅代表作者觀點，不代表新浪網立場。）

分享到:

保存 | 打印 | 關閉

首页国产亚洲小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看

大模型價格戰，還能再狠一點

微博推薦

作者簡介

作者文章

推薦閱讀

新聞熱榜

首页 国产 亚洲 小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看

大模型價格戰，還能再狠一點

微博推薦

作者簡介

作者文章

推薦閱讀

新聞熱榜

首页国产亚洲小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看