深燃(shenrancaijing)原創
作者 | 王敏
編輯 | 金玙璠
一夜之間,AI大模型熱得發燙。
繼3月中旬,百度最先下場,以“文心一言”搶占了對標ChatGPT的“國內第一”后,過去一個月,大模型一直是市場的焦點。尤其是在過去一周里,各界選手紛紛“大干快上”,密集開“卷”,要么直接卷大模型,要么卷產品卷Demo,要么卷預告卷進展。總之,大模型江湖,徹底火起來了。
百度最先挑起戰事,阿里、商湯跟得最緊、跑得最猛,都已發布類ChatGPT產品。
不止如此,科大訊飛等中大廠的大模型也已經在發布的路上。而適配到具體場景的應用和產品,比如360的“360智腦”已經進行過現場演示,有贊也帶來了由大模型驅動的首個AI產品“加我智能”。就連飛書,也悄悄上線了關于智能助手“My AI”的Demo視頻。
就在去年,AI還因為商業化困局而被外界詬病。去年年底,OpenAI的ChatGPT問世,成為了攪動AI大模型江湖的鯰魚,一時間,各類選手紛紛涌了進來。
被視為是移動互聯網時代第一場大戰的“千團大戰”,至今仍令人記憶猶新,那時,從業者們的信念是,所有的行業都值得用互聯網再做一遍。時至今日,阿里巴巴集團董事會主席兼CEO張勇在4月11日已經喊出“所有產品都值得用大模型重做一遍”的口號。盡管當下還處于大模型混戰的早期階段,各家的能力更新,都還沒有正式對外開放,對于大廠的大模型能力,還沒有一套成熟的評估體系,但是,AI大模型時代的變革,已經開始醞釀。
市場各種信號都昭示著,“百模大戰”的帷幕已經拉開。曾經,硝煙彌漫的“千團大戰”,結局是一地雞毛,數千家公司同臺競技,只有美團最終跑了出來,無數公司淪為炮灰。現如今,AI時代的“百模大戰”,“入場券”更貴,對于資源、技術、人才的要求更高,也更需要耐心和時間。新選手燒錢燒時間,結果也可能只是巨頭的陪跑。這場持久戰,才剛剛開始。
百“模”大戰,一觸即發
大模型江湖混戰,愈演愈烈,下場的選手越來越多。競爭最激烈也最受關注的,便是在大模型領域有所積累的互聯網巨頭選手們。
這波混戰源起ChatGPT。巨頭選手們的類ChatGPT產品以及最新的AI大語言模型首先受到關注。其中,百度3月16日發布了“文心一言”;阿里的“通義千問”已從4月7日開始企業內測;商湯科技在4月10日的技術交流會上帶來了“商量SenseChat”,目前還未對外開放;360在3月29日現場演示了“360智腦”后,也將于4月16日開啟企業內測。
這些類ChatGPT產品,主打的都是對話問答、文本及代碼等生成能力,外界常常會把多輪對話、數學能力、編碼能力作為測評的標準。
業界的共識是,國內這些產品相較ChatGPT,還有一定的差距。但是這些產品,究竟孰強孰弱、孰優孰劣,還難下定論,因為尚處于內測或演示階段。
不過,各家的產品形態有一定差別。比如,盡管文心一言的生成圖片能力遭到吐槽,但已經實現了多模態交互;通義千問增加了“百寶袋”,把寫提綱、SWOT分析等能力單獨列成板塊以供使用;360則是直接和搜索引擎場景進行了結合。
與類ChatGPT產品共同進入我們視野的,則是各家的大模型體系。
其中,360的大模型,此前市場關注度并不算高。不過,360稱,其人工智能研究院從2020年開始,一直在對包括類ChatGPT在內的大模型通用人工智能技術持續投入。
其余三家中,百度“文心一言”和阿里的“通義千問”,背后分別是此前已經發布過的文心大模型體系和通義大模型體系;商湯“商量SenseChat”背后是最新問世的“日日新SenseNova”大模型體系。三家本質都是在統一AI底座的基礎上,在通用模型層覆蓋NLP、視覺等領域,再進行行業模型和場景模型的孵化。
深燃制圖
文心大模型除了有文心一言、AI作畫應用文心一格外,還和工業、能源、金融等多個行業客戶共同打造了11個行業大模型。商湯基于大模型體系,還發布了AI內容創作社區平臺“秒畫”、AI數字人視頻生成平臺“如影”、3D內容生成平臺“瓊宇”、“格物”。
接下來,預計最快亮相的選手,當屬科大訊飛。其計劃于5月6日發布“1+N認知智能大模型”,“1”是底座平臺,“N”則是應用于多個行業領域的專用大模型版本,同時,“N”個場景的示范性應用產品也將隨之呈現。但是否會有類ChatGPT產品,還不確定。
備受市場期待的選手,還有華為、騰訊、京東、字節跳動,這幾家雖然沒有大張旗鼓發布基于大語言模型的新產品,但也找機會對外重新梳理大模型體系或透露新進展。
其中,華為云首席科學家田奇在4月8日的一場公開活動上表示,華為盤古大模型在2022年發布NLP大模型、CV大模型和科學計算三個基礎大模型之后,又陸續發布行業大模型系列,包括盤古氣象大模型、藥物分子大模型等等,華為大模型還是堅定走To B的路線。其內部專家此前就曾指出,“華為很少在新的趨勢出現后,立馬追上”。
騰訊曾于2022年發布混元大模型體系,據透露,目前也在研發類ChatGPT產品;京東4月對外宣稱,計劃在今年發布新一代產業大模型“言犀”;字節跳動根據公開報道正分別在語言和圖像兩種模態上發力。
當然,市場上也不乏蹭熱點的選手。昆侖萬維的大語言模型“天工”3.5,也將于4月17日開啟內測。4月11日,深交所向昆侖萬維下發關注函,再次提醒不得利用市場熱點題材,進行“蹭熱點”等違法違規行為。
除了這些大公司之外,根據民生證券相關研報統計,目前國內至少已經有30多家大模型亮相,其中不乏參數規模甚至超過ChatGPT規模的大模型。廠商涵蓋了互聯網巨頭、AI上市公司、服務器龍頭企業、科研院所與一級市場創業公司。
大模型應接不暇,新產品層出不窮,ChatGPT風口上的諸神混戰才剛剛開始。
搶發大模型,大廠不能錯過的一戰
大廠混戰大模型之際,各家的大模型能力究竟幾何,才是最令外界好奇的。以往,大廠選手們做大模型,總是粗暴地拼參數量,業內大模型的參數從百億進化到了千億甚至萬億。
現如今,參數量早已不能當作衡量大模型能力的唯一標準。AI領域從業者章容對深燃表示,大模型的能力或許有學術層面的評估,但依然缺乏較為成熟的評估標準和體系。
文心一言發布后,百度創始人李彥宏在3月下旬曾對外表示,文心一言不如最新的ChatGPT版本,但是差距不是很大,可能就是一兩個月的差別。就連剛剛下場成立AI公司“百川智能”的搜狗創始人王小川也對外表示,正在研發大模型產品,今年內可能就能追上ChatGPT3.5的水平,至于趕上GPT-4或者GPT-5,可能需要3年左右的時間。
現如今,業界衡量大模型能力最直接的標準,似乎變成了和ChatGPT相比差距有多大,多久能追上,但也只能是模糊對比。
雖然如何評價大模型的實力還沒有統一標準。但是,大廠們已經開始展望大模型進入到業務應用層能帶來的變革。從目前選手們的參與思路來看,百度、阿里都已經宣布未來主流業務,將與最新的大語言模型深度結合。
在文心一言發布前,李彥宏在內部信中就曾介紹,百度計劃將搜索、智能云、自動駕駛多項主力業務與文心一言整合。4月11日的阿里云峰會上,張勇也表示,阿里巴巴所有產品,包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等,未來都將接入“通義千問”大模型進行改造。目前釘釘和天貓精靈已經接入測試,新功能將在評估之后發布。
大廠主流業務的改造正在醞釀或進行。而大廠掌握著更多的場景和數據,也能反哺大模型的發展。
在云計算領域,2022年,以天翼云為代表的運營商云加速崛起,而以阿里、騰訊為代表的互聯網大廠云計算業務增速放緩,大廠云需要找到新的增長驅動力,張勇甚至下場擔任阿里云事業部的一把手。
顯然,大模型正在扮演這樣的角色。百度、阿里、華為,都是云事業部來做大模型to B、to G的對外服務,云計算市場頭部四朵云已經集齊三朵。在大模型時代,正如李彥宏所言,云計算市場的游戲規則正在發生根本性變化。
企業協同辦公市場中,疫情以來,釘釘、飛書、企業微信三足鼎立的格局基本形成。而釘釘在4月11日展示了接入“通義千問”的Demo之后,飛書在當天下午也緊急發布了智能助手“My AI”的Demo視頻。就如同微軟Office 365的Copilot產品,釘釘和飛書的Demo,都或將幫助職場人在工作效率方面實現大幅提升。現在,壓力給到了企業微信。
在搜索領域占市場六成份額的百度,要讓文心一言改造搜索體驗。占據搜索市場三成份額的360緊隨其后演示360智腦,被外界認為是,開啟了搜索市場爭奪戰。
同樣,商湯、科大訊飛這些曾經的AI大廠,見證了從機器學習到AI大模型時代的變遷,現如今,更是不愿錯過大模型的風口。
擁抱大模型,就是擁抱下一個時代。大模型內卷之際,結合場景,基于大模型的產品依然在層出不窮。比如有贊接入GPT-4,上線了“加我智能”。同花順的AI產品將在4月14日上線,但是否會在其i問財產品的基礎上有所創新,還未可知。
“讓子彈先飛半年”
“大廠們都是先來占位!”章容稱,“因為大模型的能力還遠未成熟落地,現在互聯網大廠更像是在秀肌肉”。
一位即將進行AIGC創業的AI從業者告訴深燃,大模型就像是AI時代的操作系統,大廠搶先占位,不排除是為了搶客戶、搶人才。畢竟,大佬們下場官宣創業,往往伴隨著招人。
但更值得注意的是,大模型的能力越強,API可以實現的應用端場景就越豐富,相當于大廠都在爭AI時代的“App Store”。
大模型并非一朝一夕就能夠煉造的,現如今大廠選手大模型動態層出不窮,本質還是過去幾年技術積累的產物。
做大模型,必然伴隨著重投入。在國外,微軟投資OpenAI,先后投資了超100億美元,而OpenAI對于GPT-3的訓練費用已經超過1200萬美元。這一點,從國內大廠的研發投入也可窺一斑。
財報顯示,2022年百度的核心研發費用為214.16億元,占百度核心收入比例達到22.4%。過去10年,百度研發投入超1000億元。根據商湯財報,過去四年,商湯總營收為149.8億元,而研發開支則達到了114.3億元,營收占比達到76.3%。
或許也是因為如此重的投入,對于大模型領域內卷加劇,業界出現一種討論,國外已經跑出了GPT-4,面對如此大的差距,國內新選手現在殺入戰場做大模型,意義大不大,會不會造成人才和資源的浪費。
2023年以來,多位大佬宣布下場進行大模型創業,但是一部分人的思路已經開始調整。出門問問創始人李志飛最近多次對外表示,做大模型不能過于樂觀,貿然進入難度很大,而且競爭激烈。他的思路已經從開始的做通用型大模型,轉向更注重結合自身業務場景,做垂直整合大模型。
他認為,國內在1-2年之后,將會有50家以上的公司擁有自己的大模型。包括互聯網大廠自研、中型互聯網公司基于開源大模型微調、一些AI公司及垂直領域的甲方,都會有大模型,市場大模型的供給一定不會太少。
也有很多業界人士認為,未來大模型的發展,將會是頭部幾家寡頭之間的競爭。
但是,中國必須做自己的大模型,已是共識。出現分歧,本質上還是因為,大模型的鏖戰才剛剛開始。
民生證券相關研報指出,目前表面上大模型百花齊放,不再稀缺,是因為開源基礎以及大公司本身的算力儲備與資金實力,單純發布一個大模型門檻,沒有市場想象那么高。但是能夠擁有高質量數據場景,才能持續迭代,性能逐步逼近ChatGPT的大模型,預計最終仍是“鳳毛麟角”。市場會逐步凝結共識:得數據者得天下,數據成為大模型差異化競爭的關鍵。
算力、算法、數據是AI大模型研發的三大要素。大廠云們在算力上擁有一定優勢。AI領域從業者貝科對深燃表示,華為布局昇騰芯片、昇騰生態已經多年,而且在各地也投資了算力中心,現如今也已經有了一定量的算力儲備。阿里整個集團在GPU算力上也有一定儲備。但這并不意味著大模型能力一定能持續攀升。
章容認為,大模型將帶來生產力的變革,已經是毋庸置疑的事實,但是,即便是國外跑得最快的OpenAI以及微軟,目前在商業化落地上已經有所進展,但也依然不能說成熟穩定。至于國內大廠的大模型,目前更是還處于非常早期的階段。
一方面,生成式人工智能的信息安全問題已經顯現。4月11日,國家互聯網信息辦公室發布了《生成式人工智能服務管理辦法(征求意見稿)》,強調了生成內容的真實性,并且提出了相應的容錯率和懲罰措施。
另一方面,當前國內市場上最新的大模型產品,無論是面向C端的體驗產品,還是面向企業的接口,基本都處于內測階段,還沒有真正放開。
按照目前的形勢,章容認為,當前大模型從發布走向到企業端,摸索如何真正提升生產力,至少需要半年的時間。
(聲明:本文僅代表作者觀點,不代表新浪網立場。)