來(lái)源 :價(jià)值研究所
進(jìn)入5月,國(guó)產(chǎn)大模型的風(fēng)口非但沒(méi)有熄火,反倒越燒越旺。過(guò)去一個(gè)星期,就有多家企業(yè)發(fā)布AI大模型相關(guān)產(chǎn)品:
5月5日,網(wǎng)易有道發(fā)布了基于“子曰”大模型開(kāi)發(fā)的AI口語(yǔ)老師劇透視頻,介紹其基于教育場(chǎng)景的類ChatGPT產(chǎn)品布局;5月6日,科大訊飛發(fā)布認(rèn)知大模型“訊飛星火”,董事長(zhǎng)劉慶峰表示有信心超越ChatGPT;同日,淘云科技發(fā)布“國(guó)內(nèi)首個(gè)”兒童認(rèn)知大模型“阿爾法蛋”……
在上述公司之外,還有很多企業(yè)宣布進(jìn)軍大模型,類ChatGPT產(chǎn)品正在密鑼緊鼓研發(fā)中,預(yù)計(jì)不久便會(huì)正式上線。企業(yè)的熱情毋庸置疑,AI大模型似乎已經(jīng)不是一條選擇題,而是必做題。
然而,狂熱背后不乏擔(dān)憂。大模型技術(shù)應(yīng)用范圍雖廣,目前落地的場(chǎng)景畢竟有限。而這群入局大模型的企業(yè),分別來(lái)自游戲、教育、動(dòng)漫等諸多行業(yè),和大模型的應(yīng)用場(chǎng)景離得很遠(yuǎn)。
當(dāng)國(guó)產(chǎn)大模型變得泛濫,我們?cè)撊绾畏直鎯?yōu)劣?
沒(méi)技術(shù)不要緊
有公司靠“外援”搗鼓大模型
要評(píng)判一個(gè)大模型的優(yōu)劣,首先看技術(shù),其中最核心的是算法和算力,即訓(xùn)練參數(shù)量。因?yàn)閰?shù)量越大,系統(tǒng)的知識(shí)面就會(huì)越廣,表現(xiàn)也會(huì)越穩(wěn)定。資料顯示,openAI在2020年推出的ChatGPT-3參數(shù)量已經(jīng)達(dá)到1750億,谷歌在一年后發(fā)布的PaLM則達(dá)到5400億,更不用說(shuō)最新的ChatGPT-4了。
參照此技術(shù)標(biāo)準(zhǔn),我們可以精準(zhǔn)識(shí)別一批蹭熱點(diǎn)的企業(yè):它們要么確實(shí)拿出了產(chǎn)品,但參數(shù)量和ChatGPT等有較大差距,功能也較單一;更有甚者,套用別家公司的硬件、數(shù)據(jù)庫(kù)來(lái)預(yù)訓(xùn)練參數(shù),本身缺乏核心技術(shù)。
當(dāng)中的代表,有昆侖萬(wàn)維。
4月10日,昆侖萬(wàn)維宣布聯(lián)合奇點(diǎn)智源研發(fā)“天工3.5”國(guó)產(chǎn)大語(yǔ)言模型。根據(jù)發(fā)布會(huì)上的介紹,“天工3.5”定位為“中國(guó)第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)”的大模型產(chǎn)品,具備智能問(wèn)答、聊天互動(dòng)、文本生成等多種應(yīng)用功能以及豐富的科學(xué)、技術(shù)、文化、藝術(shù)和歷史知識(shí)儲(chǔ)備。
根據(jù)官方資料,昆侖萬(wàn)維最早在2020年布局AIGC業(yè)務(wù),投入數(shù)億元組建研發(fā)團(tuán)隊(duì)。去年12月,“昆侖天工”首次亮相,初代產(chǎn)品提供圖像、音樂(lè)、文本及代碼AI生成功能。作為對(duì)比,大模型領(lǐng)頭羊 openAI在2019年發(fā)布ChatGPT-1,每一代產(chǎn)品的研發(fā)周期都在一年左右。
乍一看,昆侖萬(wàn)維的“天工3.5”功能全面對(duì)標(biāo)ChatGPT,比起百度“文心一言”、阿里“通義千問(wèn)”等國(guó)產(chǎn)大模型毫不遜色。在研發(fā)速度上,昆侖萬(wàn)維也領(lǐng)先于大多數(shù)國(guó)內(nèi)同行。不過(guò)昆侖萬(wàn)維的缺點(diǎn)也很突出——“天工3.5”是和阿里云合作的產(chǎn)物,后者的參數(shù)、硬件設(shè)備幫了昆侖萬(wàn)維很大忙。
事實(shí)上,昆侖萬(wàn)維一直抱緊阿里云的大腿。資料顯示,過(guò)去幾年昆侖萬(wàn)維的海外數(shù)據(jù)基本都在使用阿里云公有云儲(chǔ)存服務(wù),2020年布局AIGC時(shí)也是在阿里云的協(xié)助下建立算力集群。在“天工3.5”發(fā)布后,還有媒體爆出昆侖萬(wàn)維缺乏文本生成、數(shù)據(jù)處理專利的消息,和百度、阿里形成鮮明對(duì)比。
同樣遭遇技術(shù)質(zhì)疑的,還有“AI四小龍”之一的商湯科技。
商湯科技在4月10日發(fā)布了自研大模型系統(tǒng)“日日新SenseNova”,內(nèi)含AI數(shù)字人視頻生成平臺(tái)“如影”,3D內(nèi)容生成平臺(tái)“瓊宇”和“格物”,類ChatGPT產(chǎn)品“SenseChat”等產(chǎn)品。別人都是發(fā)布單個(gè)產(chǎn)品,商湯科技一次過(guò)拿出一套“全家桶”,可見(jiàn)其野心之大。
然而,商湯的大模型全家桶在發(fā)布那天就有翻車跡象。演示視頻公布后,就有媒體和網(wǎng)友發(fā)現(xiàn)商湯“妙畫”生成的圖片和AI網(wǎng)站Civitai的圖片撞車,甚至還有來(lái)自Civitai的文字注釋。SenseChat則在一些基礎(chǔ)問(wèn)題上表達(dá)含糊不清,其訓(xùn)練參數(shù)量也遭到質(zhì)疑。
在價(jià)值研究所(ID:jiazhiyanjiusuo)看來(lái),缺乏數(shù)據(jù)源,是昆侖萬(wàn)維和商湯科技共同的命門。
“文心一言”背后有百度的海量搜索數(shù)據(jù)和語(yǔ)料庫(kù),阿里的“通義千問(wèn)”則有來(lái)自電商、云計(jì)算等領(lǐng)域的語(yǔ)料庫(kù),流量大、用戶覆蓋面廣,能提供足夠的參數(shù)。缺乏面向C端用戶的通用產(chǎn)品、沒(méi)有參數(shù)積累,強(qiáng)行上馬大模型,昆侖萬(wàn)維和商湯科技的尷尬處境完全可以預(yù)料。
沒(méi)應(yīng)用場(chǎng)景又如何?
這些企業(yè)硬要和AI攀關(guān)系
除了缺乏核心技術(shù)、產(chǎn)品缺陷明顯的昆侖萬(wàn)維等企業(yè),另一類企業(yè)的行為更讓人迷惑:在缺乏應(yīng)用場(chǎng)景的情況下,硬要給自身產(chǎn)品貼上大模型標(biāo)簽、 “硬蹭”熱點(diǎn)。
這一類企業(yè),以專注C端服務(wù)的互聯(lián)網(wǎng)公司為主,尤其是近年來(lái)處境不佳的教育、科技金融、游戲公司。
比如專注于智能教育硬件研發(fā)的淘云科技,在5月6日發(fā)布了首個(gè)兒童認(rèn)知大模型“阿爾法兒童認(rèn)知大模型”和GPT機(jī)器人,并宣布把平臺(tái)的兒童原始語(yǔ)料加入科大訊飛的“訊飛星火”大模型中。同樣來(lái)自教育領(lǐng)域的學(xué)而思,也在近日宣布研發(fā)數(shù)學(xué)大模型MathGPT,目前已取得階段性成果,預(yù)計(jì)年內(nèi)推出。
這類企業(yè)最大的問(wèn)題在于,大模型的應(yīng)用場(chǎng)景、目標(biāo)用戶和它們的業(yè)務(wù)有巨大差異。強(qiáng)推大模型,根本無(wú)法為它們的用戶帶來(lái)多少幫助。
根據(jù)淘云科技董事長(zhǎng)劉慶升的說(shuō)法,“阿爾法兒童認(rèn)知大模型”基于兒童場(chǎng)景提供更貼近幼兒理解力的生成式內(nèi)容,讓兒童用戶在輕松的氛圍下積累新知識(shí)。問(wèn)題在于,類ChatGPT應(yīng)用仍無(wú)法保證100%準(zhǔn)確率,常識(shí)性的錯(cuò)誤屢見(jiàn)不鮮。對(duì)于認(rèn)知能力有限的兒童來(lái)說(shuō),并不穩(wěn)定的大模型反倒可以帶來(lái)反作用。
當(dāng)然,上面這些公司蹭熱點(diǎn)的目的雖然很明確,但好歹拿出了實(shí)打?qū)嵉漠a(chǎn)品或規(guī)劃。還有一些企業(yè),不僅業(yè)務(wù)場(chǎng)景和大模型相去甚遠(yuǎn),甚至還沒(méi)有拿出實(shí)際產(chǎn)品就開(kāi)始往自己臉上貼金。
比如定位于“國(guó)漫IP孵化平臺(tái)和漫畫分享社區(qū)”的快看漫畫,就在4月27日宣布成立AIGC事業(yè)部。創(chuàng)始人兼CEO陳安妮更是在內(nèi)部信中表示,AI將會(huì)給內(nèi)容產(chǎn)業(yè)帶來(lái)“顛覆式”生態(tài)變革。
再比如最近一邊搗鼓直播電商、一邊忙著進(jìn)軍本地生活的小紅書(shū),也沒(méi)忘記籌備大模型團(tuán)隊(duì)。根據(jù)36氪報(bào)道,小紅書(shū)在今年3月開(kāi)始組建研發(fā)團(tuán)隊(duì),主要成員來(lái)自廣告NLP技術(shù)部門。4月,小紅書(shū)悄悄上線了一款名為“Trik”的AI創(chuàng)作應(yīng)用,主打AI繪畫,但沒(méi)有大規(guī)模宣傳,至今沒(méi)有引發(fā)多少關(guān)注。
總的來(lái)說(shuō),這兩類企業(yè)的大模型布局都經(jīng)不起推敲。但蹭上大模型風(fēng)口,確實(shí)為其帶來(lái)了可觀的流量,也掀起資本市場(chǎng)的狂歡。前面提到昆侖萬(wàn)維,在發(fā)布“天工3.5”次日股價(jià)暴漲16%?;蛟S正因?yàn)槭袌?chǎng)過(guò)于狂熱,才會(huì)反過(guò)來(lái)迫使這些企業(yè)主動(dòng)迎合熱點(diǎn)。
可惜這種熱度是無(wú)法持續(xù)的,而且還會(huì)遭到監(jiān)管機(jī)構(gòu)的重點(diǎn)關(guān)照。在“天工3.5”發(fā)布次日,昆侖萬(wàn)維就收到了深交所的關(guān)注函,要求前者結(jié)合項(xiàng)目研發(fā)進(jìn)度、行業(yè)政策風(fēng)險(xiǎn)、對(duì)公司財(cái)務(wù)的影響等情況,說(shuō)明該業(yè)務(wù)可能面臨的風(fēng)險(xiǎn)。
雖然深交所沒(méi)有把話挑明,但明眼人都看得出這封關(guān)注函寫滿對(duì)昆侖萬(wàn)維蹭熱點(diǎn)的懷疑。在價(jià)值研究所(ID:jiazhiyanjiusuo)看來(lái),蹭熱點(diǎn)的行為正在損壞行業(yè)生態(tài)。給大模型降降火、讓市場(chǎng)回歸理性,對(duì)踏實(shí)搞研發(fā)的企業(yè)來(lái)說(shuō)非常重要。
追趕ChatGPT
一場(chǎng)艱苦的馬拉松競(jìng)賽
不可否認(rèn),除了上面這些蹭熱點(diǎn)的公司外,國(guó)內(nèi)有不少企業(yè)在認(rèn)真打磨大模型產(chǎn)品,也有一定的技術(shù)積累和豐富的應(yīng)用場(chǎng)景。不過(guò)從百度、阿里,再到360,幾乎所有頭部企業(yè)都承認(rèn)自己的技術(shù)不如openAI的ChatGPT。
5月7日,周鴻祎應(yīng)邀來(lái)到東方甄選直播間,和俞敏洪、董宇輝大談國(guó)內(nèi)的大模型創(chuàng)業(yè)熱潮。周鴻祎直言,openAI比國(guó)內(nèi)企業(yè)領(lǐng)先至少兩年,國(guó)產(chǎn)大模型有機(jī)會(huì)在一年內(nèi)追上ChatGPT-3.5,但openAI已經(jīng)開(kāi)始訓(xùn)練ChatGPT-5了。
“上來(lái)就說(shuō)能超越ChatGPT,那叫吹牛?!?/p>
周鴻祎最后這番話,不少媒體認(rèn)為是在影射5月6日發(fā)布“訊飛星火”認(rèn)知大模型的科大訊飛。科大訊飛董事長(zhǎng)劉慶峰在發(fā)布會(huì)上表示,“訊飛星火”在文本生成、知識(shí)問(wèn)答、數(shù)學(xué)能力上已經(jīng)超過(guò)ChatGPT,目標(biāo)是到今年10月,通用認(rèn)知能力對(duì)標(biāo)ChatGPT,并在中文上超越ChatGPT。
周鴻祎是否意有所指不得而知,可以肯定的是,投資者、用戶對(duì)國(guó)產(chǎn)大模型的耐心正在流失,要求變得更加苛刻,外部的競(jìng)爭(zhēng)也更加激烈——留給國(guó)產(chǎn)大模型的時(shí)間已經(jīng)不多了。
5月4日,微軟宣布Bing預(yù)覽版全面開(kāi)放,該系統(tǒng)此前已接入openAI的ChatGPT-4;一天后,谷歌也宣布向所有擁有Wordspace賬號(hào)的用戶開(kāi)放Bard AI工具訪問(wèn)權(quán)限。
微軟和谷歌先后走向開(kāi)放,意味著新一輪用戶爭(zhēng)奪戰(zhàn)正式打響。一旦它們滲透進(jìn)國(guó)內(nèi)市場(chǎng),面對(duì)技術(shù)上的差距,國(guó)產(chǎn)大模型并沒(méi)有太多應(yīng)對(duì)方法。比起那群蹭熱點(diǎn)的企業(yè),追趕openAI的骨干力量更值得我們關(guān)注——特別是百度、阿里、騰訊三巨頭,周鴻祎治下的360,疑似被其揶揄的科大訊飛實(shí)力也不容小覷。
這幾家公司的優(yōu)勢(shì)是相似的:雄厚的資金儲(chǔ)備;擁有諸多面向用戶的產(chǎn)品/服務(wù),語(yǔ)料庫(kù)十分豐富;主營(yíng)業(yè)務(wù)貼近大模型應(yīng)用場(chǎng)景,如百度和360的搜索,騰訊的社交媒體,阿里的云計(jì)算和電商,科大訊飛的智慧辦公等?,F(xiàn)階段,這些企業(yè)的產(chǎn)品距離ChatGPT當(dāng)然還有一定差距,但并非沒(méi)有追趕的機(jī)會(huì)。
要知道,即便是技術(shù)領(lǐng)跑全行的openAI,也有自己的苦惱。過(guò)去一年,隨著ChatGPT走紅openAI的估值也是一路走高,成為全球范圍內(nèi)升值最快的獨(dú)角獸——可惜隨之飆升的,還有虧損額。
據(jù)外媒報(bào)道,openAI上一財(cái)年凈虧損達(dá)到5.4億美元,同比幾乎放大一倍。每一次預(yù)訓(xùn)練參數(shù)都要耗費(fèi)巨資,要提升系統(tǒng)穩(wěn)定性又必須不斷加大參數(shù)量和預(yù)訓(xùn)練頻次,虧損自然成為無(wú)解難題。國(guó)盛證券的研報(bào)指出,通過(guò)測(cè)算,2800億參數(shù)量的大模型預(yù)訓(xùn)練成本約為200萬(wàn)美元/次,谷歌的PaLM號(hào)稱擁有5400億參數(shù),單次預(yù)訓(xùn)練成本將高達(dá)1200萬(wàn)美元。
今年2月推出的付費(fèi)版ChatGPT和其他商業(yè)化嘗試收效甚微,短時(shí)間內(nèi)不可能覆蓋預(yù)訓(xùn)練所需成本。CEO Sam Altman曾暗示,公司未來(lái)幾年可能需要籌集約1000億美元的資金,才能進(jìn)一步提升技術(shù),打磨下一代產(chǎn)品。
openAI的經(jīng)歷表明,AI大模型研發(fā)如同一場(chǎng)漫長(zhǎng)且艱難的馬拉松——不要總是奢望彎道超車,踏踏實(shí)實(shí)和參數(shù)打交道是成功的基礎(chǔ)。
寫在最后
水能載舟亦能覆舟,狂熱的市場(chǎng)氛圍既給企業(yè)帶來(lái)了資金和關(guān)注度,也帶來(lái)了難以預(yù)估的風(fēng)險(xiǎn)。近段時(shí)間,證監(jiān)會(huì)等監(jiān)管機(jī)構(gòu)已經(jīng)加大管控力度,不少公司也主動(dòng)出面自證清白:據(jù)不完全統(tǒng)計(jì),4月底至今已有世紀(jì)天鴻、萬(wàn)興科技、中科信息、唐德影視等多家上市企業(yè)發(fā)布股票交易異常波動(dòng)公告,澄清自身業(yè)務(wù)和AI、大模型的關(guān)系。
經(jīng)過(guò)移動(dòng)互聯(lián)時(shí)代的洗禮,蹭熱點(diǎn)、追風(fēng)口的情況太過(guò)常見(jiàn)了。似乎任何一個(gè)風(fēng)口都逃不過(guò)從萌芽到爆發(fā),再走向混亂、重塑秩序的過(guò)程。但在亂戰(zhàn)過(guò)后,有的風(fēng)口出清泡沫、置之死地而后生;有的賽道卻徹底沉淪,如一顆流星般結(jié)束自己絢爛卻短暫的一生。
走在時(shí)代前沿的AI大模型,似乎更有可能成為前者,不過(guò)需要所有從業(yè)者、監(jiān)管機(jī)構(gòu)的共同努力才能保證健康發(fā)展。大模型是一條技術(shù)門檻、資金門檻都很高的賽道,蹭熱點(diǎn)的企業(yè)注定無(wú)法長(zhǎng)久。加強(qiáng)監(jiān)管、凈化行業(yè)環(huán)境、驅(qū)逐不良玩家可能會(huì)帶來(lái)短期混亂,但對(duì)行業(yè)的長(zhǎng)期發(fā)展肯定是有益的。
(聲明:本文僅代表作者觀點(diǎn),不代表新浪網(wǎng)立場(chǎng)。)