科技首頁(yè) 創(chuàng)事記互聯(lián)網(wǎng) 電信 IT業(yè)界投稿

魚(yú)龍混雜大模型：誰(shuí)在蹭熱點(diǎn)？誰(shuí)有真實(shí)力？

2023-05-09 11:14:48 創(chuàng)事記作者： Hernanderz

　　來(lái)源：價(jià)值研究所

　　進(jìn)入5月，國(guó)產(chǎn)大模型的風(fēng)口非但沒(méi)有熄火，反倒越燒越旺。過(guò)去一個(gè)星期，就有多家企業(yè)發(fā)布AI大模型相關(guān)產(chǎn)品：

　　5月5日，網(wǎng)易有道發(fā)布了基于“子曰”大模型開(kāi)發(fā)的AI口語(yǔ)老師劇透視頻，介紹其基于教育場(chǎng)景的類ChatGPT產(chǎn)品布局；5月6日，科大訊飛發(fā)布認(rèn)知大模型“訊飛星火”，董事長(zhǎng)劉慶峰表示有信心超越ChatGPT；同日，淘云科技發(fā)布“國(guó)內(nèi)首個(gè)”兒童認(rèn)知大模型“阿爾法蛋”……

　　在上述公司之外，還有很多企業(yè)宣布進(jìn)軍大模型，類ChatGPT產(chǎn)品正在密鑼緊鼓研發(fā)中，預(yù)計(jì)不久便會(huì)正式上線。企業(yè)的熱情毋庸置疑，AI大模型似乎已經(jīng)不是一條選擇題，而是必做題。

　　然而，狂熱背后不乏擔(dān)憂。大模型技術(shù)應(yīng)用范圍雖廣，目前落地的場(chǎng)景畢竟有限。而這群入局大模型的企業(yè)，分別來(lái)自游戲、教育、動(dòng)漫等諸多行業(yè)，和大模型的應(yīng)用場(chǎng)景離得很遠(yuǎn)。

　　當(dāng)國(guó)產(chǎn)大模型變得泛濫，我們?cè)撊绾畏直鎯?yōu)劣？

　　沒(méi)技術(shù)不要緊

　　有公司靠“外援”搗鼓大模型

　　要評(píng)判一個(gè)大模型的優(yōu)劣，首先看技術(shù)，其中最核心的是算法和算力，即訓(xùn)練參數(shù)量。因?yàn)閰?shù)量越大，系統(tǒng)的知識(shí)面就會(huì)越廣，表現(xiàn)也會(huì)越穩(wěn)定。資料顯示，openAI在2020年推出的ChatGPT-3參數(shù)量已經(jīng)達(dá)到1750億，谷歌在一年后發(fā)布的PaLM則達(dá)到5400億，更不用說(shuō)最新的ChatGPT-4了。

　　參照此技術(shù)標(biāo)準(zhǔn)，我們可以精準(zhǔn)識(shí)別一批蹭熱點(diǎn)的企業(yè)：它們要么確實(shí)拿出了產(chǎn)品，但參數(shù)量和ChatGPT等有較大差距，功能也較單一；更有甚者，套用別家公司的硬件、數(shù)據(jù)庫(kù)來(lái)預(yù)訓(xùn)練參數(shù)，本身缺乏核心技術(shù)。

　　當(dāng)中的代表，有昆侖萬(wàn)維。

　　4月10日，昆侖萬(wàn)維宣布聯(lián)合奇點(diǎn)智源研發(fā)“天工3.5”國(guó)產(chǎn)大語(yǔ)言模型。根據(jù)發(fā)布會(huì)上的介紹，“天工3.5”定位為“中國(guó)第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)”的大模型產(chǎn)品，具備智能問(wèn)答、聊天互動(dòng)、文本生成等多種應(yīng)用功能以及豐富的科學(xué)、技術(shù)、文化、藝術(shù)和歷史知識(shí)儲(chǔ)備。

　　根據(jù)官方資料，昆侖萬(wàn)維最早在2020年布局AIGC業(yè)務(wù)，投入數(shù)億元組建研發(fā)團(tuán)隊(duì)。去年12月，“昆侖天工”首次亮相，初代產(chǎn)品提供圖像、音樂(lè)、文本及代碼AI生成功能。作為對(duì)比，大模型領(lǐng)頭羊 openAI在2019年發(fā)布ChatGPT-1，每一代產(chǎn)品的研發(fā)周期都在一年左右。

　　乍一看，昆侖萬(wàn)維的“天工3.5”功能全面對(duì)標(biāo)ChatGPT，比起百度“文心一言”、阿里“通義千問(wèn)”等國(guó)產(chǎn)大模型毫不遜色。在研發(fā)速度上，昆侖萬(wàn)維也領(lǐng)先于大多數(shù)國(guó)內(nèi)同行。不過(guò)昆侖萬(wàn)維的缺點(diǎn)也很突出——“天工3.5”是和阿里云合作的產(chǎn)物，后者的參數(shù)、硬件設(shè)備幫了昆侖萬(wàn)維很大忙。

　　事實(shí)上，昆侖萬(wàn)維一直抱緊阿里云的大腿。資料顯示，過(guò)去幾年昆侖萬(wàn)維的海外數(shù)據(jù)基本都在使用阿里云公有云儲(chǔ)存服務(wù)，2020年布局AIGC時(shí)也是在阿里云的協(xié)助下建立算力集群。在“天工3.5”發(fā)布后，還有媒體爆出昆侖萬(wàn)維缺乏文本生成、數(shù)據(jù)處理專利的消息，和百度、阿里形成鮮明對(duì)比。

　　同樣遭遇技術(shù)質(zhì)疑的，還有“AI四小龍”之一的商湯科技。

　　商湯科技在4月10日發(fā)布了自研大模型系統(tǒng)“日日新SenseNova”，內(nèi)含AI數(shù)字人視頻生成平臺(tái)“如影”，3D內(nèi)容生成平臺(tái)“瓊宇”和“格物”，類ChatGPT產(chǎn)品“SenseChat”等產(chǎn)品。別人都是發(fā)布單個(gè)產(chǎn)品，商湯科技一次過(guò)拿出一套“全家桶”，可見(jiàn)其野心之大。

　　然而，商湯的大模型全家桶在發(fā)布那天就有翻車跡象。演示視頻公布后，就有媒體和網(wǎng)友發(fā)現(xiàn)商湯“妙畫”生成的圖片和AI網(wǎng)站Civitai的圖片撞車，甚至還有來(lái)自Civitai的文字注釋。SenseChat則在一些基礎(chǔ)問(wèn)題上表達(dá)含糊不清，其訓(xùn)練參數(shù)量也遭到質(zhì)疑。

　　在價(jià)值研究所（ID：jiazhiyanjiusuo）看來(lái)，缺乏數(shù)據(jù)源，是昆侖萬(wàn)維和商湯科技共同的命門。

　　“文心一言”背后有百度的海量搜索數(shù)據(jù)和語(yǔ)料庫(kù)，阿里的“通義千問(wèn)”則有來(lái)自電商、云計(jì)算等領(lǐng)域的語(yǔ)料庫(kù)，流量大、用戶覆蓋面廣，能提供足夠的參數(shù)。缺乏面向C端用戶的通用產(chǎn)品、沒(méi)有參數(shù)積累，強(qiáng)行上馬大模型，昆侖萬(wàn)維和商湯科技的尷尬處境完全可以預(yù)料。

　　沒(méi)應(yīng)用場(chǎng)景又如何？

　　這些企業(yè)硬要和AI攀關(guān)系

　　除了缺乏核心技術(shù)、產(chǎn)品缺陷明顯的昆侖萬(wàn)維等企業(yè)，另一類企業(yè)的行為更讓人迷惑：在缺乏應(yīng)用場(chǎng)景的情況下，硬要給自身產(chǎn)品貼上大模型標(biāo)簽、 “硬蹭”熱點(diǎn)。

　　這一類企業(yè)，以專注C端服務(wù)的互聯(lián)網(wǎng)公司為主，尤其是近年來(lái)處境不佳的教育、科技金融、游戲公司。

　　比如專注于智能教育硬件研發(fā)的淘云科技，在5月6日發(fā)布了首個(gè)兒童認(rèn)知大模型“阿爾法兒童認(rèn)知大模型”和GPT機(jī)器人，并宣布把平臺(tái)的兒童原始語(yǔ)料加入科大訊飛的“訊飛星火”大模型中。同樣來(lái)自教育領(lǐng)域的學(xué)而思，也在近日宣布研發(fā)數(shù)學(xué)大模型MathGPT，目前已取得階段性成果，預(yù)計(jì)年內(nèi)推出。

　　這類企業(yè)最大的問(wèn)題在于，大模型的應(yīng)用場(chǎng)景、目標(biāo)用戶和它們的業(yè)務(wù)有巨大差異。強(qiáng)推大模型，根本無(wú)法為它們的用戶帶來(lái)多少幫助。

　　根據(jù)淘云科技董事長(zhǎng)劉慶升的說(shuō)法，“阿爾法兒童認(rèn)知大模型”基于兒童場(chǎng)景提供更貼近幼兒理解力的生成式內(nèi)容，讓兒童用戶在輕松的氛圍下積累新知識(shí)。問(wèn)題在于，類ChatGPT應(yīng)用仍無(wú)法保證100%準(zhǔn)確率，常識(shí)性的錯(cuò)誤屢見(jiàn)不鮮。對(duì)于認(rèn)知能力有限的兒童來(lái)說(shuō)，并不穩(wěn)定的大模型反倒可以帶來(lái)反作用。

　　當(dāng)然，上面這些公司蹭熱點(diǎn)的目的雖然很明確，但好歹拿出了實(shí)打?qū)嵉漠a(chǎn)品或規(guī)劃。還有一些企業(yè)，不僅業(yè)務(wù)場(chǎng)景和大模型相去甚遠(yuǎn)，甚至還沒(méi)有拿出實(shí)際產(chǎn)品就開(kāi)始往自己臉上貼金。

　　比如定位于“國(guó)漫IP孵化平臺(tái)和漫畫分享社區(qū)”的快看漫畫，就在4月27日宣布成立AIGC事業(yè)部。創(chuàng)始人兼CEO陳安妮更是在內(nèi)部信中表示，AI將會(huì)給內(nèi)容產(chǎn)業(yè)帶來(lái)“顛覆式”生態(tài)變革。

　　再比如最近一邊搗鼓直播電商、一邊忙著進(jìn)軍本地生活的小紅書(shū)，也沒(méi)忘記籌備大模型團(tuán)隊(duì)。根據(jù)36氪報(bào)道，小紅書(shū)在今年3月開(kāi)始組建研發(fā)團(tuán)隊(duì)，主要成員來(lái)自廣告NLP技術(shù)部門。4月，小紅書(shū)悄悄上線了一款名為“Trik”的AI創(chuàng)作應(yīng)用，主打AI繪畫，但沒(méi)有大規(guī)模宣傳，至今沒(méi)有引發(fā)多少關(guān)注。

　　總的來(lái)說(shuō)，這兩類企業(yè)的大模型布局都經(jīng)不起推敲。但蹭上大模型風(fēng)口，確實(shí)為其帶來(lái)了可觀的流量，也掀起資本市場(chǎng)的狂歡。前面提到昆侖萬(wàn)維，在發(fā)布“天工3.5”次日股價(jià)暴漲16%?；蛟S正因?yàn)槭袌?chǎng)過(guò)于狂熱，才會(huì)反過(guò)來(lái)迫使這些企業(yè)主動(dòng)迎合熱點(diǎn)。

　　可惜這種熱度是無(wú)法持續(xù)的，而且還會(huì)遭到監(jiān)管機(jī)構(gòu)的重點(diǎn)關(guān)照。在“天工3.5”發(fā)布次日，昆侖萬(wàn)維就收到了深交所的關(guān)注函，要求前者結(jié)合項(xiàng)目研發(fā)進(jìn)度、行業(yè)政策風(fēng)險(xiǎn)、對(duì)公司財(cái)務(wù)的影響等情況，說(shuō)明該業(yè)務(wù)可能面臨的風(fēng)險(xiǎn)。

　　雖然深交所沒(méi)有把話挑明，但明眼人都看得出這封關(guān)注函寫滿對(duì)昆侖萬(wàn)維蹭熱點(diǎn)的懷疑。在價(jià)值研究所（ID：jiazhiyanjiusuo）看來(lái)，蹭熱點(diǎn)的行為正在損壞行業(yè)生態(tài)。給大模型降降火、讓市場(chǎng)回歸理性，對(duì)踏實(shí)搞研發(fā)的企業(yè)來(lái)說(shuō)非常重要。

　　追趕ChatGPT

　　一場(chǎng)艱苦的馬拉松競(jìng)賽

　　不可否認(rèn)，除了上面這些蹭熱點(diǎn)的公司外，國(guó)內(nèi)有不少企業(yè)在認(rèn)真打磨大模型產(chǎn)品，也有一定的技術(shù)積累和豐富的應(yīng)用場(chǎng)景。不過(guò)從百度、阿里，再到360，幾乎所有頭部企業(yè)都承認(rèn)自己的技術(shù)不如openAI的ChatGPT。

　　5月7日，周鴻祎應(yīng)邀來(lái)到東方甄選直播間，和俞敏洪、董宇輝大談國(guó)內(nèi)的大模型創(chuàng)業(yè)熱潮。周鴻祎直言，openAI比國(guó)內(nèi)企業(yè)領(lǐng)先至少兩年，國(guó)產(chǎn)大模型有機(jī)會(huì)在一年內(nèi)追上ChatGPT-3.5，但openAI已經(jīng)開(kāi)始訓(xùn)練ChatGPT-5了。

　　“上來(lái)就說(shuō)能超越ChatGPT，那叫吹牛?！?/p>

　　周鴻祎最后這番話，不少媒體認(rèn)為是在影射5月6日發(fā)布“訊飛星火”認(rèn)知大模型的科大訊飛。科大訊飛董事長(zhǎng)劉慶峰在發(fā)布會(huì)上表示，“訊飛星火”在文本生成、知識(shí)問(wèn)答、數(shù)學(xué)能力上已經(jīng)超過(guò)ChatGPT，目標(biāo)是到今年10月，通用認(rèn)知能力對(duì)標(biāo)ChatGPT，并在中文上超越ChatGPT。

　　周鴻祎是否意有所指不得而知，可以肯定的是，投資者、用戶對(duì)國(guó)產(chǎn)大模型的耐心正在流失，要求變得更加苛刻，外部的競(jìng)爭(zhēng)也更加激烈——留給國(guó)產(chǎn)大模型的時(shí)間已經(jīng)不多了。

　　5月4日，微軟宣布Bing預(yù)覽版全面開(kāi)放，該系統(tǒng)此前已接入openAI的ChatGPT-4；一天后，谷歌也宣布向所有擁有Wordspace賬號(hào)的用戶開(kāi)放Bard AI工具訪問(wèn)權(quán)限。

　　微軟和谷歌先后走向開(kāi)放，意味著新一輪用戶爭(zhēng)奪戰(zhàn)正式打響。一旦它們滲透進(jìn)國(guó)內(nèi)市場(chǎng)，面對(duì)技術(shù)上的差距，國(guó)產(chǎn)大模型并沒(méi)有太多應(yīng)對(duì)方法。比起那群蹭熱點(diǎn)的企業(yè)，追趕openAI的骨干力量更值得我們關(guān)注——特別是百度、阿里、騰訊三巨頭，周鴻祎治下的360，疑似被其揶揄的科大訊飛實(shí)力也不容小覷。

　　這幾家公司的優(yōu)勢(shì)是相似的：雄厚的資金儲(chǔ)備；擁有諸多面向用戶的產(chǎn)品/服務(wù)，語(yǔ)料庫(kù)十分豐富；主營(yíng)業(yè)務(wù)貼近大模型應(yīng)用場(chǎng)景，如百度和360的搜索，騰訊的社交媒體，阿里的云計(jì)算和電商，科大訊飛的智慧辦公等?，F(xiàn)階段，這些企業(yè)的產(chǎn)品距離ChatGPT當(dāng)然還有一定差距，但并非沒(méi)有追趕的機(jī)會(huì)。

　　要知道，即便是技術(shù)領(lǐng)跑全行的openAI，也有自己的苦惱。過(guò)去一年，隨著ChatGPT走紅openAI的估值也是一路走高，成為全球范圍內(nèi)升值最快的獨(dú)角獸——可惜隨之飆升的，還有虧損額。

　　據(jù)外媒報(bào)道，openAI上一財(cái)年凈虧損達(dá)到5.4億美元，同比幾乎放大一倍。每一次預(yù)訓(xùn)練參數(shù)都要耗費(fèi)巨資，要提升系統(tǒng)穩(wěn)定性又必須不斷加大參數(shù)量和預(yù)訓(xùn)練頻次，虧損自然成為無(wú)解難題。國(guó)盛證券的研報(bào)指出，通過(guò)測(cè)算，2800億參數(shù)量的大模型預(yù)訓(xùn)練成本約為200萬(wàn)美元/次，谷歌的PaLM號(hào)稱擁有5400億參數(shù)，單次預(yù)訓(xùn)練成本將高達(dá)1200萬(wàn)美元。

　　今年2月推出的付費(fèi)版ChatGPT和其他商業(yè)化嘗試收效甚微，短時(shí)間內(nèi)不可能覆蓋預(yù)訓(xùn)練所需成本。CEO Sam Altman曾暗示，公司未來(lái)幾年可能需要籌集約1000億美元的資金，才能進(jìn)一步提升技術(shù)，打磨下一代產(chǎn)品。

　　openAI的經(jīng)歷表明，AI大模型研發(fā)如同一場(chǎng)漫長(zhǎng)且艱難的馬拉松——不要總是奢望彎道超車，踏踏實(shí)實(shí)和參數(shù)打交道是成功的基礎(chǔ)。

　　寫在最后

　　水能載舟亦能覆舟，狂熱的市場(chǎng)氛圍既給企業(yè)帶來(lái)了資金和關(guān)注度，也帶來(lái)了難以預(yù)估的風(fēng)險(xiǎn)。近段時(shí)間，證監(jiān)會(huì)等監(jiān)管機(jī)構(gòu)已經(jīng)加大管控力度，不少公司也主動(dòng)出面自證清白：據(jù)不完全統(tǒng)計(jì)，4月底至今已有世紀(jì)天鴻、萬(wàn)興科技、中科信息、唐德影視等多家上市企業(yè)發(fā)布股票交易異常波動(dòng)公告，澄清自身業(yè)務(wù)和AI、大模型的關(guān)系。

　　經(jīng)過(guò)移動(dòng)互聯(lián)時(shí)代的洗禮，蹭熱點(diǎn)、追風(fēng)口的情況太過(guò)常見(jiàn)了。似乎任何一個(gè)風(fēng)口都逃不過(guò)從萌芽到爆發(fā)，再走向混亂、重塑秩序的過(guò)程。但在亂戰(zhàn)過(guò)后，有的風(fēng)口出清泡沫、置之死地而后生；有的賽道卻徹底沉淪，如一顆流星般結(jié)束自己絢爛卻短暫的一生。

　　走在時(shí)代前沿的AI大模型，似乎更有可能成為前者，不過(guò)需要所有從業(yè)者、監(jiān)管機(jī)構(gòu)的共同努力才能保證健康發(fā)展。大模型是一條技術(shù)門檻、資金門檻都很高的賽道，蹭熱點(diǎn)的企業(yè)注定無(wú)法長(zhǎng)久。加強(qiáng)監(jiān)管、凈化行業(yè)環(huán)境、驅(qū)逐不良玩家可能會(huì)帶來(lái)短期混亂，但對(duì)行業(yè)的長(zhǎng)期發(fā)展肯定是有益的。