燃次元(ID:chaintruth)原創
作者 | 馬舒葉
編輯 | 謝中秀
一夜之間,大廠紛紛卷起了AI大模型。
繼百度文心一言之后,360GPT大模型、華為“盤古大模型”迅速跟上,僅在2023年4月10日,一天內三個大模型爭相“官宣”,包括搜狗創始人王小川的“百川智能”、商湯科技的日日新SenseNova大模型、昆侖萬維的大語言模型“天工”3.5。
4月11日,阿里更宣布所有產品將接入“通義千問”大模型。在即將到來的5月,騰訊混元大模型也即將發布。
大廠之外,也有不少“明星創業者”入局。
2023年2月,原美團聯合創始人王慧文發布“AI英雄榜”,并火速啟動A輪融資;隨后,創新工場CEO李開復、前搜狗CEO王小川、前京東AI掌門人周伯文、出門問問創始人李志飛等掀起了AI大模型創業狂潮。阿里AI大牛賈揚清亦被爆出投身AI創業。
大廠“開卷”,資本也迅速嗅到味道。“被ChatGPT帶火的AI大模型,無疑是近半年內資本重要關注的方向。”科技賽道投資關注者william表示。
“通俗來講,AI大模型是一種基礎設施,更類似于公有云在互聯網中的角色,涵蓋知識領域多、產出內容更為智能,舉個例子,ChatGPT通過機器學習實現復雜的語音、圖像、語音處理,既能像醫生問診,也能似作家寫文,還能當得了貼心客服。”william解釋。
也已有創業者和細分領域受益。“現在大廠卷起AI大模型,我們創業者的日子越來越有盼頭了。” AI自由職業者阿斌興奮地表示。
“大廠在大模型的研發上能投入更多資源,負擔更高的成本,并且持續豐富AI的應用場景。”阿斌向燃次元說道,“用ChatGPT,我一個文科生竟然搭建起了自己的語言學習網站,甚至網站的插圖也都是用Mid Journey生成,只要跑通目前工作和AI工具的流程,AI大模型能讓創業者用3個小時做完原本1-2天的工作量。”
除了利用AI大模型為自己打工,AI創業者們基于大模型還能進行“再開發”,“例如使用文心一言大模型,基于其語音和文本處理功能,開發者再增加線上記賬小模型,就能用語音輸入實現實時記賬,便捷性秒殺現在市面上的所有記賬APP。”AI創業者大林補充道。
尤其是在一些基于AI大模型發展的垂直應用場景,也成為新的機會。
比如近期華為發布的高分辨率全球AI氣象預報系統——盤古氣象大模型,能夠秒級預測未來7天全球天氣情況,相比傳統預報算法,速度提升1萬倍、精度提升20%。同時,已有650家企業首批接入了“文心一言”,涵蓋了互聯網、媒體、金融、保險、汽車、企業軟件等各個場景。
只是在眾多行業人士和觀察人士看來,對于AI大模型也不可過于樂觀。
畢竟當前國內算力稀缺、數據模型訓練不足,甚至版權糾紛等等問題難以忽視,“現在的大語言模型還是存在‘胡說八道’輸出錯誤信息的問題,ChatGPT珠玉在前,留給大廠們的時間似乎并不算多。”阿斌補充道。
4月11日,國家互聯網信息辦公室發布《關于<生成式人工智能服務管理辦法(征求意見稿)>公開征求意見的通知》,這也是國家首個國家AIGC監管文件。這給行業發展增加了信心,因為管理的完善將有助于行業更好、更規范地發展,同時國家層面的關注,也表明了AIGC的重要性及未來。
只是也許道路是光明的,但走向目標的過程必須謹慎且踏實,才能走得更遠、更好。
大廠開卷
“面向AI時代,所有產品都值得用大模型重新升級。”4月11日,在2023年阿里云峰會上,阿里巴巴集團董事會主席兼首席執行官張勇描述了AI大模型廣袤的未來。
但在這句話背后,AI大模型早已成為國內各互聯網大廠近期發展的重點,蓄勢“開卷”。
2023年,ChatGPT爆火,在帶火了AI大模型的同時,也帶動國內大廠紛紛入局,爭搶起下一個“國產ChatGPT”。
3月16日,百度率先發布“文心一言”,發布會上,百度創始人、董事長兼首席執行官李彥宏表示,“文心一言的期望值是要對標ChatGPT,甚至要對標GPT-4。”
隨后,3月29日,360創始人、董事長兼CEO周鴻祎在展示了旗下首個人工智能聊天平臺。4月9日,360正式宣布,基于360GPT大模型開發的人工智能產品矩陣“360智腦”落地搜索場景,將于16日面向企業用戶開放內測。
而在百度、360等以“搜索場景”為主的大廠紛紛推出AI大模型之外,其他大廠也毫不示弱,4月8日,華為云人工智能領域首席科學家田奇首次介紹了華為“盤古大模型”的進展及其應用。
緊接著4月10日,一天內三個大模型爭相“官宣”,包括搜狗創始人王小川宣布即將投入創業的大模型產品名為“百川智能”,并宣布拿到5000萬美元啟動資金;還有被譽為“AI四小龍”之一的商湯科技發布日日新SenseNova大模型;精品游戲開發商昆侖萬維宣布大語言模型“天工”3.5即將發布,并于4月17日啟動邀請測試。
當時,昆侖萬維還表示,“天工”大模型已經非常接近ChatGPT的智能水平。
“卷”無止境。4月11日,阿里亦表示,阿里巴巴所有產品未來將接入“通義千問”大模型。在峰會上,昆侖萬維也宣布與阿里云在智算中心建設、大模型訓練等領域展開合作。
來源/視覺中國
4月11日,字節跳動旗下辦公軟件飛書發布視頻,預告專屬智能助手“My AI”,區別于其他大廠的AI智能工具,“My AI”似乎無意再復制一個類似ChatGPT的語言大模型,更類似微軟推出的Office Copilot。
如今,包括百度、騰訊、阿里、華為、京東、360等多家國內科技巨頭均已宣布在生成式AI產業有相應布局,5月,騰訊混元大模型也即將發布。
在大廠一頭扎進AI大模型戰局背后,或許是想再造一個未來。
盤古智庫高級研究員江瀚表示,大廠爭相推出AI大模型,背后也有“難言之隱”,“目前如果企業沒有AI大模型,很有可能引發市場對企業人工智能技術的不信任。”因此,“只要是互聯網做人工智能的公司,幾乎都在卷大模型。”
而對于大廠而言,除了用AI大模型帶來新的用戶流量和用戶關注之外,資深互聯網觀察家丁道師指出,“用AI大模型對業務進行改造升級,提升收益或許才是大廠的最終目的。”
正如GPT-4全面接入微軟Office和必應,根據移動互聯網研究公司Data.ai的統計,接入后微軟必應搜索的全球下載量翻了8倍。如今,百度文庫也通過接入文心一言為用戶提供對話交互、內容創作等功能。
AI大模型賽道大廠布局頻頻,背后也有一本“經濟賬”。“大模型是人工智能的發展趨勢,而大模型的資金、技術門檻高,開發和訓練一次花費約1200萬美元,需要對AI框架深度優化和超強的并行計算能力,未來大模型有可能收編高度定制化的小模型,導致市場向大公司集中。”田奇指出。
只是市場是否會為互聯網大廠的AI大模型新故事買單,似乎也在觀察。
3月16日,“第一個吃螃蟹”的百度,在發布當日股價下跌一度超9%,次日股價又沖高,收盤漲超13%。3月30日,360發布大模型次日股價高開5.53%,隨后4月3日再次漲停。4月11日,昆侖萬維繼發布當日暴跌超過17%之后,次日強勢反彈大漲9.5%,盤中最高上漲近16%。
從一定程度上來看,不論是百度、360,還是華為、阿里、昆侖萬維和商湯科技,市場也用金錢投票,表明了對類ChatGPT式AI大模型的渴求。
這也成為吸引各互聯網大廠紛紛開卷AI大模型的一大原因。
創業者喝湯
大廠成為開卷AI大模型的主力軍。畢竟誠如田奇所言,大模型雖是人工智能發展的趨勢,但大模型的資金、技術門檻高,并非創業者以及小公司可以輕松吃下的蛋糕。
但在大廠開卷之際,小廠、創業者也在風口中找到了機會。
“雖然創業小公司沒有大廠那么雄厚的人力物力財力,但是如果能基于大廠的AI大模型,通過小模型解決某個領域的痛點,也會受到資本的關注。”william表示。
在一致卷下一個“國產ChatGPT”的大廠之外,小型創業項目的身影亦十分活躍。
目前william所在的投資機構正密切關注以digitextend為代表的小型創業團隊,以digitextend為例,“創始人團隊出身科大訊飛和微軟,并且基于ChatGPT自研算法做了一個小模型,為企業提供類似助理的總結歸納服務,對于大模型產生的回答,通過小模型進一步提升精確度,就能成為小廠的優勢。”
此外,近期清華系AI初創公司深言科技(DeepLang AI)已完成新一輪高估值融資,最新市場估值約1億美金。而專注大模型加速與應用落地的面壁智能,同樣此前傳出被王慧文收購的信息,同時高額融資亦推進得十分迅速。
此外,AI大模型也在為更多的AI創業者提供可能。
“AI大模型是中小創業者的最強助手。”大林表示,作為第一批的ChatGPT使用者,他關注到ChatGPT已經開始支持創業者以其為用戶入口開發插件,“例如用戶能通過ChatGPT問答來搜索旅游攻略,預定旅行社和酒店機票。”
對于大林來說,“這讓原本必須通過應用商店觸達用戶的創業者看到了新的流量入口,創業者可以省去被應用商店收取30%的廣告推廣費用。”
而目前,大林正在開發基于ChatGPT強大的文本翻譯能力的在線精準翻譯APP,“只要對ChatGPT的翻譯結果進行一定的人工干預和糾偏,就可以實現更為精準的翻譯效果。”而目前,大林已經接洽了2-3家投資機構。
圖/AI創業者討論群(左)
阿斌用大模型做出的網站(右)
來源/燃次元截圖
和大林一樣,阿斌亦感慨,“AI大模型無疑是最熱的賽博合伙人,在當前的AI創業群內,討論如何用大模型創業已成為新潮流,有個創業者基于語言模型開發出一個AI閱讀APP,一周用戶就破萬了。”而“售賣整理的prompt、利用各類AI工具輔助寫作、繪圖和制作產品圖接商單等也成了新的財富密碼”。
此前作為一名影視行業制片人,阿斌從未設想過能夠進入人工智能行業,而在HustleGPT發起人的啟下,阿斌參與了“給AI 100美元讓它做商業伙伴賺錢”的挑戰,如今,“借助大模型,我花了5天就搭建起了網站頁面,這是過去難以想象到的。”
AI大模型或有顛覆及再造、重塑之力。張勇在峰會上表示,“所有的行業、軟件以及服務都值得基于新型的人工智能技術重做一遍,這不僅會帶來創新性的客戶體驗,同時也會讓我們的生產、工作、生活范式發生變化。”
百度創始人、董事長兼首席執行官李彥宏也指出,“大模型時代,最大的創業機遇在應用端。移動互聯網時代,操作系統其實沒幾個,最成功的是微信、抖音、淘寶這些應用。未來10年,可能誕生10倍價值于他們的機會。”
以此觀之,AI大模型前景廣大。
ChatGPT復制不易
但無論是大廠開卷,還是小廠、創業者喝湯,擺在國內AI大模型之路上的困難都重重。
首先齊卷AI大模型的大廠們,都難以避免“ChatGPT”的陰影,并且因為數據模型訓練不足,招致諸多質疑。
“大模型的訓練需要大量的高質量數據。雖然國內大廠,如華為、阿里、百度等早已在人工智能領域有了大量的數據資源,如文心一言官方的模型參數是2600億,高于ChatGPT3的1750億,但同是NLP大模型,ChatGPT3.5已經積累超過萬億的人類語言數據集,文心一言初始文本數據僅為3300億條。”阿斌指出。
而除了數據積累之外,數據的整理、模型訓練等等都需要大量時間,“國內大廠的AI大模型想要追趕上GPT4,時間是無法跨越的。”阿斌亦表示。
“如今大廠做AI大模型,最大的挑戰其實是激烈的競爭和用戶體系的發展。當前對于AI大模型來說,不僅競爭激烈,而且用戶的口味顯然已經被ChatGPT養刁了,大廠也將面臨更高的用戶要求。”張書樂補充道。
以百度的文心一言大模型為例,不僅3月16日發布當天被群嘲引發股價下跌一度超9%,3月下旬,有關“文心一言”作圖是“套殼”“畫皮”“造假”的爭議亦甚囂塵上,有網友吐槽讓文心一言畫“鼠標和總線”,結果出來是“老鼠和公共汽車”,因為其英文翻譯為“mouse”和“bus”,并質疑其引用國外某開源AI工具作圖。
來源/視覺中國
對此,3月23日百度聲明稱,“文心一言完全是百度自研,文生圖能力來自文心跨模態大模型ERNIE-ViLG”,并表示目前文心一言仍需“通過訓練進一步調優迭代”。
大林也指出,關于文心一言“人工智障”的嘲諷和爭議,背后是用戶與ChatGPT對比之下的失望情緒,“可以說,現在國內的AI大模型雖然掌握了大量的中文數據,但對于中文數據的理解和使用,乃至生成仍然有很大的進步空間”。
不過,“即使是ChatGPT也都有‘學習資料’更新時點和覆蓋性不足等問題,深度學習需要消化大量數據,國內的AI大模型數據訓練不足不是一時可解。”張書樂指出,現在國內國外的AI大模型都只是一個正常發揮時表現不錯的“編輯”,并不具備真正的思考和創新能力,“目前依然是AI大模型的學習時間,國內AI大模型仍有機會。”
其次,在數據之外,大廠的AI大模型也受到算力不足的掣肘。
“國內企業的算力太稀缺了。”大林向燃次元表示,AI大模型對算力要求極高,而且應用場景越多,算力需求能增加10-100倍,以ChatGPT為例,訓練算力的數據中心包括服務器等在內,投資規模至少在100億元人民幣以上。
“要想做成中國的ChatGPT,缺了算力芯片的產業供應和政策支持,也是一紙空談。”丁道師補充道。
另外,隨著大廠、明星創業者爭相涌入,AI大模型顯然成為了企業新的“流量密碼”,不過其間難免魚目混珠,泥沙俱下。
江瀚表示,當前AI大模型的頭部玩家,其中百度和阿里的優勢較為明確,而由于百度文心一言發布得更早,先發優勢更加明顯。
“包括科大訊飛、商湯科技在內,他們在ChatGPT火爆之前,已經有了大量關于人工智能的積累,他們更有可能做出真正意義上的類ChatGPT的自然語言生成的大模型,但也有部分企業還是以炒作概念,割韭菜為主,要注意區分。”丁道師直言。
更何況,大廠加速推進AI大模型的開發,人工智能技術的潛在風險也引發諸多討論。
近日,包括馬斯克、蘋果聯合創始人斯蒂夫·沃茲尼亞克在內的上千名頂尖人士,就曾公開呼吁AI實驗室暫停訓練更強大的模型6個月,此前OpenAI數據泄露亦引發了隱私爭議,“用戶的數據安全和隱私保護,以及AI創作引發的版權和知識產權的爭論,都是AI大模型發展不能繞過的問題。”阿斌補充道。
目前,算力的掣肘有望得到解決,根據工信部消息,近年來我國算力產業規模快速增長,年增長率近 30%,算力規模排名全球第二。截至去年底,我國算力總規模達到 180 百億億次浮點運算/秒,算力核心產業規模達到 1.8 萬億元。
《生成式人工智能服務管理辦法(征求意見稿)》,也明確了對生成式人工智能產業的支持和鼓勵態度。
從大方向上來看,前途是光明的,只是回到腳下的路,困難重重,AI大模型能否卷出一個新天地、新未來,還得謹慎圖之。
(聲明:本文僅代表作者觀點,不代表新浪網立場。)