來源:中國經營報
本報記者 李玉洋 上海報道
忽如一夜AIGC來,千模萬模競相開。對于眼下爆火的國內AI大模型賽道,套用這句唐詩來形容十分應景。
近日,36氪爆料稱小紅書入局AI大模型,從3月起籌備了獨立的大模型團隊,同時其內部還有多個獨立部門推進AIGC方向的落地探索。對此,《中國經營報》記者向小紅書方面求證,該公司回應表示對上述消息不做評論,至于對AI大模型技術的態度以及該技術對于公司的業務發展會有哪些促進,截至發稿前,小紅書方面未回復。
記者注意到,今年5月份以來,包括科大訊飛、萬興科技、中文在線、云知聲等也推出或官宣入局大模型賽道。在AI大模型賽道上,截至目前,不僅百度、阿里巴巴、騰訊、華為等國內互聯網科技大廠置身其中,商湯科技、知乎、浪潮、昆侖萬維、藍色光標等獨角獸企業或傳統上市企業也紛紛加入,如此多的國內企業聲稱要做AI大模型,以至于被業內一些人士稱為“百模大戰”。
基于“百模大戰”的現狀,我們是時候需再考慮再復盤“大模型是什么?它是一種更偏向軟件還是硬件的技術?又能給企業帶來什么?”等問題了。
對此,原中科院計算所上海分所所長、豪威研究院院長孔華威對記者表示:“大模型以軟件技術為主,是新一代操作系統,類似Android和iOS?!彼€提到,大模型是快速嵌入式的個人助理,就像手機,而大模型的發展,意味著企業效率革命的真正到來,就像電商對于企業、美團對于飯店。
“作為技術發展的趨勢,大模型已經是互聯網企業繞不開的技術。對于這項技術,有條件的企業當然越早布局越好?!敝袊鐣茖W院數量經濟與技術經濟研究所助理研究員端利濤向記者指出,大模型技術的出現勢必會推動商業模式的轉變,這將是一片全新的藍海。
在大模型研發上國內有機會追趕
OpenAI旗下應用ChatGPT掀起的GPT浪潮,讓人工智能再次火熱了起來,或者說屬于AI的2.0時代到來了。
“AI本身可認為是純粹的軟件技術,包括各種GPT都是?!遍L期關注AI行業發展的觀察人士黃燁鋒表示。根據騰訊科技的報道,多語言多領域自然語言處理(NLP)資深架構師、Trend首席科學家李維博士認為:“算法就是模型?!?/p>
端利濤也認為,大模型可以說是一種算法,其具有上千億甚至萬億的參數,這種參數上的規模是傳統模型所無法比擬的,這是一種超大規模的軟件。綜上來看,大模型相對來說更偏向軟件技術。
“在OpenAI證實了大模型的威力之后,說明這條路已經走出來了,后來者趕上只是一個時間的問題?!崩罹S博士表示,雖然在具體的實踐中會有一些細節不相同,但算法在大層面上是學術界共享的。
中國開源軟件推進聯盟副秘書長李震寧也表示,開源打破了技術壁壘,將進一步廣泛推動AI技術的市場化。近期因翻唱《好漢歌》《愛在西元前》等經典曲目而火遍全網的“AI孫燕姿”,憑借天后音色,直接成為AI翻唱的新寵兒。
據了解,作為“AI孫燕姿”背后的技術支撐,So-vits-svc(也稱Sovits)是由中國歌聲合成愛好者Rcell在VITS、soft-vc、VISinger2等一系列項目基礎上所開發的一款開源免費AI語音轉換軟件。用更通俗的話來說,如果說ChatGPT是文字領域的AI,那么Sovits就是語音方面的AI。
開發者可以用現有的聲音來投喂訓練Sovits,產生一套語音系統。投喂具體是指,使用素材,讓AI學習模仿,不斷訓練強化AI。比如說,給Sovits聽孫燕姿的聲音、氣息和咬字,Sovits慢慢會學會孫燕姿的聲音、表演風格和特點,形成一套可以進行塑造的語音系統。需要指出的是,在開源社區GitHub上,Sovits目前還只能被讀取。
開源對于推動AI的發展意義重大。哪怕AI研發實力強勁的谷歌,也意識到與開源AI競爭將難以占據優勢。據外媒semianalysis報道,谷歌研究員在一份泄密文件中指出,谷歌沒有護城河,OpenAI也是如此,與開源AI競爭將難以占據優勢。
該泄密文件還提到,開源模型訓練速度更快,可定制性更強更私密,而且比同類產品能力更出色。“他們正在用100美元和130億的參數做一些‘谷歌1000萬美元和540億的參數難以企及’的事情,而且在短短幾周內就能做到,而不是幾個月?!痹撔姑芪募赋雠c開源直接競爭是賠本生意。
再回過頭來看,為什么那么多國內企業入局大模型,掀起“百模大戰”?原因在于大模型的技術門檻相對而言沒那么高,至少能很快上手,一是大模型更偏向軟件,經過多年發展,國內軟件人才沒那么緊缺;二是受益于開源,很多AI項目都能被開發者使用。
“總體上,從國內已經經歷過大模型研發的團隊的報告來看,只要按照他們的路線走,大都搞定了語言模型的理解和生成能力,甚至達到了篇章對話、思維鏈、多任務等重要指標。因此,從算法方面來說,總體上來說是可以追趕或者復制的?!崩罹S博士告訴記者。
越早布局越好
作為國內AI大模型的先行者, 3月下旬,百度文心一言也上線了AI作圖功能,也引發了業內的廣泛關注和討論。百度方面稱,“文心一言完全是百度自研,文生圖能力來自文心跨模態大模型ERNIE-ViLG”,并表示目前文心一言仍需“通過訓練進一步調優迭代”。
隨著眾多國內企業紛紛搶灘入局AI大模型,業內也出現了套殼換皮等的一些擔憂。
“如果是換皮的模型,那么百模大戰沒意義?!笨兹A威表示,需警惕企業只講應用、薅“開源”羊毛來做AI大模型的聲明和姿態。李震寧也表示,豐富的應用場景是國內企業入局AI大模型的優勢未來也要重視模型算法等核心能力的自主創新。
不過,大模型已成為發展趨勢。“和之前火爆的應用不太一樣,例如去年的元宇宙,關于元宇宙的討論非常激烈,對未來的憧憬也十分飽滿,但短時間內落地是個大問題?!倍死麧硎?,大模型技術和元宇宙不一樣,當前的“百模大戰”還談不上過熱,因為它已經在一些場景中實現了應用,并可以帶來收入。
比如微軟把ChatGPT嵌入到office全家桶里,谷歌把AI能力嵌入到了搜索引擎本身,這些操作都顯著提升了原產品的體驗效果,為它們帶來了收益。此外,端利濤還指出,生成式AI在代碼編程、金融分析、醫學、教育等領域都顯著提升了效率并改善了用戶的體驗。
正如阿里巴巴集團董事會主席兼首席執行官張勇在2023年阿里云峰會上所說:“所有的行業、軟件以及服務都值得基于新型的人工智能技術重做一遍,這不僅會帶來創新性的客戶體驗,同時也會讓我們的生產、工作、生活范式發生變化。”
百度創始人、董事長兼首席執行官李彥宏則指出: “大模型時代,最大的創業機遇在應用端。移動互聯網時代,操作系統其實沒幾個,最成功的是微信、抖音、淘寶這些應用?!倍鴦撔鹿S董事長兼CEO李開復指出:“最早使用AI工具的人,往往最早發現其中的機會所在?!?/p>
端利濤表示,作為技術發展的趨勢,大模型已經是互聯網企業繞不開的技術。對于這項技術,對于有條件的企業當然是越早布局越好。
“美國對華一些不公平的政策已經限制了我國相關領域的發展,已經入局大模型的國內企業會受到嚴重阻礙?!倍死麧硎?,在大模型領域,國內企業只能把有限的條件發揮最大的價值,加大對模型(算法)和芯片的研發投入,盡可能地抓住一切可以利用的機會發展自身。
同時,他也建議政府相關部門盡快完成國內各類數據的整合、電子化和開放共享,讓國內大模型領域的企業能夠擁有更有利的發展環境。
責任編輯:李桐
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)