炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
關于“誰是中國版ChatGPT”的討論從未消失,在一眾“大哥”面前,一家創業公司被視為最有力的挑戰者,旗下名為“Kimi”的應用甚至成為了資本市場的新寵。
3月21日,人工智能板塊持續上行,Kimi概念股集體高開,華策影視、掌閱科技、中廣天擇漲停,海天瑞聲、九安醫療、深信服等跟漲。
站在Kimi背后的是北京月之暗面科技有限公司(下稱“月之暗面”),該公司3月18日宣布,Kimi 智能助手在長上下文窗口技術上再次取得突破,無損上下文長度提升了一個數量級到200萬字。而在此之前,GPT-4 Turbo 128k公布的數字約為10萬漢字,Claude 3200k上下文約為16萬漢字。
長上下文意味著什么?實際能力如何?第一財經記者征求了業內人士的意見并實測了Kimi和通義千問等國產大模型產品。
為“宕機”致歉
Kimi訪問量的激增讓這家公司的網絡一度陷入癱瘓。從20日一早起,Kimi就發生429(引擎過載)問題,月之暗面為此發布了情況說明并道歉。21日下午,月之暗面旗下大模型應用Kimi的App和小程序一度無法正常使用,后恢復正常。
月之暗面由“90后”楊植麟創立,成立于2023年3月1日,目前已完成三筆融資。今年2月,該公司以15億美元投前估值完成超10億美元B輪融資,由阿里領投,礪思資本、小紅書跟投,投后估值約25億美元,是國內最主要的大模型獨角獸之一。
長文本無損壓縮是該公司瞄準的一個方向。據楊植麟介紹,長文本作為公司“登月”的第一步,是新的計算機內存,個性化并非通過微調實現,上下文定義了個性化過程。楊植麟還認為,大模型“馬拉松剛開始,接下來會有更多差異化”。
關于上下文長度提升后有何變化,21日月之暗面相關負責人告訴第一財經記者,這會進一步幫助打開對AI應用場景的想象力,包括完整代碼庫分析理解、可自主幫人類完成多步驟復雜任務的智能體(Agent)、不會遺忘關鍵信息的終身助理、真正統一架構的多模態模型等。
一名大廠大模型研究人員告訴記者,目前判斷一個大模型是否強大,還是基于指定評估數據集和用戶日常聊天體驗,但文本長度普遍有限,就會限制商業價值。在實際應用中,很多時候要考慮的是需處理的巨大信息量。如果大模型能解決長文本問題,潛在價值是巨大的,例如投喂財務數據輸出完整財報、投喂大量病例情況讓大模型幫助解決醫學問題。
“但值得注意的是,長文本擴展并不一定意味著實際效果足夠好,還需要有足夠理解能力以及對人類指令的遵循能力。文本之外,圖像及視頻大模型有更多token需要處理,需要足夠長的上下文能力支持。除文本的長上下文外,要實現AGI(通用人工智能)還需要有同時處理時、空、物等多維度信息的能力。”上述研究員說。
國內大模型哪家強?
國內大模型發展至今,不少應用已逐步走入C端,但國產大模型理解能力如何?能理解長文本并給出高質量回答嗎?第一財經記者實測了Kimi、智譜清言、通義千問等國內幾大主流大模型產品。
在評測后,記者發現,一些大模型還不支持長文本輸入或不支持較大的文檔上傳,Kimi、通義千問在解讀財報、研報、論文方面的能力較好,但Kimi有時會因“高峰時段忙碌而暫不回復”,智譜清言則犯過將非上市公司列入股票行列的錯誤,文心一言對諸如選股、找最新報告的要求有時不直接回應且出現過核心信息遺漏問題。
近日騰訊與清華大學、 香港科技大學聯合發布了一個圖生視頻模型,記者將該模型相關英文論文交給Kimi和通義千問、文心一言、智譜清言和訊飛星火,要求分析核心內容和論文實現方法,Kimi和通義千問都給出詳細解答。其中,Kimi點明論文貢獻、相關模型的框架和實現的關鍵步驟,關鍵詞匯還附帶英文名詞標注,通義千問除了實現方法外,還解答了實驗方面研究者如何進行評估。此外,將論文發給訊飛星火APP后,訊飛星火給出較短的文檔摘要,但不如Kimi和通義千問詳細清晰,且訊飛星火對記者的提問表示“在文檔中沒有找到與提問相關的內容”,訊飛星火網頁端對20M以上文檔上傳則有限制。
對于哪個國產大模型能讀懂研報并給出投資建議?記者將兩份不同券商發布的關于人形機器人行業的研報交給Kimi、通義千問、訊飛星火、文心一言、智譜清言,其中一份長達50頁,記者要求大模型分析哪些機器人股票比較有潛力,并要求挑出兩只可考慮買的股票。
測試結果顯示,Kimi和訊飛星火均給出10家有潛力的個股并分析原因,記者追問“如果要挑兩只股票買,哪兩只比較好”,Kimi和訊飛星火給出了兩只個股并解釋原因,同時提醒股票投資風險或建議咨詢財務顧問意見。通義千問則按產業鏈不同環節分列20余只有較高投資潛力的個股并解釋原因,根據研報資料挑選出兩只股票,同樣給出投資風險提示并建議尋求專業投資顧問的意見。值得注意的是,通義千問和Kimi挑出的兩只股票中,有一只是相同的,Kimi和訊飛星火挑選出的兩只股票也有一只是相同的。
即便是給出了風險提示,但這樣的結果也讓部分券商分析師感到不安。某分析師說:“如果將概念股的信息通過某些渠道加大投喂力度,這是否會引起搜索結果的導向出現偏差,引發較高的投資風險?”
從記者評測的結果看,智譜清言給出5只潛力比較大的個股中,其列出的公司中有一家并未上市。文心一言則表示,產業鏈一些環節的公司具有潛力,但沒有列出具體個股并逐個說明原因,且未直接回復“買哪兩只股票好”的問題,而是列出通用的選股策略。
能趕上GPT4嗎?
Kimi“引爆”概念股,一定程度上顯現資本市場對國產大模型能力躍進的期待。此外,近期國產大模型密集發布,廠商最頻繁使用的一個詞匯是“逼近”,強調自身技術實力“逼近GPT4”。資本市場聞風而動、大模型密集發布背后,國產大模型能趕上GPT4嗎?
一位人工智能行業人士對記者表示,由于目前大模型企業之間并無明確的對比項目,大多通過打榜的形式來佐證自身實力,因此無法通過嚴謹的第三方數據來區分廠商之間的技術差距,但可以明確的是,自從OpenAI將GPT4閉源后,國內廠商與其差距目前仍較大。
多名業內人士也提到過國內廠商與硅谷廠商之間的差距。智象未來創始人兼CEO、加拿大工程院外籍院士梅濤表示,從通用大模型的角度來說,中國廠商與硅谷廠商之間的差距有被拉大的風險,原因包括人才密度問題、資源問題。
瀾舟科技創始人兼CEO周明認為,國內缺乏一個國家機制或聯盟體來定義一個大模型未來發展的必要趨勢。這個問題一旦解決,中國的人才便可以快速攻關。雖然算力不足的問題尚在,但通過算法或應用發力,可以彌補這一缺憾。
此外,周明認為國內大模型企業要跟國家的發展大趨勢配合,而非一味去與美國相關企業看齊。他稱,更合適的動作應從綜合趨勢上進行推進,最為重要的是應用驅動。如果在場景和應用角度去反向驅動各個應用,推動國家經濟和生產力各個方面提升,中國基礎創新能力有可能在下一輪 AI 創新中引領國際潮流。
談及近一年人工智能領域的動態,中關村數智人工智能產業聯盟理事長、小米集團原副總裁崔寶秋是興奮的,他稱,看好大數據和深度學習帶來新一代AI技術的快速發展。從時間線上來看,一年多前大模型的發布仍存在“胡說八道”的問題,讓人感覺很不靠譜。但新的時代到來,雖然大模型技術目前是美國引領,但中國企業也在快速跟進。
責任編輯:楊紅艷
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)