股市瞬息萬變,投資難以決策?來#A股參謀部#超話聊一聊,[點擊進入超話]
作者: 劉曉潔
[ 據科技部新一代人工智能發展研究中心5月底發布的《中國人工智能大模型地圖研究報告》,中國10億以上參數規模的大模型已經發布了79個。 ]
剛過去的世界人工智能大會上,關于大模型的商業化和落地,幾乎是每一場論壇都被提及的問題。
“大家都看到了大模型的可能性,但是這個落地到底能有多大助力,還是未知數,”浙江大學教授趙俊博表示,“如何讓用戶在某一場景下感受到大模型的能力,并且愿意為它付費,這是巨大機會也是巨大挑戰。”
如果在WAIC的展覽上走一圈,你會發現大模型隨處可見,目不暇接,但走完后,很難說會對哪一個大模型的應用留下特別深刻的印象。百模大戰的背景下,同質化成為一個顯性的問題,此外,在如此大的投入下,企業應該如何建立競爭壁壘,在未來的洗牌階段生存下來,也是應該考慮的問題。
多位大模型從業者在接受第一財經記者采訪時表示,現在如果只是做出一個“聊得還不錯”的大模型,難度沒那么大,同時各家的區別并不大,真正有區分度的是解答數學題這類復雜推理的題目,這里面才真正體現了模型的思維能力。與此同時,面對同質化,不同的企業應當有對自身定位和資源稟賦的認真思考。
群雄逐鹿的大模型時代
過去的半年,通用大模型和垂直大模型的創業如火如荼,據科技部新一代人工智能發展研究中心5月底發布的《中國人工智能大模型地圖研究報告》,中國10億以上參數規模的大模型已經發布了79個。
在2023年H1結束后,啟明創投基于與近200家生成式AI企業的交流做了一個總結。在這些生成式AI新公司中,多模態應用方向占比達到44%,而提供支持的底層技術企業共占比29%,還有27%做的是語言類應用。
在200余家公司的具體方向中,生產力工具占得最多,高達46%,包括文案寫作、圖像生成、視頻腳本生成、3D資產生成等,另外ChatBot 占了8%。
銜遠科技創始人周伯文對第一財經表示,目前看來,各家大模型的總體差距不大,還沒有出現具備明顯優勢的一方,均處于對下一代AI技術研發與應用落地的探索階段。無論是百度、阿里等大廠,還是諸多創業公司,整體的發展策略還是以“追趕”為先。
在WAIC期間,上海AI實驗室發布了書生通用大模型,談及與其他大模型不一樣的地方,上海AI實驗室教授林達華告訴第一財經,實驗室非常關注模型核心內在的思維能力,“就聊天這個事情,從目前大家已經認知到的技術路徑來說,要調出一個感覺還可以的模型沒有那么困難,但是真正難的是要解非常難的數學題,一些復雜推理的題目。”
在6月,上海AI實驗室已經首發過一次書生·浦語模型,林達華表示,當時模型的數理能力還在30分左右,這個數字是相當低的,但現在已經到了60分了,而這背后的支撐的條件,一個是從2K做到8K的語境長度升級,其次是一些微調和更高質量的語料訓練。
不過,即使是該實驗室現在發布的模型,與GPT4仍然有著很大的距離。
國內的大模型發展速度已經非常快,在林達華看來,整體的感覺是,最頭部的企業與GPT3.5的距離沒有很大,背后的一個點在于,OpenAI在過往的一些論文里對GPT3.5的技術路徑大體有所公開,不過,從GPT3.5如何到GPT4的水平,到現在OpenAI沒有公布任何細節。
國內訓練大模型有不少的短板,此前很多觀點提到了中文語料的缺乏,但林達華認為,語料需要更好的技術清洗,但這并不是大的問題,最根本的是技術上的壁壘。
在用戶與大模型的互動中,經常會發現生成出來的東西令人哭笑不得,張冠李戴,例如讓AI畫一張車水馬龍的圖片,結果AI確實畫了一匹馬、一條龍還有水;紅燒獅子頭畫成了一張紅色的動物獅子的腦袋,這是模型怎么樣來保證生成結果的可靠性和準確性問題,林達華表示,這其實是目前行業共同面臨的阻礙。
包括此前的ChatGPT,在生成結果的準確性方面還有很大的挑戰,但在GPT4版本中,已經能夠做得相對較好,林達華解釋,在技術上是有壁壘的,需要后來者大量地試錯,經由不同的方案逐漸去靠近準確性。
網梯科技創始人張震提及自己的一個觀察是,在2022年12月用ChatGPT,感覺它還在一本正經地胡說八道,僅僅是及格線,而GPT4已經可以做到80分。
他舉例:“測國內的模型,你問它公雞蛋怎么做才好吃?所有的模型都會一本正經地說公雞蛋要蒸、炸、炒、煮,包括拿小學基本的邏輯題測國內的模型,只要那個題目不在之前的題庫里,它都聽不懂,唯一能聽懂的就是GPT4。”在全面測試了國內國際全部模型后,張震認為,如果是在教育領域做“老師”,GPT4是有希望的,目前國內的其他模型還沒有可能性,它們大都在教育領域缺乏基本的常識和推理能力。
由于GPT4未公開算法,作為追趕者的企業需要創造性地提出自研算法才能研發出達到或超過GPT4效果的通用大模型。基于以上的判斷,對于目前大模型的井噴式發布,行業普遍認可和樂觀。
商湯科技智能產業研究院院長田豐此前就對第一財經提到,“必須要通過競爭才能出來一個更優秀的大模型,美國在人工智能仍排在第一,我們在追趕的狀態,這個時候還是得去做,要重視或者鼓勵這種基礎科研的創新。”他認為,這是一個行業必經的歷程。
周伯文認為,良性競爭是發展的助推器。但他同時也提到,不建議所有的企業扎堆,尤其是做基礎的模型,消耗資源很大,且最后市場化和商業化的風險也存在很多不明朗的地方。不過長遠來看,算力方面的“浪費”會持續收窄,因為大模型最重要的是能力,而非參數規模。生成式AI未必需要大規模的模型參數,還有大量的空間去壓縮。
落地需深挖渠、高筑墻
最近半年,張震每周要參加1~2次的AI模型研討會,在WAIC期間,關于大模型、生成式AI等的相關論壇就有幾十場。
張震總結了研討會的頻率與行業發展階段的規律,“看論壇開的頻率就知道這個行業是什么階段,頻率特別高就說明在探索階段。”在畢業之前,張震在學校做過電子商務創業,當時創業失敗,很多人請他做專家講授失敗的經驗,“這樣的論壇一直持續到2004年就沒有了,因為在國內基本成熟了。”在他看來,現在大模型行業還處于初期不成熟的階段。
“我自己的判斷依據是,大模型是操作系統,所以國內只要沒有實力挑戰操作系統的公司,在兩年之后都會銷聲匿跡,都會變成每個行業的應用公司,在這個背景下,深入行業、深入應用,我覺得是未來發展的方向。”張震表示,大模型改變了教育領域里的計算結構,從過去的CPU+操作系統+應用,變成了GPU+大模型+應用。
應用、落地也是在WAIC期間經常被與會嘉賓提及的詞。“任何的技術,無論是大模型還是過往的深度學習,一個技術有生命力,一定要通過落地在實際的應用中產生價值。”周伯文對第一財經表示。
周伯文認為,中國生成式人工智能需要探索一條新的道路,即垂直整合從自有基礎大模型到應用,到終端用戶的全場景閉環,以實現生成式 AI 技術與商業價值“雙落地”。未來,大模型領域的企業還需深挖渠、廣積糧、高筑墻,錨定適合的行業,從創意工具走向可控性極強的生產力工具,建立自己的壁壘。
在有市場壓力的情況下,從企業的角度,周伯文的建議是先把價值閉環摸清楚,“從開源的基礎模型出發,先去構建整體的價值閉環,把商業形態價值點先摸清楚了之后,再回來去看整個閉環哪里還存在技術上的短板,這樣就能更有針對性地投入技術研發的力量,而不至于大家都重復投入到基礎模型上面。”
此前還有觀點認為,大模型領域是贏者通吃的游戲,林達華認為,可能會有少數的機構有能力做出高質量的基座模式,但會有非常多的企業和研究機構、團隊,能夠在這個基礎之上深入不同行業、不同需求場景,打造出真正有創造性、符合需求的產品,“這其實是一個非常分散的市場,很難一個公司有足夠多的部門能夠把落地場景做得很豐富。”
他的建議是,不同的企業應該有對自己定位和資源稟賦的認真思考,基于我們的生產生活需求非常復雜,最終一定會形成新的不同的分工格局。
據啟明創投報告,當前生成式AI市場處于技術主導的早期階段,未來存在千億美元市值的平臺性企業的機會。而那些簡單的文本處理和套殼的ChatBot將很快成為紅海。創業公司要從取悅早期用戶的興奮中冷靜下來,構筑更高的壁壘。絕大多數用戶并不僅僅滿足于獲取可能與事實不符的娛樂性對話,如何把知識嵌入大模型的需求非常迫切,當前相關技術和產品尚供給不足,仍處于藍海狀態。
而在通用大模型創業公司方興未艾的同時,許多面向特定行業的垂直大模型公司開始出現,主要聚焦在醫療、電商、科研、工業、自動駕駛和機器人等方向。具備行業屬性的智能助手方向的創業企業開始增加,如求職、招聘、求學、法律、健康、購物、企業知識問答等方向的個人助手和員工助手方向的創業公司持續涌現。
趙俊博團隊正在嘗試用大語言模型TableGPT處理表格。他們想做讀懂表格的大語言模型,根據表格和數據庫內容聊天,絕非閑聊,而是偏向于完成實際的工作內容,目標用戶包括企業管理者、數據分析師、學生等等,例如“零門檻讓你玩轉表格”。
責任編輯:周唯
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)