神州數碼副總裁李剛:大模型幻滅低谷or波動上升?|甲子引力

神州數碼副總裁李剛:大模型幻滅低谷or波動上升?|甲子引力
2024年12月24日 15:19 甲子光年

精度、算力和應用場景局限,是大模型跨越幻滅低谷的關鍵。

在2024年12月11日的“萬千流變,一如既往”2024甲子引力年終盛典上,神州數碼副總裁、CTO李剛發表了題為《跨越幻滅低谷,懷疑還是行動?》的演講。

演講中,李剛強調了大模型技術對企業級應用帶來的機遇與挑戰,并指出了當前企業面臨的三大核心問題:精度、算力成本和應用場景局限。

李剛指出,神州數碼深耕To B領域超過20年,服務上千家國內大型企業。面對大模型對傳統數字化系統的顛覆性影響,神州數碼視其為重要的戰略方向。

然而,盡管LLM在提升效率和改善用戶體驗方面展現了顯著進步,其企業級應用效果尚未完全達標。部分原因是這些項目帶有防御性質,更多是為了跟上技術潮流而啟動,而非基于明確的應用場景需求。

自2023年起,神州數碼深入研究并致力于LLM的應用探索,發現客戶反饋的“幻滅”主要源于三個方面的問題:精度問題、算力成本高、應用場景局限。

針對這些挑戰,李剛著重分析了精度問題。大模型雖然能處理通識知識,但在特定企業的內部知識理解上可能存在偏差,導致不準確的回答。

為解決此問題,神州問學通過封閉的知識空間內訓練模型,即對企業內部知識進行治理,從而大幅提升模型對特定企業知識的理解精度。

此外,隨著單位算力成本的快速下降及技術創新,如神州數碼推出的異構融合智算加速平臺HICA,算力正在變得如同電力一樣普及且經濟,極大降低了企業的進入門檻。

李剛呼吁企業積極應對而非被動等待,抓住這一歷史性機遇,避免因錯失而喪失競爭力。他認為,持續解決問題將使大模型跨越幻滅周期,在企業應用中實現更廣泛的發展。

神州數碼副總裁、CTO李剛

以下是神州數碼副總裁李剛演講實錄,「甲子光年」整理刪改:

神州數碼專注于To B領域已有20年,特別是在服務大型企業方面,為上千家國內B端企業提供服務。大模型現在是我們的一個重要的戰略領域。

首先,大模型有可能徹底顛覆現有的To B數字化系統。有觀點認為它將重塑所有的數字化解決方案。我們認識到這種潛力,并將其視為重要的發展機遇。

其次,從事B端業務的一個顯著優勢是,一旦深入客戶環境,便能建立難以逾越的客戶粘性和競爭壁壘。這是神州數碼堅持深耕B端市場的另一個重要原因。

此外,神州數碼在過去20年間經歷了多次技術革命,如互聯網和移動互聯網等,這些都對B端業務模式產生了重大影響。面對當前的大模型浪潮,我們并不感到陌生,因為類似的沖擊我們已經歷過。

根據Gartner 2024年的技術成熟度曲線,大語言模型(LLM)已從2023年的期望膨脹期步入泡沫破裂低谷期,這一年被視為LLM應用的元年。現在,在大模型的實際應用中,已經出現了“幻滅低谷”的現象。這是新技術在進入企業應用環境時不可避免地經歷的一個階段,從萌芽期、期望膨脹期到幻滅低谷期,最后逐步進入穩步上升期。

實際情況是,盡管生成式AI已經開始為企業帶來成本節約、員工效率提升或營收增長,但許多企業客戶反饋現有解決方案尚未完全滿足企業級應用的需求。

當真正要推進大模型應用時,企業常常表示對投資回報率(ROI)并不十分清楚。這種不確定性導致了一種“噪音”,似乎表明大模型在企業落地過程中進入了幻滅期。

我們進行了非常深入的分析,基于服務數百家企業,并幫助大約100家實施應用的經驗,發現企業客戶認為大模型進入幻滅期的主要原因有三個方面:

1. 精度問題:大模型幻覺、上下文遺忘、可解釋性差以及領域知識缺失。

2.?算力成本高:高昂的投資、能源消耗及資源調度分配的復雜性。

3. 應用場景局限:高昂的投資、能源消耗及資源調度分配的復雜性。

關于精度問題,它是大模型在企業落地過程中的核心障礙。如果可以突破這一瓶頸,將極大地加速大模型的應用進程。

當前,很多應用場景集中在簡單的知識問答上,盡管這類場景看似基礎,但如果企業內部一個大模型對企業內部的知識能夠100%的答對,那么它的下游爆發出的場景是有無限想象空間的。

例如,它可以支持客服、維護維修、培訓,甚至輔助決策等多方面的工作。這樣的精度提升將會引發指數級別的場景爆發,為企業帶來巨大的價值。

為了實現這一目標,我們認為關鍵在于在一個封閉的知識空間內提高精度到企業可接受的水平。企業內部的知識空間不像通用大模型那樣沒有邊界;相反,它是有限且具體的。

例如,在汽車行業,“車書”涵蓋了所有與車輛相關的資料。如果一個大模型能夠完全掌握這些資料的內容,其產生的價值將是不可估量的。

以神州數碼發布的神州問學產品為例,我們進行了一項對比測試,結果顯示,未經優化的基礎大模型在獲取企業知識后進行檢索時,答案往往是不準確的。但是,經過企業知識治理并提升精度后,模型可以輸出完全不同的結果,顯著提高了準確性和可靠性。這表明,通過針對性的知識優化,可以在企業內部實現大模型的有效應用,從而克服精度問題,推動更多應用場景的開發。

在企業內部,還有大量的表格、圖片、專業術語以及復雜的公式等知識形式。對這些知識進行完整的治理后,我們可以大幅減少大模型可能出現的幻覺現象。就像數字化轉型中的數據治理一樣,知識治理將是大模型成功落地的關鍵工作之一。一旦這項工作完成,將會極大地促進企業大模型應用場景的爆發。

關于算力問題,在2024年初與企業的交流中,許多企業都表達了對算力成本的巨大壓力,動輒需要幾百萬甚至上千萬的投資。企業在沒有產生足夠真實的場景來證明算力需求合理性時,往往會望而卻步。

然而,我們可以預測到,隨著應用場景的爆發,算力需求將進一步提升。特別是從模型訓練轉向推理的過程中,這種需求會發生變化:訓練所需的算力會逐漸下降,而推理所需的算力則會上升。

根據IDC的數據,從2022年到2027年,智能算力的復合增長率預計將達到33%。雖然算力需求增長顯著,但好消息是單位算力成本正以每兩年4-8倍的速度快速下降。

例如,神州數碼推出的異構融合智算加速平臺HICA,算力正在變得如同電力一樣普及且經濟,極大地降低了企業的進入門檻。這樣的技術進步不僅促使企業更快地采用更多模型,還降低了算力成本。

最后再來看應用場景局限性問題。

作為一項革命性的創新技術,企業現在需要改變其擁抱新技術的方式。傳統的數字化轉型體系非常完善,通常基于自頂向下的項目規劃和預算設定。

但在大模型時代,我們轉向了產品交付組合型的數字化轉型,即圍繞具體任務場景不斷優化迭代,明確目標。當前AI在企業中的應用具有更大的不確定性,系統化的數字化轉型方法論正在形成之中,尚未完全固定。這一過程既是挑戰也是未來提升空間所在。

人工智能的應用將通過不斷的迭代——無論是數據還是用戶反饋——逐步實現新的范式。隨著大模型場景的逐步落地,智能化轉型將迎來一個新的階段。

回顧最初的技術成熟度曲線,如果我們只是懷疑和等待,迎接我們的可能不是大模型技術的幻滅,而是企業錯失戰略性甚至歷史性的機遇,從而喪失競爭力。積極面對并解決問題,這將不是一個幻滅的過程,而是一個波動上升的過程,是暫時的波折。實際上,幻滅的破滅,正是大模型進一步深入企業應用深度和廣度發展的良好時期。

海量資訊、精準解讀,盡在新浪財經APP

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 12-30 賽分科技 688758 --
  • 12-30 鈞崴電子 301458 --
  • 12-24 星圖測控 920116 6.92
  • 12-23 黃山谷捷 301581 27.5
  • 12-20 天和磁材 603072 12.3
  • 新浪首頁 語音播報 相關新聞 返回頂部