國內算力需求的黎明已經到來!

國內算力需求的黎明已經到來!
2024年12月26日 11:52 華爾街見聞

國盛證券認為,相較于ASIC芯片,GPGPU將是更適合中國當下幾年算力市場的產品模式。未來的2-3年內,GPGPU將憑借“能用”與“易用”成為國產算力的主旋律;通信方面,Scale-Out將以太網主導、Scale-Up領域“中國版 NV-Link”迫在眉睫。

周四A股市場,算力硬件股持續拉升,銅高速連接、CPO方向領漲,博創科技鑫科材料寶勝股份(維權)華脈科技得潤電子銘普光磁(維權)徠木股份等多股漲停,金信諾兆龍互連漲超10%。

國盛證券分析師宋嘉吉在25日的最新報告中指出,隨著頭部模型廠商開始走向放量與商業循環,國內算力需求的黎明已經到來。

今年以來國內“豆包”、“可靈”等優秀模型也開始商業化嘗試,隨著頭部模型廠商開始走向放量與商業循環,對于中國互聯網行業蛋糕的再一輪切分即將到來,而在本輪競爭之中,算力的建設,將是一切的先決條件。

國盛證券報告從梳理國產算力起量過程中的投資框架與邏輯:

算力:在未來的2-3年內,GPGPU將依然憑借“能用”與“易用”,成為國產算力的主旋律。

通信:未來機會將出現在兩個方向,第一是以太網交換機芯片的國產替代,第二則是隨著國產芯片放量,參與到中國版“NV-LINK”的合作與開發之中。

基建:從兩方面來看,首先是電子制造能力,國內光模塊廠商也將受益此輪從市場總體供需到客戶結構的改善。第二方面,中國擁有全球最先進的電網設施和充足的電力供應。

一個路徑:GPGPU將憑借“能用”與“易用”成為國產算力的主旋律

近期,海外ASIC的業務版圖逐漸浮出水面,許多投資者在這種背景下,認為ASIC作為AI專用芯片,其擁有更強的專用性,將會擁有比英偉達為代表的通用GPU更強的理論性能,是實現制程限制下算力“彎道超車”的理想之選。

但是國盛證券堅定認為,相較于ASIC芯片,GPGPU將是更適合中國當下幾年算力市場的產品模式。在未來的2-3年內,GPGPU將依然憑借“能用”與“易用”,成為國產算力的主旋律。

具體來看,AIASIC是指沒有DCU部分,只保留TensorCore,且采用脈動陣列取數法為原理的芯片,即谷歌TPU、Groq、Tenstorrent等海外主流ASIC。其余保留了DCU部分的芯片,均應歸類為GPGPU類型。

AIASIC和GPGPU的有不同優劣勢,國盛證券介紹稱:

GPGPU構型的芯片,最大的特點是其芯片由兩大部分組成,專門負責矩陣運算的TensorCore(TU)與負責其他運算如向量運算,加減乘除的小核部分(DCU)。

在ASIC芯片上,以當下主流的TPU架構為例,其底層原理是“脈動陣列取數法”,從微架構層面看,其拋棄了DCU小核的部分,只保留TU大核來進行矩陣乘法運算。CPU與編譯器直接從HBM中取出數字灌入TU來進行運算。

這么做有兩個好處,第一,省去了在實際運算中不參與矩陣乘法的“DCU”部分,可以將多余的面積堆積更多的TU,從而實現更高的“AI算力密度”。第二,由于采用了“脈動陣列取數法”作為填滿TU的底層原理,其將TU裝滿運算一次,并得出矩陣乘法結果的速度也更快。兩者相互結合,相同面積與制程下,此種原理的芯片相較于英偉達的GPGPU,可以擁有更好的理論算力。

但與之對應的,ASIC的芯片相較于GPGPU也有不少缺陷和劣勢。第一,在碰到稀疏數據,數據流中斷時,脈動整列取數法的效率會降低,而GPGPU因為有DCU提前處理數據,因此不會有此類隱患。而在AI場景中,大部分數據是稀疏數據,同時受制于通信,顯卡所獲取的數據并不完全連續,這在一定程度上降低了ASIC芯片的理論效率。

因此,國盛證券認為,GPGPU將是更適合中國當下幾年算力市場的產品模式:

雖然ASIC的芯片在同等制程和面積下,擁有更高的理論性能,但ASIC芯片的開發,需要編譯器和軟件生態層面的配合。由于沒有DCU部分的輔助,ASIC芯片的編譯器開發難度遠高于GPGPU芯片,同時新的生態軟件也給客戶帶來了極高的切換成本。

在當下階段,只有從模型訓練到推理應用全自有的海外頭部大廠,才能較好的運用自研ASIC。對于國內來說,未來幾年是算力部署的初始階段,GPGPU算力的易用性將使其對客戶更有吸引力,中國需要先用海量的,可用且易用的GPGPU算力堆砌出自己的模型與商業循環,在完全成熟以及業務顆粒度放大之后,ASIC在國內的市場才會慢慢顯現。

在此過程中,對于GPGPU架構的優化也非常重要,例如可以同樣通過對DCU中不同算力精度小核的取舍,來強化芯片的AI精度,也就是FP16精度的算力,實現更好的追趕,我們認為這才是對于中國算力來說當下更為合適的道路。

兩種道路:Scale-Out-以太網主導、Scale-Up-“中國版 NV-Link”迫在眉睫

隨著中國算力加速放量,自主可控的AI通信能力建設也迫在眉睫,國盛證券認為,建設中國AI通信,同海外一樣,分為“Scale-Out”與“Scale-Up”兩個部分。未來的機會將出現在兩個方向,第一是以太網交換機芯片的國產替代,第二則是隨著國產芯片放量,參與到中國版“NV-LINK”的合作與開發之中。

對于以交換機,以太網為主導的“Scale-Out”網絡,核心是具備從芯片到整機自主可控的交換機體系。而對于過去更加封閉和專用的“Scale-Up”網絡,我們不應走英偉達NV-Link體系的老路,而是應當學習海外以博通、AMD為主導的“UA-Link”聯盟的經驗,以及博通提倡的從封裝開始的算核標準化互聯服務,憑借過往中國電信巨頭的網絡經驗和國產交換機芯片,封裝技術的革新,組成適用于所有國產算力的自主版“UA-Link”和算核封裝標準。

首先看Scale-Out領域,國盛證券將是以太網主導:

在Scale-Out網絡這一層面,目前主要是兩大協議在相互競爭,一個是英偉達獨有的IB協議,另一個則是博通主導的以太網協議。在AI放量初期,英偉達的IB交換機憑借更好的集群性能以及對于AI訓練的支持獨樹一幟,但隨著在博通帶領下的以太網聯盟對于ROCE2.0協議的迅速推廣以及調試,性價比更高且開源的以太網開始逐漸滲透。

,當下來看,中國的主流交換機廠商推出的AI交換機普遍基于海外芯片,自主可控的交換芯片,將成為組建全國產化AI集群的關鍵一步,同時通過與國產芯片廠商與客戶的緊密合作,國產交換芯片也有望獲得更快的滲透曲線。

其次Scale-Up領域,國盛證券認為“中國版 NV-Link”迫在眉睫:

在Scale-Up網絡這一層面,全球目前是NV-Link發展較快,而NV-Link的持續迭代,也是英偉達在GPGPU架構下,保持對于ASIC芯片性能及性價比領先的關鍵一步。同時,ASIC和博通為代表的競爭者們,正在從過去的各自為戰,轉變為統一聯盟,24年5月,博通、AMD、Arista、谷歌等芯片,互聯網,網絡巨頭們組成UA-Link聯盟,共同創建一種加速器到加速器的開放行業標準化互聯,也就是人人可用的“NV-link”。

海外UA-LINK聯盟的成立,給了中國自主可控的“Scale-Up”網絡以非常好的追趕機會。但對比海外,中國一樣擁有具有深厚通信協議經驗積累的電信巨頭,同樣也擁有自主可控交換芯片道路上不斷探索的企業,我們認為,如果這些企業能夠帶頭組成類似于“UA-LINK”一樣的聯盟,可以快速幫助中國芯片公司形成對標“NV-LINK”一樣的互聯能力,這將助力中國算力的高速發展。

領先電網支撐海量AI算力,IDC再次成為核心資產

進入AI時代以來,單芯片性能固然重要,但算力的部署已經逐漸成為了像航母一樣考驗一個國家綜合制造能力的系統工程。

國盛證券認為,國內光模塊廠商也將受益此輪從市場總體供需到客戶結構的改善。

隨著國內算力逐漸放量,國內對于光模塊的需求也將逐漸釋放,同時疊加在速率迭代下,DAC等傳統連接線纜向AEC的升級,也有望助力光模塊廠商實現在邁向制造業龍頭成長路上的品類擴張的關鍵步伐。

同時,IDC再次成為核心資產,國盛證券表示:

相較于美國,中國的電力基礎設施與容量,都相較美國來說更優。美國的互聯網廠商在未來有可能走向自建核電站+DCI互聯的擴容之路。但對于國內來說,完善且充足的電力設施可以讓客戶通過第三方IDC提供的電力資源和機房實現算力的快速部署,從而為算力搶裝和業務擴展提供助力。同時由于不需要新建變電站、核電站等設施,中國的算力成本也有望通過基建和電力側縮小與海外先進集群的差距。

本文摘取自國盛證券《黎明已經到來—從技術演進看國產算力投資機會》,分析師宋嘉吉(執業證書編號:S0680519010002)

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

海量資訊、精準解讀,盡在新浪財經APP

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 01-06 惠通科技 301601 --
  • 01-06 思看科技 688583 --
  • 12-30 鈞崴電子 301458 --
  • 12-30 賽分科技 688758 --
  • 12-24 星圖測控 920116 6.92
  • 新浪首頁 語音播報 相關新聞 返回頂部