轉自:中國經營網
本報記者 李玉洋 李正豪 上海報道
金秋九月,推遲兩月的2022世界人工智能大會(WAIC)在上海舉行。在美國剛剛對華限售英偉達和AMD高端GPU(圖形處理器)的背景下,AI/GPU成為本屆大會除元宇宙之外的另一大“流量密碼”。
芯片是AI的基石。在“WAIC 2022”評選出來的八大“鎮館之寶”中,上海天數智芯的“智鎧100”和壁仞科技的通用GPU芯片BR100系列入選其中,成為業界關注的焦點。
《中國經營報》記者注意到,不只寒武紀、壁仞科技、燧原科技、瀚博半導體等這些AI芯片公司展示了最新的芯片產品,百度、華為等科技大佬也展示出了AI相關的硬件。
另外,在全民關“芯”的背景下,記者在一些AI芯片論壇上注意到,國內AI芯片公司已不止于對外宣揚算力理論峰值和未來愿景了,而把重點更多地放在了算力密度、能源效率、生態合作等話題上。
資深產業分析師黃燁鋒表示:“從今年的新品和生態更新中,能看到國產GPU/AI芯片企業在走向成熟。發布POD(智算機)、集群,強調系統和軟件生態的重要性,并將其落地轉化為生產力,無一不體現著現在的國產AI芯片企業已經脫離了過去講故事、賣情懷、談愿景的初期階段,朝著更具切實意義的方向邁進。”
算力不是看理論峰值
據了解,壁仞科技通用GPU芯片BR100采用了臺積電7nm制程,單芯片峰值算力可達每秒千萬億次浮點運算,打破了全球通用GPU算力紀錄;同樣采用7nm工藝的天數智芯首款云端推理通用GPU產品——“智鎧100”,于今年5月成功點亮,經后續測試修正后即可量產;成立于2018年的瀚博半導體則展示了國產云端7nm GPU芯片SG100,據悉該芯片是集渲染、AI于一體的全功能GPU,而云游戲、云手機、云桌面、云計算等元宇宙關鍵性應用場景正是其所要發力的重點領域。
值得一提的是,專注云端算力的人工智能公司燧原科技發布了高性能AI加速集群服務器產品云燧智算機(CloudBlazer POD),里面內置了云端AI訓練芯片“邃思1.0”和“邃思2.0”,云燧智算機及集群方案的誕生,也讓燧原完成了芯片、板卡、服務器、集群算力中心解決方案的覆蓋。
燧原科技創始人兼COO張亞林對記者表示,從前些年開始,AI模型參數規模就以每3個月提高一倍的速度在發展,如今模型參數已經發展到了千億,甚至萬億級規模了。“大規模集群是AI計算的必需品。”他指出,“算力底座不僅是芯片,還有板卡、軟件,更重要的是系統一體化。而這塊除了美國友商之外,中國國內能實現的還非常罕見。”
張亞林還指出,如何通過集群和系統的方式使AI大模型達成更高的生產力,已經成為一個關鍵問題。“我國東數西算工程的落地,不僅對能效、算力密度有要求,還在部署、運維、集成等方面提出了非常高的交鑰匙一體化需求。”他說,這是云燧智算機和集群誕生的背景。
“在AI技術、AI芯片發展到一定階段后,有越來越多的芯片企業開始強調有效算力、算力效率、算力密度之類的概念,且從端到云的不同企業都在談這些事。”黃燁鋒注意到,今年WAIC不止一家企業用PUE(Power Usage Effectiveness,數據中心總能耗/IT設備能耗)來衡量能源效率,這是一個更偏系統層面的指標。
而在單個AI芯片層面,瀚博半導體創始人兼CEO錢軍則在人工智能大芯片產業落地論壇上指出“評價算力,不能只看它的絕對值”,并提出了“算力密度”的概念,該概念可用來衡量一家芯片企業的實力。
如何理解算力密度?錢軍將其分為兩個部分:一是芯片單位面積內可達成的算力,比如一平方毫米芯片的算力如何;二是每瓦性能(Perf/W),即每瓦功耗能夠提供多大的算力。而算力密度在具體業務中的性能表現可從最大吞吐率、最大吞吐率下的時延和超低時延下的吞吐率這三個指標的對比中得出。
與算力密度相關的還有“算力網絡”。“現在,我國數據中心能耗每年都有10%以上的增長,每年的電費有近3%是服務于數據中心的。”中國移動(上海)產業研究院技術部總經理陰啟明指出,“算力網絡是將不同的算力孤島做連接,降低算力成本、提高算力可用性,如將東數西算工程與‘雙碳’目標匹配。”
“從企業的角度來看,更低的TCO(總擁有成本)才是追求算力密度的實際目的:以更低的成本獲得相同的有效算力,并且散熱、電費、運維之類的成本也需要足夠低。國家與企業兩者有著異曲同工的目標,都要求芯片能達成更高的算力效率和算力密度,這應當是這兩年的共識了。”黃燁鋒說。
國產AI芯片企業走向成熟
在錢軍看來,芯片及其衍生的產品從來不是“單打獨斗”的存在。對此,黃燁鋒持有類似觀點。“當我們到具體業務中去看算力和效率的時候,就不是拼芯片堆料的事情了,還涉及到系統級硬件、軟件框架、庫、工具鏈、生態這種難度顯著增大的組成部分。”他說。
在這些方面的建設上,英偉達是座高山,其余AI芯片公司目前只能望其項背,國內同行都對英偉達的生態建設水平感到有些無奈。英偉達CEO黃仁勛曾表示,開發者是英偉達的重要財富,目前英偉達全球開發者近300萬,在其CUDA(英偉達推出的通用并行計算架構,該架構使GPU能夠解決復雜的計算問題)計算架構平臺上有超過50萬個開發者,其中包含了百度、騰訊、阿里巴巴等大型跨國企業。
復旦大學芯片與系統前沿技術研究院副研究員陳遲曉則用了通俗易懂的話語闡述了生態對開發者的重要性和凝聚作用,他說學生在使用CUDA時碰到bug,網上一搜就能找到不少人也遇到了相同問題和解決方法,慶幸的是國內AI企業也在重視生態方面的建設了。
為破解硬件性能上的“單打獨斗”并不能將芯片功力全部發揮出來的問題,瀚博半導體更新和完善了軟件平臺VastStream,其不僅能加速各類AI應用的部署,例如計算機視覺、視頻處理、自然語言處理、搜索與推薦、算子自定義擴展等,還提供了系統管理等三大管理工具,方便客戶部署。同時,VastStream的基礎軟件棧功能也變得更加豐富。
壁仞科技也發布了類似的BIRENSUPA軟件全棧,從驅動、硬件抽象層、編程平臺、框架,到具體的解決方案和應用。除了壁仞GPU自身架構特性相關的接口外,BIRENSUPA框架層支持PyTorch、TensorFlow和百度飛槳PaddlePaddle,證明了產品兼容性。
要真正釋放集群作為生產力工具的價值,燧原科技認為軟件是關鍵要素。燧池智算平臺是燧原科技的軟件和生態平臺,其結合強大的云燧AI算力集群和先進的大規模算力資源調度,能為用戶提供人工智能模型生產及應用發布的全流程服務,能夠一站式滿足復雜的人工智能業務場景對人工智能服務的需求。
“從底層硬件(芯片到板卡,再到服務器與集群),到中間層的燧池軟件平臺,以及上層的應用,包括各種網絡模型,如視覺模型、語音模型、推薦模型、多模態大模型等。今年不少國產AI芯片企業都開始強調自家的‘一體化方案’,而著墨于系統和軟件平臺,體現的也是芯片的真正落地。”黃燁鋒說。
國內這些AI芯片企業雖然一直都在做軟件,但在今年更加注重落地的WAIC上,軟件、生態等的重要性更加凸顯了出來。黃燁鋒認為,軟件及各種框架、庫、中間件的完善程度才是一家AI芯片/GPU企業是否走向成熟的最直觀表現。
芯謀咨詢研究總監王笑龍也認為,“(AI芯片)設計得再好再花樣多,大家都不用,這搞出來有啥意義?所以關鍵還是要有合適的應用場景,讓大家都用起來。”
“發布POD、集群,強調系統和軟件生態的重要性,并將其落地轉化為生產力,無一不體現著現在的國產AI芯片企業已經脫離了過去講故事、賣情懷、談愿景的初期階段,朝著更具切實意義的方向邁進。或許對于整個行業而言,這些都是AI芯片從初期步入成熟期的開端。”黃燁鋒說。
“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)