早在2015年,全球GPU芯片龍頭英偉達的創始人黃仁勛就曾犀利地評價競爭對手AMD:“我們已經好多年不看AMD的動作了,當(英偉達和AMD)差距是9跟0的時候,已經不是差距的問題了。” 在圖形顯示等GPU傳統應用市場,英偉達長期占據了80%以上的市場份額,將AMD遠遠甩在后頭。但隨著AI大模型時代到來,AMD正試圖憑借空前強大的芯片新品和難得的產業機遇,攻入英偉達的腹地。
作者 |董溫淑
來源 |市界
“我在不停打仗”,在芯片界鐵娘子蘇姿豐(Lisa Su)的職業生涯里,有兩場至關重要的戰役。
第一場,是在2014年接手AMD(美國超威半導體),以力挽狂瀾之勢讓AMD從深陷財務危機到一舉成為英特爾最強勁對手,股價上漲了40倍。另一場則是在當下,今年6月,AMD發布了針對AI需求的最新款芯片Instinct MI300,這是其狙擊英偉達最強勁的一個武器。
在GPU芯片領域,AMD與英偉達的緣分妙不可言。英偉達與AMD長期以“八二開”的比例瓜分著全球市場份額,在圖形顯示等市場并稱雙雄。而媒體則樂于炒作二者更私人的關系——比如,英偉達CEO黃仁勛與蘇姿豐可能存在的“表親關系”,當然,雙方從未在任何場合正式回應過這些話題。
無論關系如何,黃仁勛一點都不手軟,他對鐵娘子蘇姿豐的第二場戰役迅速展開了雷霆反擊。
北京時間11月13日晚間,英偉達發布了全球最強AI芯片H200,其性能較H100直接翻倍。打了搶先發布MI300的AMD一個措手不及。此前,AMD表示,公司正在今年第三季度向客戶提供樣品,產量將在第四季增加。原本MI300將有望成為AMD最快銷售額破10億美元的產品。
英偉達稱H200將在2024年第二季度開始交付,留給AMD搶跑的時間不多。
AMD還是樂觀了。
今年Q3財報發布之際,AMD曾大膽給出業績預期:四季度營收將達到58億美元至64億美元之間,預計為61億美元,同比增長9%——這也將是AMD自2022年第三季度以來,最高的季度收入。
這種預期也可以理解,2023年第三季度,AMD營收58億美元,凈利潤2.99億美元——是連續7個季度的凈利潤同比下滑之后,首次實現季度凈利潤的同比正增長。
而AMD幾乎將自己未來業績強勁增長的底牌,全部押注在了一款產品上:
今年6月份,AMD專門針對AI大模型訓練需求發布的Instinct MI300系列芯片。這幾乎是全球范圍內,第一款能夠直接對標英偉達大模型訓練芯片H100的產品。
根據AMD官方信息,MI300在部分技術指標上相比英偉達的H100更具優勢,比如MI300提供的HBM(高帶寬內存)密度是H100的2.4倍,HBM帶寬是H100的1.6倍。這意味著AMD可以運行比英偉達H100更大的模型。
驚艷四座的ChatGPT大模型大部分基于英偉達2020年發布的A100芯片進行訓練。而在2022年3月份,英偉達面向AI大模型訓練需求專門發布了H100芯片。
從亮相開始,H100就迎頭趕上了“百模大戰”的風口,成為了被各方力量爭奪的寶貴算力資源。據坊間傳聞,早在今年第三季度時,英偉達H100的訂單就已排到了2024年,至今產品稀缺程度有增無減。
盡管如此,在發布會上蘇姿豐還是表現得十分有信心:“我們認為,數據中心人工智能加速器(市場)將以超過50%的復合年增長率,從今年的300億美元左右增長到2027年的1500億美元以上。”
AMD計劃在第四季度量產MI300。在此基礎上,公司預計在第四季度,包含MI300在內的數據中心GPU業務營收將達到4億美元;而在整個2024年,公司數據中心GPU產品有望實現20億美元的銷售額。
AMD數據中心GPU產品的下游市場既包括科學計算等高性能計算領域,也包括AI領域,但蘇姿豐認為后者才是業績的主要增長動力:“隨著2024年的到來,我們預計收入將繼續按季度增長,而且,這將主要來自人工智能。”
而其中MI300被寄予厚望,將成為該公司“有史以來最快達成10億美元銷售額的產品”。
此前,AMD雖然在GPU市場名列第二,但主要應用于圖形處理、消費級產品等傳統GPU應用場景,在AI和高性能計算領域始終存在感較低。
從MI300的性能指標而言,AMD本來已經幾乎具備了與英偉達叫板的能力,直到H200橫空出世。在H200發布會結束結束后,AMD收盤股價下跌1.52%。
在未來,AMD想要在如火如荼的AI技術市場中搶得一席之地,面前的壓力仍毋庸多言。
至今AMD尚未公布MI300的官方定價,但市場預計,為了增加與英偉達的競爭籌碼,AMD MI300或許不得不延續其在傳統GPU市場的性價比路線。
不僅如此,為了完成預期業績,AMD還于10月份在上海啟動了一輪裁員“瘦身”。
據一位AMD前員工對‘市界’透露,本次AMD給出的賠償條件是“N+3”倍的月工資,主要涉及的部門為SoC(系統級芯片技術部門)和RTG(Radeon系列顯卡技術部門)。
大模型時代,AMD等來了一個翻身機遇,只是對這份機遇AMD做出的反應還是晚了。
一位在國內高校任職的AI研究人員告訴‘市界’:“除了媒體報道的韓國(指該國電信運營商’KT’)使用AMD Instinct平臺運行了AI大模型的新聞,在日常研究里,我還沒有接觸或了解到使用AMD芯片訓練的項目。”
這種情況也反映在了市場數據上,據IDC調研,2022年中國AI加速卡(即AI訓練芯片)出貨量約為109萬張,其中英偉達在中國AI加速卡市場份額為85%,華為市占率為10%,百度市占率為2%,寒武紀和燧原科技均為1%。根據這組數據,AMD的AI訓練芯片在國內市場甚至“沒有姓名”,淪為其他。
不僅如此,亞馬遜AWS、谷歌、騰訊云等全球主要云廠商的AI芯片也大多來自英偉達及自研,采用AMD產品的占比較小。
追溯形成顯著市場差距的原因,可以將目光轉向多年之前。
英偉達創始人黃仁勛曾這樣總結:“我們很早地,大約在10年前就發現,(AI)這種制作軟件的方式可以改變一切。我們從底層一直到頂層,從各個角度改變了公司。”
在一家美國GPU獨角獸企業擔任市場總監的Lee告訴‘市界’:“早在2012年,英偉達就開始投入在深度學習的計算了,而且是在全公司范圍內貫徹執行。”而這相較業內普遍意識到AI芯片的重要性,至少早了四五年的時間,領先一個身位。
從2016年開始,英偉達旗下的加速計算GPU產品線(代號“Tesla”)開始專門針對AI訓練任務進行設計。這一年推出的芯片型號為P100,同時配備有英偉達新研發的高速互聯技術“NVLink”。而NVLink能夠允許CPU、GPU芯片間進行高速交互,進一步提升了運算效率,至今仍是英偉達AI芯片中的核心技術之一。
還是在這一年,英偉達向后來推出了ChatGPT的OpenAI捐出了一臺搭載了8塊P100芯片、價值百萬的超級計算機“DGX-1”。在這臺超算的機箱上,黃仁勛親手寫道:“為了計算和人類的未來,我捐出世界第一臺DGX-1。”
后來的種種跡象都表示,這段時間正是人工智能的黃金發展期。正是在2016年,谷歌Alpha go擊敗了圍棋大師李世石,被視為AI技術邁上新臺階的重要標志。不僅如此,AI相關產品、硬件、軟件等的市場規模已經超過80億美元,紐約時報評價稱“AI已經到達了一個熱潮”。
反觀同一時期的AMD,雖然同樣試圖在AI方面有所布局,但彼時其重心更多放在CPU業務線上,并未像英偉達一樣全面押注。
2016年,AMD正式推出Radeon Instinct系列產品線,旨在加速深度學習、神經網絡和高性能計算等方面應用。
然而從產品更新情況而言,AMD對旗下AI芯片的設計顯然不夠“上心”。在之后的4年間時間里,Radeon Instinct系列雖然不斷更新,但始終與AMD的消費級顯卡Radeon公用基礎架構,在計算方面缺乏針對性和高效率,難以滿足AI訓練的需求。
直到2020年,這種情況才有所轉變。這一年,AMD將AI芯片產品線更名為“Instinct”,并首次拋棄了以往的消費級顯卡架構,為其采用了專門設計的CNDA計算架構。
在此之后,AMD連續更新了三代產品MI100、MI200,以及最新發布的MI300。憑借全新的技術路線,以及采取高性價比的市場策略,AMD才開始在AI訓練市場中有人問津。
只是,在AMD“缺席”AI市場的幾年里,英偉達已經建立起了極強的生態壁壘。
Lee這樣向‘市界’描述英偉達在AI領域樹立的優勢:“真正難的并不是說比別人跑的多快,而是圍繞著這一個主題,進行全方位點點滴滴的下注,從語言設計到開發者工具這些周邊的東西才是最難得的。”
而周邊工具一旦被用戶所接受,“客戶技術遷移的成本將會是難以想象的高”。
資深AI從業者路云的說法也從側面印證了這一點,據其回憶:“早在大約10年前,我們學校就給高性能計算相關專業的學生開設了基于CUDA的課程。”
CUDA是英偉達在2006年推出的通用并行計算架構,借助CUDA提供的編程接口和工具集等,開發者可以基于GPU芯片編程、運行復雜的AI算法等等。
全球頂尖AI學者、前百度首席科學家吳恩達曾這樣評價CUDA:“CUDA出現之前,全球能用GPU編程的可能不超過100人,有了CUDA之后使用GPU就變成了一件非常輕松的事情。”
這樣一代代的開發者和研究者,用汗水澆灌出了英偉達的強大生態。換句話說,即使AMD MI300的官方性能指標相比英偉達H100體現出優勢,后者的生態壁壘仍舊難以逾越,更別提H200展現出了更強的性能指標。
這樣的背景下,AMD想要逆風翻盤,除了著力補上生態差距,還不得不在市場策略上別出心裁。
生態方面,2016年,AMD推出了對標英偉達CUDA的ROCm架構。據東吳證券研報,由于ROCm平臺起步晚,其對于GPU加速庫的支持沒有英偉達CUDA全面。CUDA的應用場景基本能夠覆蓋全場景,但ROCm更多用于高性能計算領域,對AI的覆蓋稍顯不足。
至今,AMD ROCm平臺的工具鏈已經相對完善,并且能夠兼容英偉達的CUDA平臺。此外,為了進一步優化軟件生態,AMD還在2023年10月份官宣收購了AI軟件企業Nod.ai。
對此東吳證券研報評論道:AMD的軟件生態在公司大力投入和其它廠商積極扶持下,有望徹底改善。
另一方面,AMD高性價比的市場策略將是其在AI領域的另一大優勢。聯博資產管理公司的分析師Stacy Rasgon認為,提供’平替版的英偉達’,將是AMD爭取市場支持的關鍵。
AI研究公司Cambrian AI Research則分析稱,大公司需要“第二供應商”的戰略將為AMD提供機遇:“像OpenAI和微軟這樣的公司需要有一個能替代英偉達產品的選擇,AMD可能會給他們一個無法拒絕的提議,但不要指望能從英偉達那里搶走很多份額。”
無論如何,大模型產業疾速發展帶來了巨大的算力缺口:根據OpenAI 數據, 模型計算量增長速度遠超人工智能硬件算力增長速度,兩者之間存在萬倍差距。
對于長期在AI領域缺乏存在感的AMD而言,它正迎來了最好時機。
(聲明:本文僅代表作者觀點,不代表新浪網立場。)