歡迎關注“新浪科技”的微信訂閱號:techsina
文/常心悅 周文君 溫俊 梁晴玟
來源/遠川科技評論(ID:kechuangych)
今天,當你走進顯卡市場,映入眼簾的各類產品大多屬于同一家公司——英偉達(Nvidia)。砥礪多年,如今的英偉達赫然在芯片界擁有著無可撼動的巨頭地位。回顧英偉達披荊斬棘的逆襲之路,讓我們回到那個群雄林立、硝煙四起的精彩年代:
1993年,30歲的黃仁勛與兩位合伙人一起創辦了Nvidia,作為自己的而立之禮。
1995年,Nvidia的第一款芯片NV1四處碰壁,公司只剩下30天的周轉資金。
1998年,Nvidia推出RIVA TNT,與當時如日中天的3dfx的Voodoo卡分庭抗禮。
1999年,第一顆GPU——GeForce 256誕生,成為Nvidia在顯卡史上留下的濃墨重彩的一筆。
2000年,Nvidia收購了曾經的對手3dfx,憑借著GeForce系列加冕為“顯卡之王”;另一邊,ATI不甘示弱地推出了Radeon DDR,AN對峙拉開序幕。
2006年,經過與ATI長達6年的拉鋸戰,Nvidia獲勝,并發布CUDA架構,邁向了新的革命進程。
十幾年的時間說長不長,但放在芯片行業已足夠使滄海變桑田,物轉又星移。在一輪輪硝煙彌漫的商業戰中,對手換了一個又一個,英偉達卻始終屹立不倒,不斷書寫著傳奇。
那么,英偉達是如何在群雄爭霸、變幻莫測的市場中審時度勢,百煉成鋼的呢?本文將分五個部分加以分析:
1. 前情概要:從VGA到GPU
2. 首次亮相,出師不利
3. 背水一戰,后來居上
4. 定義GPU,對峙ATI
5. 一統天下,發布革命性CUDA架構
前情概要:從VGA到GPU
說到顯卡,就不得不提它的由來——VGA Card。最初的顯卡稱為顯示適配器,是不受關注的電腦主板上的小芯片。隨著人們對PC圖形界面的需求越來越高,顯示適配器的彩色顯示能力大大增強,VGA card也從主板上獨立出來,顯卡這才誕生,但名稱并未固定下來:
VGA Card的第一代產品,是由ATI發布的 ATI VGA Wonder(圖像顯示卡),它只有輸出圖像功能。
到了第二代,Graphics Card(圖形加速卡)已經具備了圖形處理能力,將CPU從大量圖形計算工作中部分解放了出來,微軟Windows界面運行更加流暢。
到了第三代,Video Card(視頻加速卡)具備了視頻輔助解碼功能,此時仍是ATI主導發布。
經過了單色、彩色、2D、視頻,到了3D時代,顯卡市場迎來了新局面。1996年,3dfx旗下的Voodoo系列異軍突起。第四代3D加速卡革新了所有PC圖形處理器,也開啟了顯卡史上的“戰國時代”。
激烈的市場競爭加快了技術的更迭,1999年,英偉達發布了第五代顯卡~GPU(圖形處理器),硬件T&L賦予了GPU更多的圖形計算能力,顯卡由此上升到了與CPU比肩的高度。
從輸出圖形的微小芯片,到足以與CPU相提并論的圖形處理器,顯卡一步步從邊緣走向舞臺中心,而英偉達也是這樣逐步登上圖形市場之巔的。
首次亮相,出師不利
英偉達的故事,要從1993年說起。
那年,剛從斯坦福畢業兩年的黃仁勛懷揣著雄心壯志,與Curtis Priem和Chris Malachowsky兩位合伙人創辦了Nvidia。英偉達的初衷是瞄準3D領域,研發用于加快游戲中3D圖像渲染速度的專用芯片,以帶來更逼真的顯示效果。
當時的顯卡市場情況并不樂觀,3D技術蓄勢待發,2D統治力仍然在線。
市面上已有20多家圖形芯片公司,后起之秀層出不窮,市場趨于飽和。同時段ATI已發展多年,S3又憑借著出色的2D畫質,擊敗了對家Trident,盛極一時。英偉達所面臨的對手不可謂不強大。
但彼時的英偉達初出茅廬,工程師們一腔熱血,潛心打磨了兩年,終于推出了第一款面向游戲主機的圖形卡芯片NV1。然而,這樣一款被寄予厚望的匠心之作,卻差點將英偉達扼殺在搖籃里。
英偉達為什么出師不利?其根本原因還是顯卡與API的適配性出了問題。
電腦由不同硬件組成,由軟件發布指令驅動硬件完成相應工作。顯卡作為重要的硬件,其設計必然要能夠執行軟件的指令,而連接顯卡與軟件的重要環節就是圖形API。
圖形API是一個大量底層圖形指令的集合,軟件只需將自己所要進行的工作表達成特定的函數,進而根據API中規定好的指令功能設定出函數的執行和指令的調用方式,便可以調用硬件來執行這些函數,完成圖形的表達工作。而被調用的硬件,即顯卡,其設計則需要遵循API的需求。因此,顯卡的實際性能表現是由其與API的契合度決定的。
英偉達在NV1的設計上,集成了最大最全的游戲方案,迥異于市面上的所有其他芯片產品。NV1不僅同時支持2D、3D處理能力,還擁有當時流行的音頻處理能力,按理來說性能應該很能打。
然而,英偉達選擇了方形繪圖來實現游戲的的3D效果,它能讓NV1用更少的計算量來顯示更光滑的3D物體。
事不湊巧,在NV1發布的同一年,微軟開發出了采用多邊形成像技術的圖形編程接口——Direct3D標準,加上此前SGL發布的OpenGL,兩者都是采取三角形繪圖渲染。
NV1采取的非主流設計,使它既不支持 OpenGL標準,也不支持后來的 direct X 標準。與主流的API標準相悖,意味著NV1完全無法兼容行業通用標準。
此外,NV1身兼眾多功能,這也使開發成本居高不下,產品最終的售價高達399美元,是同期其他同類產品價格的兩倍。價格過高和需求不匹的雙重壓力下,NV1競爭優勢并不突出,銷量冷淡。
產品剛面世就跌了個大跟頭,英偉達舉步維艱,運營資金一度只能維持公司運轉30天。
縱使NV1讓英偉達開局不利,但它讓游戲屆大佬世嘉看到了英偉達的技術潛力。關鍵時刻,世嘉將瀕危的英偉達拉上了岸。
游戲機與PC不同,有自己的API,而且英偉達集成 2D 和聲卡的做法也很適合游戲機。世嘉要求調整 NV1 的架構,并用在土星游戲機上,隨后成為了NV1芯片的最大客戶。NV1有了用武之地,終于可以大展身手。
有了第一次合作之后,世嘉又找到了英偉達,希望他們來做下一代主機dream cast的顯示芯片,但英偉達沒有抓住這個機會。在幫助世嘉開發NV2的時候,英偉達堅持基于方形繪圖的設計理念與世嘉產生分歧,雙方的合作就此中止。
與世嘉合作破裂,研發中的 NV2 芯片也因此流產,但世嘉提供的700萬美元開發資助并未收回,這也成為了英偉達的救命稻草。靠著這700萬美金,英偉達終于摸到了市場的脈象。
背水一戰,后來居上
頭兩次的失敗給初生的牛犢狠狠澆了兩盆水。英偉達終于意識到,自己首先是一家公司,其次才是一家技術公司。閉門造車能夠成功的前提是出門合轍,衡量硬件開發成功的標尺握在軟件的手里。
1997年,英偉達推出全球首款128位3D處理器riva128。riva128使用了三角形繪圖,加入了 OpenGL 和 Direct X 等主流 API 的支持。它也是當時最早的支持AGP1x規范的顯示芯片之一。此外,riva128采用了當時最新的NV3核心,頻率能達到100MHz,制造工藝350nm,晶體管數量300萬。
憑借低廉的價格與高性能的2D/3D加速,riva128迅速獲得設備制造商(OEM)的認可。1997年底,Dell、Gateway和Micron相繼使用了riva 128。零售市場上,Diamond、STB、ASUS、ELSA和Canopus等也都相繼推出了基于riva128的產品。
riva128在前四個月內出貨量突破100萬臺,這一成功為英偉達積聚了足夠的資金發展后續產品,也讓英偉達得以進一步挑戰當時的市場霸主——3dfx。
1996年,3dfx公司推出Voodoo圖形芯片組。Voodoo是一款為游戲玩家量身定制的產品,專注于3D加速卡, 并支持D3D和OpenGL。Voodoo是一塊3D子卡,需要配合2D顯卡才能工作,但它可以跑出非常驚艷的 3D 畫面。
而英偉達的riva 128,顯示核心最大僅僅支持4MB顯存,3D分辨率只有800x600,在總體性能上與Voodoo仍有一定差距。
當時的顯卡市場,可謂是3dfx一枝獨秀。在Voodoo統治市場的鼎盛時期,3dfx占據了3D加速器市場80-85%的份額。
為什么Voodoo會如此受市場追捧呢?原因離不開它獨有的 API——Glide。
Glide是專為Voodoo卡打造的底層API,使得Voodoo無須硬件廠商額外提供API就可以直接開發游戲。在當時,Glide被公認為最好的3D接口程序,具有超高的易用性和穩定性。
由于Glide免費授權,90年代后期的絕大部分頂級游戲都支持Glide,比如極品飛車、雷神之錘系列等。當時的 PC 游戲也掀起一股 “Glide” 熱潮,即使價格遠高于同時期的riva128,不少人依然愿意花高價選擇Voodoo。
1997 年 11 月,3dfx推出Voodoo2。Voodoo2性能暴增,它的像素單元從一組升級到了兩組,頻率從 50 兆提高到了 90 兆。
此外,Voodoo2 還有一個殺手锏——SLI。憑借SLI,機器可以插入兩張Voodoo2,獲得成倍的性能提升。在那個平均工資都只有 600 塊的時代,一張Voodoo2的價格就一度高達 3000元。加上初代Voodoo的成功,不斷有游戲廠商尋求合作,最終Voodoo2成為了 3 dfx 最成功的一款產品。
面對強勢的3dfx,英偉達緊追不舍。
1998 年,英偉達推出TNT,與 Voodoo2競爭市場。相比 riva 128,TNT像素渲染管線增加到了兩根,與此同時,TNT也加入了 32 位色深的支持,相比同期只支持 16 位的Voodoo2,性能大幅提升,成為當時速度最快的3D加速卡。
但由于0.25微米制程在當時沒有完善,英偉達只好采用0.35微米制程,TNT也只能在90MHz下工作,實際上,TNT 性能未能趕超Voodoo2,而是互有勝負。
好在,英偉達的渠道廣,贏得了各大 OEM 廠商、板卡廠商的信任。在各大廠商的幫忙之下,英偉達扭虧為盈,站上了與3dfx爭霸的擂臺。
那么英偉達又是如何擊敗當時的巨頭3dfx呢?
在科技的比拼中,實力永遠是制勝的第一位。而在瞬息萬變的芯片行業,創新與質量便是實力的代名詞。
隨著微軟Direct X的更新完善,3dfx引以為傲的獨家API Glide在功能和效率上卻仍在原地踏步,因此逐漸失去了游戲開發商的青睞。到了1999年,大量游戲開始轉投Direct X和OpenGL。直到2000年12月,3dfx才宣布其Glide專有圖形API以開源形式提供。
除了在圖形API方面固步自封,3dfx的第二個問題出在代工廠。
為了在激烈戰局中維持利潤,3dfx于1998年收購了一線板卡廠商STB。但該公司使用的代工廠,與臺積電以及聯華電子相比,質量和生產成本都完全沒有競爭力。
此外,在團結產業鏈方面,3dfx也犯了大錯。由于收購STB,3dfx放棄了其他板卡廠商并收回芯片授權,自己生產顯卡。這一舉動激怒了技嘉,帝盟等一眾板卡制造商,它們紛紛轉投英偉達的懷抱。
無獨有偶,在此前的1997年,3dfx就因上市需要公開資料,將世嘉DC的詳細參數公布于眾,導致違約,兩家對簿公堂,最終世嘉終止與3dfx的合作。
昏招迭出之下,3dfx后續推出的Voodoo3沒能履行其架構和功能設置的承諾。
反觀同期英偉達的riva TNT2,則采用了臺積電的250nm工藝,并提供了最初的TNT所希望的性能,全面勝過了Voodoo 3。
因而,到了1999年初,英偉達與3dfx的爭霸賽逐漸沒有了懸念,隨著下半年英偉達向市場投以重磅炸彈,顯卡市場開啟了“楚漢爭雄”階段。
定義GPU,對峙ATI
1999年10月1日,紛爭不斷的顯卡市場響起了一記驚雷。
英偉達發布了GeForce 256 SDR,這是一款基于臺積電220納米工藝、集成了2300萬個晶體管的芯片,是世界上第一顆 GPU(圖形處理器)。
GeForce 256第一次在顯卡中加入了硬件T&L,即transforming&lighting(坐標轉換和光照計算),能夠進行大量浮點運算,從而將原本依賴于CPU的3D計算剝離到顯卡上,釋放了大量CPU資源,在使得游戲運行更流暢的同時,也大幅提高了畫面的精細度。
顯卡的地位隨著GPU時代到來而大大提高,成為了游戲電腦中最核心的硬件。
此外,GeForce 256 也是史上第一款256位的顯卡,帶來了有史以來最大的一次性能提升。首發的SDR版本相比TNT2只過去了半年,性能卻有60%的提升,兩個月后發布的DDR版本又在SDR版的基礎上提升了30%的性能。
英偉達憑借著GeForce 256這張卡皇領先的T&L引擎和翻倍的性能,打得各路對手不知所措。在臺式機版本上市一個月后,英偉達宣布了他們第一個適用于專業工作站的產品——Quadro,即基于GeForce 256的SGI VPro V3和VR3。
2000年12月25日,英偉達以 7000 萬美元外加 100 萬股股票,總計 1.1 億美元的價格收購了 3 dfx 的資產和專利,此時放眼市場,能夠與英偉達一戰的只剩下了ATI。
當年,英偉達的利潤為4100萬美元,是1998年的十倍,相比老牌巨頭ATI的1.6億美元,雖仍有一段距離,但這股增長的勁頭不容小覷。
英偉達過關斬將,終于在世紀之交與ATI展開了正面對決,而這場拉鋸戰一打就是六年。
英偉達的GeForce 256為其帶來了無限榮耀,隨后發布的繼任者GeForce 2 GTS又將上一代的性能大幅提升。在英偉達的步步緊逼下,ATI決定放手一搏,建立一條全新的游戲產品線。
2000年8月,全世界第一張Radeon顯卡上市了,它就是Radeon DDR,ATI宣稱其為“有史以來為臺式PC設計的最強大的圖形處理器”,ATI也憑借其卓越的T&L性能和對即將推出的Direct X 8的支持而勉強追上了英偉達的步伐,暫且保住了圖形市場份額第一的位置。
但反攻也隨之到來。
英偉達于2001年2月27日發布了GeForce 3,給GPU帶來了一項突破性的改變——可編程頂點著色器,用于更緊密地控制多邊形網格運動和更流暢的動畫序列,大大改進了傳統的GPU工作流程。
微軟隨后推出的Direct X(dx) 8第一次引入了Shader model的概念,制定了可編程著色器的標準,使得GeForce 3成為了超高分辨率下的視覺王者。
但由于支持Shader model的游戲當時尚未推出,GeForce 3最初的表現并不出眾,這就使ATI有了喘息之機。
ATI在2001年10月推出了新一代的旗艦顯卡,Radeon 8500,搭載了大幅改進過的R200 GPU,并首次支持到 dx 8.1,領先于GeForce 3的dx 8,性能幾乎達到前一代Radeon DDR 的2.5倍。同時,Radeon 8500還帶來了其他先進技術,令微軟也對ATI另眼相看。
在GF3系列的低時鐘Ti 200和超頻Ti 500型號的前后夾擊下,Radeon 8500表現依然不俗,A卡從這時打響了“驅動戰未來”的名號。
然而,N卡的市占率并沒有受到太大影響,這要歸功于英偉達對產品線的部署。
早在256時期,英偉達就通過DDR、SDR和TNT三個系列實現了高中低端全面布局,再到GeForce 2時期的旗艦版GeForce 2 ultra、高端GeForce 2 Ti、甜品GeForce 2 Pro、中端GeForce 2 gts 和 低端的GeForce 2 MX,覆蓋了顯卡市場的每個死角,只有消費者想不到,沒有英偉達賣不到。
至此,英偉達控制了32%的圖形市場,ATI為19%。
Nvidia在2002年2月發布了GeForce 4,從MX系列到高性能的Titanium系列(Ti 4400和Ti 4600),加上基于TSMC的150nm工藝,全方位滿足不同消費者對性能和性價比的需求。
面對GeForce 4出色的銷量,ATI破釜沉舟,選擇放棄R200的舊架構,用時一年打造出了R300,即Radeon 9700 Pro,這也成為A卡最高光的時刻。
Radeon 9700 Pro有許多“第一”的光環:全球第一款支持DX 9和SM(Shader model)2.0,全球第一款使用AGP 8倍速接口,全球第一款配備256bit位寬的128 MB DDR顯存……這枚顯卡的核心里包含1.07億個晶體管,能夠完成DX 9的海量浮點運算,還支持高級渲染器語言HLSL,在畫面效果大幅飛躍的同時還降低了開發難度。
與R300相比,GeForce 4的性能遭到全面碾壓,即使是高端的Ti 4600,很多游戲運行起來也落后R300一倍以上。R300標著和Ti4600相同的定價,提供的卻是翻倍的性能,自然廣受游戲廠商的歡迎。
面對ATI的逆風翻盤,英偉達這一次沒有給出及格的反應。
在錯過了微軟DX 9架構確立的消息后,英偉達推出的FX系列由于兼容問題和高溫自燃事故全面崩盤。
曾經的手下敗將3dfx在搬到英偉達之后終于實現了復仇,交出了糟糕的NV30圖形芯片——臭名昭著的“吸塵器”FX 5800和速度較慢的FX 5800 Ultra,甚至還落后于預定期限,更別提追上ATI了。
在這一回合里,ATI始終憑借著優越的驅動程序保持領先,市場的天平開始向A卡傾斜。于是英偉達痛定思痛,迅速投入了下一代DX9.0c 顯卡的研發。
功夫不負有心人,2004年英偉達又向沉寂許久的顯卡市場投下了一顆重磅炸彈——GeForce 6800 Ultra(NV40),首次支持Direct X 9.0c、SM 3.0,疊加Nvidia的PureVideo解碼和播放引擎,還引入了SLI技術,即允許多個GPU連接在一起,從而顯著提升單臺機器的圖形處理能力。
另一邊,ATI僅在一個月后就拿出了R400c 應對,但只是沿用R300的架構,并不支持DX 9.0c、SM 3.0。
2005年,英偉達與ATI繼續交錯發布新產品,戰況激烈。ATI的年度收入達到22億美元,創下公司歷史最高紀錄。然而,凈利潤卻下滑至1,690萬美元,這是受累于加速迭代產品和高額的研發費用。光靠ATI的力量已經無力再與英偉達競爭。
2006年10月25日,ATI被CPU巨頭AMD收購,AMD因此背負了巨額債務。
負債累累的AMD在CPU方面應戰英特爾,在GPU方面應戰英偉達,不同的強敵使其一時難以招架,隨之帶來市場份額下滑與顯卡發布延期,這就給英偉達創造了寬松的發展空間,使其進一步搶占了更多的市場份額。
AN爭霸戰,終于以英偉達的勝利告終。
一統天下,發布革命性CUDA架構
隨著顯卡大戰走向終結,GPU的發展也迎來了一個轉折點。
在當時,英特爾的CPU可以通過多線程技術被所有計算機應用分享,但GPU還只能通過OpenGL/Direct X等接口跟用戶交互。到了2005年,主要的GPU制造商都使用頂點著色單元和像素渲染單元兩種計算資源。然而,合理配置這兩種資源的問題卻始終沒有得到完美解決。特別是兩種處理器數量的最佳比例是隨應用的變化而變化的,因此經常出現一種處理器不夠用、而另一種處理器閑置的情況,這就限制了高性能運算技術的發展。
雖然當時英偉達的傳統游戲和專業繪圖業務并沒有這樣的高性能運算需求,英偉達首席科學家David Kirk卻認為,從長遠看,讓原本只做3D渲染的GPU技術通用化,有重大戰略意義。
如果能夠給GPU裝備一組完全相同的、具有較強編程能力的內核,根據任務情況在頂點和片元處理任務之間動態分配,問題就會被完美地解決了,而這套編程體系正是著名的CUDA(Compute Unified Device Architecture)技術。
David Kirk最終說服黃仁勛,投入大量資源研發能夠讓GPU變得通用化的CUDA技術,并讓每一顆英偉達GPU都支持CUDA。這一舉動在當時被視為不計成本的瘋狂之舉,絕對是一場賭上全部身家的押注。
在技術方面,芯片面積增大、散熱增加、成本上升、故障率增高;同時,還要保證每款產品的軟件驅動都支持CUDA,這對英偉達的工程師來說是巨大的工作量。
在資金方面,一旦項目啟動,每年砸到CUDA的研發成本估算就有5億美元,而當時公司全年的總收入約30億美元。更何況,在當時CUDA只是一個與公司核心業務關系不緊密的軟件平臺。最后來看,自CUDA推出以來,英偉達在將GPU轉化為更通用的計算工具上投入了將近100億美元。
從G80開始,英偉達GPU體系結構已經全面支持通用編程,同時英偉達也推出了CUDA編程技術,為GPU通用程序設計提供了第一套完整工具。在G80之后,英偉達又推出G90、Fermi、Kepler和Maxwell等多代GPU,其通用計算能力越來越強大。
而此時,計算行業也正在發生著變革,摩爾定律帶來的計算提升速度正在放緩,這也讓當初借此統治芯片市場的英特爾地位發生動搖。諸多芯片設計公司試圖從無到有打造更專業的芯片,并讓該類芯片與英特爾處理器一同運行。
英偉達不需要從頭做起,只要重新定位已有的芯片,利用在CUDA項目中開發的芯片和軟件,就打造出一個廣受程序員和企業歡迎的技術平臺。
芯片戰爭還在繼續。
在AI領域,芯片制造商之間的斗爭才剛開始。英特爾接連重金收購了可編程芯片制造商Altera、專注于研究深度學習和機器視覺的其他創業公司、還有為汽車生產自動駕駛設備的以色列公司Mobileye。谷歌也在自研人工智能芯片,在TPU的助力下,谷歌在圍棋比賽中擊敗了世界冠軍柯潔。
但無論是誰,都無法在通用計算領域真正與英偉達爭雄。
尾聲
分久必合,合久必分。經歷了戰國混戰、楚漢爭雄,英偉達成為顯卡市場毋庸置疑的統治者。
但英偉達一路上的挫折實在不少,黃仁勛也不是一個全知全能的創業者。創業初期執意用方形繪圖的技術路線,追求盡善盡美的全能產品定義,都是英偉達曾經犯過的致命錯誤。但是,好在黃仁勛懸崖勒馬,在存亡危急之秋力挽狂瀾,最終成長為一個在商業上高度理性、卻又保持積極進取、知道犯錯就打臉改正的企業家。
而英偉達一路崛起和升級打怪的關鍵,在于敏銳把握商業環境中的關鍵變量,永遠比對手先行一步。
正是在世紀之交的顯卡大戰中,黃仁勛天才般地聚集了GPU行業成功所需的核心要素:
在圖形API上,英偉達開放擁抱direct x和OpenGL,摒棄閉門造車的陋習;
在產品定義上,英偉達率先將硬件T&L等功能從CPU解放出來,重新定義了GPU,并逐漸修煉出嫻熟的刀法,為不同的人群和市場定位出高、中、低端產品,最大化市場收益;
在技術路線上,英偉達廣泛吸取業界的前瞻性概念并加以激進實現,率先支持shader model和發布CUDA,都是無與倫比的杰作;
在晶圓代工上,英偉達與臺積電結成了牢固的同盟,由此開始了長達二十多年的戰斗友誼,產業鏈上游始終穩如磐石;
在板卡和OEM廠商上,英偉達團結了最多的產業鏈下游,鞏固了市場渠道。
在劇烈動蕩的芯片市場,黃仁勛在混沌變化的環境中建立了全面穩固的支撐,英偉達的創新冒險也由此變得不再那么高風險而致命,而是可以一步一步,搭建起通往通用計算的天梯,完成對計算世界的整合。
英偉達的神話至今還在延續。太平洋西岸的中國,一場對標英偉達的創業潮徐徐拉開了帷幕。
那么,誰能成為中國的英偉達呢?
(聲明:本文僅代表作者觀點,不代表新浪網立場。)