來源:新智元
黃仁勛、皮衣、自家廚房。
這一次,老黃的頭發有點長。
今日凌晨,NVIDIAGTC2021開幕。
今年,「GPU大哥」英偉達居然「不講武德」,發布一個基于Arm架構的新數據中心CPU Nvidia Grace,它將直接挑戰英特爾在服務器和數據中心計算領域的主導地位。
毫不奇怪,英特爾和AMD的股價在這一消息上下跌了幾個百分點。
隨著英偉達進軍CPU領域,且能大大超越Intel和AMD的處理器,英特爾和AMD或將在這一技術領域輸掉競爭?
先來看看英偉達的CPU有多強。
英偉達CPU:因AI而生,進擊英特爾最賺錢的領域
對英特爾和AMD來說,這是個壞消息。
英偉達宣布出算力強大的CPU, 把戰火燒到了英特爾后院。
十年前在英特爾試圖狙擊Nvidia GPU殺進HPC異構并行的努力,畫了一張圖,今天隨手在手機上指頭畫了一下,CPU和GPU分別從高浮點算力和高通量處理的南北山頭向頂端攀登,
現在看,借助AI興起,英偉達勢頭更猛一些,帕特基辛格同志要小心了。
專攻GPU的英偉達在這次GTC大會上推出了基于Arm架構的中央處理器(CPU)—— Grace,用于大規模人工智能和高性能計算應用。
黃仁勛表示,「這是英偉達第一個數據中心CPU,專為大型應用建立」。
這款CPU以美國海軍少將、計算機編程先驅GraceHopper的名字命名。
Grace Hopper是計算機科學的先驅之一,也是哈佛Mark 1的第一批程序員和第一個鏈接器的發明者。
她在20世紀50年代開創了計算機編程,發明了世界上第一個編譯器,被稱為「計算機軟件工程第一夫人」。
GPU用于運行視頻游戲和數據中心的數據密集型計算任務。而CPU更像是「通才芯片」,可以執行諸如運行操作系統之類的基本任務。
這款名為Grace的CPU使用了節能 Arm 核心—— Neoverse,為系統訓練大型人工智能模型提供了巨大的性能飛躍。
具體講,基于Grace的系統與NVIDIA GPU緊密結合,性能將比目前最先進的NVIDIA DGX系統(在x86 CPU上運行)高出10倍。
它能夠滿足世界上最先進應用的計算需求,包括自然語言處理、推薦系統和人工智能超級計算,這些應用分析需要超快計算性能和大容量內存中的巨大數據集。
Grace還是一款高度專用型處理器,主要面向大型數據密集型HPC和AI應用。新一代NLP模型的訓練會有超過一萬億的參數。
這款CPU的基本性能是第四代Nvidia NVLink互連技術,該技術在Grace和Nvidia圖形處理單元之間提供每秒900 GB的連接,使總帶寬比目前領先的服務器高出30倍。
英偉達表示,新產品將于2023年初上市。
黃表示,使用經過授權的 ARM IP,英偉達將 Grace 設計成專門用于大規模人工智能和高性能計算的 CPU。
「加上 GPU 和 DPU,Grace 為我們提供了計算的第三個基礎技術,以及重新構建數據中心的能力,以推進人工智能。英偉達現在是一家三芯片公司?!?/font>
英偉達新推出CPU將會在明年兩臺性能強大的AI超算上實現首次應用。
黃表示,「這是世界上第一個為 TB 級計算設計的 CPU」。
作為首批客戶,瑞士超級計算中心(CSCS)和美國洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)將是第一個使用由惠普打造的Grace驅動的超級計算機的機構。
Grace將為世界上最快的超級計算機提供驅動力。這臺被稱為阿爾卑斯山的超算將具有20億次浮點運算的能力。
這比當今領先的人工智能超級計算機——2.8億次運算的 Nvidia Seline 超級計算機的計算能力高出約7倍。
GTC 2021推出的第一款服務器微處理器Grace,代表了英偉達想要在CPU領域一展宏圖,搶占英特爾最賺錢的市場領域。
BlueField-3 DPU
黃仁勛宣布NVIDIA BlueField-3 DPU將為構建超大規模數據中心、工作站和超級計算機所需的基礎設施提供進一步的加速。
這款新一代數據處理器將提供最強大的軟件定義網絡、存儲和網絡安全加速功能。
BlueField-2能夠卸載相當于30個CPU核的工作負載,而BlueField-3實現了「10倍」的性能飛躍,能夠替代300個CPU核,以400Gbps的速率,對網絡流量進行保護、卸載和加速。
英偉達「三芯」
數據中心路線圖包括CPU、GPU和DPU這三類芯片,Grace和BlueField是其中必不可少的關鍵組成部分。
每個芯片架構歷經兩年的打磨周期(周期內可能出現轉變),一年專注于 x86 平臺,另一年專注于 Arm 平臺。
「我們每年都會發布激動人心的新品。三類芯片,逐年飛躍,一個架構。」
Arm無可比擬
Arm是全球最受歡迎的CPU,黃仁勛解釋:「理由很充分,因為它超級節能,而且其開放式授權許可模式激勵了全世界的創新者?!?/font>
在云計算、企業和邊緣數據中心、超級計算、PC等其他市場中,Arm也開始嶄露頭角。
黃仁勛宣布與多家重要的Arm合作伙伴展開合作,包括云計算領域的AWS、科學和云計算領域的Ampere Computing、超融合邊緣服務器領域的Marvel、以及將打造Chrome OS和Linux PC SDK與參考系統的聯發科。
面向AI的計算機DGX
軟硬件雙管齊下,黃仁勛宣布升級NVIDIA專為工作組打造的「便攜式AI數據中心」——NVIDIA DGX Station,以及NVIDIA專為密集型AI研發打造的AI數據中心產品——NVIDIA DGX SuperPod。
全新DGX Station 320G借助320GB超快速HBM2e連接至4個NVIDIA A100 GPU,內存帶寬達到每秒8TB。然而,僅需將其插入普通的壁裝電源插座即可使用,耗電量只有1500瓦。
DGX SuperPOD使用全新80GB NVIDIA A100,將其HBM2e內存提升至90TB。目前它已經升級至采用NVIDIA BlueField-2,且NVIDIA如今還為該產品提供配套的NVIDIA Base Command DGX管理和編排工具。
Omniverse:還原尼爾·斯蒂芬森的《雪崩》世界
人類與AI和機器人共存的虛擬實時3D世界不再只是科幻小說中的故事情節。
NVIDIA Omniverse是一個云原生平臺,其特點包括:可以擴展至多個GPU、具有高物理精度、能夠充分運用RTX實時路徑追蹤和DLSS、可以使用NVIDIA MDL模擬材料、可以使用NVIDIA PhysX模擬物理學并且與NVIDIA AI完全集成。
黃仁勛表示:「Omniverse旨在創建共享虛擬3D世界,就像尼爾·斯蒂芬森在1990年代早期的小說《雪崩》中所描述的科幻虛擬空間那樣。」
黃仁勛還宣布將從今年夏季開始提供Omniverse企業授權許可。自公測版發布以來,建筑領域的福斯特建筑事務所(Foster and Partners)、娛樂領域的ILM、游戲領域的Activision以及大型廣告公司WPP等合作伙伴都將Omniverse運用到了其工作中。
NVIDIA Jarvis,加速AI對話
此次NVIDIA還發布了用于訓練Transformers的框架—— NVIDIA Megatron。
在keynote中,黃仁勛詳細介紹了NVIDIA用于計算藥物研發加速庫Clara Discovery的一些新模型,以及與Schrodinger的合作。
Schrodinger是一個基于物理學和機器學習的頂尖藥物研發與材料科學計算平臺。
為加快有賴于量子比特的量子計算研究,黃仁勛發布了cuQuantum,其能夠為量子電路模擬器提供加速,以助力研究人員設計出更完善的量子計算機。
為加快對話式AI的發展,黃仁勛宣布先進的深度學習AI——NVIDIA Jarvis已經可用,其能夠實現語音識別、語言理解、翻譯和表達性語音。
為幫助客戶將自身專業知識應用于AI領域,黃仁勛發布了NVIDIA TAO,其可以運用客戶和合作伙伴的數據,對NVIDIA預訓練模型進行微調和適配,同時保護數據隱私。
最后出場的是推理服務器NVIDIA Triton,它可以從進入客戶EGX服務器或云實例的連續數據流中獲取洞察。
黃仁勛說:「這包括任何在cuDNN上運行的AI模型,也就是幾乎所有的AI ,包括來自TensorFlow、Pytorch、ONNX、OpenVINO、TensorRT或自定義C++/python后臺等的任何框架?!?/font>
NVIDIA Drive Orin:汽車的中央大腦
最后是自動駕駛。
黃仁勛表示,自動駕駛汽車領域是「機器學習和機器人技術所面對的最嚴峻的挑戰之一,同時也是最棘手、影響最大的挑戰之一?!?/font>
NVIDIA正在為價值「10萬億美元」的交通運輸行業構建模塊化的端到端解決方案,使合作伙伴能夠充分利用所需要的部件。
黃仁勛表示,將于2022年投產的NVIDIA自動駕駛汽車計算系統級芯片——NVIDIA DRIVE Orin,旨在成為汽車的「中央電腦」。
沃爾沃從2016年開始應用NVIDIA DRIVE的算力,基于NVIDIA DRIVE Xavier,為新車型開發AI輔助駕駛功能,軟件則由沃爾沃汽車旗下的自動駕駛軟件開發公司Zenseact自主研發。
沃爾沃新一代汽車的自動駕駛計算機將配備NVIDIA DRIVE Orin。
這也是英偉達和合作伙伴致力推廣的「軟件定義車型」的概念。
與此同時,黃仁勛宣布了NVIDIA新一代車載系統級芯片NVIDIA DRIVE Atlan,為汽車帶來真正的數據中心。
Atlan可以達到每秒超過1000萬億次(TOPS)運算次數,這是DRIVE平臺首次集成DPU,通過Arm核為自動駕駛汽車帶來數據中心級的網絡,致力于應用到2025年的車型。
Atlan約是上一代Orin處理器的4倍,超過了絕大多數現有無人駕駛出租車的計算能力。
NVIDIA DRIVE Orin - 2019年年底公布但至今沒有出貨的芯片方案算力254 TOPS;2020年的Xavier方案有30 TOPS,而2018年的Parker僅可以提供1 TOPS。
TOPS就是新馬力
黃仁勛表示:「Atlan集NVIDIA在AI、汽車、機器人、安全和BlueField安全數據中心領域的所有技術之大成,堪稱一項技術奇跡。」
黃仁勛還發布了NVIDIA第八代Hyperion汽車平臺,包括參考傳感器、自動駕駛汽車和中央計算機、3D地面真實數據記錄儀、網絡以及所有必要的軟件。
黃仁勛還宣布DRIVE Sim將于今年夏季開放供業界使用。
正如Omniverse能夠構建汽車生產工廠的數字孿生一樣,DRIVE Sim也可用于創建自動駕駛汽車的「數字孿生」,并將其用于自動駕駛汽車的開發。
In a word, 黃仁勛表示:「幾乎可以說,NVIDIA將助力您成就畢生的事業。」
參考資料:
https://blogs.nvidia.com/blog/2021/04/12/nvidia-drive-atlan-autonomous-vehicle-platform/
https://venturebeat.com/2021/04/12/nvidia-unveils-grace-arm-based-cpu-for-giant-scale-ai-and-hpc-apps/
https://nvidianews.nvidia.com/news/nvidia-unveils-nvidia-drive-atlan-an-ai-data-center-on-wheels-fornext-gen-autonomous-vehicles
(聲明:本文僅代表作者觀點,不代表新浪網立場。)