自動駕駛一夜變“牛夫人” 英偉達直擊AI命門

自動駕駛一夜變“牛夫人” 英偉達直擊AI命門
2023年03月23日 09:18 快科技

一夜之間,英偉達就掐住了AI的命門。

從火遍全球的GPT-4,到百度的文心一言、微軟的365 Copilot以及Stable Diffusion 等AI超級應用的出現,AI開始滲透各個角落。

在這些大廠向AI集中炮火猛攻之際,“軍火商”英偉達,賺翻了。

這些AI技術席卷全球,離不開英偉達硬件的支持,無論最后誰勝出,手握GPU算力技術的英偉達都能笑到最后。

而且昨夜,英偉達又向AI圈扔出重磅“核彈”,發布了三款全新推理芯片。有讓大模型處理成本下降10倍的超級芯片、也有針對生成式AI圖像處理的芯片,還發布了超級計算機,以及針對場景優化的應用100個等等。

此外,英偉達還圍繞汽車、量子計算、元宇宙等發布了一系列前沿技術和產品。

“AI的iPhone時刻已經到來!”

在近80分鐘的演講中,老黃強調了3次這個觀點。

如果說游戲促生了英偉達,挖礦讓英偉達成就了算力,而現在AI讓英偉達看到成為超級巨頭的曙光。

與其說是“AI的iPhone時刻“,倒不如說是現在的AI,成就了英偉達的“曙光時刻”。

向AI全面出擊

去年英偉達給自動駕駛業務帶來了智能汽車芯片算力的天花板——DRIVE Thor(雷神),今年GTC大會,黃老板把大量篇幅給到了大火的ChatGPT和其背后的AI技術和A100、H100芯片等產品。

難道自動駕駛已經成了牛夫人,AI才是小甜甜?

在發布硬核的產品和技術以及服務之前,黃仁勛回顧了英偉達是如何進軍AI 領域的。

“英偉達加速計算始于DGX(AI超級計算機),這是大型語言模型實現突破背后的引擎。”黃老板說,他曾親手將全球第一款DGX交給了OpenAI,現場還放出了當年給 OpenAI 捐超算的視頻。

時間在2016年8月, 那時候的OpenAI 成立不到一年。單價12.9萬美金一臺的超算DGX-1,雖然不是很貴,但當時的英偉達手里已經積壓了100 多家公司的 DGX-1 訂單,制造出來的第一臺還是捐給了OpenAI。

老黃在機器上簽下“致Elon和OpenAI 團隊,為了計算和人類的未來。”

這臺附有黃仁勛簽名和贈語的全球第一臺DGX,集成了8塊通過NVLink共享算力的H100組成的超級計算機,為OpenAI奠定了創造ChatGPT的重要算力基礎。

這之后的幾年里,OpenAI 的發展速度驚人,在去年年底推出 ChatGPT 后達到了巔峰,毫無疑問AIGC已經成為全新的內容生產方式。

ChatGPT發布后在全球火速吸引了超過1億用戶,成為歷史上增長速度最快的產品。

而這背后的引擎是英偉達DGX ,最初被用作 AI 的研究設備,現在已經被各大企業用于優化數據和處理 。黃仁勛在GTC大會上透露,“《財富》100強企業中有一半安裝了DGX AI超級計算機,DGX已成為AI領域的必備工具。”

于是,黃仁勛帶來了全新的GPU推理平臺,包括4種不同配置:L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超級芯片。

針對不同工作負載進行優化,分別對應了AI視頻加速、圖像生成加速、大型語言模型(LLM)加速和推薦系統和LLM數據庫。

H100 專為ChatGPT等大型語言模型設計

配備雙GPU NVLink,基于Hopper架構及其內置Transformer Engine,針對生成式AI、大型語言模型和推薦系統的開發、訓練和部署進行優化,利用FP8精度在大型語言模型上,可以提供比上一代A100快9倍的AI訓練和快30倍的AI推理。

DGX H100擁有8個H100 GPU模組,在FP8精度下可提供32Peta FLOPS的算力,并提供完整的英偉達AI軟件堆棧,助力簡化AI開發。

同時黃仁勛宣布,NVIDIA DGX H100 AI超級計算機已全面投產,很快就會和全球企業見面。

L4 針對AI視頻生成的通用GPU

用于加速AI視頻,比CPU的AI視頻性能高120倍,能效提高近99%。優化視頻解碼與轉碼、視頻內容審核、視頻通話等功能,還可以替換背景、重新打光、眼神交流等。一臺8-GPU L4服務器將取代100多臺用于處理AI視頻的雙插槽CPU服務器。

L40則可用于圖像生成

針對2D視頻和3D圖像生成進行優化,推理性能是英偉達云推理GPU T4的10倍。

Grace Hopper超級芯片

為推薦系統和大型語言模型的AI數據庫所設計,可用于圖推薦模型、向量數據庫和圖神經網絡,通過900GB/s的高速一致性芯片到芯片接口連接英偉達Grace CPU和Hopper GPU。

GTC 上關于AI的另一個重點,就是英偉達發布的DGX Cloud云服務。

英偉達DGX Cloud的AI超級計算服務,提供了專用的NVIDIA DGX AI超級計算集群,搭配NVIDIA AI軟件,使每個企業都可以通過一個Web瀏覽器就能訪問AI超算。

目前這項服務已經與微軟Azure、谷歌OCP、Oracle OCI合作,企業可以租用DGX Cloud,每月36999美元起。

每個DGX Cloud實例都有八個H100或A100 80GB Tensor Core GPU,每個節點共有640GB GPU內存,

英偉達還推出了全新云服務及代工廠NVIDIA AI Foundations,面向需要構建、改進和定制 LLM 和生成式 AI 的用戶,企業可以用自己的數據在特定領域訓練AI。

AI Foundations 包括NeMo、Picasso、BioNeMo。

NVIDIA NeMo:用于文本生成模型構建。提供從80億到5300億個參數的模型,定期更新訓練數據,幫助企業生成AI應用進行模型定制。

畢加索:視覺語言模型構建,具有先進的文生圖、文本轉視頻、文本轉3D功能。

BioNeMo:生命科學服務,可以幫助生物醫藥研究人員提供AI模型訓練和推理,加速研發進度。

直接在瀏覽器或通過API訪問這些運行在NVIDIA DGX Cloud上的云服務。NeMo、BioNeMo云服務已開放早期訪問,Picasso云服務正在私人預覽中。

瘋狂的芯片“制造器”

在此次發布會上介紹完“AI核彈”后,又迎來了另一個亮點,英偉達秘密研發了四年,計算光刻能加速40倍以上,名為cuLitho的計算光刻庫,這使得2nm及更先進芯片的生產成為可能。

要知道光刻是芯片制造過程中最復雜、最昂貴、最關鍵的環節,其成本約占整個硅片加工成本的1/3甚至更多。

“計算光刻是芯片設計和制造領域中最大的計算工作負載,每年消耗數百億CPU小時。大型數據中心24 x 7全天候運行,以便創建用于光刻系統的掩膜板。這些數據中心是芯片制造商每年投資近2000億美元的資本支出的一部分。”黃仁勛說,而cuLitho能夠將計算光刻的速度提高到原來的40倍。

什么是光掩模?

光掩模是塑造光投射到硅晶片上以制造電路的方式的屏幕,計算光刻就是模擬了光通過光學元件并與光刻膠相互作用時的行為,應用逆物理算法來預測掩膜板上的圖案,以便在晶圓上生成最終圖案。

所以說加速計算光刻是提高光刻分辨率、推動芯片制造達到2nm及更先進節點的關鍵手段。

以英偉達這次公布的AI“核彈”芯片H100 GPU來舉例,其需要89塊掩膜板,在CPU上運行時,處理單個掩膜板需要兩周時間,而cuLitho只需8小時。

比如臺積電可通過在500個DGX H100系統上使用cuLitho加速,將功率從35MW降至5MW,替代此前用于計算光刻的40000臺CPU服務器。使用cuLitho的晶圓廠,每天可以生產3-5倍多的光掩膜,僅使用當前配置電力的1/9。

全球最大晶圓廠臺積電、全球光刻機霸主阿斯麥、全球最大EDA巨頭新思科技均參與合作并引入這項技術。

臺積電首席執行官魏哲家,則夸贊它為臺積電在芯片制造中廣泛地部署光刻解決方案開辟了新的可能性,為半導體規模化做出重要貢獻。

阿斯麥首席執行官Peter Wennink稱,阿斯麥計劃將對GPU的支持,集成到其所有的計算光刻軟件產品中。

右手持AI,左手掐元宇宙底層生態

在本次GTC發布會上,最后登場的是“數字孿生”工業模擬應用Omniverse。

其實近年來,Omniverse已經是老黃在大會上必講科目之一了。

這次的用處主要是讓企業在實際建設工廠、生產產品前,通過數字化模擬“預覽”實際的成品。例如這幾年很火的“黑燈工廠”,就能通過Omniverse進行設計和模擬。

NVIDIA Omniverse 是一個基于 USD(Universal Scene Description) 的可擴展平臺,可使個人和團隊更快地構建自定義 3D 工作流并模擬大型虛擬世界。

簡單來說Omniverse就是虛擬世界的基建狂魔,專注于元宇宙底層邏輯構建。幫助人類去更好的創建數字化的世界,構建成千上百萬個數字世界,然后進行鏈接并賦能的平臺。

Omniverse更加專注于工業和工程方面這些應用,比如更加關注3D創作,或者設計整個過程中的流程。從工作順暢角度去解決目前的痛點。

在汽車行業中,Omniverse已經與多家車企展開了合作。

沃爾沃和通用汽車使用Omniverse統一產品設計的管線,豐田汽車則用來創建數字孿生工廠。

再比如英偉達已經為Rimac推出新的3D 車輛配置器,它由 Nvidia 的新 Omniverse Cloud 提供支持。

看起來與其他在線配置器沒有什么不同,底部有一排選項——油漆、車輪、內飾、選項和背景。

當用戶調整下視角,在車輛周圍平移,觀察燈光與各種表面和材料的相互作用下的光影效果,這就相當炫酷了。

梅賽德斯·奔馳使用這款軟件建立和優化新車的生產線,捷豹路虎汽車的工程師在Omniverse中使用Driver Sim生成合成數據來訓練AI模型,通過虛擬NCAP駕駛測試驗證主動安全系統。

在此次大會上,黃仁勛還參與互動了寶馬第一家數字工廠揭幕。

黃仁勛指出,寶馬正在使用Omniverse規劃全球近30家工廠的運營,在每座工廠實際開業兩年之前,他們會模擬完整建造一間電動汽車工廠,并不斷進行調整優化。

關于和比亞迪的合作

作為英偉達在汽車領域的重要合作對象,此次活動中,NVIDIA再次介紹了其與比亞迪的合作進展。

比亞迪王朝系列和海洋系列的下一代多款車型,將使用英偉達DRIVE Orin高性能計算平臺。

比亞迪首款采用NVIDIA芯片的產品將裝備激光雷達,并在今年二季度上市。

在這此前,比亞迪就與英偉達合作,通過將NVIDIA GeForce NOWTM云游戲服務上車,來增強車載體驗。

官方在新聞稿中表示,英偉達和比亞迪都相信,未來的汽車將是可編程的,從基于許多嵌入式控制器演變為高性能的集中式計算機,通過軟件更新提供和增強功能。

責任編輯:若風

新浪科技公眾號
新浪科技公眾號

“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)

創事記

科學探索

科學大家

蘋果匯

眾測

專題

官方微博

新浪科技 新浪數碼 新浪手機 科學探索 蘋果匯 新浪眾測

公眾號

新浪科技

新浪科技為你帶來最新鮮的科技資訊

蘋果匯

蘋果匯為你帶來最新鮮的蘋果產品新聞

新浪眾測

新酷產品第一時間免費試玩

新浪探索

提供最新的科學家新聞,精彩的震撼圖片