白交 衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
剛剛,中國臺灣大學體育場,歡呼陣陣如同演唱會,但這次“搖滾巨星”,其實是英偉達創始人黃仁勛,再次回到學校,帶來Computex重磅演講,以及英偉達的新一代GPU。
是的,英偉達新架構Blackwell宣布不過3個月,老黃就把后三代路線圖全公開了:
2025年Blackwell Ultra,2026年新架構Rubin,2027年Rubin Ultra。
好好好,像做iPhone一樣造芯片。
到這一代Blackwell為止,英偉達已經把AI模型有效擴展到萬億參數。(還給token定了個譯名:詞元)。
1.8萬億參數GPT4的訓練能耗,8年降低至原來的1/350。
推理能耗,8年降低至原來的1/45000。
看著這一波亮相和劇透,網友真相了:英偉達沒有競爭對手,而是選擇將摩爾定律放在地上摩擦……
老黃是在書寫自己的定律。
ComputeX前夜,老黃一開場就展開了一波隱形賣貨,他自稱不太準確的“CEO數學”:
買得越多,省得越多……
The more you buy, the more you save.
經典語錄依然引發現場歡呼大笑:雖然不太準確,但好像有些道理……
除此之外,還有一些新產品亮相,包括能夠模擬氣沖的天氣預測模型CorriDiff、數字人微服務、BlackWell系統、Spectrum-X、機器人平臺Isaac……
好了話不多說,這就來看看老黃這次到底搞了哪些事情
“AI Factory Is generating”
談到當前新的產業革命,老黃表示:新的計算時代正在開始;而AI Factory正在誕生。
他在現場展示了BlackWell系統。
3月份GTC大會上還遮遮掩掩地說是GPT-MoE-1.8T模型,這下徹底攤牌了:GPT-4參數就是1.8T。
跟DGX Hopper相比。
現場還看到了它的真身,大概有兩米那么高吧…
而真正的AI Factory大概會長這樣,大概有32000GPU。
AI加速每個應用程序
AI對于企業的影響,老黃認為AI加速每一個應用程序。他首先談到了NIM推理微服務,這是一個幫助開發者或者企業輕松構建AI應用,簡化大模型部署程序。
不管是聊天機器人、還是生活/駕駛助手等,部署時間都能從幾周縮短到幾分鐘。
運行Meta Llama 3-8B的NIM可以產生比不使用NIM多3倍的tokens。
企業和開發者可以使用NIM運行生成文本、圖像、視頻、語音和數字人類的應用程序。
而背后源于豐富的技術合作生態——
近200家技術合作伙伴,包括Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI和Synopsys等,正在將NIM集成到他們的平臺中。
此次在這個NIM中還有上新,也就是ACE 生成式AI微服務,數字人AI技術套件。
除了原有自動語音識別、文本到語音的轉換和翻譯、Nemotron語言模型、 Audio2Face等套件,還增加了兩個技術:
一個是可以基于音軌生成身體姿勢Audio2Gesture;
一個Nemotron-3 4.5B,這是英偉達首款SLM(小愛語言模型),專為低延遲端側設備而生。
?接下來,這一數字人微服務將部署在一億臺RTX AI PC上面。
當前英偉達在新的合作伙伴,比如華碩、MSI的加入下,已經擁有超過200種RTX AI PC型號。
還推出了RTX AI Toolkit,一個工具和SDK集合,幫助Windows開發者定制優化本地部署模型。
同Mac相比,部署了RTX的Windows的Stable Diffusion推理速度是Mac的7倍。
每一臺帶有RTX的PC,都是一臺RTX AIPC。
用于機器人開發的技術平臺Isaac
這次一同亮相的,還有用于機器人開發的技術平臺,NVIDIA Isaac。
為啥搞這玩意兒呢,老黃給出的理由是這樣的:
機器人時代已經到來。
有朝一日,所有會移動的東西,都將實現自主化。
這個Isaac平臺具體長啥樣呢?
Isaac平臺提供一系列英偉達加速庫、AI基礎模型和仿真技術,供機器人制造商集成到自己的技術棧中。
注意,平臺是模塊化的,允許公司單獨或一起采用多種技術。
具體而言,其中包括:
NVIDIA Isaac ROS:一系列模塊化的ROS 2包,為ROS社區開發者帶來NVIDIA加速和AI模型
NVIDIA Isaac Perceptor:一個參考工作流程,提供基于AI的自主移動機器人的多攝像頭3D環視能力
NVIDIA Isaac Manipulator:一個簡化AI啟用機械臂開發的參考工作流程
NVIDIA Isaac Sim:一款參考應用程序,用于在基于NVIDIA Omniverse平臺的物理環境中模擬、測試和驗證機器人,并生成合成數據
NVIDIA Isaac Lab:Isaac Sim中的參考應用程序,針對AI機器人基礎模型訓練的強化、模仿和遷移學習進行了優化
據介紹,目前,包括比亞迪電子、西門子、泰瑞達機器人和Intrinsic(Alphabet的子公司)在內,全球超多名列前茅的機器人開發團隊,都在采用Isaac平臺。
這些團隊用上Isaac,一邊提高制造工廠、倉庫和配送中心的效率,同時確保人類同事的安全;一邊也能充當重復勞動和超精確任務的執行者。
現場放出了很多demo,很多工廠在英偉達Omniverse里建造了一個完全模擬現實的自助工廠,以及基于Isaac平臺開發的AI機器人。
官網悄悄推出游戲Agent助手
除了現場老黃親自發布的上述內容外,我們在英偉達官網還找到了一個彩蛋,一個巨久遠的call back。
Project G-Assist。
時間回到2017年愚人節,英偉達官網開了個大玩笑:
宣稱自家發布了一款支持10080款游戲的USB人工智能超算卡GeForce GTX G-Assist。
重點在于它很AI。
GeForce GTX G-Assist像是個AI游戲助手,可以幫助玩家自動完成游戲操作,甚至代打擊敗Boss。
今天,英偉達真的將這個愚人節玩笑變為現實——
英偉達官網上線Project G-Assist,一套工具和模型的集合而成的AI Agent系統,供游戲和應用程序開發者使用。
通過前后劇情,Project G-Assist利用大模型對游戲輸出響應,能夠檢查游戲性能和系統設置,建議用戶優化以充分利用可用硬件,或者適當升級角色。
玩家這邊呢,還可以通過Project G-Assist找到最好的武器,也可以查詢到最牛的攻略,然后就可以或制作武器材料,或一路殺怪通關。
總而言之,Project G-Assist可以讓人有個Agent外掛,但是不會讓你完全掛機,
官網還貼心表示:
G-Assist 項目不會像我們在2017年愚人節預言視頻中那樣完全替代您玩游戲,但它可以幫助您從您最喜歡的游戲中獲得更多收益。
游戲體驗再上大分!
據介紹,Project G-Assist支持各種模態的輸入。
可以是來自玩家的文本提示,或聲音指令;可以是屏幕上顯示框架的上下文;可以是來自應用程序或系統本身的API。
這些數據都通過連接了游戲知識數據庫的大模型處理,然后使用RAG(檢索增強生成)生成和用戶相關的查詢結果——沒錯,Project G-Assist允許玩家使用PC或云端RTX AI驅動的知識庫。
Project G-Assist開發工具將出現在即將推出的RTX AI開發套件中,具體會用在哪些游戲上,還需要游戲開發商來決定并提供支持。
為了讓大家更好地使用Project G-Assist,英偉達貼心地附上視頻教學大禮包,需要可自取。
One More Thing
整場發布會,老黃還整了不少活兒。
比如AI老黃似乎已經成了發布會常客。
在介紹天氣預測模型時,他坦白承認在視頻中那么流利講普通話的那位是AI生成的,因為自己中文不太好。
而本場重磅的BlackWell系統、AI Factory的核心構成,也被他各種搬來搬去……
除了下一代GPU取名Rubin,我們還看到 Vera CPU,他們共同出現在新的Vera Rubin加速器上。而這一名稱來源,實際上是來自美國一位女天文學家Vera Rubin,她是研究暗物質先驅。
以及,COMPUTEX 2024不愧是6月開頭就炸場的AI終端大戲。
除了黃院士外,英特爾、AMD、高通等老板都悉數到場,接下來幾天會挨個發表演講。
這些主題演講,絕大部分都跟AIPC有關。
大家一起蹲一蹲吧~
參考鏈接:[1]https://www.nvidia.com/en-us/geforce/news/computex-2024-nvidia-geforce-announcements/
(聲明:本文僅代表作者觀點,不代表新浪網立場。)