科技首頁創事記互聯網電信 IT業界投稿

老黃數字人登場！英偉達秀“元宇宙”肌肉，推巴掌大AI超算和虛擬人平臺

2021-11-09 23:11:14 創事記作者：智東西

黃仁勛“手辦”對答如流，英偉達強勢拉開元宇宙序幕，幫企業開發大模型。　　

　　歡迎關注“新浪科技”的微信訂閱號：techsina

　　文/ZeR0

　　來源：智東西（ID:zhidxcom)

　　芯東西11月9日報道，今日，人工智能及高性能計算頂級技術盛會NVIDIA GTC大會如約而至。

　　這個市值已高達7700億美元的AI頂級玩家，剛剛推出全球最小、功能最強大、能效最高的下一代AI超級計算機NVIDIA Jetson AGX Orin，其算力達到200TOPS，可與內置GPU的服務器媲美。

　　在下午的虛擬主題演講中，NVIDIA創始人兼CEO黃仁勛穿著熟悉的皮衣，公布了一系列最新AI技術和產品，并推出承載著其“元宇宙”愿景的全新虛擬化身平臺。

　　由這個平臺生成的“迷你玩具版黃仁勛”Toy-Me，能與人自然地問答交流。

　　在幫助企業降低AI開發部署門檻方面，NVIDIA可以說是做到了極致，比如提供方便企業構建AI大模型的框架，以及定制專屬聲音的虛擬助手。

　　黃仁勛說，NVIDIA開發者數量已接近300萬，CUDA過去15年下載量達3000萬次，一年下載量達到700萬。

　　此外，NVIDIA繼續表露對醫療健康領域的熱情，推出搭載新一代Orin芯片、無縫連接醫療設備和邊緣服務器的AI計算平臺Clara Holoscan。

　　黃仁勛還宣布，NVIDIA將構建一個數字孿生模型來模擬和預測氣候變化，新的超級計算機將名為E-2，即Earth Two，地球的數字孿生，能夠在虛擬世界模擬引擎Omniverse中以Million-X百萬倍的速度運行。

　　01.

　　Jetson AGX Orin：

　　手掌大小，算力堪比服務器

　　自2014年推出Jetson TK1至今，NVIDIA Jetson系列已經積累了85萬名開發者。

　　今日，NVIDIA推出全球最小、功能強大、能效最高的新一代AI超級計算機NVIDIA Jetson AGX Orin，用于機器人、自主機器、醫療器械和其他形式的邊緣嵌入式計算。

　　Jetson AGX Orin保持了與前代機型Jetson AGX Xavier相同的外形尺寸和引腳兼容性，處理能力提升6倍，每秒算力達200TOPS，可與內置GPU的服務器相媲美，而尺寸只有手掌那么大。

　　它采用NVIDIA Ampere架構GPU、Arm Cortex-A78AE CPU以及新一代深度學習和視覺加速器。高速接口、更快的存儲帶寬和對多模態傳感器的支持，為多個并行AI應用流水線輸送數據。

　　與歷代Jetson計算機一樣，使用Jetson AGX Orin的客戶可以運用NVIDIA CUDA-X加速計算棧、NVIDIA JetPack SDK和最新NVIDIA工具進行應用開發和優化，包括云原生開發工作流程。

　　來自NVIDIA NGC目錄的預訓練模型已經過優化，并可以使用NVIDIA TAO工具套件和客戶數據集進行微調。這減少了生產級AI的部署時間和成本，而云原生技術實現了產品整個生命周期內的無縫更新。

　　DRIVE AGX Orin同樣由Jetson AGX Orin等 NVIDIA Ampere架構提供支持，它是新發布的NVIDIA DRIVE Concierge和DRIVE Chauffeur背后的先進處理器，這兩個AI平臺分別為安全的自動駕駛提供動力。

　　針對特定用例的軟件框架包括用于機器人技術的NVIDIA Isaac Sim，用于自動駕駛的NVIDIA DRIVE，用于智慧城市的NVIDIA Metropolis。最新的Isaac版本包括對機器人操作系統（ROS）開發人員社區的重要支持。

　　NVIDIA還發布了用于Isaac Sim的全新NVIDIA Omniverse Replicator，用于為機器人生成合成訓練數據。這些硬件加速軟件包使ROS開發者更容易在Jetson平臺上構建高性能AI機器人。

　　NVIDIA Jetson AGX Orin模塊和開發者工具包將于2022年第一季度上市。

　　黃仁勛還在演講中談道：“到2024年，絕大多數新款電動汽車將具備強大的自動駕駛能力。”

　　他展示了一個新自動駕駛平臺DRIVE Hyperion 8 GA，這是2024年模型的架構。其傳感器套件包含12個攝像頭、9個毫米波雷達、12個超聲波雷達和1個前向激光雷達，所有這些都由2顆NVIDIA DRIVE Orin芯片來進行處理。

　　據他透露，目前，英偉達已經在全球各地收集到了PB級的道路數據，并擁有大約3000名訓練有素的標記員，創建訓練數據。盡管如此，合成數據仍是NVIDIA數據策略的基石。

　　02.

　　NeMo Megatron：

　　讓企業開發自己的大模型

　　為了方便企業開發部署大型語言模型，NVIDIA推出了為訓練具有數萬億參數的語言模型而優化的加速框架NeMo Megatron。

　　NVIDIA NeMo Megatron是Megatron的基礎上發展起來的。Megatron是由NVIDIA研究人員主導的開源項目，研究大型Transformer語言模型的高效訓練。Megatron 530B是全球最大的可定制語言模型。

　　利用先進的數據、張量和管道并行化技術，它能使大型語言模型的訓練有效地分布在成千上萬的GPU上。

　　企業可以通過NeMo Megatron框架，進一步訓練它以服務新的領域和語言。經優化，該框架可以在NVIDIA DGX SuperPOD的大規模加速計算基礎設施上進行擴展。

　　除了NeMo Megatron外，NVIDIA還推出了一個開發Physics-ML模型的框架NVIDIA Modulus。

　　它使用物理原理及源自原理型物理和觀測結果的數據訓練Physics-ML模型，支持多GPU多節點訓練，由此生成的模型，其物理仿真速度比模擬快1000-100,000倍。

　　科學家可借助Modulus創建數字孿生模型，來解決預測氣候變化等重要科學問題。

　　例如研究人員利用歐洲中期天氣預報中心的ERA5大氣數據訓練Physics-ML模型，該模型在128個A100 GPU上訓練需要4小時，訓練后的模型能以30公里的空間分辨率預測颶風嚴重程度和路徑。

　　原本需要7天才能完成的預測，現在在一個GPU上只需0.25秒，比模擬快了10萬倍。

　　為了幫助企業加快AI之旅，NVIDIA宣布在全球范圍內擴展其LaunchPad計劃，它允許用戶即時訪問在加速基礎設施上運行的NVIDIA AI軟件。企業可使用NVIDIA LaunchPad免費體驗開發和部署大型語言模型。

　　LaunchPad計劃由Equinix服務支持，包括數據中心、連接和裸金屬產品，獲得LaunchPad體驗后，企業可以在全球Equinix地點運行其NVIDIA加速的人工智能工作負載。

　　03.

　　Riva定制語音：

　　快速創建定制版品牌聲音

　　NVIDIA的Riva語音AI軟件同樣有了新進展，黃仁勛宣布了該軟件一個新功能——Riva定制語音。

　　Riva可識別英語、西班牙語、德語、法語、日語、普通話和俄語等7種語言，可以生成隱藏字幕、翻譯、摘要、回答問題并理解意圖。

　　只需訓練30分鐘的音頻數據，企業即可構建屬于自己品牌大使的聲音，獲得類似人類的表現力。

　　也就是說，用戶根據特定的領域或行業術語，可以量身定制擁有獨特聲音的虛擬助理。

　　不到三年間，NVIDIA的對話AI軟件已被下載超過25萬次，并被廣泛采用到各個行業。

　　對于小規模研發，NVIDIA NGC容器注冊表免費提供NVIDIA Riva，開發者可加入Riva開放測試版程序來試用該軟件。

　　對于擁有大規模部署并尋求NVIDIA專家技術支持的客戶，NVIDIA宣布了NVIDIA Riva Enterprise計劃，該計劃預計將于明年初推出。

　　04.

　　Omniverse Avatar：

　　構建生動的智能虛擬化身

　　虛擬助手的下一步，是擁有常識、推理能力和生動的視覺形象。

　　在GTC大會上，黃仁勛宣布推出一個全方位的虛擬化身平臺——Omniverse Avatar。

　　它是NVIDIA一系列先進AI技術的集大成者，將Metropolis的感知能力、Riva的語音識別能力、Merlin的推薦能力、Omniverse的動畫渲染能力等交匯于一體。

　　這使得開發者能構建出一個完全交互式的虛擬化身，它足夠生動，能對語音和面部提示做出反應，能理解多種語言，能給出智能的建議。

　　黃仁勛展示了一些例子。

　　比如，其玩偶復制品可以跟人對答如流。

　　Metropolis工程師用Maxine創建了Tokkio智能操作臺應用程序，讓操作臺具有高度交互性，可快速做出對話響應。

　　在餐廳，兩名顧客點餐時，一個客戶服務虛擬化身可以跟他們交談和理解他們的需求。

　　這些演示由NVIDIA AI軟件和Megatron 530B提供支持，Megatron 530B是目前世界上最大的可定制語言模型。

　　在DRIVE Concierge AI平臺的演示中，中央儀表板屏幕上的數字助理，可幫助司機選擇最佳駕駛模式，使其按時到達目的地，然后在汽車續航里程下降到100英里以下時，按他的請求設置提醒。

　　Maxine項目更強調多種語言的實時翻譯和轉錄。

　　借助Maxine，這個人的話不僅被轉錄，還能以相同的聲音和語調被實時轉換成德語、法語等多種語言。

　　Maxine使用計算機視覺來追蹤人的面部，并識別其表情，3D動畫可為其制作虛擬而逼真的頭像。

　　可以想象，在企業和開發人員中，每個行業都需要某種形式的虛擬化身。

　　使用Omniverse Avatar平臺，你可以為視頻會議和協作平臺、客戶支持平臺、內容創建、應用收益和數字孿生、機器人應用等等構建定制的AI助理。

　　NVIDIA的虛擬世界模擬Omniverse是打造虛擬世界的關鍵平臺。從機器人、自動駕駛車隊、倉庫、工業廠房到整個城市，都能在Omniverse數字孿生中完成創建、訓練和運行。

　　黃仁勛說，Omniverse面向數據中心規模設計，有朝一日有望能達到全球數據規模。

　　愛立信正構建整個城市的數字孿生環境，幫助確定如何放置和配置每個站點以獲得最佳覆蓋范圍和網絡性能，可對整個5G網絡執行逼真遠程仿真。

　　05.

　　AI推理：Triton推理

　　服務器助力實時大模型推理

　　目前微軟、三星、Snap等25000多家客戶都在使用NVIDIA的AI推理平臺。

　　今日，NVIDIA推出多節點分布式推理功能的NVIDIA Triton推理服務器，以及NVIDIA A2 Tensor Core GPU加速器。

　　NVIDIA A2 GPU是一個入門級、低功耗的緊湊型加速器，適用于邊緣服務器中的推理和邊緣AI，推理性能比CPU高出20倍。

　　NVIDIA AI推理平臺此次更新包括開源NVIDIA Triton推理服務器軟件的新功能，和對NVIDIA TensorRT的更新。

　　最新NVIDIA Triton推理服務器中的多GPU、多節點特性，使大型語言模型推理工作負載能夠實時在多個GPU和節點上擴展。

　　借助Triton推理服務器，Megatron 530B能在兩個NVIDIA DGX系統上運行，將處理時間從CPU服務器上的1分鐘以上縮短到0.5秒，令實時部署部署大型語言模型成為可能。

　　在軟件優化上，Triton推理服務器的模型分析器，新工具可以自動化地從數百種組合中為AI模型選擇最佳配置，以實現最優性能，同時確保應用程序所需的服務質量。

　　RAPIDS FIL是針對隨機森林和梯度提升決策樹模型GPU或CPU推理的新后端，為開發者使用Triton進行深度學習和傳統機器學習提供了一個統一的部署引擎。

　　Triton與AWS、阿里云等平臺集成，并支持在各代GPU、x86 CPU和Arm CPU上優化AI推理工作負載。NVIDIA AI Enterprise也集成了Triton。

　　NVIDIA AI Enterprise是一款經NVIDIA優化、認證和支持的用于開發和部署AI的端到端軟件套件，客戶可利用它在本地數據中心和私有云的主流服務器上運行AI工作負載。

　　NVIDIA旗艦TensorRT推理引擎亦進行了更新，已原生集成到TensorFlow和PyTorch中，只需1行代碼，就能提供比框架內推理快3倍的性能。

　　NVIDIA TensorRT 8.2是SDK的最新版本，可實時運行數十億個參數的語言模型。

　　NVIDIA還宣布微軟會議軟件Teams采用NVIDIA AI和Azure認知服務。

　　微軟Azure認知服務為高品質AI模型提供基于云的API，以創建智能應用程序。他們在用Triton運行語音轉文本模型，為微軟Teams用戶提供準確的實時字幕和轉錄。

　　微軟Teams每月有近2.5億活躍用戶，微軟Azure認知服務上的NVIDIA GPU和 Triton推理服務器使用28種語言和方言，結合AI模型幫助提升實時字幕和轉錄功能的成本效益。

　　Mavenir宣布由NVIDIA Metropolis AI-on-5G平臺提供支持的MAVedge-AI智能視頻分析，以加速企業人工智能，該方案預計2022年初提供給客戶。

　　06.

　　數據中心：全新網絡安全功能

　　面向數據中心，黃仁勛宣布推出BlueField DOCA 1.2來支持全新網絡安全功能，希望使BlueField成為業界構建零信任安全平臺的理想之選。

　　目前有1400名開發者正在BlueField上進行開發，現在采用BlueField的網絡安全公司已可提供零信任安全即服務。

　　NVIDIA還發明了一個深度學習網絡安全平臺Morpheus來監控分析網絡行為。

　　它構建于NVIDIA RAPIDS和NVIDIA AI之上，其工作流會為每種應用和用戶的組合創建AI模型和數字指紋，并學習其日常的模式和尋找異常操作。這些異常操作將觸發安全警告，并提醒分析員作出響應。

　　Bluefield、DOCA和Morpheus都是數據中心的全堆棧加速AI解決方案的一部分。NVIDIA將為其網絡安全合作伙伴提供一個零信任的安全平臺，從而提高安全性和應用程序性能。

　　Bluefield坐在網絡上，向Morpheus AI平臺提供數據中心發生的所有活動。Morpheus是一個深度學習網絡安全平臺，可以監控和分析來自每個用戶、機器和服務的所有信息。

　　NVIDIA今日也宣布了Morpheus早期訪問2版本。

　　Morpheus創建了預訓練的用戶活動指紋模型。當這些指紋發生變化時，它能夠實時識別出異常交易正在發生，創建一個可疑行為正在發生的安全警報，并隔離活動和加以提醒。

　　07.

　　醫療健康：合作癌癥中心，推新機器人平臺

　　在醫療健康領域，NVIDIA宣布與多家先進癌癥中心合作，將AI的力量帶到癌癥治療。這些癌癥中心將采用NVIDIA DGX來加速開發AI模型。

　　許多醫療設備公司正在將AI和機器人技術融入其中，在機器人手術、移動CT掃描、支氣管鏡檢中使用NVIDIA加速計算平臺。

　　為加速AI醫療設備的應用，NVIDIA推出一個面向醫療健康行業的新計算平臺NVIDIA Clara Holoscan。

　　Holoscan是繼Isaac和Drive后，NVIDIA的第三個機器人平臺，能為可擴展、軟件定義、端到端流媒體數據處理的醫療設備提供所需的計算基礎設施。

　　該平臺集成了NVIDIA AGX Orin和ConnectX-7，FP32算力達5.2TFLOPS，AI算力達250TOPS，740Gbps高速IO用于連接傳感器。

　　添加RTX A6000 Ampere GPU后，可獲得另外39TFLOPS（FP32）和超過600TOPS的AI推理性能。

　　Clara Holoscan是一個醫療設備與邊緣服務器無縫連接的端到端平臺，能助力開發者創建AI微服務，用以在設備上運行低延遲串流應用，同時將更復雜的任務傳至數據中心資源。

　　借助Clara Holoscan，開發者可以自定義應用，按需在其醫療設備中充分添加或減少計算和輸入/輸出功能，從而平衡延遲、成本、空間、性能和帶寬的需求。

　　Clara Holoscan SDK通過加速庫、AI模型和超聲波、數字病理學、內窺鏡檢查等參考應用支持此項工作，以幫助開發者利用嵌入式和可擴展的混合云計算。

　　在藥物發現方面，加拿大AI制藥創企Entos發明了一種深度學習架構OrbNet，用物理機器學習方法訓練圖神經網絡，取代分子模擬中昂貴的原子間作用力，將分子模擬速度提高1000倍。

　　08.

　　Quantum-2：史上最先進端到端網絡平臺

　　此次GTC期間，NVIDIA還宣布了下一代NVIDIA Quantum-2平臺，可進行云原生超級計算。

　　該網絡平臺由NVIDIA Quantum-2交換機、ConnectX-7網絡適配器、BlueField-3數據處理單元（DPU）和支持新架構的所有軟件組成。ConnectX-7將于明年1月問世。

　　其中，Quantum-2 InfiniBand交換機基于新的Quantum-2 ASIC，采用臺積電7N節點，包含570個晶體管，超過有540億晶體管的A100。

　　Quantum-2 InfiniBand擁有400Gbps，網絡速度翻倍，交換機吞吐量增加了2倍，集群可擴展性增為原來的6.5倍，同時降低了數據中心的功耗。

　　其多租戶性能隔離利用先進的基于遙測的擁塞控制系統，確保可靠的吞吐量，無論用戶激增或工作量需求激增，都能確保可靠的吞吐量，從而防止一個租戶的活動干擾其他租戶的活動。

　　相比上一代，第三代SHARPv3TM網絡計算技術的交換機計算能力比原來高32倍，用于加速AI訓練。

　　09.

　　新加速庫：優化路線規劃，加速量子模擬

　　最后，我們來看看NVIDIA推出的3個新加速庫。

　　首先是NVIDIA ReOpt，這是一款針對運籌優化問題的加速求解器，可實現實時路線規劃優化。

　　以與NVIDIA合作的達美樂披薩為例，配送14個披薩的路徑有870億種，這意味達美樂要在30分鐘內將披薩送達絕非易事。

　　運籌優化對“最后一英里”配送是必需的，路線規劃是個極為棘手的物流問題，如果應用到行業中，即使是小規模的路線優化也能節省數十億美元。

　　黃仁勛展示了一個用NVIDIA Omniverse虛擬倉庫來展示優化路線在自動訂單揀選場景中的影響，優化后的規劃能使訂單揀選節省一半的時間和路程。

　　當前路線優化求解器收到新訂單后，需要數小時來重新運行和響應，而ReOpt能持續運行并實時動態地進行重新優化，在短短幾秒鐘內響應并擴展至數千個位置。

　　第二個是cuQuantum DGX設備，配備有針對量子計算工作流的加速庫，可用態矢量和張量網絡的方法來加速量子電路模擬。

　　谷歌Cirq將成第一個得到加速的量子模擬器。

　　借助該設備，曾經需要耗費幾個月的模擬，現在幾天就能完成。

　　NVIDIA研究部門在量子算法模擬方面取得了重要里程碑，用1688個量子位為3375個頂點集求解MaxCut問題。

　　這是有史以來最大的精確量子電路模擬，比以往模擬的量子位多8倍。

　　cuQuantum DGX設備將在第一季度推出。

　　第三個加速庫是在PyData和NumPy生態系統的大規模加速計算cuNumeric，它允許用戶用Python代碼在超級計算機上透明加速和擴展NumPy工作流，并無需更改代碼。

　　它屬于NVIDIA RAPIDS開源Python數據科學套件，RAPIDS今年的下載量超過50萬次，比去年增長了4倍多。NumPy在過去5年下載量達到了1.22億次，別用于GitHub上近80萬個項目。

　　在著名的CFD Python教學代碼中，cuNumeric能擴展至1000個GPU，而擴展效率僅比線性擴展效率損失了20%。

　　10.

　　結語

　　乘著AI、高性能計算和元宇宙的東風，NVIDIA今年過得可謂風生水起，市值一路扶搖直上，突破7700億美元。其Omniverse平臺更是被分析機構視作NVIDIA一項重要的平臺擴張戰略。

　　在這表面風光的背后，NVIDIA的遠見和前瞻性不容小覷。無論是如火如荼的AI，還是方興未艾的虛擬世界，NVIDIA能成為科技熱潮的直接受益者，都離不開過去多年對其軟硬件產品的打磨。

　　此次NVIDIA GTC大會期間，我們還將看到更多覆蓋深度學習、數據科學、高性能計算、機器人等領域的最新進展，而始于NVIDIA CUDA的加速計算正在這些領域催化效率提升，推動現代科技快速進化、走向未來。

（聲明：本文僅代表作者觀點，不代表新浪網立場。）

分享到:

保存 | 打印 | 關閉

首页国产亚洲小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看

老黃數字人登場！英偉達秀“元宇宙”肌肉，推巴掌大AI超算和虛擬人平臺

微博推薦

作者簡介

智東西

作者文章

推薦閱讀

新聞熱榜

首页 国产 亚洲 小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看

老黃數字人登場！英偉達秀“元宇宙”肌肉，推巴掌大AI超算和虛擬人平臺

微博推薦

作者簡介

智東西

作者文章

推薦閱讀

新聞熱榜

首页国产亚洲小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看