黃仁勛:這是第一次,通用人形機器人的關鍵技術“近在眼前”了

黃仁勛:這是第一次,通用人形機器人的關鍵技術“近在眼前”了
2025年01月11日 15:30 市場資訊

  轉自:華爾街見聞

  作者:硬AI

  在最新的訪談中,黃仁勛表示,通用人形機器人的技術“難以實現”,但隨著大型語言模型以及基礎模型方面的突破,必要的技術“近在眼前”。未來,AI的應用科學將變得尤為重要。新一代面臨的挑戰是如何利用AI技術解決實際問題并創造價值。

  近日,英偉達首席執行官黃仁勛接受了科技自媒體Tiff In Tech的采訪。他分享了英偉達在物理AI領域的最新突破。

  黃仁勛表示,通用人形機器人的技術“難以實現”,但隨著Transformer模型、大型語言模型以及基礎模型方面的突破,必要的技術“近在眼前”,英偉達能夠在這個領域做出真正的貢獻。

  物理AI指能理解和交互物理世界的AI系統,這一技術將徹底改變機器人的訓練方式。英偉達推出的Cosmos和Omniverse平臺能夠在虛擬環境中模擬真實世界,大大縮短了機器學習的時間。

  黃仁勛表示,英偉達的技術可以將機器人的訓練時間從多年縮短至幾小時,極大提高了效率和可行性。

  黃仁勛還特別強調了英偉達“三臺計算機”自動駕駛解決方案的安全性。這種涉及三個獨立計算機協同工作的系統,可以提供更高的可靠性和冗余性,從而增強自動駕駛汽車的安全性能。

  黃仁勛表示,在接下來的十年里,人工智能的應用科學將變得尤為重要。與上一代主要關注如何應用計算機來解決芯片設計和軟件工程問題不同,新一代面臨的挑戰是如何將AI技術應用到各個行業和領域中,以解決實際問題并創造價值。

  以下為對話亮點總結:

  • 通用人形機器人技術將最為實用,因為我們的世界是圍繞人類自身需求而建造的。這項技術極其難以實現。然而,隨著Transformer模型、大型語言模型以及基礎模型方面的突破,我們相信,我們已經具備了在這一領域做出實質性貢獻的技術基礎。
  • 教導通用機器人的方式類似于教導一個人。利用Isaac Sim,我們可以進行幾次人類示范,然后使用AI、Cosmos和Omniverse生成大量不同場景。
  • Omniverse創建的這個虛擬世界,實際上是現實世界的數字孿生(digital twin),這正是它的設計初衷。
  • Omniverse就是一個虛擬游樂場。對機器人來說,它感覺就像真實世界一樣,因為這個虛擬環境遵循物理定律,一切看起來都很真實。機器人無法分辨虛擬世界和現實世界的差別,這正是關鍵所在。
  • 我們為自動駕駛汽車行業提供服務的方式是通過三個計算機系統:一個用于訓練AI,一個用于模擬AI,稱為全景宇宙,還有一個用于將AI裝入汽車中。
  • 我們這一代人主要關注如何應用計算機來解決芯片設計和軟件工程問題,而新一代則需要思考如何應用 AI 來解決所有這些基本問題。比如,如何將 AI 應用于林業?如何將 AI 應用于海洋學?諸如此類,每個行業,每個科學領域都將受到影響。

  以下為訪談全文:

  構建通用機器人:世界模型與人工智能的融合

  Tiff In Tech:

  嗨,Jensen。感謝您今天抽出時間與我聊天。你在CES上發布了一些突破性的公告,特別是有一個領域我非常好奇,那就是機器人技術。當談到機器人技術時,使用Cosmos或世界基礎模型等工具,什么最讓你興奮?

  黃仁勛:

  我們正處于機器人技術的一個不可思議的時代。構建通用人形機器人所需的關鍵技術即將到來。其中一項關鍵技術是理解世界的人工智能模型,就像我們擁有理解語言的人工智能模型一樣。現在有了ChatGPT和Llama等,我們需要一個世界模型,一個理解世界的語言模型。世界需要機器人。其中一個原因是我們沒有足夠的勞動力。你知道,人口正在老齡化,人們對工作類型的偏好也在改變,出生率在下降,而世界需要更多的勞動力。因此,擁有機器人系統的時機確實相對迫切。

  通用人形機器人技術將最為實用,因為我們的世界是圍繞人類自身需求而建造的。這項技術極其難以實現。然而,隨著Transformer模型、大型語言模型以及基礎模型方面的突破,我們相信,我們已經具備了在這一領域做出實質性貢獻的技術基礎。

  我們需要將幾個方面結合起來:首先,機器人必須理解我們。例如,ChatGPT的突破確實使這成為可能。但缺少的是,我們現在需要一個理解物理世界的人工智能。它必須理解物理世界的動力學,包括重力、慣性、摩擦,還必須理解空間關系和幾何關系,以及一些常識性的東西,比如對象恒存性(指物體即使暫時看不見也仍然存在的認知)等。

  因此,我們著手創建本質上是世界模型的ChatGPT或Llama。它被稱為世界基礎模型(用于理解和模擬物理世界的AI模型)。就像語言基礎模型(用于理解和生成人類語言的AI模型)一樣,這是一個理解世界的基礎模型。如果我們能創造這樣的東西,那就是Cosmos,我們將它公開供所有人使用,希望這將真正點燃并加速機器人技術的發展。

  Isaac Sim:虛擬現實賦能機器人高效訓練

  Tiff In Tech:

  在教授機器人技術方面,這些技術非常有前景。我了解到最近有關Isaac Sim的一些新公告,特別是在虛擬現實訓練方面。您如何看待這項技術的未來發展和潛力?

  黃仁勛:

  訓練AI的第一步是要給它們基礎知識,也就是常識知識。第二步是要培養必要技能。教導通用機器人的方式類似于教導一個人。我們通過示范來教學。我們使用人類示范,向機器人展示如何拿起玻璃杯。每次玻璃杯的位置、高度和形狀可能略有不同,但本質上仍是拿起一杯水的動作。利用Isaac Sim,我們可以進行幾次人類示范,然后使用AI、Cosmos和Omniverse生成大量不同場景。我們生成各種不同大小、位置和擺放方式的版本,并將這些訓練數據,包括模仿數據提供給機器人學習。這樣,機器人就能學習到大量泛化版本的動作。

  Tiff In Tech:

  看起來可能有無限多的版本。這正是這項技術解決的問題,通過為機器人提供這些多樣化的訓練版本。

  黃仁勛:

  沒錯。我們不是只給機器人一個例子,而是提供數百萬個不同的例子。

  Omniverse:打造機器人訓練的無限可能

  Tiff In Tech:

  您還提到了Omniverse,這讓我非常感興趣,尤其是在制造業等行業的虛擬現實訓練方面。您如何看待這些行業使用Omniverse進行訓練的未來發展?

  黃仁勛:

  機器人行業發展緩慢,主要是因為訓練機器人非常困難。你需要為機器人創造大量的體驗場景。而且在現實世界中訓練機器人也存在安全隱患。因此,我們創造了一個虛擬世界,本質上是一個機器人的游樂場。

  這個Omniverse就是一個虛擬游樂場。對機器人來說,它感覺就像真實世界一樣,因為這個虛擬環境遵循物理定律,一切看起來都很真實。機器人無法分辨虛擬世界和現實世界的差別,這正是關鍵所在。我們在Omniverse這個虛擬世界中訓練機器人,為其創造大量學習場景。當機器人學會如何在Omniverse中完成任務后,我們將這個機器人大腦轉移到真實的機器人中。如果虛擬到現實的差距(SIM-to-real gap,即仿真環境與真實環境之間的差異)足夠小,機器人就無法察覺差別。這就是令人驚嘆的地方。Omniverse創建的這個虛擬世界,實際上是現實世界的數字孿生(digital twin),這正是它的設計初衷。

  Tiff In Tech:

  這太神奇了。如果用傳統方法訓練,肯定會消耗大量資源和時間。

  黃仁勛:

  是的,確實如此。否則,如果要在現實世界中訓練機器人學習行走,它將按照人類的時間進度線性學習。但在全景宇宙(omniverse,一種虛擬仿真環境)中,我們可以創建多個不同的多元宇宙(multiverse,即多重平行世界),讓機器人并行學習,可能同時以10萬種不同的方式學習。這樣,我們就可以將原本需要10年才能訓練機器人完成的任務,縮短到幾個小時內完成。

  想象一下,如果我們有多元宇宙,我們會變得多么聰明。就像Tiffany的不同版本可以在這里學習數學,在那里學習科學,在另一處學習英語,還有地理等等,同時學習所有這些內容。這基本上就是全景宇宙所能實現的。

  英偉達駕駛AI:多層次安全保障自動駕駛未來

  Tiff In Tech:

  這個技術真是令人向往。昨天你們還宣布了另一個領域的進展,就是關于英偉達駕駛AI,真正增強和提高了自動駕駛汽車的安全性。我知道你們還宣布了與豐田的合作,這也非常令人興奮。

  黃仁勛:

  是的,那是一個重大新聞,真的很重要。豐田是世界上最大的汽車公司。

  Tiff In Tech:

  沒錯,這確實令人非常興奮。你認為英偉達駕駛AI的發展前景如何?

  黃仁勛:

  我們在自動駕駛領域已經深耕多年,現在已經發展成為一個約50億美元規模的業務。我們為自動駕駛汽車行業提供服務的方式是通過三個計算機系統:一個用于訓練AI,一個用于模擬AI,稱為全景宇宙,還有一個用于將AI裝入汽車中。

  對于車載AI來說,安全就是一切。要解決安全問題,首先算法必須安全。它必須能夠智能地避開危險,知道如何安全駕駛等。

  但這些都是算法層面的問題,在更底層,操作系統必須設計得安全。車載計算機必須設計得安全,意味著它不能失效,即使失效也要安全失效。這涉及到一系列非常復雜的技術,包括算法多樣性(diversity of algorithms,即使用多種算法以提高系統的魯棒性)和計算冗余(redundancy of computing,即設置多重備份計算系統以防止單點故障)。所有這些復雜技術使得安全成為可能。

  Tiff In Tech:

  這個觀點很有意思。因為從消費者的角度來看,人們通常認為安全更多是關于檢測物體之類的。但正如你所說,它涉及很多層面,一直延伸到算法層面,這才是關鍵所在。

  黃仁勛:

  沒錯。你擁有的多樣性和冗余越多,系統就越安全。

  Tiff In Tech:

  你帶領英偉達在游戲和人工智能領域取得了諸多突破。在未來十年,你認為哪項新興技術將對我們產生最大影響?

  黃仁勛:

  毫無疑問,人工智能是我們這個時代最重要的技術。如果你退一步思考,問自己,如果我們能夠擴展智能并將其應用于渠道能力、醫療保健互動、藥物研發、應對氣候變化或開發機器人等,會發生什么?我們正在研究這些技術,以便應對人口老齡化、人口減少,并通過提高每個行業的生產力來防止和緩解各地的通貨膨脹。人工智能將影響如此多的領域,這就是為什么我們公司全力投入其中。

  現在,人工智能影響著我們所有的其他業務,包括電子產品在內。盡管 GeForce 是推動人工智能發展的重要力量,但 AI 現在反過來又讓 GeForce 在計算機圖形學方面變得更加出色。我們將人工智能和計算機圖形學結合起來所能實現的效果令人難以置信。我們正將人工智能與物理科學相結合,徹底革新了科學計算的方式。我們還將其應用于芯片設計和軟件開發,以設計出更好的芯片和開發更優質的軟件。因此,人工智能影響著我們所做的一切,它也將影響每個行業的方方面面。毫無疑問,這是當今最重要的技術。

  未來技術AI趨勢與職業發展

  Tiff In Tech:

  這讓我想到一個問題。我的頻道上有很多粉絲和關注者,他們要么是學習計算機科學的,要么是在科技領域工作。一個常見的問題是,科技領域有這么多方向可以選擇。從商業和技術角度看,人工智能似乎確實是一個值得他們繼續深耕的領域。

  黃仁勛:

  是的,為人工智能的基礎科學做貢獻當然很棒。然而,在接下來的十年里,人工智能的應用科學將變得尤為重要。

  我每天都把 ChatGPT 作為工作伙伴。我一直開著 ChatGPT,向它提問并與之合作解決問題。你必須學會如何與 AI 互動。正如你所知,提示工程確實是一門藝術,其中既有藝術性也有科學性。因此,你需要學會如何與人互動,同樣也要學會如何與 AI 互動。我們需要思考如何將 AI 應用于內容創作、工程、軟件開發、市場營銷、金融或法律等各個領域。

  如何將 AI 應用于這些領域是一個值得大量研究和開發的方向。我們這一代人主要關注如何應用計算機來解決芯片設計和軟件工程問題,而新一代則需要思考如何應用 AI 來解決所有這些基本問題。比如,如何將 AI 應用于林業?如何將 AI 應用于海洋學?諸如此類,每個行業,每個科學領域都將受到影響。

  Tiff In Tech:

  非常感謝你今天抽出時間與我交流。這次對話讓我對未來和即將到來的技術變革感到非常興奮。

  本文來自微信公眾號“硬AI”,關注更多AI前沿資訊請移步這里

  市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:于健 SF069

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 01-16 亞聯機械 001395 --
  • 01-16 海博思創 688411 --
  • 01-14 富嶺股份 001356 --
  • 01-13 興福電子 688545 11.68
  • 01-13 超研股份 301602 6.7
  • 新浪首頁 語音播報 相關新聞 返回頂部