■ 龔夢澤
在2025年國際消費類電子產品展覽會(CES 2025)上,包括英偉達、谷歌、世界實驗室等多家全球頭部科技企業集體宣布入局人工智能領域當下最關鍵的方向——世界模型(World Models)。
所謂世界模型,最早出現在機器學習領域,專為物理交互、模擬工業環境和駕駛環境的高質量生成而構建。現階段,世界模型主要用于生成逼真的視頻訓練機器人和自動駕駛汽車,并通過創建合成訓練數據,幫助機器人和汽車理解物理世界。
世界模型為何備受矚目?首先基于“自主決策”。相比語言模型還停留在理解人類語義階段,世界模型則從一維形式的數字智能走向三維形式的空間智能,開始理解真實的物理世界,創建對世界運作方式的內部表征,理解現實世界的規律,并據此推理行為的后果,這種潛意識里的推理和決策,被認為是實現人類級智能的先決條件之一。
其次則緣于成本。自動駕駛的成長需要海量數據(維權)“喂養”,依靠豐富、復雜的場景進行“錘煉”。然而,現實測試中危險場景和長尾數據稀缺,3D重建又成本高、效率低。因此,采用合成數據來助力自動駕駛模型訓練成了有效的解決方案——世界模型正是這樣的場景生成和預測工具,自己“造數據”,可以用于場景數據增強、危險場景生成、算法評測等應用,有效降低自動駕駛研發中訓練數據成本。
筆者認為,在自動駕駛領域,我們可以通過世界模型生成帶有預測性質的視頻數據,實現極端情況下的多樣化訓練;讓世界模型采用強化學習的方法認識復雜駕駛環境,通過視頻輸出駕駛決策。
盡管世界模型在理論上具有巨大潛力,但在實際應用中仍然存在不確定性。例如,環境模擬的準確性極大地依賴于模型復雜度和數據質量,要精確地預測復雜環境中的動態變化,需要大量的數據和強大的計算資源,這需要龐大成本且漫長的周期方能實現。此外,在不同的應用場景中調整模型參數以適應特定的需求等問題也需要進一步研究、探索。
但無論如何,世界模型勢必將成為汽車智能化的一道分水嶺,其在場景生成、模型訓練、仿真測試、數據閉環等方面的獨特優勢,將推動包括自動駕駛、機器人等在內的人工智能應用迎來高光時刻。
責任編輯:江鈺涵
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)