安裝新浪財經(jīng)客戶端第一時間接收最全面的市場資訊→【下載地址】
10秒內(nèi)可以完成的簡單任務,而且未見過的游戲也會玩。
谷歌DeepMind號稱打造出了首個能在廣泛3D虛擬環(huán)境和視頻游戲中遵循自然語言指令的通用AI智能體。
名為SIMA,不是NPC,是可以成為玩家拍檔,幫忙干活打雜的那種。
比如,在《模擬山羊3》(Goat Simulator 3)中當司機開開車:
在《幸福工廠》(Satisfactory)中挖礦石:
在《瓦爾海姆》(Valheim)中尋找水源:
在《無人深空》中(No Man’s Sky)駕駛宇宙飛船射擊小行星收集資源:
……
SIMA全稱Scalable Instructable Multiworld Agent,顧名思義可擴展、可指導、多世界。
之前,谷歌DeepMind在AI+游戲方面也做過許多工作,比如推出能和人類玩家打PK、會玩《星際爭霸II》的AlphaStar系統(tǒng)。
而SIMA被DeepMind稱作是一個“新的里程碑”,主打從適用單一游戲轉(zhuǎn)向通用多種游戲,且可遵循語言指令。
SIMA一公開,網(wǎng)友們也是討論熱烈。
讓它們替我完成無聊繁瑣的任務,這樣我就可以直接做有趣的部分,而不必花幾個小時培育chocobos獲取隨機召喚。
嗯…《最終幻想》(Final Fantasy)玩家無疑了。
專業(yè)《模擬山羊》玩家在此刻也懵了:
最近這一連串的AI進展也是整的網(wǎng)友們措不及防,直呼“慢一點”:
10秒內(nèi)完成的簡單任務
接下來再來看一波SIMA的表現(xiàn)。
為了讓SIMA接觸到更多游戲環(huán)境,開發(fā)團隊表示目前已與八家游戲工作室合作,在九款不同的視頻游戲上訓練和測試了SIMA。
當前的SIMA已在600個基本技能上進行了評估。
基本操作、交互、使用菜單都會:
簡單的任務,10秒內(nèi)可完成。
各種場景都能適應:
除此外,谷歌DeepMind還發(fā)布了一份技術(shù)報告,一起來看看里面都有啥。
未見過的游戲也會玩
SIMA的整體架構(gòu)是將預訓練視覺模型與自監(jiān)督學習的Transformer相結(jié)合。
從用戶那里接收語言指令,并從環(huán)境中獲取圖像觀察結(jié)果,然后將它們映射為鍵盤和鼠標動作。
具體架構(gòu)如下圖:
開發(fā)人員收集了一個既包括精選研究環(huán)境又包括商業(yè)視頻游戲的大型多樣化游戲數(shù)據(jù)集。
此外,他們還用Unity創(chuàng)建的一個新環(huán)境,名為“the Construction Lab”。在這個環(huán)境中,智能體需要使用積木構(gòu)建雕塑,這考驗了它們對物體的操縱能力和對物理世界的理解。
數(shù)據(jù)收集包含多種方法,比如讓不同成對的人類玩家的互動,其中一名玩家觀察并指導另一名玩家,以此來捕獲語言指令;讓玩家自由玩游戲,觀察他們的操作,并記錄下可能導致其游戲行為的指令。
通過在不同的游戲世界中學習,SIMA能夠?qū)⒄Z言與游戲行為相結(jié)合。
不需要訪問游戲源代碼,也不需要定制API,僅需要兩個輸入:屏幕上的圖像和用戶提供的簡單的自然語言指令。
然后SIMA就會使用鍵盤和鼠標輸出來控制游戲角色以執(zhí)行這些指令,這一操作與人類類似,也就意味著SIMA有潛力與任何虛擬環(huán)境互動。
在評估測試中,研究人員表示SIMA在九個3D游戲集上接受訓練,表現(xiàn)顯著優(yōu)于僅在單個游戲上專門訓練的智能體。
而且SIMA在未訓練過的游戲中的表現(xiàn)和專門使用該游戲數(shù)據(jù)集訓練過的智能體表現(xiàn)一樣好。
也就是說,SIMA在全新環(huán)境中具備泛化能力。
此外測試結(jié)果還顯示,SIMA的性能依賴于語言。在一個控制測試中,智能體沒有接受任何語言訓練或指令,它就會出現(xiàn)無目的的操作,不遵循指令。
而且,和人類玩家相比較,SIMA水平還是差一點。
風險提示及免責條款
市場有風險,投資需謹慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資,責任自負。
責任編輯:馬夢斐
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)