首页 国产 亚洲 小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看

設為書簽 Ctrl+D將本頁面保存為書簽,全面了解最新資訊,方便快捷。 您也可下載桌面快捷方式。點擊下載 | 新浪科技 | 新浪首頁 | 新浪導航

這個拒絕內卷的AI狼火了!高智商卻自暴自棄,不想抓羊只想躺

2021-03-20 13:22:27    創事記 微博 作者:   

來源:新智元

智障AI狼最近火了!

在一個狼吃羊的AI游戲中,狼發現自己吃不到羊,而選擇了「自殺」。

那么,狼為啥會選擇直接撞死呢?

傻狼選擇「自殺」,只因人間不值得!

近日,微博上一位網友@二雨TR最近發文稱,聽我老師給我講他搞游戲ai的事情笑死我了。

在他發布的這三張聊天記錄截屏中,具體介紹了這個狼抓羊的游戲機制。

從截圖中可以看出,狼選擇撞石的原因竟是,「自殺分數高!」

在這個項目中,研究人員給設定了狼吃羊游戲的基本原則是,狼在20秒內得分越高越好,而羊在20秒內存活時間越長得分越高。

開局兩只狼,還有六只羊,地圖上紅色帶×的字符就是狼和羊隨機出現的可能位置。

狼和羊前面有6根射線,是用來感知范圍。當這6根線和障礙物以及地圖邊界碰撞,就會返回一個坐標。

那根坐標白線便是狼和離它最近羊的連接,這樣狼就可以每次優先吃掉最近的那只羊。

在研究人員開始訓練的最初階段,先固定了羊的位置,讓狼去學習抓羊。

在狼學會抓羊后,羊也以隨機的位置出現在游戲中。

狼抓到羊,獎勵10分

狼撞到障礙物,扣1分

為了節省狼抓羊的時間,每秒鐘狼都會受到0.1的懲罰

其中,羊撞到石頭不會死,只要存活時間長,羊就能得到高分。

如果這兩只狼想要在20秒以內得到高分,需要狼吃到羊的數量越多越好,吃羊所用時間越短越好。

在研究人員進行了20W次的訓練,竟發現狼抓羊的效果越來越差。

大多數情況下狼基本吃不到羊,而且在抓羊的過程中浪費的時間也被扣分,干脆就選擇撞死了!

該項目的一位研究人員@Sdust星塵研表示,「之所以會自殺, 是因為狼在前幾萬次的訓練中發現一頭撞死只扣-1.1分(-1 + -0.1)。

往羊那邊走兩步撞死扣-1.1到-2.4分。

偶爾一次能吃到,雖然正分,但是不值得」。

狼是打工人,羊是永遠達不到的升職加薪

這只蠢狼已經在微博、知乎、豆瓣等各大平臺上火出了圈。

網友們從狼抓羊的身上看到了自己。

那只狼不就是現在的我么!

狼就是打工人…每秒扣的是青春和時間,羊是永遠達不到的「升職、加薪、迎娶白富美、走上人生巔峰」,撞石頭就是躺平摸魚…

還有網友表示,「AI訓練告訴你,為什么現在的年輕人都不愿意努力了」。

獎勵機制不合理

有網友對這一項目的獎勵機制設置是否合理提出了質疑。

還有網友認為,單步懲罰太大,而撞障礙物的懲罰太小,應該把獎勵函數設置為,撞到障礙物的懲罰無窮大,那么狼就知道了撞石的代價,就不會輕易選擇自殺了。

所以,狼選擇自殺的部分原因也是獎勵機制設置不合理而導致的。

星塵研在B站中的視頻表示,狼自殺的錯誤是很多因素共同影響產生的,最主要的原因是迭代次數太少,20W次完全不夠學。后面提高到100W次起步,效果直線上升。

自暴自棄的狼終于抓到了羊

訓練次數從最初5W次一輪,迭代了13代。到后來改成200W一輪,迭代了5代,狼抓羊的訓練效果明顯提升。

在訓練了300萬次后,狼終于可以成功地吃到羊。

但是,游戲還是存在一定的缺陷,兩只狼還是會偶爾撞石而死。

狼終于學會了抓羊~~

參考資料:

https://m.weibo.cn/6611961566/4613651452134398 https://m.weibo.cn/6611961566/4613930355525879

https://www.bilibili.com/video/BV16X4y1V7Yu?p=1

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

分享到:
保存   |   打印   |   關閉