系統(tǒng)之家 - 系統(tǒng)光盤下載網(wǎng)站!

當(dāng)前位置:系統(tǒng)之家 > IT快訊 > 詳細頁面

谷歌的AI能踢“足球”?

編輯:chenbing 2016-06-21 10:15:20 來源于:互聯(lián)網(wǎng)

  谷歌的 DeepMind 小組能力超強。此前在圍棋上擊敗李世石,現(xiàn)在開始挑戰(zhàn)3D 導(dǎo)航和益智解謎游戲。谷歌的AI也 一直朝著超神的道路走去。

  在 DeepMind 的挑戰(zhàn)中,最值得注意的是一款名為“螞蟻足球”的游戲。玩家需要控制一只螞蟻形狀的物體去追逐小球,然后帶球直至將其送進球門得分。這種事對于人類來說可 謂易如反掌,就看 DeepMind 怎么做了。

谷歌的AI能踢“足球”?

  根據(jù) DeepMind 小組 David Silver 說法,AI 不僅完成了這個挑戰(zhàn),最令人驚訝的是它在整個過程中“完全不需要提前灌輸有關(guān)力學(xué)的任何知識”。這個結(jié)果表明,谷歌提出的強化學(xué)習(xí)(Reinforcement Learning)概念近來又有了巨大的突破。

  為了得到這樣的結(jié)果,DeepMind 結(jié)合了強化學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)和 Deep Q-Network 于一體。專門有一個算法負責(zé)存儲機器人的經(jīng)驗積累,以及在完成某個特定行為后它的獎勵預(yù)期。其實這也的算法早在 DeepMind 完成 2D 游戲挑戰(zhàn)時就已經(jīng)得以應(yīng)用,不過 Silver 說它現(xiàn)在已經(jīng)得到改進,比以前好得太多。

  舉個例子,該算法現(xiàn)

  在能夠允許單個神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)多個游戲。為此研究組打造了一個大型分布式深度強化學(xué)習(xí)系統(tǒng),能夠利用谷歌的云平臺來加速訓(xùn)練時間。值得注意的是,該技術(shù)已經(jīng)被運用在谷歌的推薦系統(tǒng)中了。

  不過,真正能夠讓 DeepMind 學(xué)會玩這個“螞蟻足球”的關(guān)鍵在于谷歌最新開發(fā)出的所謂“異步 Actor-Critic 算法”,即 A3C。在解決電機控制和使用視覺在隨機 3D 迷宮中導(dǎo)航的問題上,采用這個算法的話標(biāo)準多核 CPU 較之 GPU 效率更高。

  David Silver 表示,DeepMind 現(xiàn)在達到的成績可以說是最尖端的了,這樣能夠在訓(xùn)練時間和資源消耗上達到一個平衡。

  隨著 AI 技術(shù)的繼續(xù)發(fā)展,人類會受到威脅嗎?事實上谷歌也有類似的擔(dān)憂,DeepMind 小組曾表示他們擔(dān)心 AI 會自己發(fā)展出一套它們認為可以達到目的,但卻不是人類想要的方案來完成目標(biāo)。

  對于AI 的任何行動,DeepMind 小組已經(jīng)開發(fā)出了一種機制。而關(guān)于AI 會不會帶來毀滅性后果的問題,并不是我們?nèi)?dān)憂的事。

標(biāo)簽 谷歌

發(fā)表評論

0

沒有更多評論了

評論就這些咯,讓大家也知道你的獨特見解

立即評論

以上留言僅代表用戶個人觀點,不代表系統(tǒng)之家立場

官方交流群 軟件收錄