當(dāng)前位置：系統(tǒng)之家 > IT快訊 > 詳細頁面

谷歌的AI能踢“足球”？

編輯：chenbing 2016-06-21 10:15:20 來源于：互聯(lián)網(wǎng)

　　谷歌的 DeepMind 小組能力超強。此前在圍棋上擊敗李世石，現(xiàn)在開始挑戰(zhàn)3D 導(dǎo)航和益智解謎游戲。谷歌的AI也一直朝著超神的道路走去。

　　在 DeepMind 的挑戰(zhàn)中，最值得注意的是一款名為“螞蟻足球”的游戲。玩家需要控制一只螞蟻形狀的物體去追逐小球，然后帶球直至將其送進球門得分。這種事對于人類來說可謂易如反掌，就看 DeepMind 怎么做了。

　　根據(jù) DeepMind 小組 David Silver 說法，AI 不僅完成了這個挑戰(zhàn)，最令人驚訝的是它在整個過程中“完全不需要提前灌輸有關(guān)力學(xué)的任何知識”。這個結(jié)果表明，谷歌提出的強化學(xué)習(xí)（Reinforcement Learning）概念近來又有了巨大的突破。

　　為了得到這樣的結(jié)果，DeepMind 結(jié)合了強化學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)和 Deep Q-Network 于一體。專門有一個算法負責(zé)存儲機器人的經(jīng)驗積累，以及在完成某個特定行為后它的獎勵預(yù)期。其實這也的算法早在 DeepMind 完成 2D 游戲挑戰(zhàn)時就已經(jīng)得以應(yīng)用，不過 Silver 說它現(xiàn)在已經(jīng)得到改進，比以前好得太多。

　　舉個例子，該算法現(xiàn)

　　在能夠允許單個神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)多個游戲。為此研究組打造了一個大型分布式深度強化學(xué)習(xí)系統(tǒng)，能夠利用谷歌的云平臺來加速訓(xùn)練時間。值得注意的是，該技術(shù)已經(jīng)被運用在谷歌的推薦系統(tǒng)中了。

　　不過，真正能夠讓 DeepMind 學(xué)會玩這個“螞蟻足球”的關(guān)鍵在于谷歌最新開發(fā)出的所謂“異步 Actor-Critic 算法”，即 A3C。在解決電機控制和使用視覺在隨機 3D 迷宮中導(dǎo)航的問題上，采用這個算法的話標(biāo)準多核 CPU 較之 GPU 效率更高。

　　David Silver 表示，DeepMind 現(xiàn)在達到的成績可以說是最尖端的了，這樣能夠在訓(xùn)練時間和資源消耗上達到一個平衡。

　　隨著 AI 技術(shù)的繼續(xù)發(fā)展，人類會受到威脅嗎？事實上谷歌也有類似的擔(dān)憂，DeepMind 小組曾表示他們擔(dān)心 AI 會自己發(fā)展出一套它們認為可以達到目的，但卻不是人類想要的方案來完成目標(biāo)。

　　對于AI 的任何行動，DeepMind 小組已經(jīng)開發(fā)出了一種機制。而關(guān)于AI 會不會帶來毀滅性后果的問題，并不是我們?nèi)?dān)憂的事。