時間:2017-06-15 來源:互聯網 瀏覽量:
安妮 編譯整理
量子位出品 | 公眾號 QbitAI
AI把吃豆人打通關了。
△ 穀歌首頁上的吃豆人遊戲
目前,微軟的一個AI係統在Atari 2600版的經典遊戲吃豆人中獲得最高分999,990分,用“分解攻克”的方式把遊戲打通關了。
回顧一下之前的戰績,Highscore.com上的吃豆人得分榜顯示,這個版本此前的最高分是266330分,成就屬於一名巴西玩家。
△ 據Highscore統計,目前吃豆人最高記錄是巴西玩家在2015年創下的
微軟的解決方案被稱為混合獎勵體係結構(Hybird Reward Architecture),利用了150多個獨立智能體協作處理遊戲。一個“高級智能體”從其他智能體那收集建議,然後決定在遊戲過程中屏幕裏角色的移動路徑。
吃豆人問題是對AI係統的一個考驗。AI需將遊戲解決方案分解成很多小步驟,然後在正確的時間將它們組合成正確的順序。這個過程和人類大腦的工作方式非常相似。
此成就來源於今年1月剛被微軟收購的加拿大AI創業公司Maluuba。在被收購前,Maluuba主要研究利用深度搜索和強化學習增強計算機自然語言讀寫和文本深度理解能力,還發布了自己的語音助手軟件。Maluuba解釋,之所以用Atari 2600版本來測試整這個AI係統,是因為此版本吃豆人已經被標準化,他們可以從中直接比較研究結果和方法。
這事說起來也很有意思,微軟CEO Satya Nadella曾經打趣說,穀歌建立AI係統想要贏得圍棋或星際爭霸II這樣的遊戲,但微軟是想建立能解決實際問題的AI。
研究人員希望將這項工作納入其他人工智能研究領域,如自然語言處理。他們表示,這種方法可能會對教AI進行複雜任務產生廣泛影響,從而增強人類能力。
【完】
一則通知
量子位正在組建自動駕駛技術群,麵向對象為研究自動駕駛相關領域的在校學生或一線工程師~
歡迎大家加量子位(Qbitbot)備注:自動駕駛,申請加入哈~