時間:2017-06-18 來源:互聯網 瀏覽量:
Maluuba的方法很有趣。這種方法將遊戲所需的策略和技巧分解成為獨立的元素,AI的不同部分專注於其中每個元素,而更高層次的AI會做出總體決策,判斷優先執行什麼操作。
微軟在官方博客中表示,《吃豆人》遊戲在AI研究領域被廣泛使用,因為其玩法存在不可預測性。這款遊戲最初的開發者之一的格爾森(Steve Golson)指出,這是有意為之,因為遊戲依賴於玩家通過反複練習去獲得成功。
Maluuba利用了強化學習技術,即對於特定問題,AI將獲得正麵或負麵反饋,從而應對不可預測性。強化學習被認為可以幫助係統自主做出決策。這與受監督學習不同,即係統獲得正麵和負麵案例數據,從而建立經驗基礎。