時間:2017-06-15 來源:互聯網 瀏覽量:
微軟昨天宣布它的人工智慧(AI)係統在經典遊戲《吃豆人》上拿下首個滿分的999990分。
這個係統是由微軟今年一月收購的加拿大深度學習新創公司Maluuba所開發。該團隊運用一種強化式學習(reinforcement learning)的人工智慧技術及分散合擊的策略,在Atari 2600模擬器上執行《吃豆人》,並因此超越人類拿下首個滿分。
《吃豆人》是1980年代相當受歡迎的遊戲,小精靈要在迷宮中盡可能吃下白豆子拿分,但又要小心4大幽靈的追趕。然而這個遊戲變化多端相當難打,因而也成為許多AI界人士很有興趣的目標。今年Google在4月1日也曾推出結合《吃豆人》和Google Maps作為愚人節慶祝活動。人類最高紀錄是266,330分。
微軟Maluuba團隊設計了一種名為混合式獎賞架構的策略,它使用150多隻小精靈,使它們在單一共同目標之下,又各自被分配一個特定任務。例如一些去尋找大力丸,一些負責躲避幽靈。此外並設計出一個類似公司資深經理的大精靈(top agent),可在收集所有精靈建議做出團隊的最佳決策。
例如,某些AI可能會追蹤豆子,而另一些則專注於躲避敵人。負責最終決策的AI將基於加權邏輯去進行決策。如果100個AI希望向左側移動去吃掉一個豆子,而隻有3個想要向右移動躲避敵人,那麼最終的決策將是向右移動,以避免撞上敵人。
研究人員表示,透過強化式學習,這個AI係統中一方麵協調所有成員偏好,另一方麵讓各個成員專注單一問題,結果是對整個團體都獲益。
這次發表再次顯示AI在遊戲或比賽上已經不輸人類。Alphabet旗下DeepMind公司的人工智慧AlphaGo在上個月以三戰全勝擊敗世界排名第一的柯潔後,暫時沒有人類能阻止AI了。