研究建議利用 Overcooked 遊戲作 AI 評估標準

深度強化學習系統是一種應用層面相當廣泛的人工智能系統，在機械人的應用上更甚。由於這種人工智能的特色是可以應對未經訓練的場景作出應變，有研究就建議可以利用名為 Overcooked 的遊戲作其評估標準。

Microsoft、加州大學柏克萊分校和諾丁漢大學最近一個合作研究開發了一個新的方式去測試人工智能與真人合作的能力，利用名為 Overcooked 的合作廚房管理遊戲中不同的合作任務挑戰，讓人工智能可以展示其解難能力。研究團隊認爲，這個遊戲雖然最初並非因應評估人工智能而設，但裏面的挑戰是相當合適的工具，去測試潛在的極端場景，例如碟子亂放，或者真人玩家沒有反應等等。

研究團隊發現，利用 Overcooked 作測試後，沒有一個深度強化學習系統可以獲得超過 65% 的分數，因此未來仍然有很大的進步空間，也證明這個遊戲的難度對作為評估標準而言適中。研究報告強調，Overcooked 測試方式可以提供驗證獎勵以外的其他元素，而且不是測試特定技巧。未來希望可以透過這個方式測試人機合作以外的其他人工智能範疇。

來源：Venture Beat

—
新增 : unwire.pro Mewe 專頁 : https://mewe.com/p/unwirepro