比起限定功能的人工智能系統,「通用人工智能」是不少研究的目標,這樣的系統可以更有彈性地自動對應不同的應用範疇,就有如真人一樣。DeepMind 最近就宣稱,就算只是用強化學習方式訓練,也可以達到這個水平。
在 DeepMind 最近於 Artificial Intelligence 期刊發表的一份論文表示,人工智能系統的能力並不是透過制定和解決複雜問題而產生,而是透過「獎勵最大化」的單一原則可以達成。他們認為,獎勵最大化和試行錯誤的經驗,可以培養出智力相關能力,而其中一個實際應用的方式就是強化學習,他們相信最終可以達到通用人工智能的水平。
他們提出,利用這樣的原則可以更有效的建立 AI 系統,他們假設「最大化獎勵的一般目標足以驅動表現出自然和人工智能研究的大部分(如果不是全部)能力的行為」,模仿大自然智能進化的適者生存機制,迫使系統在單一目標之下發展出不同的相關能力。不過這套理論仍然有需要解決的地方,例如對於學習代理的樣本效率應該如何判斷,始終強化學習需要大量數據作訓練,而現有的數據下可能要幾個世紀的訓練時間才可以發展出通用人工智能。
來源:Venture Beat
—
新增 : unwire.pro Mewe 專頁 : https://mewe.com/p/unwirepro