close
人工智能

Microsoft 亞洲研究團隊公佈自我學習 AI 技術 LeMa

如何有效提升 AI 模型的準確度,一直以來都是開發者希望解答的問題。最近 Microsoft 的亞洲研究團隊就聯通中國兩間大學的研究人員,開發可以「從錯誤中學習」的 AI 技術。

Microsoft Research Asia、北京大學和西安交通大學的研究人員共同開發了一個名為「從錯誤中學習」(LeMa) 的新技術,旨在提高大型語言模型 (LLMs) 解決數學問題的能力。這種訓練方式可以讓 AI 在運算錯誤時自我糾正,其原理是首先讓模型例如 LLaMA-2 生成數學文字問題的錯誤推理路徑,然後用 GPT-4 識別推理中的錯誤,對其進行解釋並提供糾正的推理路徑,進一步訓練原始模型。

透過這種訓練方式,讓 AI 可以更接近人類的學習模式,有效提升性能。研究人員表示,在五個骨幹 LLM 和兩個數學推理任務中,使用 LeMa 與只透過 CoT 數據微調相比,效能都一直有所改善。LLM 的推理能力向來不太理想,今次研究的結果將有望提升 LLM 在數學推理方面的表現,同時使其在更多應用範疇中都可以發揮優勢。

來源:Venture Beat

Tags : LeMaMicrosoft
Antony Shum

The author Antony Shum