Google 旗下的 AI 研究部門 DeepMind 最近推出了 AlphaEvolve,一種由大型語言模型驅動的「演化編碼代理」,專為發現和最佳化算法而設計。作為一套指令集,運算機算法被用於解決複雜問題。AlphaEvolve 被定位為數學家、科學家和工程師處理算法任務的實用工具,適用範圍從抽象數學證明到數據中心作業調度等。
AlphaEvolve 的核心優勢在於其演化方法。例如,在改進矩陣乘法(機器學習中的核心運算)的過程中,AlphaEvolve 發現了一種新算法,使用僅 48 次標量乘法來乘以 4×4 複值矩陣,超越了 Strassen 1969 年的成果。
AlphaEvolve 使用自動化指標評估代碼性能,然後透過演化算法的新版本來提出改進方案。這代表了 AI 輔助編程的重大進步,結合了大型語言模型的創造力與進化算法的最佳化能力,為長期困擾科學界的問題開闢了新的解決途徑。
與 Google 的 AI 共同科學家系統不同,AlphaEvolve 專注於代碼改進和評估,而非以自然語言表示假設,因此幻覺問題較少令人擔憂。在 Google 內部,研究人員表示 AlphaEvolve 已經提高了數據中心調度、晶片設計和 AI 訓練的效率。他們還將其貢獻歸功於幫助設計更快的矩陣乘法算法並為長期存在的數學問題生成新解決方案。
AlphaEvolve 團隊在博客文章中解釋:「AlphaEvolve 將我們 Gemini 模型的創造性問題解決能力與驗證答案的自動評估器配對,並使用演化框架來改進最有前途的想法」。
Google 使用「演化」一詞使編碼代理的技術過程聽起來很有機性。隨附的論文還使用了具有生物聯想的術語:「AlphaEvolve 延續了演化或遺傳編程的悠久研究傳統,在這種編程中,人們反覆使用一組突變和交叉操作符來發展程序池。」
對 AI 訓練等效率有幫助
在數據中心管理方面,Google 已經使用 AlphaEvolve 最佳化了其 Borg 運算集群管理系統的性能。根據研究人員的說法,這個編碼代理提出了一個用於在線運算作業調度的啟發式函數,其表現超過了生產中運行的函數。「這個解決方案現已在生產環境中運行一年多,平均持續恢復了 Google 全球運算資源的 0.7%,」研究人員聲稱。對於管理大型運算基礎設施的企業,這代表了顯著的效率提升和成本節約。
在 AI 模型訓練方面,DeepMind 團隊指出 AlphaEvolve 幫助最佳化了 Google Gemini 模型系列訓練中涉及的矩陣乘法操作,透過加速其 Pallas 核心 23%,從而減少了 1% 的訓練時間。對於開發和部署 AI 系統的公司而言,即使是訓練時間的小幅減少也能轉化為顯著的成本節約,尤其是對大規模模型。
同時,AlphaEvolve 展示了在數學分析、幾何、組合學和數論等超過 50 個開放問題上的實用性。「據我們所知,在大約 75% 的情況下,它重新發現了最先進的解決方案。在 20% 的情況下,AlphaEvolve 改進了之前已知的最佳解決方案,在相應的開放問題上取得了進展,」研究人員表示。這對於從事基礎研究或需要突破性算法解決方案的企業具有深遠意義。
對於軟件開發團隊,這種工具可提高代碼效率和最佳化關鍵算法的新途徑。企業可以使用類似 AlphaEvolve 的系統來審查現有代碼庫,識別最佳化機會,並自動生成更高效的替代方案,從而減少人工審查和重構所需的時間和資源。
AI 專業化趨勢帶來新機遇
AlphaEvolve 的推出標誌著 AI 輔助編程的重要里程碑,也預示了幾個關鍵趨勢。首先,我們正在見證神經符號 AI 的崛起,這種方法結合了神經網絡的學習能力和符號 AI 的精確推理。正如 AI 專家 Gary Marcus 所觀察到的,DeepMind 探索純大型語言模型之外的技術表明,將神經網絡與經典 AI 思想結合的方法正在成為未來的發展方向。
AlphaEvolve 不是通用 AI 工具,而是專門為算法發現和最佳化而設計。這種專業化趨勢可能會延續,各行業將看到越來越多的專用 AI 系統,專門解決其獨特挑戰。未來結合不同 AI 方法的混合系統將成為解決最複雜問題的關鍵,透過整合大型語言模型的創造性能力與演化運算的搜尋效率,該系統實現了單獨使用任何一種方法都難以實現的結果。
Google 計劃率先向學術界提供試用,有興趣的人可以在網上申請。隨著更多研究人員開始探索 AlphaEvolve 的能力,我們可能會看到其在更廣泛的學科中的應用,從材料科學到藥物發現,再到氣候模型都有望獲得推進。
來源:The Register