close
IT 基建人工智能企業趨勢業界消息

阿里通義千問獲 NeurIPS 最佳論文獎 首個中國團隊奪此殊榮


阿里通義千問獲 NeurIPS 最佳論文獎 首個中國團隊奪此殊榮

阿里通義千問(Qwen)團隊於 NeurIPS 大會上,從全球逾 20,000 篇投稿中脫穎而出並獲最佳論文獎,是本屆唯一獲此殊榮中國團隊。研究針對「注意力門控機制」,揭示提升大模型訓練效率關鍵路徑,標誌中國 AI 基礎研究能力晉身全球第一梯隊。在 AI 競爭日趨激烈下,成果對全球大模型產業發展具里程碑意義。

突破 AI 訓練瓶頸技術創新

通義千問團隊研究聚焦 Transformer 架構核心組件注意力機制,首次系統性解密「注意力門控機制」如何影響模型效能與訓練穩定性。團隊透過在 1.7B 稠密模型與 15B 混合專家模型(MoE)進行數十組大規模實驗,單組訓練數據量最高達 3.5 兆 tokens,證實門控機制能作模型「智能閥門」,有效過濾冗餘資訊並提升模型表現。

論文揭示兩大關鍵發現改寫業界對注意力機制理解。首先在 Softmax 注意力低秩映射引入非線性變換;其次利用查詢相關稀疏門控分數調節注意力輸出。此機制除緩解「啟動爆炸」和「注意力沉降」問題,亦顯著改善長文本處理外推效能。NeurIPS 評審委員會指出,方法將被廣泛採用,大幅推動社群對大語言模型注意力機制理解。

從學術突破到產業應用閉環

研究成果並非停留理論層面,已成功應用於 Qwen3-Next 模型系列,顯著提升模型效能與穩健性。Qwen3-Next 採用創新混合注意力架構,實現 80B 參數僅需啟動 3B 算力即媲美 235B 密集模型效能,訓練成本較傳統密集模型降逾 90%。效率革命令長文本推理處理量提升 10 倍,單卡即可在 24GB 視像記憶體運作 80B 模型,徹底改變大模型部署經濟邏輯。

目前阿里通義千問已開源逾 300 款模型,覆蓋全模態及全尺寸,全球累計下載量突破 7 億次,衍生模型數量逾 18 萬個。《財富》雜誌 2025 年「改變世界」榜單特別肯定 Alibaba 開源策略,認為透過免費或低成本提供 AI 模型,正支援初創企業、研究人員與技術愛好者探索前沿技術,並促使 OpenAI、xAI 等美國同行紛紛發布開源模型。

頂級 AI 會議認可背後競爭格局

NeurIPS 作為人工智能領域最具影響力學術會議,曾孕育 Transformer、AlexNet 等改變行業里程碑成果。本屆會議接收 5,524 篇論文,整體錄用率僅 24.52%,最終僅 4 篇論文獲最佳論文獎,入選機率不足萬分之二。參與競爭包括 Google、Microsoft、OpenAI 及麻省理工學院等全球頂尖機構,Alibaba 能在激烈競爭勝出,充分展現其 AI 基礎研究深厚實力。

值得關注是中國 AI 研究在全球舞台扮演越趨重要角色。根據 Digital Science 發布報告,2024 年中國 AI 研究論文產出已匹敵美國、英國和歐盟總和,佔據全球逾 40% 引用關注度。史丹福 AI 指數報告亦顯示,中國在 AI 專利、研究產出和開源模型活動方面領先全球,目前僅在尖端模型發布數量落後美國。中國擁有約 30,000 名活躍 AI 研究人員,且研究人力年輕化、成長快速,為長期創新奠定獨特優勢。

大模型訓練成本革命產業意義

研究產業價值在於為大模型降低成本與提升效益提供可行路徑。當前 AI 領域面臨訓練成本高昂挑戰,過去 8 年間 AI 模型訓練成本飆升約 2,400 倍,頂級模型訓練費用高達 10 億美元(約港幣 78 億元)。通義千問團隊門控注意力機制研究證實,透過架構創新可在維持甚至提升效能同時,將訓練成本降低 90% 以上。

技術突破使企業級部署和即時應用成常態。Alibaba Cloud 已憑藉包括通義千問在內 AI 能力,與 Google、OpenAI 並列被 Gartner 確立為生成式 AI 領導者地位。通義千問首席科學家表示,對門控機制等模型機制深入理解,除為大語言模型架構設計提供新方向,亦為構建更穩定、更高效、更可控大模型奠定基礎。

開源生態驅動全球影響力

Alibaba 透過建立中國最大開源 AI 社群 ModelScope,目前累計服務逾 1,800 萬用戶,涵蓋逾 10 萬個模型,彰顯其在開源領域深厚影響力。開源策略除降低 AI 技術採用門檻,亦促進 Alibaba 自身雲端生態系統發展;當開發者在通義千問模型構建應用時,自然融入 Alibaba 利潤日益增長雲端業務。

對全球 AI 產業而言,獲獎研究及其產業化應用預示大模型技術正從「能力競賽」轉向「生態協同」階段。隨著門控注意力機制等創新技術普及,AI 大模型將更高效、穩定且易於部署,推動人工智能從實驗室走向更廣泛商業場景。此乃中國 AI 研究重要里程碑,亦是全球 AI 技術進步共同成果。

資料來源:新浪財經快科技36氪Digital ScienceAlibaba News

 

Tags : aialibabaLLMNeurIPSQwen
Pierce

The author Pierce

喜歡尋找本地潛力 Startups 與讀者分享, 對企業資訊安全特別注意