Google 研究揭 AI 內部如「群體辯論」 DeepSeek、QwQ 運作機制曝光

Google 最新研究揭示 DeepSeek 與 QwQ 等 AI 模型內部運作如「群體辯論」,顛覆傳統對 AI 推理的認知。本文深入分析這項發現如何推動 2026 年 AI 市場從規模競賽轉向結構改良,並探討香港企業如何利用新一代推理模型實現數碼轉型。



機器如何「思考」?內部辯論機制首度曝光

研究團隊透過量化分析和機制可解釋性方法,解剖 DeepSeek-R1 和 QwQ-32B 的推理軌跡,發現這些模型處理複雜任務時,會自發啟動多個具不同「人格特質」和「專業領域」的內部視角。論文稱此現象為「觀點多樣性」(perspective diversity),即系統能同時持有並比較多條推理路線。例如模型解決數學難題時,內部可能同時存在嚴謹邏輯學家、具創造力探索者,以及批判性事實核查者等視角。三者透過「觀點轉換」(perspective shifts)和「衝突解決」(conflict resolution)等對話策略,互相質疑並修正錯誤,最終收斂至正確答案。這種機制與人類團隊協作解決問題的過程驚人相似,但完全在單一模型內部自發形成。

研究人員透過控制實驗證實,當僅以推理準確性作為獎勵進行強化學習訓練,基礎模型會自發增加對話行為,並非程式設計師刻意編程。進一步實驗顯示,使用對話式框架(conversational scaffolding)進行微調的模型,其推理能力提升速度顯著快於使用傳統獨白式推理框架訓練的模型。這印證法國認知科學家 Mercier 和 Sperber 提出的「理性之謎」理論:人類推理本質上是社會過程,知識透過對抗性論證和跨觀點交流而浮現。Google 研究團隊認為,AI 推理模型已建立起與人類群體集體智能相似的運算平行機制,其中多樣性在系統化結構下能促成卓越的問題解決能力。

產業洗牌在即:從「規模競賽」轉向「結構改良」

這項研究對全球 AI 產業戰略方向產生深遠影響。長期以來,科技巨頭普遍認為提升 AI 效能主要依賴更大模型規模、更多數據和更強算力。然而 Google 團隊發現表明,模型內部推理的組織方式可能與規模同等重要,甚至更關鍵。IBM 研究主管 Peter Staar 在 2025 年底接受訪問時預測,2026 年將見證「更小型、多模態且易於針對特定領域調優的推理模型」興起。他指出與其用一個巨型模型應對所有任務,企業將採用針對特定場景調優的小型高效模型,準確度可能更高。此趨勢與 DeepSeek 在 2026 年 1 月 21 日(R1 發布一周年)揭曉的新模型 MODEL1 技術路線吻合,該模型在 KV 快取佈局、稀疏性處理和 FP8 解碼等方面進行針對性改良,而非單純擴大參數規模。

市場數據進一步支持此轉變。根據產業分析,2026 年被定義為「推理優先」(reasoning-first)LLM 年,AI 將從實驗階段轉向執行階段。Gartner 預測 2026 年 AI PC 市場佔有率將從 2025 年的 31% 躍升至 55%,企業應用中將有 40% 整合 AI 功能。在香港,生產力促進局 2025 年 10 月調查顯示,本地企業 AI 採用率已接近 90%,但人才短缺仍是最大挑戰。香港電腦學會同期調查則發現,69% 組織已處於 AI 採用的發展、成熟或領先階段,近 30% 認為 AI 已重塑其行業。這些數據顯示,掌握推理模型內部機制改良技術的企業,將在激烈競爭中佔據先機。

中美技術角力:DeepSeek 與 QwQ 挑戰美國霸主地位

研究選擇中國開發的 DeepSeek-R1 和阿里巴巴 QwQ-32B 作為主要分析對象,反映全球 AI 推理模型競爭格局微妙變化。DeepSeek-R1 於 2025 年 1 月首次發布,同年 5 月更新為 R1-0528 版本,在基準測試、減少幻覺和新增 JSON 輸出及函數調用功能等方面均有顯著提升。阿里巴巴雲於 2025 年 3 月 6 日發布的 QwQ-32B 雖然僅有 320 億參數,但在數學推理(AIME 24)、編碼能力(Live CodeBench)和指令遵循(IFEval)等基準測試中,表現可媲美甚至超越 OpenAI 的 o1-mini 和 DeepSeek-R1 精簡版。這證明中國模型在特定領域已實現技術突破。

香港大學商學院 2025 年 10 月發布評估報告指出,美國開發的模型在進階推理能力方面仍保持明顯優勢,尤其在多模態和奧林匹克級推理表現中持續領先。中國模型則需在深度情境理解、複雜推理鏈條或創意問題解決場景中彌補關鍵差距。OpenAI 的 o1 系列開創「慢思考」(slow thinking)推理範式,在 STEM 任務和編碼方面取得飛躍(如數學奧林匹克資格賽大幅提升),催化業界從「聊天」轉向審慎問題解決的典範轉移。2026 年 1 月 20 日在香港舉辦的世界人工智能大會(WAIC)上,專家 Steve Hoffman 指出,AI 已從「模型展示」階段進入「變現階段」,美中技術堆疊選擇將深刻影響生態系統競爭。這場技術競賽核心,正是誰能更有效運用「思想社會」機制改良推理效能。

歷史轉折點:從單線程運算到集體智能模擬

將 AI 推理視為內部集體智能的概念並非憑空出現,而是人工智能發展史上多條研究路線匯聚結果。早在 2021 年,學術界已有研究者主張應更重視「社會 AI 系統」(social AI systems)開發,即讓多個 AI 代理人溝通協作,形成超越單一代理人能力的集體智能。當時技術路徑仍聚焦於顯式多代理系統設計。Google 支援的最新研究突破在於發現,單一大型推理模型內部已自發演化出「隱式多代理過程」,無需外部編程即可實現多視角辯論。此發現得益於強化學習技術成熟應用,Nature 期刊 2025 年 10 月發表論文甚至顯示,機器已能自主發現優於人工設計的最先進強化學習演算法。

技術演進的社會背景同樣關鍵。隨著生成式 AI 在 2024 至 2025 年爆發式增長,業界開始反思 AI 對集體智能的影響。法國專家 Bertrand Duperrin 於 2025 年 4 月撰文指出,AI 並非威脅集體,而是揭示不良實踐缺陷並促使我們重新思考協作模式。「當濫用時,AI 會成為格式化工具,削弱批判性思維;但正確使用時,它能透過結構化交流、減輕認知負擔和促進包容性來強化集體動態」。香港企業在實踐中已體現此理念,IAB 香港 2025 年 7 月調查顯示,40% 受訪者已建立穩健數據收集和協調框架,內容創作成為領先應用場景之一(26%),反映生成式 AI 技術日趨成熟。未來 12 個月,43% 香港企業計劃擴展 AI 應用場景,35% 專注強化數據基礎設施,27% 致力建立內部 AI 能力,這些策略調整與「思想社會」研究揭示的方向高度一致。

企業應用前景:更平衡、更透明的 AI 決策系統

對日常用戶和企業而言,這項研究實際意義在於,透過內部辯論進行推理的 AI 系統將更擅長處理模糊問題、不完整資訊和現實世界複雜性,產出回應將更平衡且靈活。研究團隊指出,若模型自然考慮多元觀點,將較不易陷入單一狹隘視角,雖無法完全消除偏見,但可成為構建更公平可靠系統的重要策略之一。在實務層面,用戶可能會看到 AI 工具變得更「深思熟慮」和「適應性強」,而非僅是更快速。這些系統能提供承認不確定性或解釋權衡的答案,反映出更「人性化」的問題解決方法。

香港金融業已率先探索此方向。香港金融管理局於 2024 年 10 月發布 AI 採用政策聲明,鼓勵金融機構採取「基於風險」方法實施和使用 AI,並要求制定 AI 治理策略以指導系統實施和使用。AllianzGI 於 2025 年 8 月發布分析指出,推理 AI 透過逐步邏輯推進自動化,驅動大規模基礎設施投資並創造變革性機會。強化學習市場規模預計將從 2024 年的 21 億美元(約港幣 163.8 億元)增長至 2033 年的 150 億美元(約港幣 1,170 億元),年複合增長率達 35%。隨著雲端運算和邊緣 AI 普及,企業無需龐大基礎設施即可部署 RL 解決方案,多代理系統(如協調多架無人機或機械人決策)和 RL 系統可解釋性正成為新趨勢。

Google 研究最終指向 AI 理解方式根本轉變:不再將 AI 視為強大計算機,而是建立在有組織內部協作基礎上的系統。若「單一模型內的集體智能」概念經得起驗證,將為該領域下一階段重大進展奠定基礎。對香港企業而言,抓住這波推理模型革命意味從追求「最大最快」轉向「最適最智」,在人才培養、數據治理和場景落實三個維度同步發力,才能在 2026 年這個 AI 從試點邁向盈利的關鍵年份實現真正數碼轉型。

資料來源:
arXiv
香港生產力促進局
香港大學商學院
IBM Think
DataCamp