國產大模型追到全球第五　企業 AI 選型不再只看排名

SuperCLUE 最新中文大模型測評顯示，中國 AI 模型已形成明顯追趕力量，但全球第一梯隊暫時仍由海外模型佔據。今次測評覆蓋 21 款模型、492 題，包括數學推理、科學推理、程式碼生成、智能體任務規劃、精確指令遵循及幻覺控制。對企業決策人而言，這不單純是排名新聞，而是 AI 採購邏輯改變的訊號：模型能力、成本結構和合規部署，將同時影響未來一年企業導入生成式 AI 的速度。

全球前四仍被海外模型佔據，中國三強進入企業候選清單

SuperCLUE 榜單顯示，Gemini、GPT-5.5、Claude-Opus 及 Gemini-Flash 位居前四；DeepSeek-V4-Pro、Qwen3.7-Max 及豆包 Seed 2.0 Pro 分數接近，集中在全球第五名附近。由於「GPT-5.5」等名稱來自榜單及原文表述，本文只按測評結果轉述，不代表相關廠商已作官方確認。從企業角度看，國產大模型已不再只是中文問答或內容生成工具，而是逐步進入客服、程式輔助、知識庫搜尋、文件摘要及工作流程自動化等核心流程。原文指出，Qwen3.7-Max 在程式碼生成項目與海外頭部模型差距不足 2 分，DeepSeek 與豆包在數學及科學推理項目多次進入前列。

成本下降迫使 CIO 重新計算 AI 投資回報

DeepSeek 近日宣布，將 V4-Pro 模型 API 價格永久下調 75%，降至原來四分之一。Reuters 報道，調整後價格約為每百萬 token 0.025 至 6 元人民幣。這數字對企業很關鍵，因為生成式 AI 真正大規模落地後，最大成本往往不是試用費，而是每天反覆發生的推理費、延遲成本、整合成本和監控成本。CKGSB 教授陳龍分析，DeepSeek 代表一種新的 AI 經濟學，重點是用工程效率與成本控制改寫模型競爭規則。

香港企業要把模型能力、資料治理與本地部署放在同一張表

香港企業面對國產大模型時，不能只看分數。香港政府在 2026 至 27 年度財政預算案提到，30 億港元 AI 資助計劃已批准約 30 個研發申請，範疇包括大語言模型、新材料及生物醫學；香港整體算力達 5,000 petaFLOPS，為 AI 應用提供基礎。另一方面，數字政策辦公室在立法會回覆中披露，HKGAI V1 已基於 DeepSeek 技術更新，並正整合到 HKPilot，用於草擬、翻譯及摘要等文件處理任務。這說明本地化大模型並非概念，而是已進入政府及公共服務場景。對銀行、零售、物流及專業服務公司而言，國產大模型意味着成本下降；同時亦意味着資料存放地、審計紀錄、偏見控制、幻覺風險及供應商可替換性，需要納入採購條款。

從榜單競爭到供應鏈競爭，AI 採購將走向多模型管理

這場競爭的背景，是中國 AI 公司過去一年加速追趕。DeepSeek 先以低成本推理模型打開國際知名度，阿里 Qwen、字節豆包及其他平台隨後加快模型迭代。SuperCLUE 今次測評反映的，不只是單一模型排名，而是中國模型在中文理解、程式碼生成、性價比和應用場景上形成集群效應。可是，企業也要看到另一面：原文指出海外模型仍佔據高效能區，國產模型在推理效能上仍多處於中低區間。換句話說，高敏感決策、金融風險分析、醫療建議及跨境合規任務，仍需要更嚴格測試。

企業下一步是建立 AI 模型治理，而不是追逐排行榜

國產大模型追到全球第五，對企業的真正影響，是把 AI 導入從「創新項目」推向「營運基建」。未來一年，模型排名仍會變動，但成本、合規和流程整合會比名次更重要。企業現在要問的開放性問題是：哪些工作值得交給 AI，哪些決策必須保留人工審批？

資料來源：cnBeta、Reuters、Stanford HAI、香港政府財政預算案、香港政府新聞公報

國產大模型追到全球第五　企業 AI 選型不再只看排名

全球前四仍被海外模型佔據，中國三強進入企業候選清單

成本下降迫使 CIO 重新計算 AI 投資回報

香港企業要把模型能力、資料治理與本地部署放在同一張表

從榜單競爭到供應鏈競爭，AI 採購將走向多模型管理

企業下一步是建立 AI 模型治理，而不是追逐排行榜

Anthropic Claude Opus 4.8 登場　同日完成新融資估值反超 OpenAI

越南研虛擬資產作貸款抵押　中小企融資或迎突破

The author Pierce

國產大模型追到全球第五 企業 AI 選型不再只看排名

全球前四仍被海外模型佔據，中國三強進入企業候選清單

成本下降迫使 CIO 重新計算 AI 投資回報

香港企業要把模型能力、資料治理與本地部署放在同一張表

從榜單競爭到供應鏈競爭，AI 採購將走向多模型管理

企業下一步是建立 AI 模型治理，而不是追逐排行榜

The author Pierce

you might also like

香港 AI 發展的挑戰｜突破數據孤島與資源瓶頸

DeepSeek 自研 AI 推理晶片 從模型效率走向算力自主

胡潤榜大洗牌 Anthropic 一年暴漲 15 倍 中國「清華系」獨角獸強勢崛起

Anthropic Claude Opus 4.8 登場 同日完成新融資估值反超 OpenAI

LayerX 報告揭企業 AI 管治盲點 5% 重度用戶製造企業大半 AI 風險

國產大模型追到全球第五　企業 AI 選型不再只看排名

DeepSeek 自研 AI 推理晶片　從模型效率走向算力自主

胡潤榜大洗牌 Anthropic 一年暴漲 15 倍中國「清華系」獨角獸強勢崛起

Anthropic Claude Opus 4.8 登場　同日完成新融資估值反超 OpenAI

LayerX 報告揭企業 AI 管治盲點　5% 重度用戶製造企業大半 AI 風險