close
人工智能企業趨勢應用方案業界消息

國產大模型追到全球第五 企業 AI 選型不再只看排名


chatgptimage20265280

SuperCLUE 最新中文大模型測評顯示,中國 AI 模型已形成明顯追趕力量,但全球第一梯隊暫時仍由海外模型佔據。今次測評覆蓋 21 款模型、492 題,包括數學推理、科學推理、程式碼生成、智能體任務規劃、精確指令遵循及幻覺控制。對企業決策人而言,這不單純是排名新聞,而是 AI 採購邏輯改變的訊號:模型能力、成本結構和合規部署,將同時影響未來一年企業導入生成式 AI 的速度。

全球前四仍被海外模型佔據,中國三強進入企業候選清單

SuperCLUE 榜單顯示,Gemini、GPT-5.5、Claude-Opus 及 Gemini-Flash 位居前四;DeepSeek-V4-Pro、Qwen3.7-Max 及豆包 Seed 2.0 Pro 分數接近,集中在全球第五名附近。由於「GPT-5.5」等名稱來自榜單及原文表述,本文只按測評結果轉述,不代表相關廠商已作官方確認。從企業角度看,國產大模型已不再只是中文問答或內容生成工具,而是逐步進入客服、程式輔助、知識庫搜尋、文件摘要及工作流程自動化等核心流程。原文指出,Qwen3.7-Max 在程式碼生成項目與海外頭部模型差距不足 2 分,DeepSeek 與豆包在數學及科學推理項目多次進入前列。

超級CLUE智能指數圖表,展示2026年5月各大科技公司AI能力排名。.

成本下降迫使 CIO 重新計算 AI 投資回報

DeepSeek 近日宣布,將 V4-Pro 模型 API 價格永久下調 75%,降至原來四分之一。Reuters 報道,調整後價格約為每百萬 token 0.025 至 6 元人民幣。這數字對企業很關鍵,因為生成式 AI 真正大規模落地後,最大成本往往不是試用費,而是每天反覆發生的推理費、延遲成本、整合成本和監控成本。CKGSB 教授陳龍分析,DeepSeek 代表一種新的 AI 經濟學,重點是用工程效率與成本控制改寫模型競爭規則。

香港企業要把模型能力、資料治理與本地部署放在同一張表

香港企業面對國產大模型時,不能只看分數。香港政府在 2026 至 27 年度財政預算案提到,30 億港元 AI 資助計劃已批准約 30 個研發申請,範疇包括大語言模型、新材料及生物醫學;香港整體算力達 5,000 petaFLOPS,為 AI 應用提供基礎。另一方面,數字政策辦公室在立法會回覆中披露,HKGAI V1 已基於 DeepSeek 技術更新,並正整合到 HKPilot,用於草擬、翻譯及摘要等文件處理任務。這說明本地化大模型並非概念,而是已進入政府及公共服務場景。對銀行、零售、物流及專業服務公司而言,國產大模型意味着成本下降;同時亦意味着資料存放地、審計紀錄、偏見控制、幻覺風險及供應商可替換性,需要納入採購條款。

從榜單競爭到供應鏈競爭,AI 採購將走向多模型管理

這場競爭的背景,是中國 AI 公司過去一年加速追趕。DeepSeek 先以低成本推理模型打開國際知名度,阿里 Qwen、字節豆包及其他平台隨後加快模型迭代。SuperCLUE 今次測評反映的,不只是單一模型排名,而是中國模型在中文理解、程式碼生成、性價比和應用場景上形成集群效應。可是,企業也要看到另一面:原文指出海外模型仍佔據高效能區,國產模型在推理效能上仍多處於中低區間。換句話說,高敏感決策、金融風險分析、醫療建議及跨境合規任務,仍需要更嚴格測試。

企業下一步是建立 AI 模型治理,而不是追逐排行榜

國產大模型追到全球第五,對企業的真正影響,是把 AI 導入從「創新項目」推向「營運基建」。未來一年,模型排名仍會變動,但成本、合規和流程整合會比名次更重要。企業現在要問的開放性問題是:哪些工作值得交給 AI,哪些決策必須保留人工審批?

資料來源:cnBetaReutersStanford HAI香港政府財政預算案香港政府新聞公報

 

Tags : DeepseekSuperCLUE企業 AI大模型香港科技政策
Pierce

The author Pierce


chatgptimage20265280

喜歡尋找本地潛力 Startups 與讀者分享, 對企業資訊安全特別注意