DeepSeek V4 正式登場:成本僅 GPT 百分之一 企業 AI 市場大洗牌

DeepSeek 推出旗艦模型 V4,以極低 API 定價及兆級 MoE 架構挑戰 GPT 與 Claude 領導地位。本文深度解析其如何透過華為晶片實現技術自立,並試算企業改用開源模型後的財務效益,為決策者提供關鍵的技術與合規評估。



DeepSeek V4 於 2026 年 4 月正式推出。定價每百萬 token 僅 0.3 美元(約港幣 2.3 元),比 GPT 旗艦模型平逾 10 倍,亦較 Claude Opus 4.6 便宜約 16 倍。開源 AI 正式進入兆參數時代。這款中國研發的模型加入全新 Engram 條件記憶架構,支援 100 萬 token 超長上下文窗口。編寫程式碼與推理測試成績直逼頂尖閉源模型,各大企業技術主管都要重新考慮 AI 供應商。

兆參數架構 推理成本不升反跌

DeepSeek V4 採用混合專家(MoE)架構,總參數量約達 1 兆。每個 token 推理過程只激活約 32 億個參數,比上一代 V3 的 37 億參數更少。模型規模擴大約 50%,單次推理成本卻不升反跌。V4 採用 Top-16 路由機制,在數百個專家子網絡中每次激活 16 個,平衡運算效率與表達能力。

訓練成本亦是關鍵。上一代 V3 訓練成本約 600 萬美元(約港幣 4,680 萬元),對比 OpenAI 訓練 GPT-4 估計花費逾 1 億美元(約港幣 7.8 億元),差距極大。DeepSeek V4 輸入定價為每百萬 token 0.3 美元(約港幣 2.3 元),輸出定價為 0.5 美元(約港幣 3.9 元)。

AI 開支慳足九成 實測數據見真章

以每月處理 10 億 token 計算,DeepSeek V4 無快取費用約 300 美元(約港幣 2,340 元),啟用快取後更低至 30 美元(約港幣 234 元)。若使用 GPT 旗艦模型執行相同工作量,估計需 2,500 美元(約港幣 19,500 元)。Claude Opus 4.6 標準輸入定價計算則約需 5,000 美元(約港幣 39,000 元)。兩者成本相差 10 至 150 倍。

網上流傳「Claude Opus 4.6 每月 15,000 美元」的說法,其實是混淆了舊版 Claude Opus 4 定價。根據 wavespeed.ai 實測分析,V4 性能有明顯提升,SWE-Bench 分數由 V3 的 69% 升至 81%,但定價只比 V3.2 高約 15%。

基準測試逼近閉源模型 Engram 記憶架構發功

目前流出的 V4 預發布基準測試數據尚未經第三方核實。報告指 SWE-Bench Verified 軟件工程任務得分達 81%,HumanEval+ 程式碼生成約 90%,GPQA Diamond 研究生級科學推理約 88%。Claude Opus 4.6 在 SWE-Bench Verified 錄得 81.42%。兩者表現相近,但每百萬 token 成本相差 16 倍。

背後關鍵在於 Engram 條件記憶架構。官方文件顯示,新架構能在超過 100 萬 token 的超長上下文做到高效檢索。V4 特別適合處理超長文件、程式碼庫分析或跨對話記憶等企業應用。evolink.ai 分析指出,DeepSeek 早於 2026 年 2 月起,已將基礎設施上下文窗口由 128K 擴展至 100 萬 token,早為 V4 生產環境做準備。

採用華為晶片 需考量地緣政治風險

V4 背後的硬件策略涉及地緣政治因素。路透社於 2026 年 4 月 3 日引述 The Information 報道,V4 完全運行於華為最新設計的晶片。DeepSeek 為此直接與華為及中國晶片設計商寒武紀合作,重寫模型底層程式碼。Nvidia 並未獲得 V4 早期測試機會,打破業界慣例。

Alibaba、ByteDance 及 Tencent 等中國科技巨頭已為 V4 採購數十萬台華為最新 Ascend 950PR 晶片。需求激增推動晶片價格上漲約 20%。Reddit 上有開源情報報告指,V4 多次延期,部分原因是華為 Ascend 910B 硬件在早期訓練過程故障,才順延至 2026 年 4 月發布。企業考慮採用 V4 時,要同時評估供應鏈風險與資料合規要求。

開源策略吸引企業自設伺服器

DeepSeek 計劃以 Apache 2.0 授權開源發布 V4 權重。Apache 2.0 允許企業在自家伺服器自行部署,消除依賴 API 的風險。企業亦可按業務需求微調模型,解決資料主權疑慮。金融、醫療、法律等監管嚴格行業對此甚有需求。

隨着 V4 落地,企業技術主管要面對的問題,已由「開源夠不夠用」變成「閉源模型高昂收費是否合理」。根據 particula.tech 市場數據,DeepSeek 與 Qwen 目前合計佔全球 AI 市場約 15% 份額,對比一年前僅有 1%。

成本與風險的角力

DeepSeek V4 打破了市場定價慣例。當成本相差最高 150 倍,繼續盲目選用 GPT 或 Claude 似乎不再是理所當然。然而便宜背後有代價。V4 依賴華為晶片,加上基準測試數據仍未經獨立核實,實際應用表現仍有待觀察。各大企業要享受低成本開源模型帶來的好處,就要先搞清楚如何在法規與地緣政治風險中取得平衡。這不再是單純的技術測試,而是一場真金白銀的商業決策。

資料來源:nxcode.io · reuters