DeepSeek V4 正式登場：成本僅 GPT 百分之一企業 AI 市場大洗牌

DeepSeek 推出旗艦模型 V4，以極低 API 定價及兆級 MoE 架構挑戰 GPT 與 Claude 領導地位。本文深度解析其如何透過華為晶片實現技術自立，並試算企業改用開源模型後的財務效益，為決策者提供關鍵的技術與合規評估。

DeepSeek V4 於 2026 年 4 月正式推出。定價每百萬 token 僅 0.3 美元（約港幣 2.3 元），比 GPT 旗艦模型平逾 10 倍，亦較 Claude Opus 4.6 便宜約 16 倍。開源 AI 正式進入兆參數時代。這款中國研發的模型加入全新 Engram 條件記憶架構，支援 100 萬 token 超長上下文窗口。編寫程式碼與推理測試成績直逼頂尖閉源模型，各大企業技術主管都要重新考慮 AI 供應商。

兆參數架構推理成本不升反跌

DeepSeek V4 採用混合專家（MoE）架構，總參數量約達 1 兆。每個 token 推理過程只激活約 32 億個參數，比上一代 V3 的 37 億參數更少。模型規模擴大約 50%，單次推理成本卻不升反跌。V4 採用 Top-16 路由機制，在數百個專家子網絡中每次激活 16 個，平衡運算效率與表達能力。

訓練成本亦是關鍵。上一代 V3 訓練成本約 600 萬美元（約港幣 4,680 萬元），對比 OpenAI 訓練 GPT-4 估計花費逾 1 億美元（約港幣 7.8 億元），差距極大。DeepSeek V4 輸入定價為每百萬 token 0.3 美元（約港幣 2.3 元），輸出定價為 0.5 美元（約港幣 3.9 元）。

AI 開支慳足九成實測數據見真章

以每月處理 10 億 token 計算，DeepSeek V4 無快取費用約 300 美元（約港幣 2,340 元），啟用快取後更低至 30 美元（約港幣 234 元）。若使用 GPT 旗艦模型執行相同工作量，估計需 2,500 美元（約港幣 19,500 元）。Claude Opus 4.6 標準輸入定價計算則約需 5,000 美元（約港幣 39,000 元）。兩者成本相差 10 至 150 倍。

網上流傳「Claude Opus 4.6 每月 15,000 美元」的說法，其實是混淆了舊版 Claude Opus 4 定價。根據 wavespeed.ai 實測分析，V4 性能有明顯提升，SWE-Bench 分數由 V3 的 69% 升至 81%，但定價只比 V3.2 高約 15%。

基準測試逼近閉源模型 Engram 記憶架構發功

目前流出的 V4 預發布基準測試數據尚未經第三方核實。報告指 SWE-Bench Verified 軟件工程任務得分達 81%，HumanEval+ 程式碼生成約 90%，GPQA Diamond 研究生級科學推理約 88%。Claude Opus 4.6 在 SWE-Bench Verified 錄得 81.42%。兩者表現相近，但每百萬 token 成本相差 16 倍。

背後關鍵在於 Engram 條件記憶架構。官方文件顯示，新架構能在超過 100 萬 token 的超長上下文做到高效檢索。V4 特別適合處理超長文件、程式碼庫分析或跨對話記憶等企業應用。evolink.ai 分析指出，DeepSeek 早於 2026 年 2 月起，已將基礎設施上下文窗口由 128K 擴展至 100 萬 token，早為 V4 生產環境做準備。

採用華為晶片需考量地緣政治風險

V4 背後的硬件策略涉及地緣政治因素。路透社於 2026 年 4 月 3 日引述 The Information 報道，V4 完全運行於華為最新設計的晶片。DeepSeek 為此直接與華為及中國晶片設計商寒武紀合作，重寫模型底層程式碼。Nvidia 並未獲得 V4 早期測試機會，打破業界慣例。

Alibaba、ByteDance 及 Tencent 等中國科技巨頭已為 V4 採購數十萬台華為最新 Ascend 950PR 晶片。需求激增推動晶片價格上漲約 20%。Reddit 上有開源情報報告指，V4 多次延期，部分原因是華為 Ascend 910B 硬件在早期訓練過程故障，才順延至 2026 年 4 月發布。企業考慮採用 V4 時，要同時評估供應鏈風險與資料合規要求。

開源策略吸引企業自設伺服器

DeepSeek 計劃以 Apache 2.0 授權開源發布 V4 權重。Apache 2.0 允許企業在自家伺服器自行部署，消除依賴 API 的風險。企業亦可按業務需求微調模型，解決資料主權疑慮。金融、醫療、法律等監管嚴格行業對此甚有需求。

隨着 V4 落地，企業技術主管要面對的問題，已由「開源夠不夠用」變成「閉源模型高昂收費是否合理」。根據 particula.tech 市場數據，DeepSeek 與 Qwen 目前合計佔全球 AI 市場約 15% 份額，對比一年前僅有 1%。

成本與風險的角力

DeepSeek V4 打破了市場定價慣例。當成本相差最高 150 倍，繼續盲目選用 GPT 或 Claude 似乎不再是理所當然。然而便宜背後有代價。V4 依賴華為晶片，加上基準測試數據仍未經獨立核實，實際應用表現仍有待觀察。各大企業要享受低成本開源模型帶來的好處，就要先搞清楚如何在法規與地緣政治風險中取得平衡。這不再是單純的技術測試，而是一場真金白銀的商業決策。

資料來源：nxcode.io · reuters

Next Read: 走進「黑馬」時代：從華強北的草莽進化到 DeepSeek 的矽谷震撼 —— 剖析大灣區科技企業非對稱作戰之美 »

兆參數架構 推理成本不升反跌

AI 開支慳足九成 實測數據見真章