中國人工智能初創企業深度求索 (DeepSeek) 於周五推出備受市場觸目的 V4 大型語言模型預覽版,一次過發佈參數規模達 1.6 萬億的 Pro 版本以及 2840 億參數的 Flash 版本,兩款模型均支援長達 100 萬 token 的上下文處理能力。
今次更新距離震撼全球科技市場的 R1 推理模型發佈已相隔超過 1 年,並與 OpenAI 當天推出的 GPT-5.5 形成正面對壘。深度求索繼續沿用開源路線,聲稱在程式編寫、知識處理以及代理任務等範疇貼近 OpenAI 與 Google 的閉源領先方案。華為同日確認最新昇騰 AI 運算叢集全面支援 V4 模型運作,消息推動中芯國際 (SMIC) 以及華虹半導體港股分別急升 8.9% 及 15.2%,為國產晶片產業鏈注入強心針。
混合注意力架構帶來效能躍升
深度求索在 Hugging Face 平台上載的技術文件顯示,V4 系列引入結合壓縮稀疏注意力 (CSA) 與深度壓縮注意力 (HCA) 的混合注意力機制,並配搭 DeepSeek Sparse Attention (DSA) 稀疏化設計,令 100 萬 token 場景下的單 token 推理浮點運算量僅需 V3.2 版本的 27%,KV 緩存佔用更降至 10% 水平。兩款模型經過逾 32 萬億 token 的預訓練,採用混合專家 (MoE) 架構,Pro 版本實際啟用的活躍參數控制於 490 億,Flash 版本則為 130 億,於運算效率與效能之間取得平衡。深度求索同時強調 V4 已針對 Anthropic 的 Claude Code 與 OpenClaw 等主流代理工具優化,目前僅支援純文本處理,多模態能力仍在開發階段。模型權重透過 MIT 授權公開釋出,開發者可自由下載、本地執行以及二次修改。
基準測試逼近前沿閉源對手
深度求索自行公佈的基準測試結果顯示,V4-Pro 在編程以及數學評測擊敗所有開源對手,知識類別僅落後 Google 的 Gemini 3.1-Pro 一個身位,整體表現與 OpenAI 的 GPT-5.4 以及 Anthropic 的 Claude Opus 4.6 僅屬輕微差距。V4-Pro 在 Agentic Coding 評測取得開源模型最佳成績,內部測試顯示其交付質素接近 Opus 4.6 非思考模式,使用體驗超越 Sonnet 4.5。中文問答能力方面,V4-Pro 更擊敗除 Gemini 3.1 Pro 以外所有主要閉源模型,確立首個中文場景可與前沿閉源方案並駕齊驅的開源選擇。長文本檢索領域仍有追趕空間,V4 的 MRCR 1M 測試得分落後 Opus 4.6 的同類基準。
企業部署經濟效益顯著
深度求索採用開源授權發放模型權重,為企業提供本地化部署以及敏感數據自主管控空間,有效削減供應商鎖定風險。API 服務同步更新上線,開發者僅需將 model 參數修改為 deepseek-v4-pro 或 deepseek-v4-flash 即可調用,介面兼容 OpenAI ChatCompletions 與 Anthropic 兩套標準,大幅降低遷移成本。Gartner 2026 年初預測,開源 MoE 模型有望在 2028 年前佔據企業 AI 市場 30% 份額。法律服務、醫療保健以及金融分析等需要深度語境理解的行業,可以善用 100 萬 token 長文本能力處理整份合約、完整病歷甚至龐大程式碼庫;Flash 版本的低延遲特性則適合客戶服務、對話機械人以及代理工作流程等成本敏感場景。深度求索坦言 Pro 版本服務吞吐受高端算力供給限制,預計下半年華為昇騰 950 超節點量產後,Pro 版本定價將進一步下調。
國產晶片供應鏈獲得強心針
市場對 V4 訓練所使用的晶片身份保持高度關注,華為同日宣佈其搭載昇騰 950 AI 處理器的最新運算叢集全面支援 V4 模型運作,但未披露實際訓練階段中昇騰晶片與 Nvidia 方案的使用比例。美國出口管制禁止中國 AI 開發商採購 Nvidia 最先進晶片,美國官員早前更指控深度求索曾使用受禁的 Blackwell 晶片。《The Information》披露深度求索過去數月與華為以及寒武紀合作改寫模型堆疊並進行測試,Nvidia 以及 AMD 均未獲早期存取權限。V4 發佈後中芯國際以及華虹半導體港股分別飆升 8.9% 及 15.2%,反映資金對國產晶片產業鏈接單預期明顯升溫。
國內開源陣營競爭白熱化
MorningStar 資深股票分析師 Ivan Su 接受 CNBC 訪問時分析,V4 料難以複製 R1 當年的市場震撼,因為全球投資者早已消化中國 AI 兼具競爭力與成本優勢的現實。他補充,深度求索今次明確將其他中國開源模型視為直接對手,該定位框架在 R1 時代並不存在,單憑這點已足以反映內地競爭白熱化程度。R1 問世以來,阿里巴巴與字節跳動等本土巨頭相繼推出新模型搶攻市場。周五港股交易時段,稀宇科技 (MiniMax) 以及智譜分別下跌約 8%,杭州開發商群核科技 (Manycore Tech) 更急挫 9%。深度求索於 2023 年成立,作為「杭州六小龍」成員之一,2024 年底憑免費開源的 V3 模型嶄露頭角,其後 2025 年 1 月推出的 R1 推理模型聲稱僅用不足 2 個月時間及少於 600 萬美元即可訓練完成,令市場質疑美國科技巨頭大規模投入 AI 基建的必要性。
地緣政治風險與未來走向
V4 的發佈標誌著中國 AI 產業邁入新階段,開源模型效能追近前沿閉源系統的同時,硬件層面亦逐步減少對海外先進晶片的依賴。華為昇騰 950 與國產晶圓代工產能結合,為中國 AI 供應鏈自主化提供具體範例。企業用戶面對的選擇日趨多元,除成本考量以外也需要衡量合規風險,美國多個州份、澳洲、台灣、南韓、丹麥以及意大利早前已就 DeepSeek-R1 的個人資料保護以及內容審查問題實施限制或禁令。展望未來,深度求索正開發多模態版本以及額外 V4 變體,目標是進一步提升長文本處理效率並擴展至圖像與影片處理。隨著中國開源模型與西方閉源方案在效能及定價層面差距收窄,全球 AI 基建投資策略勢必面臨重新評估,企業採購決策亦將由單純追求極致效能,轉向效能、成本以及地緣政治風險之間的務實平衡。
來源:CNBC