Claude Fable 5 隱藏戰場：「防蒸餾」功能，是技術升級還是地緣政治宣示？

Anthropic 今日（6 月 10 日）發布 Claude Fable 5 時，刻意將「防止蒸餾」列為核心功能之一，在大型語言模型發布歷史上幾乎前所未見。一間商業 AI 公司選擇把地緣政治防禦邏輯寫進模型本體，背後折射出當前 AI 軍備競賽最核心矛盾：技術優勢究竟能否被封鎖？

Fable 5 在 SWE-Bench Pro 錄得 80.3% 成績，較 Opus 4.8 69.2% 高出逾 11 個百分點。定價亦升至每 100 萬 token 輸入 10 美元（約港幣 HK$78），輸出 50 美元（約港幣 HK$390）。但在發布會敘事框架中，Anthropic 花在解釋防蒸餾機制篇幅，幾乎不亞於模型能力本身。這個選擇已說明不少問題。本文將從 3 個層次解讀這道防護真實意圖：它擋甚麼人、能擋多少，以及真正想傳遞甚麼訊息。

2 月指控埋下今日防線

要理解 Fable 5 防蒸餾設計，必須從 4 個月前說起。今年 2 月 Anthropic 公開指控 DeepSeek、Moonshot AI、MiniMax 透過約 24,000 個偽造帳號，向 Claude 模型發起逾 1,600 萬次查詢，系統性提取輸出用於訓練自家模型。OpenAI 亦同步游說美國立法者，推動立法限制跨境模型蒸餾行為。

這項指控當時震動業界，但後續法律行動進展緩慢。機器學習研究者 Nathan Lambert 事後拆解實際數字：DeepSeek 查詢量約 150,000 次，Moonshot 約 340 萬次，MiniMax 約 1,300 萬次，後 2 者合計對應後訓練資料量估計達 1,500 億至 4,000 億 token。若以正規方式生成，這批資料訓練成本極高；但透過蒸餾提取，成本接近零。

法律途徑困境在於舉證困難。企業可以證明某間公司模型回應「像 Claude」，卻幾乎無法在法院證明源於蒸餾。4 個月後 Anthropic 選擇換一條路：與其告你，不如讓你拿不到。

防護機制設計邏輯與真實邊界

Fable 5 防蒸餾架構分為 2 層。第 1 層是 AI 分類器，即時辨識 3 類高風險請求：資安攻擊性任務、生物與化學武器查詢，以及蒸餾行為。一旦觸發，系統會改由 Opus 4.8 作答，而非直接拒絕。這項設計既保留用戶體驗，亦避免 Fable 5 核心輸出被提取。第 2 層針對更技術性提取手法，包括 prompt 改寫、steering vectors（從外部操控模型輸出方向向量注入技術），以及 PEFT 參數高效微調。Anthropic 聲稱模型會主動降低這些方式提取成效。

然而 Anthropic 亦坦承，逾 95% 對話完全不受影響。攻擊性資安任務攔截率是 100%，但「蒸餾行為」辨識邊界極為模糊。一間企業用 API 輸出改善內部知識庫，與一間競爭對手用 API 輸出訓練新模型，技術操作上幾乎一模一樣，分類器無法區分意圖。

這裡存在 Anthropic 無法迴避根本矛盾：只要 API 仍然銷售，蒸餾永遠無法徹底封堵。開放 API 是 Anthropic 核心商業模式，而大規模蒸餾本來就是「開放 API」自然副產品。5% 防護覆蓋面意味餘下 95% 輸出仍在持續流動，任何有意提取行為者只要分散調用、控制頻率，便可輕易規避觸發門檻。

擋不住原因：算力壁壘才是真正戰場

Lambert 判斷揭示更深層問題：「封堵蒸餾，會比限制 GPU 這類實體貨物出口困難得多。」

這句話觸及技術封鎖本質困境。晶片是實體商品，可以在邊境查扣；API 回應是數碼資訊流，具備天然無邊界穿透性。美國政府過去 3 年對中國實施 AI 晶片出口管制，從 A100、H100 到最新 H20 限制，是目前最具實際效果技術封鎖手段，因為算力是物理性稀缺資源。

但即使 GPU 受限，Lambert 觀察到中國實驗室強化學習（RL）基建依然扎實。DeepSeek 以遠低於西方同類模型算力成本，在多個基準測試達到接近水平，核心原因在於將合成資料生成「正確地規模化」——讓模型透過反覆嘗試與獎罰回饋自主學習，而非依賴大量人工標註或蒸餾現成答案。換言之，即使 Fable 5 防蒸餾機制完全有效，中國開源實驗室仍有 Google Gemma、Meta LLaMA 等西方開源模型、自有 RL 基建，以及合成資料管線可作依靠，技術發展路徑並不依賴單一來源。

這亦解釋為何 Fable 5 防護更像象徵性防線，而非實質壁壘。真正能拉開差距，是算力密度、資料品質，以及訓練方法論。這些都不是一道 API 分類器可以保護。

技術封鎖作為地緣政治語言

那麼 Anthropic 為何仍要高調推出這道防護？答案或許不在技術效果，而在政治訊號。

將「禁止蒸餾」寫入模型本體，這個動作同時向多個受眾發言。對美國政策圈而言，Anthropic 展示「主動保護技術邊界」姿態，有助於在 AI 監管辯論取得更有利位置。對企業客戶而言，這傳遞「模型輸出受到保護」品牌價值，強化高定價正當性。對競爭對手而言，這是一個警示：Anthropic 已將技術競爭提升至基礎設施防禦層級。

從更宏觀視角看，這標誌 AI 地緣政治戰場正在擴大。過去科技冷戰主要工具是晶片出口管制與投資審查，作用於供應鏈物理層；現在競爭已延伸至模型架構本身，嘗試在神經網絡權重層設定邊界。當一間商業 AI 公司開始將國家安全邏輯內化至產品設計，AI 開發底層規則正在悄然改寫。

對企業而言，Fable 5 高效能帶來切實應用價值，但其高定價與防護機制亦提示一個趨勢：AI 模型正變得更像受管制基礎設施，而非單純技術工具。真正問題或許不是「蒸餾能否被封堵」，而是「當算力壁壘與模型防護同時收緊，誰能最快在限制之內找到替代路徑」。

來源: Nathan Lambert