close
企業趨勢

Claude Fable 5 隱藏戰場:「防蒸餾」功能,是技術升級還是地緣政治宣示?


123

Anthropic 今日(6 月 10 日)發布 Claude Fable 5 時,刻意將「防止蒸餾」列為核心功能之一,在大型語言模型發布歷史上幾乎前所未見。一間商業 AI 公司選擇把地緣政治防禦邏輯寫進模型本體,背後折射出當前 AI 軍備競賽最核心矛盾:技術優勢究竟能否被封鎖?

Fable 5 在 SWE-Bench Pro 錄得 80.3% 成績,較 Opus 4.8 69.2% 高出逾 11 個百分點。定價亦升至每 100 萬 token 輸入 10 美元(約港幣 HK$78),輸出 50 美元(約港幣 HK$390)。但在發布會敘事框架中,Anthropic 花在解釋防蒸餾機制篇幅,幾乎不亞於模型能力本身。這個選擇已說明不少問題。本文將從 3 個層次解讀這道防護真實意圖:它擋甚麼人、能擋多少,以及真正想傳遞甚麼訊息。

2 月指控埋下今日防線

要理解 Fable 5 防蒸餾設計,必須從 4 個月前說起。今年 2 月 Anthropic 公開指控 DeepSeek、Moonshot AI、MiniMax 透過約 24,000 個偽造帳號,向 Claude 模型發起逾 1,600 萬次查詢,系統性提取輸出用於訓練自家模型。OpenAI 亦同步游說美國立法者,推動立法限制跨境模型蒸餾行為。

這項指控當時震動業界,但後續法律行動進展緩慢。機器學習研究者 Nathan Lambert 事後拆解實際數字:DeepSeek 查詢量約 150,000 次,Moonshot 約 340 萬次,MiniMax 約 1,300 萬次,後 2 者合計對應後訓練資料量估計達 1,500 億至 4,000 億 token。若以正規方式生成,這批資料訓練成本極高;但透過蒸餾提取,成本接近零。

法律途徑困境在於舉證困難。企業可以證明某間公司模型回應「像 Claude」,卻幾乎無法在法院證明源於蒸餾。4 個月後 Anthropic 選擇換一條路:與其告你,不如讓你拿不到。

防護機制設計邏輯與真實邊界

Fable 5 防蒸餾架構分為 2 層。第 1 層是 AI 分類器,即時辨識 3 類高風險請求:資安攻擊性任務、生物與化學武器查詢,以及蒸餾行為。一旦觸發,系統會改由 Opus 4.8 作答,而非直接拒絕。這項設計既保留用戶體驗,亦避免 Fable 5 核心輸出被提取。第 2 層針對更技術性提取手法,包括 prompt 改寫、steering vectors(從外部操控模型輸出方向向量注入技術),以及 PEFT 參數高效微調。Anthropic 聲稱模型會主動降低這些方式提取成效。

然而 Anthropic 亦坦承,逾 95% 對話完全不受影響。攻擊性資安任務攔截率是 100%,但「蒸餾行為」辨識邊界極為模糊。一間企業用 API 輸出改善內部知識庫,與一間競爭對手用 API 輸出訓練新模型,技術操作上幾乎一模一樣,分類器無法區分意圖。

這裡存在 Anthropic 無法迴避根本矛盾:只要 API 仍然銷售,蒸餾永遠無法徹底封堵。開放 API 是 Anthropic 核心商業模式,而大規模蒸餾本來就是「開放 API」自然副產品。5% 防護覆蓋面意味餘下 95% 輸出仍在持續流動,任何有意提取行為者只要分散調用、控制頻率,便可輕易規避觸發門檻。

擋不住原因:算力壁壘才是真正戰場

Lambert 判斷揭示更深層問題:「封堵蒸餾,會比限制 GPU 這類實體貨物出口困難得多。」

這句話觸及技術封鎖本質困境。晶片是實體商品,可以在邊境查扣;API 回應是數碼資訊流,具備天然無邊界穿透性。美國政府過去 3 年對中國實施 AI 晶片出口管制,從 A100、H100 到最新 H20 限制,是目前最具實際效果技術封鎖手段,因為算力是物理性稀缺資源。

但即使 GPU 受限,Lambert 觀察到中國實驗室強化學習(RL)基建依然扎實。DeepSeek 以遠低於西方同類模型算力成本,在多個基準測試達到接近水平,核心原因在於將合成資料生成「正確地規模化」——讓模型透過反覆嘗試與獎罰回饋自主學習,而非依賴大量人工標註或蒸餾現成答案。換言之,即使 Fable 5 防蒸餾機制完全有效,中國開源實驗室仍有 Google Gemma、Meta LLaMA 等西方開源模型、自有 RL 基建,以及合成資料管線可作依靠,技術發展路徑並不依賴單一來源。

這亦解釋為何 Fable 5 防護更像象徵性防線,而非實質壁壘。真正能拉開差距,是算力密度、資料品質,以及訓練方法論。這些都不是一道 API 分類器可以保護。

技術封鎖作為地緣政治語言

那麼 Anthropic 為何仍要高調推出這道防護?答案或許不在技術效果,而在政治訊號。

將「禁止蒸餾」寫入模型本體,這個動作同時向多個受眾發言。對美國政策圈而言,Anthropic 展示「主動保護技術邊界」姿態,有助於在 AI 監管辯論取得更有利位置。對企業客戶而言,這傳遞「模型輸出受到保護」品牌價值,強化高定價正當性。對競爭對手而言,這是一個警示:Anthropic 已將技術競爭提升至基礎設施防禦層級。

從更宏觀視角看,這標誌 AI 地緣政治戰場正在擴大。過去科技冷戰主要工具是晶片出口管制與投資審查,作用於供應鏈物理層;現在競爭已延伸至模型架構本身,嘗試在神經網絡權重層設定邊界。當一間商業 AI 公司開始將國家安全邏輯內化至產品設計,AI 開發底層規則正在悄然改寫。

對企業而言,Fable 5 高效能帶來切實應用價值,但其高定價與防護機制亦提示一個趨勢:AI 模型正變得更像受管制基礎設施,而非單純技術工具。真正問題或許不是「蒸餾能否被封堵」,而是「當算力壁壘與模型防護同時收緊,誰能最快在限制之內找到替代路徑」。

來源:  Nathan Lambert