Inception Labs 於 2025 年 2 月推出 Mercury,這款被譽為市場上首款商業級「擴散式大型語言模型」(dLLM),以其卓越的生成速度與低成本,為企業提供了一個具有競爭力的解決方案。本文將詳細介紹 Mercury 的技術優勢、成本效益及其對企業的潛在影響,幫助企業管理人員評估其應用價值。

Mercury 的技術優勢與企業價值
Mercury 是由 Inception Labs 開發的一款 AI 語言模型,採用「擴散技術」(Diffusion),與傳統「自迴歸」(Autoregressive)方法不同。其核心優勢在於生成速度與運算成本的顯著優化,使其成為企業提升效率、降低開支的理想選擇。
Inception Labs 的技術背景
Inception Labs 是一家總部位於美國的領先 AI 技術公司,其研發團隊由來自 史丹福大學(Stanford)、加州大學洛杉磯分校(UCLA) 及 康乃爾大學(Cornell) 的頂尖研究人員與工程師組成。核心成員包括史丹福大學教授 Stefano Ermon,他曾參與早期影像擴散模型的研究,為 Midjourney 和 Sora 等技術奠定基礎。該公司的研究成果曾在 NeurIPS、ICML、ICLR 等國際頂級會議發表,顯示其技術實力與行業影響力。
Mercury 的核心特點
Mercury 具備以下關鍵特性,特別適合企業應用:
高效生成:Mercury Coder Mini 每秒可生成超過 1000 Token,Coder Small 達 750 Token,較傳統模型快 5 – 10 倍。測試顯示,其生成回應僅需 6 秒,而 ChatGPT 耗時 36 秒,顯著提升業務效率。
低成本運營:相較傳統模型,Mercury 的運算資源需求減少,成本降低 10 倍,為企業節省顯著的硬體與運維支出。
程式碼生成優勢:在 Copilot Arena 測試中,Mercury Coder Mini 位列第二,超越 GPT-4o Mini 和 Gemini-1.5-Flash,開發者評價其在程式碼生成領域的性能領先,特別適合軟體開發與技術支持。
技術對比:Mercury 與市場主流模型
以下表格比較 Mercury 與 ChatGPT、DeepSeek 在技術、性能與成本方面的差異,幫助企業管理人員快速掌握其競爭優勢:

高速程式碼與即時應用
Mercury 相較於 ChatGPT 的高成本與 DeepSeek 的有限速度,提供了更高的生成效率與更低的運營成本,特別適合對延遲敏感的企業應用。
Mercury 的成本效益:企業部署優勢
Mercury 的部署成本具競爭力,無需高端硬體(NVIDIA H100 即可),並提供 API 訪問 與 本地部署 選項,支援 SFT(監督式微調)與 RLHF(強化學習人機互動)微調。以下為成本對比:
企業部署 Mercury 時,一張 NVIDIA H100(約 24 – 32 萬港幣)搭配伺服器(約 8 – 16 萬港幣),初始投入約 40 – 50 萬港幣,每月維護費用約數千至一萬港幣。API 模式按使用量計費,預估每百萬 Token 數港幣,相較於 DeepSeek 大模型的 500 – 800 萬港幣投入,Mercury 顯著降低了硬體成本與長期運營費用。對於中小型企業或需快速回應的應用(如程式碼生成、客服自動化),Mercury 提供更高的投資回報率。
Mercury 的企業應用潛力與限制
應用潛力
提升效率:Mercury Coder Mini 的每秒 1000+ Token 速度,可大幅縮短程式碼生成與技術支持的時間,提升開發與運營效率。
降低成本:通過低成本硬體與運算資源,企業可實現更高性價比的 AI 應用。
靈活部署:支援 API 與本地部署,兼容現有硬體與微調流程,適應不同企業需求。
開發者認可:在 Copilot Arena 中,Mercury 的速度與品質表現獲開發者高度評價,適用於軟體開發與技術創新。
限制與考量
應用範圍:以程式碼生成為主,對話與文章生成不如 ChatGPT,企業需根據需求選擇合適模型。
技術新穎性:基於擴散技術的 Mercury 屬於新興技術,長期穩定性與擴展性尚待驗證。
型號選擇有限:目前僅提供 Coder 與 Mini 版本,型號選擇不如 DeepSeek 多樣。
Mercury 的使用與企業部署方式
Mercury 為商業產品,提供 API 與本地部署選項,同時在 Playground(chat.inceptionlabs.ai) 開放免費試用,企業可觀察其從雜訊到精細生成的過程。目前版本包括 Mercury Coder(每秒 750 Token)與 Coder Mini(每秒 1000+ Token),聊天模型仍在封閉測試中,型號選擇相對有限。企業可通過 API 或本地部署快速整合,實現高效業務應用。
結論:Mercury 為企業帶來的機遇
Mercury 通過擴散技術實現了語言模型的生成速度突破,其每秒 1000+ Token 的性能與低成本特性,使其成為企業在程式碼生成與即時應用中的理想選擇。相較於 ChatGPT 的高成本與 DeepSeek 的有限速度,Mercury 提供更高的效率與更低的部署成本。Inception Labs 的技術實力為其後續發展奠定基礎,未來若能擴展至對話與更多應用領域,或將進一步提升企業競爭力。對於關注成本效益與業務效率的企業管理人員而言,Mercury 是一項值得評估的創新技術,其潛在價值值得深入探索。