中國 AI 新創公司 DeepSeek 憑藉僅 29.4 萬美元(約港幣 229.32 萬元)的訓練成本,成功開發出媲美 OpenAI 頂級模型的 DeepSeek-R1,並榮登《Nature》期刊封面,成為首個接受同行評審的主流大語言模型。這項突破除了打破「資金即壁壘」的 AI 產業魔咒,更透過純強化學習技術,革命性地提升了模型的自主推理能力。本文將深入解析這項技術創新如何重新定義 AI 發展軌跡、分析業界專家多元觀點,並探討其對全球科技競爭格局的深遠影響。
技術革命重新定義成本效益標準
DeepSeek-R1 的核心突破在於採用純強化學習框架,搭配群組相對策略最佳化(GRPO)演算法,僅依據最終答案正確性給予獎勵,而非模仿人類推理路徑。這種創新方法讓模型自然湧現出自我反思、自我驗證等高階行為,有時甚至生成數百個 token 來反覆推敲問題。在美國數學邀請賽(AIME 2024)中,DeepSeek-R1-Zero 的準確率從 15.6% 躍升至 77.9%,使用自洽解碼後更達 86.7%,超越人類平均水平。《Nature》評論指出,這表明模型能在沒有人類推理示範下,透過強化學習自主形成複雜思維模式,是「讓 AI 學會自己思考」的里程碑式突破。
業界巨頭震撼與專家深度剖析
面對 DeepSeek 的橫空出世,業界反應兩極分化且充滿爭議。Hugging Face 機器學習工程師 Lewis Tunstall 認為「R1 開啟了一場革命」,越來越多開發者正應用 R1 方法論改善現有大語言模型。然而 OpenAI 指控 DeepSeek 可能不當使用其專有數據訓練模型,涉及所謂「蒸餾」爭議。對此 DeepSeek 在《Nature》的 64 頁同行評審檔案中明確回應:所有訓練數據來自互聯網,雖可能包含 GPT-4 生成內容,但並非刻意為之,且無專門蒸餾程式。
香港科技大學張教授指出,「DeepSeek 面臨維持動能的挑戰」,部分源於高階晶片短缺等營運困難,但更多來自中美兩國企業激烈競爭。KPMG 中國香港資本市場主管劉路易斯強調,「DeepSeek 的架構效率方法挑戰了『越大越好』的傳統觀念,透過更智能有效地運用可用資源達到高效能」。這種低成本高效能模式為小型公司大幅降低進入門檻,為投資者創造了廣泛採用成本效益解決方案的盈利機會。
創辦人十年布局與戰略遠見
DeepSeek 的成功並非偶然,背後是創辦人梁文鋒十年來的深謀遠慮。1985 年出生於廣東湛江的梁文鋒,父親為小學教師,17 歲考入浙江大學電子資訊工程專業,研究生期間專注機器視覺研究,並將機器學習應用於金融市場探索量化交易。雖然曾收到大疆創辦人汪滔的創業邀請,梁文鋒選擇了一條少有人走的路:堅信人工智能將改變世界,決定獨立創業。
碩士畢業後,梁文鋒先是結合 AI 技術與量化交易,創辦雅克比投資及幻方科技,穩步發展十餘年。直到 2023 年,他將目光轉向通用人工智能,創辦 DeepSeek,開啟 AI 大模型研發之路。梁文鋒對團隊建設的理念同樣非同尋常,堅持「能力為先」,核心崗位多由應屆畢業生和經驗僅一兩年的年輕人組成,「我們或許不是在中國找到前 50 名頂尖人才,但我們可以自己培養」。這種信念正是 DeepSeek 能在低成本下達到高推理能力的關鍵所在。
商業格局重構與經營者戰略部署
DeepSeek 現象對商業世界帶來顛覆性影響,從根本改變了競爭邏輯,將「資源密集型」策略轉向「效率創新型」思維。這項突破實現了技術壁壘的普及化,讓中小企業也能擁有世界級 AI 能力,同時重新定義了投資回報率計算標準,未來商業投資將更重視「效率創新」而非「規模優勢」。面對這場 AI 效率革命,經營者需要立即採取四大關鍵行動:重新評估技術投資策略,建立「效率優先」的技術評估框架;實施根本性的人才策略轉變,學習梁文鋒的「能力為先」理念,重視年輕化思維和內部人才培養;進行彈性的商業模式調整,利用成本優勢擴大客戶覆蓋範圍,採用敏捷開發模式快速回應市場需求;加強風險管控與合規準備,建立透明化的營運機制並進行多元化布局。DeepSeek 的成功標誌著 AI 競爭從「數據與算力軍備競賽」轉向「演算法與智慧創新競賽」,為不同規模的企業都帶來「彎道超車」的機遇,經營者必須迅速調整戰略思維,從追求「更大更貴」轉向「更好更精」,才能在這場效率革命中立於不敗之地。
全球 AI 競爭格局重構在即
DeepSeek 的突破對全球 AI 產業格局產生深遠影響,標誌著競爭焦點從「數據與算力軍備競賽」轉向「演算法與智慧創新競賽」。根據第三橋研究分析,DeepSeek 的崛起雖被媒體標籤為「AI 史普尼克時刻」,但更準確的評估是降低 AI 進入門檻而非重新定義 AI 能力邊界。其核心創新在於混合專家(MoE)架構和 MLA 機制的改良,使計算效率大幅提升,在中國計算資源受限的環境下特別具有實用價值。
香港作為國際金融中心,正受惠於這波 AI 創新浪潮。根據 KPMG 數據,2025 年第一季香港宣布 15 項 IPO,其中 6 項融資超過 10 億港元,多數為科技公司,DeepSeek 等中國 AI 模型激發了投資者對香港 IPO 的興趣。香港創新科技及工業局局長孫東更透露,基於 DeepSeek 技術開發的本地 AI 工具「HKGAI V1」在安全測試中位居全球第一,將在 70 多個政府部門試用。
未來 AI 發展將更注重可持續性與成本效益,DeepSeek 已為這場新競賽吹響號角。其價值除了是一個性能強大的模型,更像是一份「方法論宣言」,向世界展示了不依賴海量標註數據、更具可持續性的 AI 進化之路,將 AI 發展主動權交還給科學創新本身。