
有報導指,Meta 首席人工智能科學家、圖靈獎得主 Yann LeCun(楊立昆)將在未來數月離職,創辦專注於「世界模型」(world models) 技術的初創公司。這位法裔美籍科學家目前正與投資者進行初步融資洽談。Yann LeCun 離職不只標誌著 Meta AI 策略重大轉折,當科技巨頭全力衝刺大型語言模型商業化時,下一波真正 AI 革命可能正在醞釀。
世界模型是什麼
世界模型是一種模仿人類認知過程的 AI 系統,目標是讓機器理解和預測物理世界運作方式。與大型語言模型 (LLM) 依賴文字和語言數據不同,世界模型透過學習影片、空間數據和物理互動,建立對真實環境內在表徵。簡單來說 LLM 擅長處理語言和生成文字,但無法真正理解物理世界;世界模型則讓 AI 能夠「看見」、「理解」並「預測」物體如何移動、互動和反應。
IBM 研究指出,世界模型能在實際執行前於模擬空間規劃動作和互動,這些模擬空間通常被稱為「數碼分身」(digital twins)。這種能力大幅減少昂貴試錯過程、降低安全風險,並加速機器學習,特別適用於工業裝配、倉庫物流或服務型機械人等任務。
Yann LeCun 強調,現有對文字模型依賴是不足夠的。AI 應該發展出能更細緻理解和預測現實世界現象的表徵方式。這種轉變可能為實現人工通用智能 (AGI) 鋪路,讓機器能像人類一樣思考和推理。不過他承認,完整開發這套架構可能需要 10 年時間。
世界模型的商業應用前景
世界模型技術最直接商業應用集中在機械人技術和自動駕駛領域。Meta 今年 6 月推出開源 AI 模型 V-JEPA 2,能理解、預測和規劃物理世界,特別強調其對送貨機械人和自動駕駛車輛優勢。這些應用需要即時理解環境才能有效導航。V-JEPA 2 不依賴大量標註數據或影片記錄,而是在精簡「潛在」空間運作,理解物體如何移動、互動和反應。
Yann LeCun 團隊已展示機械人零樣本任務執行能力,使用經過 62 小時真實或模擬動作訓練的自監督世界模型。無需強化學習,無需特定任務數據,只需一個世界模型。他相信這將在 3 至 5 年內成為主導 AI 架構。
在 2025 年 CES 展上,Nvidia 行政總裁黃仁勳推出 Cosmos,一套世界基礎模型 (World Foundation Models),目標是革新物理 AI 應用。這反映業界領袖認為世界模型將在多個產業帶來重大進展,從提升機械人能力到革新遊戲和客戶體驗。
製造業與物流的變革機遇
世界模型與數碼分身技術結合,為製造業和物流業帶來巨大商業價值。McKinsey 研究顯示,數碼分身可模擬整條供應鏈物理和數碼流程互動,從產品構思、製造到倉儲配送,從實體或網上購買到運送和退貨,繪製出最佳端對端供應鏈流程清晰圖像。配合當今預測性 AI 進步,數碼分身既能預測又能提供建議。
實際案例顯示成效顯著。一家全球原始設備製造商 (OEM) 使用數碼分身改良其運輸管理系統 (TMS) 平台的外向物流政策,結果將貨運和損壞成本降低 8%。另一家汽車 OEM 使用數碼分身根據供應可用性和營運複雜度變化動態調整需求,同時解決銷售和營運目標。
在即時應變方面,一家 OEM 使用自動感應和回應的數碼分身能力,識別承運商表現和附加費變化,有效將最後一里運輸成本降低 5%。McKinsey 指出,典型成果包括消費者承諾履行率提升最多 20%、勞動力成本降低 10%,以及收入提升 5%。
日本新日鐵和 NS Solutions 已開發物流數碼分身,用於可視化、分析和模擬鋼鐵製造流程中複雜物流。鋼鐵製造是多階段流程,產品在擁有不同生產線工廠之間轉移,物流通常複雜並導致庫存短缺或過剩問題。數碼分身技術為系統用戶創造共同認知,有效解決這些挑戰。
自動駕駛與機械人的投資熱潮
全球工業機械人安裝量在 2023 年激增至超過 541,000 台,較 2013 年增加超過 3 倍。雖然中國在數量上領先,但印度和英國等新興市場在自動化增長速度上最快。雖然成熟市場安裝量放緩,但轉向 AI 增強型機械人和自動駕駛車隊顯示自動化策略從規模轉向精密化。
UBS 預計,全球人形機械人和自動化系統總體可尋址市場 (TAM) 將在 10 年內達到 4,020 億美元(約港幣 3.14 兆元),複合年增長率 (CAGR) 為 11%。自動駕駛車輛和工業機械人在自動駕駛系統旗幟下匯聚,投資者應認識到機械人技術是新物理經濟作業系統基礎層。
技術創新在這次飛躍中扮演核心角色。Tesla、百度和 Uber 支援的合作夥伴都推出新一代自動駕駛平台,從 Tesla 的 Cybercab 到百度具備電池交換能力的 RT6。重要是自動駕駛技術不只針對個別車輛改良,更針對車隊經濟和可擴展性。RT6 每台售價 30,000 美元(約港幣 234,000 元),展示規模經濟和智能工程如何結合,讓自動駕駛不只是未來主義,更具財務合理性。
世界模型 vs 大型語言模型:企業如何選擇
Yann LeCun 長期主張 LLM 雖然「有用」,但永遠無法像人類一樣進行推理和規劃。LLM 在處理語言方面表現出色,但在理解物理世界方面存在根本限制。這種區別對於探索 AI 未來發展所需能力至關重要。
世界模型設計用於模仿人類認知過程,讓機器理解環境,這對需要感官輸入和即時互動任務至關重要。Yann LeCun 強調,僅僅增強 LLM 是不足夠的;我們需要能夠感知、詮釋和在物理世界中行動的模型,類似人類的方式。
對企業而言,選擇取決於應用場景。LLM 適合翻譯、自然語言處理、內容生成等語言相關任務。ChatGPT for Enterprise、Salesforce Einstein 和 Microsoft Copilot 等工具簡化溝通、客戶關係管理和生產力。McKinsey 2025 年 11 月調查顯示,更多受訪者報告其組織使用 AI,雖然大多數尚未大規模應用這些技術。
相比之下,世界模型更適合需要物理世界理解的應用:自動駕駛車輛、工業機械人、倉庫自動化、製造流程改良等。大型世界模型 (Large World Models, LWMs) 透過明確建模行動的前置條件 (precondition) 和效果 (effect),能夠預測「這個行動現在有效嗎?」和「如果我這樣做會發生什麼?」,這些能力是其他模型通常缺乏的。
Meta 策略分歧的深層原因
Yann LeCun 離職發生在 Meta 創辦人 Mark Zuckerberg 大幅調整公司 AI 策略之際。Mark Zuckerberg 改變過往專注長期研究方向,轉而追求更快速推出 AI 模型和產品,期望追上 OpenAI 和 Google。今年夏天 Mark Zuckerberg 斥資 143 億美元(約港幣 1,115.4 億元)聘請 28 歲 Scale AI 創辦人 Alexandr Wang 領導新成立「超級智能」團隊,並收購 Scale AI 49% 股權。
在 AI 部門重組後,Yann LeCun 原本向首席產品官 Chris Cox 匯報,現改為向 Alexandr Wang 匯報。這種組織架構變動反映 Meta 優先次序根本轉變:從長期基礎研究轉向短期產品交付。Yann LeCun 自 2013 年起領導的基礎人工智能研究實驗室 (FAIR),被業內人士形容為「正在緩慢死亡」。
Meta 最新推出 Llama 4 模型表現不如 Google、OpenAI 和 Anthropic 先進產品,而 Meta AI 聊天機械人也未能吸引消費者使用。這次失利促使 Mark Zuckerberg 親自組建名為「TBD Lab」的精英團隊,以 1 億美元(約港幣 7.8 億元)年薪待遇從競爭對手挖角人才,專注開發下一代大型語言模型。
投資回報的現實挑戰
Mark Zuckerberg 面對華爾街愈來愈大壓力,要求證明公司數百億美元 AI 投資能帶來收益增長。Meta 10 月底公布 AI 開支將持續增加,2026 年可能超過 1,000 億美元(約港幣 7,800 億元),消息公布後股價暴跌 12.6%,市值蒸發約 2,400 億美元(約港幣 1.87 兆元)。
與 Microsoft、Google 和 Amazon 不同,Meta 沒有雲端服務業務,缺乏與 AI 投資直接掛鉤明確收益故事,只能依賴廣告收入來變現 AI 投資。Columbia Threadneedle Investments 高級投資組合經理表示:「這感覺像是 Meta 回到過往過度投資於瑣碎項目、沒有適當回報要求舊時代。投資者正在失去耐心。」
企業啟示:如何佈局世界模型
對於考慮投資世界模型技術企業,以下是關鍵策略建議。首先評估業務是否涉及物理世界互動。製造業、物流、機械人技術、自動駕駛、倉儲管理等行業最能從世界模型受益。如果核心業務主要處理語言和資訊,LLM 可能仍是更佳選擇。
其次考慮採用混合策略。企業不必在世界模型和 LLM 之間二擇其一。McKinsey 研究顯示,數碼分身可整合現有供應鏈管理工具,作為創新層疊加在技術堆疊之上。這樣可改良輸入供應鏈管理工具數據,生成預測分析以應對多種潛在情境。
第三從數碼分身試點開始。在投入大規模世界模型開發前,企業可先建立特定流程或設施數碼分身。例如一家企業原本使用自上而下分析確定潛在新配送中心規模和位置,但使用數碼分身模擬所有潛在限制後,發現在可減少 50% 地產面積情況下重新調整規模和位置,而不影響功能。
第四關注開源解決方案。Meta V-JEPA 2 和其他開源世界模型為企業提供低成本實驗機會。Decart Oasis 平台展示世界模型如何創造適應性虛擬世界,企業可利用類似技術進行產品設計、培訓模擬或客戶體驗創新。
最後為長期投資做好準備。Yann LeCun 承認世界模型完整開發需要 10 年時間,但他相信 3 至 5 年內將成為主導架構。企業應在追求短期 AI 應用收益同時,保留資源用於探索性世界模型研究,確保在技術成熟時不會落後。
資料來源:Financial Times




