Meta 已與 AWS 簽署協議,將大規模採用 AWS Graviton 處理器,支援 Meta 下一代 Agentic AI 工作負載。雙方公布合作,部署初期以數千萬個 Graviton 核心起步,Meta 亦因此成為全球最大 Graviton 客戶之一。事件重點是 AI 基建由「GPU 優先」走向 CPU、GPU 與專用加速器分工,而非單純晶片採購。本文會從算力架構、成本效益及企業採購策略三個角度分析。

AI 基建不再只看 GPU,CPU 成為任務協調核心
Meta 與 AWS 今次合作的核心,是把 AWS Graviton 處理器納入 Meta 的大型 AI 運算組合。AWS 官方資料指出,Meta 的部署將由數千萬個 Graviton 核心開始,並可隨 AI 能力擴展。Meta 官方亦表示,Agentic AI 的運算需求正在變化,企業不能再假設單一晶片架構可高效處理所有工作負載。Reuters 另引述 AWS 高層稱,這是一項多年協議,價值達數十億美元(約港幣數百億元),但雙方公告並未正式披露合約金額,因此相關數字應視為媒體引述,而非官方財務條款。
Agentic AI 是能夠推理、規劃及執行多步驟任務的系統。這類系統運作時會生成文字,同時搜尋資料、調用工具、撰寫程式碼、驗證結果及協調下一步行動。GPU 仍然是大型模型訓練的重要基礎,但當 AI 模型進入大規模部署階段,CPU 會承擔更多即時推理、搜尋、排程及多步驟任務編排工作。這正是 Meta 選擇 Graviton 的原因:補足 Agentic AI 長時間運行所需的控制層,而非替代 GPU。
Graviton 5 強調效能、能耗與安全隔離
Graviton5 是 AWS 第五代自研 Arm 架構處理器。AWS 指出,Graviton5 每顆晶片具備 192 個核心,快取容量為上一代五倍,核心之間通訊延遲最高可降低 33%,整體運算效能較上一代最多提升 25%。AWS 亦表示,Graviton5 採用 3 納米技術,並提升網絡及 Amazon EBS 頻寬,適合高效能資料庫、大數據分析、應用伺服器及分散式工作負載。對 Agentic AI 而言,這些規格有助降低任務拆解、資料調用及跨處理器協調時的等待時間。
成本同樣是企業關注焦點。AWS Graviton 產品頁指出,Graviton 型 Amazon EC2 執行個體較可比 x86 型 EC2 執行個體成本最多低 20%,在相同性能下能源使用最多可少 60%。這些數字屬 AWS 官方對 Graviton 型執行個體的整體描述,並不等同保證每一個應用都可取得相同節省。對企業決策人來說,真正需要留意的是不同工作負載在三至五年內的總擁有成本,而非單顆晶片跑分。總擁有成本涵蓋雲端支出、遷移成本、軟件相容性、網絡延遲及合規要求。
專家焦點由「買多少算力」轉向「如何分配算力」
Amazon 副總裁兼傑出工程師 Nafea Bshara 表示,這次合作重點是整合基建、數據及推理服務,而非單純晶片,以支援能夠理解、預測並擴展至全球用戶的 AI。Meta 基礎設施主管 Santosh Janardhan 則指出,隨着 Meta 擴展 AI 願景,多元化算力來源已成為戰略要務。這兩個說法反映大型科技公司已把 AI 基建視為供應鏈管理,而非單次採購。
第三方分析亦支持這個方向。Moor Insights & Strategy 副總裁兼首席分析師 Matt Kimball 向 Network World 表示,CPU 在 Agentic AI 中扮演控制平面角色,負責協調、記憶體管理、排程及跨加速器任務。他又認為,Meta 正在組建異質化系統,而非放棄 GPU。Info-Tech Research Group 主要顧問 Nabeel Sherif 則提出關鍵問題:Meta 取得這麼多算力後,將如何把能力轉化為內部實驗、產品化服務及對外 API?這提醒企業,AI 投資的重點已由「有沒有模型」轉為「哪一段流程應放在哪一種算力上」。
香港企業應先審視工作負載,而非盲目追逐最大模型
香港企業可從今次 Meta 與 AWS 合作看到一個清晰訊號:Agentic AI 落地後,成本壓力將集中在長時間推理、資料檢索、流程自動化及風險控制。金融、零售、物流、專業服務及媒體公司若部署 AI 代理,應先把工作負載拆分清楚。哪些任務需要 GPU?哪些任務可由 CPU 處理?哪些資料不可離開受控環境?哪些推理服務可交由雲端彈性擴展?這些問題比單純比較模型參數更直接影響投資回報。
未來企業 AI 基建將更像多供應商、多晶片、多區域的營運系統。GPU 負責高密度模型運算,CPU 負責任務協調與持續運行,專用加速器則處理特定推理或訓練場景。Meta 與 AWS 的合作顯示,Agentic AI 的競爭不只在模型本身,也在背後能否以可控成本、安全隔離及穩定延遲支撐數十億次互動。開放問題是:企業應該把多少 AI 控制權交給雲端平台,又應保留多少在自家架構之內?
[最後更新:2026 年 4 月 27 日]
資料來源:AWS 官方公告;Meta Newsroom;Reuters;AWS Graviton 產品頁;Network World




