在 AWS re:Invent 2025 大會上,Amazon Web Services(AWS)於週二宣布推出第三代 Trainium3 AI 晶片。這場發布被視為雲端巨頭企圖打破 Nvidia 在 AI 晶片市場近乎壟斷地位的重要一步。對於正在思考如何在人工智能浪潮中控制成本的企業領導者而言,這項新產品釋放出一個明確訊號:AI 基礎建設的選擇正在增加,而成本結構亦將隨之改變。
這款採用最先進 3 納米製程技術的晶片,其意義遠超過技術規格的提升。根據 AWS 提供的數據,Trainium3 UltraServers 系統的運算效能較前一代提升 4.4 倍,能源效率提升 40%。這意味著企業在追求 AI 創新的同時,不必再面臨電費和營運成本失控的困境。更關鍵的是,已經測試這款晶片的企業客戶報告,相較於傳統 GPU 方案,訓練成本節省幅度高達 50%。
時間就是金錢 訓練週期大幅縮短
對於企業決策者而言,這些數字背後的商業邏輯十分清晰。當前 AI 模型訓練成本已經成為許多企業的沉重負擔,動輒需要數百萬美元(約港幣數百萬元)的投資才能建立一個像樣的 AI 能力。Trainium3 的出現,令這個門檻大幅降低。以實際應用場景來說,一家企業原本需要數月時間訓練的大型語言模型,現在可能只需要數週就能完成。這種時間成本的節省往往比直接的財務節省更具戰略價值。
挑戰 Nvidia 壟斷 企業需要更多選擇
從市場競爭角度觀察,AWS 此舉充滿戰略意圖。研究機構 Kearney 的報告指出,Nvidia 目前掌握了 90% 的 AI 訓練和推論晶片市場,這種近乎壟斷的局面令許多企業感到不安。過度依賴單一供應商不僅可能面臨價格風險,更可能在供應鏈緊張時無法取得關鍵硬件。AWS 的策略是提供一個既能支援現有技術生態、又具備成本優勢的替代方案。值得注意的是,AWS 已經宣布下一代 Trainium4 將支援 Nvidia 的 NVLink Fusion 互連技術,這表明 AWS 並非要完全取代 Nvidia,而是要在同一個生態系統中提供更多選擇。
早期客戶驗證 實際效益超越承諾
從早期採用者的經驗來看,這項技術已在真實商業環境中證明其價值。人工智能公司 Anthropic、日本的語言模型新創 Karakuri,以及專注於即時生成式影片的 Decart 等企業,都已開始使用 Trainium3。其中 Decart 在即時生成影片應用上,達到了比 GPU 方案快 4 倍的處理速度,成本卻只有一半。這種具體的應用案例,讓我們看到新一代 AI 晶片如何改變商業模式的可能性——原本因為成本過高而無法實現的即時互動式內容,現在變得經濟可行。
百萬晶片規模 開啟超大型 AI 部署時代
對於企業決策者來說,更值得關注的是 AWS 在整體架構上的野心。Trainium3 不僅是一顆晶片,而是一個完整的系統解決方案。AWS 設計了能夠容納 144 顆 Trainium3 晶片的 UltraServer 系統,更進一步,還能將數千台這樣的伺服器連結成 EC2 UltraClusters 3.0,總共可調度高達 100 萬顆晶片——這個規模是前一代的 10 倍。這種規模化能力的提升,意味著企業可以處理更複雜的 AI 任務,例如訓練需要處理數兆個資料點的多模態模型,或是同時為數百萬用戶提供即時 AI 服務。
能源效率成關鍵 降低長期營運成本
從產業趨勢來看,AWS 的這項發布反映了一個更廣泛的轉變:AI 基礎建設正在從「購買運算能力」轉向「最佳化整體擁有成本」。過去企業往往只關注晶片的原始效能,但現在越來越多的財務長開始計算每次訓練或推論的實際成本,包括電力消耗、冷卻需求,以及長期的營運費用。Trainium3 在能源效率上的提升,在這個脈絡下就顯得格外重要——在大規模部署的情況下,40% 的能源節省可以轉化為數百萬美元(約港幣數百萬元)的年度節省。
AI 工廠概念 回應資料主權需求
另一個值得企業領導者思考的面向是技術自主性。AWS 同時在大會上推出了「AI 工廠」概念,期望能讓大型企業和政府機構可以在自己的資料中心內運行 AWS 的 AI 系統。這種混合部署模式回應了許多企業對於資料主權和安全性的顧慮——特別是在金融、醫療、國防等高度監管的產業,能夠在不將敏感資料上傳到公有雲的前提下使用先進 AI 能力,是一個關鍵的商業考量。
技術快速迭代 戰略決策刻不容緩
展望未來 AWS 已經透露正在開發 Trainium4,預計將帶來至少 6 倍的處理效能提升,以及 3 倍的 FP8 運算效能提升。這種快速的迭代週期顯示,AI 晶片市場正進入一個高速演進的階段。對企業而言,這既是機會也是挑戰——如何在快速變化的技術環境中做出正確的投資決策,如何避免技術債務的累積,都需要更具前瞻性的策略思考。
從技術競爭到成本競爭 重新定義 AI 戰略
最終,Trainium3 的推出對企業決策者的啟示是:AI 的競爭正在從「誰擁有最好的演算法」轉向「誰能以最經濟的方式大規模部署 AI 能力」。當訓練成本降低一半、運算速度提升數倍時,企業就能更自由地實驗新的 AI 應用場景,更快速地將創新想法轉化為商業價值。在這個脈絡下,選擇合適的 AI 基礎建設供應商,已不再只是 IT 部門的技術決策,而是影響企業競爭力的戰略選擇。