Nvidia 行政總裁黃仁勳近日在《BG2 Podcast》中,將 Tesla 兼 xAI 行政總裁馬斯克比喻為「終極 GPU」,稱讚他在建立全球最大 AI 超級電腦時,展現出獨特的系統整合能力。馬斯克目前正在田納西州孟菲斯建立的 Colossus 超級電腦,已部署超過 230,000 個 Nvidia GPU,成為全球最強大的 AI 訓練平台。黃仁勳指出,馬斯克能夠將 AI 超級電腦所有相互依賴的複雜系統,包括技術採購、融資、土地與電力供應等要素,全部在腦內整合運算。這種能力使 xAI 在不足 122 天內,完成業界通常需要數年才能建成的超級電腦基礎設施。
罕見的系統整合思維優勢
黃仁勳在播客中強調,建立 AI 超級電腦是「人類至今面臨最複雜的系統問題」。他解釋,這些專案技術複雜,從硬件採購到融資安排、從土地選址到電力供應,每個環節都充滿挑戰。馬斯克的獨特之處在於能將所有這些相互依賴的系統,整合在單一視野中,這種能力讓他得以完成其他企業難以企及的成就。Nvidia 與 xAI 的合作始於 2024 年,當時 Colossus 在短短 19 天內,從裝置進場到開始訓練。這個速度遠超業界平均 4 年的規劃與建設週期。黃仁勳特別提到,當意志與技能結合時將發生驚人事情,而馬斯克正正具備這種緊迫感和對建設的渴求。
超級電腦軍備競賽白熱化
xAI 的 Colossus 計劃正引領一場全球 AI 基礎設施軍備競賽。截至 2025 年 10 月,Colossus 已擁有 150,000 個 H100 GPU、50,000 個 H200 GPU 和 30,000 個 GB200 GPU,並計劃在第二個孟菲斯資料中心再增加 110,000 個 GB200 GPU。馬斯克宣稱 Colossus II 將成為「世界首個千兆瓦級 AI 訓練集群」。相比之下,Meta 在 2025 年 7 月宣布建立 Prometheus 超級電腦,功耗超過 1 吉瓦,並規劃功耗達 5 吉瓦的 Hyperion 集群。OpenAI 與 Oracle 簽訂為期 5 年、價值 3,000 億美元(約港幣 2.34 兆元)的運算能力合約。
研究機構 Epoch AI 估計,到 2030 年,單個前沿 AI 訓練任務將需要 4 至 16 吉瓦的電力,相當於為數百萬戶家庭供電。這場競賽的核心已從晶片技術轉向基礎設施建立能力,誰能更快獲得電力、土地和資金,誰就能在 AI 競賽中佔據優勢。
巨額投資背後的商業邏輯
xAI 在 Colossus 計劃上的投資規模驚人。根據 Business Insider 報導,馬斯克已在 Colossus II 上投入至少 4 億美元(約港幣 31.2 億元)。2025 年 7 月,xAI 籌集 100 億美元(約港幣 780 億元)的債務和股權融資,其中 50 億美元(約港幣 390 億元)來自擔保票據和定期貸款,另外 50 億美元(約港幣 390 億元)來自戰略股權投資。《華爾街日報》報導,xAI 還計劃籌集高達 120 億美元(約港幣 936 億元)的額外債務用於擴張。分析師估計,截至 2025 年 6 月,Colossus 的硬件價值已超過 70 億美元(約港幣 546 億元),使其成為全球成本最高的 AI 超級電腦。
這種資本密集型戰略背後的邏輯是,訓練和部署先進 AI 系統需要昂貴硬件、大量運算資源和頂尖工程師,而在 OpenAI、Google 和中國 DeepSeek 等競爭對手環伺下,速度就是一切。xAI 預計 2025 年將消耗約 130 億美元(約港幣 1,014 億元)資金,這種激進的投資策略反映出馬斯克對 AI 領域領導地位的渴望。
Nvidia GPU 壟斷地位持續強化
Nvidia 在 AI 晶片市場的主導地位,在這場超級電腦競賽中進一步鞏固。2025 年第一季,Nvidia 將近 60% 的晶片產能分配給企業 AI 客戶。H100 GPU 的售價約為 30,000 至 40,000 美元(約港幣 HK234,000至HK312,000),而需求極度旺盛。Nvidia 的最新 AI 晶片已預售至 2025 年底,買家面臨漫長的交貨期。H200 GPU 在推理速度上比 H100 快 2 倍,能源使用降低 50%,總擁有成本也降低 50%。馬斯克在 2025 年 5 月表示,xAI 和 Tesla 將繼續從 Nvidia 和 AMD 等供應商購買晶片,並計劃在孟菲斯附近建立一個擁有 1,000,000 個 GPU 的設施。分析師預測,2025 年全球 AI 基礎設施支出將達到 3,750 億美元(約港幣 2.925 兆元),2026 年將達到 5,000 億美元(約港幣 3.9 兆元)。這種需求激增不但推高 GPU 價格,也造成供應短缺,高階 GPU 的售價比建議零售價高出 30% 至 50%。Nvidia 與 xAI 的深度合作關係,以及 Spectrum-X Ethernet 平台在 Colossus 上的成功部署,進一步強化 Nvidia 在 AI 基礎設施領域的技術領先地位。
企業 AI 戰略的關鍵啟示
Colossus 計劃的成功為企業制定 AI 戰略提供三大啟示。首先,速度比完美更重要:xAI 選擇廢棄的 Electrolux 工廠作為基地,因為可以快速改造,鄰近的廢水處理設施也提供水源。這種務實的選址策略使專案在 19 天內就開始運作。其次,垂直整合能力成為競爭優勢:馬斯克除了控制 xAI,還掌握 Tesla 的 Megapack 儲能技術和 SpaceX 的資源,這種跨公司協同效應是競爭對手難以複製的。第三,基礎設施先行策略正在重塑產業格局:中國計劃到 2026 年將超過 1,000,000 個 GPU 整合到集中式 AI 集群中,利用豐富的工業電力和主權級建立能力。相比之下,美國的分散式訓練集群受制於延遲、頻寬和管理複雜性的限制。對企業而言,這意味著 AI 競爭力不只取決於演算法和數據,更取決於能否快速獲取和部署大規模運算資源。