Vera Rubin 平台重寫算力經濟學 NVIDIA 掀起全球 AI 數據中心投資熱潮

NVIDIA 於 GTC 2026 宣告「推論時代」降臨,預估 AI 基礎建設需求達 1 兆美元。本文深度剖析 Vera Rubin 平台如何重塑算力經濟學,以及香港數據中心市場在 AI 工廠浪潮下結構性機遇,助企業決策者及早佈局。



NVIDIA 行政總裁黃仁勳於 2026 年 3 月 16 日在聖荷西 SAP 中心 GTC 年度開發者大會演講中,正式宣告「推論時代」到來。他將全球 AI 基礎建設需求預測從去年 5,000 億美元(約港幣 3 兆 9,000 億元)大幅上修至 2027 年底前至少 1 兆美元(約港幣 7.8 兆元)。這修正幅度直接令場內逾 30,000 名與會者震驚。演講除了是一次產品發布,也是對 AI 產業結構全面重新定義。影響波及晶片製造商、雲端巨頭、資本市場以至亞洲數據中心投資者等整條產業鏈。

兆計美元需求背後的算力爆炸

黃仁勳在演講中揭示一組震撼數據。過去兩年內完成單一 AI 工作所需推論運算量增加約 10,000 倍。整體使用量亦同步增加約 100 倍,導致全球推論運算總需求在短短兩年間暴增整整 1,000,000 倍。這增幅並非源於演算法改良或使用者數量線性成長,而是來自 AI 能力質變帶來範式轉移。黃仁勳解釋過去 AI 只能「感知」,繼而進化到「生成」,再躍升為「推理」。如今 AI 已能執行完整任務,每一個「思考」、「行動」、「閱讀」與「推理」動作,背後都需要持續生成 Token,令推論需求從選項變成剛需。

市場對這預測反應迅速且明確。有媒體引述 MarketScreener 報導指出,黃仁勳在 GTC 大會上宣布,Blackwell 與 Vera Rubin 兩大 AI 晶片架構累計訂單需求,預計到 2027 年底將達到 1 兆美元(約港幣 7.8 兆元),是去年同期預測整整兩倍。黃仁勳進一步補充指 1 兆美元這個數字「可能還是低估」。他在現場直言確定實際運算需求將遠超這數字,甚至可能面臨供給短缺。這表態意味這場 AI 基礎建設超級週期規模,或許連最樂觀市場估算都未能完全觸及天花板。

AI 工廠時代:Token 成為新型原物料

黃仁勳在演講中提出全新產業框架「AI 工廠」(AI Factory)。他指出未來數據中心不再只是儲存或傳輸數據設施,而是以生成 Token 為核心使命的生產基地。Token 就是這時代「新型原物料商品」。他特別強調每一座數據中心按定義都受限於電力。一座 1GW 工廠永遠不會變成 2GW,這是物理定律決定。在固定電力下,誰能以每瓦特產出最多 Token,誰就擁有最低生產成本。

支撐這願景是 NVIDIA 「極致協同設計」(Extreme Codesign)哲學。軟件與矽晶片在設計階段深度整合,令 NVIDIA 宣稱在全球推論成本競爭中處於領先地位。知名半導體分析機構 SemiAnalysis 創辦人 Dylan Patel 直接指出,黃仁勳公布效能數據甚至「有所保留」。實際推論效率提升幅度達到 50 倍,超過 NVIDIA 官方宣稱 35 倍。Deepwater Asset Management 聯合創辦人 Gene Munster 亦表示,是次 GTC 大會重申 AI 基礎建設需求遠比投資者預期強勁。他預期 Rubin 架構將大幅改善大規模部署 AI 模型時推論經濟效益。

Vera Rubin 平台:重寫算力經濟學的一代飛躍

NVIDIA 在 GTC 2026 正式宣布推出 Vera Rubin 平台。相比前一代 Blackwell 架構,推論 Token 成本降低達 10 倍,訓練混合專家模型(MoE)所需 GPU 數量亦減少 75%(即 4 倍)。這除了是技術規格線性進步,也是 AI 商業化部署門檻根本性突破。黃仁勳以具體數據說明,在同等 1GW 數據中心條件下,過去兩年間 Token 生成速率從每秒 22,000,000 躍升至 700,000,000,實現高達 350 倍成長,遠超同期摩爾定律帶來約 1.5 倍提升。

除 Vera Rubin 外,黃仁勳亦發布 Vera CPU 機架,專為代理式 AI(Agentic AI)工作負載最佳化。他同時展示 Groq LP30 語言處理單元(LPU),這是 NVIDIA 完成對 Groq 技術授權與團隊收購(交易規模約 200 億美元,約港幣 1,560 億元)後推出高速推論加速晶片。黃仁勳透露 Groq LP30 由三星晶圓代工(Samsung Foundry)生產,目前已進入量產階段並預計於第三季正式出貨。第一座 Vera Rubin 機架已在 Microsoft Azure 雲端上網運作。根據 Investing.com 分析,Vera Rubin 平台效能潛力能為 NVIDIA 帶來高達 5 倍潛在收益提升。NVIDIA CPU 業務亦預計在這週期內成長為數十億美元規模新業務線。

AI 原生企業浪潮與 1,500 億創投資金

推動此波需求核心力量,是黃仁勳所稱「AI 原生企業(AI Natives)」生態系統。他指出包含 OpenAI、Anthropic 以及大量市場尚未熟知初創企業,過去兩年間合計吸引高達 1,500 億美元(約港幣 1 兆 1,700 億元)創投資金,創下人類史上最大規模科技投資紀錄。黃仁勳特別強調這些企業共同特徵是投資規模首次從數百萬美元躍升至數億乃至數十億美元。背後原因只有一個,這是史上首次每一家企業都需要大量算力與海量 Token 才能運作。這形成清晰正向飛輪邏輯:算力增加→Token 生成量提升→模型更聰明→業務規模擴大→更大算力需求。

放眼香港與亞太市場,這波浪潮影響同樣深遠。香港數據中心市場預計從 2025 年 36.2 億美元(約港幣 282.36 億元)增長至 2031 年 58.1 億美元(約港幣 453.18 億元),年複合增長率達 8.2%。仲量聯行(JLL)預測 2027 年將成為關鍵轉折點,屆時 AI 推論工作負載佔比將正式超越訓練工作負載,成為數據中心需求主要驅動力。香港政府已釋出沙嶺地塊進行招標,最大總樓面面積達 250,000 平方米。政府明確以推動數據與 AI 相關產業,將香港建設為區域數碼化基礎建設樞紐為目標。仲量聯行報告指出全港目前已有逾 200 兆瓦新開發數據中心項目採用高密度機架與液冷技術,正快速向 AI 最佳化基礎建設轉型。

競爭格局與行業深遠影響

這場推論時代到來對整個科技產業格局影響不容低估。根據 Intellectia.ai 分析,NVIDIA 預測 AI 數據中心基礎建設支出到 2030 年將達每年 4 兆美元(約港幣 31.2 兆元)。目前超大規模雲端業者(Hyperscalers)貢獻 NVIDIA 約 60% 營收,其餘 40% 來自區域雲端、企業、機械人等多元化客戶群。Microsoft 已率先成為 Vera Rubin 平台首批大客戶,正積極建設以 Rubin 平台為核心次世代「Fairwater AI 超級工廠」,飛輪效應正在加速滾動。NVIDIA 透過「機架即電腦」整合架構,將價值從單一晶片延伸至整個系統棧,令競爭對手難以從任何單一環節發起有效挑戰。

香港投資者積極捕捉這趨勢。香港本地投資機構 Accelerated Infrastructure Capital(AIC)正在越南胡志明市聯合開發造價達 21 億美元(約港幣 163.8 億元)AI 數據中心。項目首期規模達 50 兆瓦,相當於 28,000 個 GPU 算力。這動向顯示推論基礎建設投資熱潮正以香港為起點,快速向東南亞擴散。

未來展望與結構性挑戰

黃仁勳在 GTC 2026 描繪願景,標誌 AI 產業從「實驗室模型競賽」正式跨入「工業化推論基礎建設」全新紀元。1 兆美元需求預測、Vera Rubin 降低 10 倍 Token 成本,以及 Token 作為新原物料產業重新定義,預示未來兩至三年內,從晶片製造、數據中心建設到電力基礎設施整條供應鏈,都將迎來前所未有擴張壓力。然而如何解決數百萬瓦級數據中心帶來能源消耗與供電挑戰,以及 Vera Rubin Ultra 能否如期量產出貨,將是決定這場「兆美元賭注」能否兌現關鍵變數。

 

資料來源:news.futunn.com | www.marketscreener.com | www.ainvest.com | www.cbre.com.hk | technode.global