close
企業趨勢

GPU 算力成「新石油」:租金急升兼頻繁當機 揭示 AI 產業基建隱憂


GPU 算力成「新石油」:租金急升兼頻繁當機 揭示 AI 產業基建隱憂

AI 算力供應危機持續升溫。根據《華爾街日報》(The Wall Street Journal) 最新調查,Nvidia Blackwell GPU 現貨租金在短短兩個月內暴漲 48%,由每小時約 2.75 美元(約 21 港元)升至 4.08 美元(約 32 港元)。與此同時,Anthropic 的 Claude API 穩定性問題日趨嚴重,正常運行率遠低於企業級標準,已有企業客戶因此轉投 OpenAI,算力荒正全面衝擊整個 AI 產業。

GPU 算力如油價般被實時追蹤

Ornn 發布的「算力價格指數」(Ornn Compute Price Index,OCPI) 近期已納入彭博終端 (Bloomberg Terminal),機構投資者現可像追蹤石油價格般,實時監察 GPU 現貨租金走勢。

今次漲價的核心驅動力,是代理式人工智能 (Agentic AI) 需求急速膨脹。AI 不再只限於前端問答功能,而需要長時間持續自主運作,對算力的胃口遠超以往,供給卻未能跟上。

雲端服務商 Vultr 行政總裁 J.J. Kardwell 直言:「這是我經營公司逾五年來所見最嚴重的算力短缺。資料中心建設週期太長,2026 年可用的電力已全數被預訂。」值得注意的是,他強調瓶頸在於「電力」而非晶片本身——算力危機已由供應鏈問題演變為電網問題。

Anthropic 宕機時數遠超行業標準

在各大 AI 廠商中,Anthropic 的情況最為嚴峻。截至 4 月 8 日的 90 天內,Claude API 正常運行率僅為 98.95%,遠低於業界企業級標準 99.99%。相差看似不足 1 個百分點,實際上代表每月額外出現近 8 小時宕機,對需要將 AI 整合至核心業務流程的企業而言,根本難以接受。

企業軟件開發平台 Retool 創辦人兼行政總裁 David Hsu 表示:「我認為 Opus 4.6 是最佳企業級模型,但最終我們還是轉到了 OpenAI,因為 Anthropic 一直在當機。」Retool 正正是 Anthropic 最需要留住的企業客戶,訂單卻因算力不足而流失。

Anthropic 已於 3 月下旬開始實施限流措施,在星期一至五太平洋時間早上 5 時至 11 時限制用戶的 token 消耗量。回望 3 月中推出的「離峰時段用量增倍」優惠,現在看來並非單純的推廣優惠,而是有意疏導流量、騰出尖峰容量的應急之舉。

雖則如此,Anthropic 的年化經常性收入 (ARR) 仍錄得驚人增長:由 2025 年底的約 90 億美元(約 702 億港元),2 月升至約 140 億美元(約 1,092 億港元),4 月更急升至約 300 億美元(約 2,340 億港元)。收入越高,算力需求越大,供需缺口反而持續擴大。

OpenAI 關閉 Sora 騰出晶片資源

OpenAI 同樣承受龐大壓力。其 API token 處理量由 2025 年 10 月的每分鐘 60 億,急增至 2026 年 3 月底的每分鐘 150 億,五個月內增長逾兩倍半。

OpenAI 財務長 Sarah Friar 坦言:「我花費大量時間四處尋找最後一點可用算力,我們正在作出非常痛苦的取捨,有些項目因算力不足而被迫放棄。」

影片生成應用 Sora 已遭下架,部分原因正是要將釋出的晶片資源重新分配至程式設計工具及企業產品線。

CoreWeave 攬大客逼走中小企

雲端算力供應商 CoreWeave 去年底上調租金逾 20%,同時要求中小型客戶簽訂至少三年合約(此前為一年),對需要彈性方案的初創及中型企業而言,形同趕客。

然而對大客戶則採取另一套策略。今年 4 月 10 日,CoreWeave 宣布與 Anthropic 簽訂多年合約,讓 Anthropic 可存取其美國資料中心內的 Nvidia GPU 算力。Anthropic 承諾投入最多 1 GW 算力規模,採用 Nvidia Grace Blackwell 及下一代 Vera Rubin 硬件。

隨着 Agentic AI 應用日益普及,各大科技公司預計將持續面臨高昂算力成本及服務穩定性挑戰。業界關注的焦點,將逐步從晶片供應轉移至電網擴容能否追上 AI 基礎設施急速增長的步伐。

對企業而言,下一步不只是比較哪家模型「最聰明」,而是重新設計供應策略。這包括多模型備援、預留尖峰配額、重新評估影片生成等高耗算場景的 ROI,以及把基礎設施可得性納入採購與產品路線圖。若電網擴容與資料中心建設速度仍追不上 Agentic AI 的需求,2026 年下半年到 2027 年,算力價格與服務穩定性很可能仍會是整個 AI 產業最敏感的兩個變數。

這意味著未來贏家未必只是模型能力最強的公司,而更可能是最能穩定取得算力、控制成本並維持 SLA 的平台。當 GPU 價格開始像能源價格一樣被全天候追蹤,企業是否也該把「算力風險管理」列為董事會層級議題?

 

來源:The Wall Street Journal