close
人工智能業界消息

OpenAI 工程團隊揭優化技術 AI 推理成本減半 RAM 價勢受衝擊


多個記憶體模塊堆疊展示電路板細節.

市場研究機構 TrendForce 及多家媒體報導指出,2026 年第一季 DRAM 合約價漲幅高達 90% 至 95%,NAND 快閃記憶體價格亦同步攀升。正當個人電腦與智能手機製造商忙於應對成本上漲之際,OpenAI 內部工程師團隊近日透露,已開發出能將特定流量的模型推理成本「削減超過一半」的軟件優化方案,消息隨即引發半導體與雲端基礎設施市場關注。

軟件優化減 GPU 用量 挑戰市場線性增長假設

外媒報導指出,該項優化主要針對未登入(logged-out)用戶的訪客流量。通過改良鍵值緩存(KVCache)使用策略、量化(quantization)、批次合併與模型路由等系統層面調整,OpenAI 工程團隊成功將高峰時段所需的 GPU 數量大幅壓縮至「數百張」級別。此舉直接挑戰了市場普遍認為人工智能模型擴張將線性推升高頻寬記憶體(HBM)及高端圖形處理器需求的假設。

記憶體產能結構轉移 消費級市場供應持續收緊

半導體供應鏈分析師指出,自 2025 年下半年起,記憶體製造商陸續將先進產能轉向生產 HBM 及高階 DRAM,以應付人工智能訓練所產生的龐大需求,結果導致消費級 DRAM 與 NAND 快閃記憶體供應持續收緊。TrendForce 年初時已多次上調價格預測,但實際合約價升幅仍超出市場原先估計。微型電腦與筆記型電腦製造商為控制成本,已調整產品規格,部分高端型號更取消可擴充記憶體插槽,同時調高終端售價。

技術突破部署範圍有限 短期價格難望回落

值得留意的是,OpenAI 的技術突破目前主要應用於未登入流量,尚未全面部署至所有用戶或大規模付費工作負載。受訪的半導體市場分析師及供應鏈採購主管均強調,軟件優化雖能緩和長期需求,但短期內無法解決產能結構轉移與雲端服務商集中採購所形成的供給瓶頸。即使人工智能對高頻寬記憶體的邊際需求下降,記憶體製造商調整產能配置仍需時間,價格短期內難望顯著回落。

企業宜採雙軌策略 應對供應鏈不確定性

業界普遍認為,若 OpenAI 的優化方法能夠複製至不同流量類型及供應商,長遠將有助改變人工智能基礎設施對硬體的依賴程度,繼而對記憶體價格上漲產生抑制作用。企業方面,短期應繼續透過議價及分散供應鏈管理(如簽訂長期合約、引入多元供應商)降低成本壓力;中長期則應投資於軟件效率優化與系統架構調整,以減少對高價記憶體的倚賴,提升營運韌性。

資料來源:cnBeta.COMYahoo FinanceAIbaseCBISH 財經

 

Tags : DRAMNANDOpenAI人工智能記憶體價格
Pierce

The author Pierce

喜歡尋找本地潛力 Startups 與讀者分享, 對企業資訊安全特別注意