儲存專家剖析: AI 發展的幕後功臣 HDD 如何推動香港的數碼願景

AI 發展對數據儲存基建提出更高要求。特區政府積極推動 AI 產業,企業需應對海量數據挑戰。本文由 Western Digital 專家 Stefan Mandl 剖析,解釋 HDD 如何憑藉其成本效益、穩定效能及技術創新,在 AI 數據生命週期中扮演關鍵角色,與 SSD 互補,成為支撐香港數碼願景、鞏固國際數據樞紐地位的幕後功臣,為企業決策者提供具前瞻性的儲存策略。

人工智能(AI)正從「技術測試」過渡至「核心應用」,促使亞太區重塑其基礎建設的優先次序,並將 AI 納入數碼政策藍圖。以香港為例,特區政府正積極推動 AI 成為核心產業,期望透過廣泛應用 AI 促進傳統行業轉型。為此政府撥款 10 億港元成立香港人工智能研發院,目標是將 AI 由理論轉化為實踐。順應此趨勢,企業正加緊提升算力及效能需求,以支援 AI 等科技應用。然而在企業積極拓展 AI 發展版圖同時,一項容易忽略但日益關鍵的挑戰逐漸浮現:如何完善數據儲存基建,以承載 AI 所需消耗及產生的海量數據。這對致力於創建國際數據樞紐地位的香港而言尤其重要。

目前關於 AI 與數據的討論多數集中在 GPU 和快閃記憶體(Flash)效能,卻很少人關注數據來源與最終去向。無論是訓練數據集、模型檢查點,還是推理日誌與遙測資料,AI 應用會產生不同類型數據,包括熱數據(hot data)、溫數據(warm data)和冷數據(cold data),因此需要根據各自容量與效能需求,度身訂造儲存解決方案。機械硬碟(HDD)在 AI 基礎建設中發揮關鍵作用,為長期、大容量數據儲存提供穩固基礎,並與高效能、低延遲的固態硬碟(SSD)相輔相成。

 

作者:
Stefan Mandl,中國、亞太地區和日本(APJC)銷售及市場推廣副總裁

 

AI 工作負載並非全是即時運算

隨著大型科技企業在亞洲擴展 AI 應用能力,AI 在數據生命週期每個階段都會消耗並產生大量數據,令數據儲存需求不斷攀升。這些數據量往往高達 PB(Petabyte)級別,為 AI 模型提供所需動力,賦予其即時、精準且大規模的決策能力。數據愈多,AI 模型產出的結果就愈理想。整個過程涵蓋準備數據與導入、模型訓練、推理與提示、推理引擎以及產生新內容,令 AI 高度依賴具備不同特性和功能的儲存解決方案。

效能表現固然關鍵,但容量、韌性、可擴展性等因素也至關重要。當中不少數據屬於「一次寫入、後續讀取」,或在訓練與遙測日誌等特定階段需要高密集寫入。這些數據通常會因為合規需求、模型再訓練、擷取快照等不同需求,需要長期保存,但並非所有數據都需要儲存於高效能的快閃記憶體。事實上,具前瞻性的 AI 平台必須結合兼顧速度與成本效益的儲存方案。

雲端及超大規模服務供應環境高度依賴 HDD

高容量、具成本效益的 HDD 解決方案是現今廣泛大數據平台與數據湖的基石,用於訓練 AI 模型所需的龐大數據集,包括原始資料庫、影片內容、物件儲存庫、系統日誌、元數據和備份等。因此每個 AI 應用都需要智能、可擴展且具成本效益的容量支援,而這正是 HDD 持續展現優勢的領域。

成本效益

在建構 AI 應用儲存環境時,每 TB 成本是企業的關鍵考量之一。大部份 AI 數據屬於溫數據或冷數據,高容量 HDD 是實現低成本、規模化儲存的理想選擇。根據 Western Digital 研究,HDD 每 TB 成本相比快閃記憶體低 6 倍,在大規模、高容量環境中表現尤其突顯。隨著 HDD 架構持續創新,使其能夠提供更高的每 TB 成本效益,而 HDD 容量增加,總體擁有成本(TCO)亦將逐步下降。

效能表現

清晰的性價比指標是影響企業制定儲存決策的關鍵,重點在於選擇最切合實際工作負載需求的解決方案。HDD 在 AI 數據生命週期中多個工作負載場景持續展現穩定效能,於數據儲存成本與效能之間取得平衡。各企業組織可按照實際需求調整所需儲存效能,避免為過剩容量支付額外費用,從而降低 TCO。Western Digital 等供應商提供兼具高效能及成本效益的儲存方案,協助客戶按不同工作負載需求,建立最合適的儲存組合。

技術創新

HDD 技術持續發展,為企業提供更高容量、效能與價值。當中包括磁性記錄系統的創新,例如能源輔助磁性記錄(EAMR)技術、疊瓦式磁記錄(SMR)技術;以及機械結構的突破,例如氦氣封裝設計,使 3.5 吋硬碟可容納多達 11 片碟片,進一步提升儲存密度、效能與能源效率。展望未來,隨著熱輔助磁記錄(HAMR)普及,HDD 容量將再創新高。

儲存不是非此即彼 而是分層共進

AI 應用對儲存的需求廣泛而多樣,HDD 一直是滿足亞太地區長期、大規模儲存需求的主要解決方案,幫助企業以高效、高性價比方式,應對不斷增長的高容量需求。現今的 HDD 並非「傳統技術」,而是數據基礎建設中不斷進化的核心引擎,承載著當前及未來 AI 工作負載所帶來的龐大且不斷增長的儲存需求。

 

Stefan Mandl,中國、亞太地區和日本(APJC)銷售及市場推廣副總裁