以適合的基礎設施加快 AI 項目(二)

上篇,我們談到在企業中實施 AI 解決方案就像爬梯子一樣,獨自攀登的風險很高。而合適的、人工智能就緒的基礎設施 (AI-ready Infrastructure) ,可助機構快速地開始攀爬 AI 梯子,降低風險。

讓我們來看看企業可如何透過在上述基礎設施上搭配 AI 軟件平台,加快 AI 之旅的每一步。(註:以下會以運行在 IBM Power 系統的 Watson Machine Learning Accelerator 作案例)

  1. 啟動運行

首先,企業需留意的是,AI 軟件平台方案是否在出廠時已預先加載最普遍的深度學習框架,包括所有已經預編譯、可隨時部署而且必需的依賴項和文件,從而大幅減少啟動及運行的時間。這點很重要。

  1. 準備數據

在使用數據的過程中,數據準備是不可或缺的第一步。然而,這個程序往往會耗費大量時間。缺乏這方面知識及資源的企業應利用專為 Clicker 類型(即缺乏編碼知識)的數據科學家設計的基礎設施。理想的 AI 軟件平台方案務必要能夠呈現易於使用的數據準備介面,並內置自動數據標記及數據正則化功能,因此,即使數據科學家以外的人員也可以幫助準備數據。

簡單而言,業務線用戶可以建立基本模型,甚至可以將其轉化成無需技術技能的 RESTful API。這意味著更多機構裡的員工可以參與整個過程,從而使整個部署更有可能成功。

  1. 建設和訓練模型

一般來說,建設和訓練 AI 模型是實現 AI 價值過程中最耗時及重複的任務。視乎不同的基礎設施,要產生準確的結果可能需要數天,數週甚至數月。

有關的 AI 軟件平台及硬件配備必需能幫助企業減少建設和訓練模型的時間。透過結合使用這些伺服器與為擴展這些框架而建設的軟件(如一些分佈式深度學習庫(Distributed Deep Learning Library)和大型模型支援(Large Model Support)),您可以需要更少伺服器,且更快地完成模型建設和培訓。

  1. 微調和部署

您需要調整模型,以進一步提升準確性。但調整模型是另一項複雜耗時的任務,亦需要數據科學技能。

調整為何如此具挑戰性?筆者認為,部分原因是數據科學家首先必須確定應該調整哪些超參數(hyperparameters)。故此,理想的 AI 軟件平台及硬件配備,需要能提供自動調整功能,從而幫助數據科學家在正確的超參數上進行調整,能夠產生最大影響的數據。

筆者喜歡把這功能想像成汽車的變速器。如果筆者是初級的駕駛者(如初級數據科學家),這功能讓筆者可以安全地駕駛我的汽車。如果筆者是專業調整人員,可以選擇以任何方式駕駛這輛「汽車」。

  1. 保持準確性

如何一直保持模型的準確性?您可以加載更多數據,並從數據準備到微調和部署,再次完成整個過程。這是一個連續的迭代循環。加快 AI 旅程中的每一步,可以幫助您更快地進行迭代,從而更好地維護和提高模型的準確性。

踏出下一步

對於許多機構而言,AI 之旅可能會非常緩慢。但是,若企業能物色到理想的 AI 軟件平台及硬件配備,就可以大大縮短 AI 計劃發揮其價值所需的時間。功欲善其事,必先利其器。下次當您打算攀登 AI 梯子時,就需要先把基礎設施這一個環節做好。

 

撰文:IBM 香港系統部總經理許旭煦