close

雲端潛力巨大已不是什麼新聞。它正在改變我們平常儲存、存取及使用數據的方式,使各個行業及我們生活的各個方面進入創新時代。在商業層面上,雲計算亦帶來巨大商業利益,不管是初創企業還是跨國企業,雲計算均可助降低資本開支與營運開支成本,並將 IT 部門的關注重心從基礎設施轉移到業務上。

cloud

 

不過對很多企業來說,雲端只是個「即插即用」的基礎設施。企業為降低成本並方便員工彈性使用,而將應用程式放在雲端。在此過程中,企業主要擔心的問題是能否確保應用程式可隨時使用。部分應用程式與雲端是完美搭檔,例如網絡服務、可擴展的 NoSQL 堆棧(如MongoDB)以及無狀態應用程式等。這些應用協調性強,幾乎不需要保養,還能夠應對故障。不過很多企業依賴一些並不適應雲端的應用,這些應用不適應自然擴展,出現故障之後亦無法恢復。隨著雲端使用率的上升,IT 部門投入愈來愈多時間和成本改進這些應用,將其納入雲端服務平台,但是這些應用依然缺乏應對故障事件的能力。

雖然 OpenStack 上有可以預測故障的監控解決方案,不過這些解決方案針對的都是特定的問題,而且多是發出警告,不會回應可能出現的問題。對企業來說,這是不夠的。任何層面都可能出現問題,包括基礎設施、客戶操作系統、應用程式等。如果一個應用程式做不到失效備援,任何層面的故障都會導致應用運行中斷,而企業就會損失時間與金錢。我們已經與 Intel 及 Mirantis 攜手,努力打造一個可以嵌入 OpenStack 的平台,從而在本機沒有失效備援的情況下降低應用程式承受的壓力與風險。

雲端面臨的一個主要挑戰是透過系統不斷變化的負荷量,來對正在使用的硬件實施中央監控。只有做到這點,才能利用現有硬件的力量來使雲端基礎設施的效率最大化,並確保雲端隨時可以使用。今年的 OpenStack 峰會上,我們展出一個平台,令 OpenStack 用戶能夠監控並自動操作糾錯措施,從而使他們的雲端服務平台無論是在本機還是在其他電腦上,均以最佳性能運轉。

根據這解決方案,我們為自己設立了目標,使企業可以同時監控主要指標,進行預測性故障分析,並自動修復。為了實現這一目標,我們採用 Zabbix 從電腦中提取監控數據,設置觸發機制,並使用 Nova 調度程式來確定新的虛擬存儲機位置。藉此,我們就可以監控從計算節點崩潰到服務器的熱足跡再到性能下降等一切現象,並自動回應。企業可以設置規則,從而在無法再取得數據之前自動處理任何層面的故障,從為過熱的服務器降低負載量,到從崩潰的節點中完整卸載工作量,這些問題都可以得到解決。所有這些功能都可以在多個框架下大規模進行。

透過這項功能,我們希望可以幫助企業降低將非本地的新應用放入雲端所需的成本與時間,提升人們對雲端應用可靠度的信心,並帶動更多人使用 OpenStack 這一靈活、低成本的雲端服務平台。

 

作者:Prateek Goel、Pramod Bhandiwad

Tata Communications 雲軟件開發主管、科技發展總經理

 

Columnist

The author Columnist

Unwire.pro 將定期邀請業界人士、名筆,撰寫有關 IT 行業趨勢的精闢分析文章。歡迎投稿。