Google 近日再次為 Google Cloud 平台加入大數據管理(Big Data)相關的新服務。新服務名為 Google Cloud Dataproc,目前已經推出 Beta 版試行,主要用於管理 Spark 數據處理或在虛擬機器上構建 Hadoop Framework,讓使用者在 Google 平台上更方便地管理、協調數據,類似於 Cloud Dataflow 的管理模式。
效能價格優勝同類服務 Dataproc 簡化部署管理大數據
Google Cloud 平台的產品管理總監 Greg DeMichillie 表示,Dataproc 用戶可以在 90 秒內快速設立 Hadoop 叢集,速度明顯高於其他同類型服務,而 Dataproc 提供低廉的收費方式,每個虛擬 CPU 每小時僅收取 1 美分費用,還可以加入 Unwire.Pro 之前亦報導過的 preemptible instances 平台使用,進一步降低成本。可以說 Dataproc 服務不論效能和價格上都比同類服務優勝。
因為 Dataproc 能如此快速地建立叢集,意味著用戶可隨時設立專案叢集,而 Google 將會為用戶妥善管理。目前 Dataproc 已支援以 Spark 1.5 及 Hadoop 2.7.1 為基礎建立的叢集。
Google 產品經理 James Malone 亦補充,Hadoop 或 Spark 雖然是常用作大數據分析工具,其功能亦十分出色,但如何部署、使用和管理均是相當複雜的工作,而且需要投入不少資源,對中小型企業而言負擔沉重。而新推出的 Cloud Dataproc 正是為簡化 Hadoop 和 Spark 服務而生,其自動化管理讓用戶能專注於資料分析上,免去了部署和管理的繁複工作,而低廉的成本讓中小企業亦能受益。
此外 Dataproc 亦可整合 Google Cloud 平台上的其他服務使用,包括 BigQuery,Cloud Storage,Cloud Bigtable,Cloud Logging 和 Cloud Monitoring,進一步強化 Dataproc 的功能,亦能讓用戶按需要組合出各種解決方案。
Source: TechCrunch