業界經常提及大數據(Big Data)這一概念,大數據的用處不止於其收集的龐大的數據量,更重要分析與洞察,不然空有數據而欠缺洞悉的方法和工具也是徒然。而近日 Google Cloud 平台再次推出雲端應用 Cloud Datalab,協助用戶探究、分析和視覺化資料,從而洞悉數據,並能透過簡易的操作,快速高效地製作分析報告。
Datalab 視覺化資料協助洞悉數據
Datalab 雲端服務主要使用 Jupyter notebooks(或稱 IPython)format,允許用戶建立即時代碼及視覺化檔案。Jupyter 在數據科學領域被廣泛採用,並圍繞該技術形成了完整的生態系統,利用這一 Google 新推出的服務,讓用戶能更容易進入數據科學領域。
透過 Cloud Datalab,用戶可以使用 Python,SQL 和 JavaScript 來探究、處理及視覺化 Google BigQuery,Compute Engine 和 Cloud Storage 內的資料數據。再進一步還可以利用這些數據建立數據通道並部署到 Google BigQuery 中,或者建立機器學習模型。
若要視覺化資料數據,用戶可以使用 Google Charting 或 Matplotlib PyPython Library。Google 亦提供詳細的入門教學。Cloud Datalab 還有不少優點,例如其開源特性允許開發者進行複柯或使用 GitHub 的 Pull Requests 功能。
除了 Cloud Datalab,Google 同時也推出 Google Cloud Shell,讓開發者可以在 Google Developers Console 透過命令行存取在 Google Cloud Platform 的運算資源。目前 Cloud Shell 已開放給所有開發者使用,並提供建基於 Compute Engine 的虛擬機器及 5 GB 儲存空間給開發者使用,還可以存取 Google Cloud SDK 和其他開發工具。
Source: TechCrunch Google Cloud Platform