助企業探索數據及機器學習 Cloudera 推數據科學工作台測試版

Cloudera 宣佈推出 Cloudera 數據科學工作台(Data Science Workbench)測試版,該項產品是 Cloudera 企業版(Cloudera Enterprise)平台的全新數據科學自助工具。他們表示,該工作台以上年收購的數據科學初創企業Sense.io 的技術為基礎,讓數據科學家使用偏好的開源語言(包括R、Python 和 Scala)及集合 Apache Spark 和Apache Hadoop 加密企業平台上的資料庫,有效促進分析平台從探索至生產過程的速度。

 

Cloudera 產品高級副總裁 Charles Zedlewski 表示:「Cloudera 將會把今年的工作重點集中於改善數據科學和工程團隊的用戶體驗,特別是希望透過 Spark 進行數據處理及機器學習的用戶。我們相信 Sense.io 及其團隊將能進一步鞏固Cloudera的基礎,使我們的數據科學工作台能為客戶提供更具規模的自助式數據科學支援。」

 

Cloudera 透露,該數據科學工作台具備以下特點:

對於數據科學家:

  • 支援 R、Python 和 Scala等開源語言,配合自訂的資料庫及框架,透過網頁瀏覽器直接使用
  • 可透過 Spark 和 Impala 直接獲取 Hadoop 開源框架上的數據
  • 可與團隊分享,從而讓研究可重複使用

對於科技專業人士:

  • 讓數據科學團隊自由選擇工作方式和時間
  • 能兼容 out-of-the-box 的個人化的服務,並透過 Hadoop、Kerberos 開源框架,實現更高的安全性
  • 可於桌面電腦裝置或雲端使用,讓用戶隨時隨地輕鬆管理數據

Cloudera 認為,隨著開放數據科學跨越了廣泛的 Python 和 R 生態系統,並拓展至 Tensorflow、Microsoft Cognitive Toolkit、MXnet 和 BigDL 等,越來越多的數據被儲存在 Hadoop 上,而數據科學團隊正在努力尋求利用這些不同工具的方法,因此 Cloudera 數據科學工作台能為用戶提供一個安全可靠的環境,並給他們帶來最新的開源創新技術。