Big Data 背後代表的是數據的爆炸性增長,規模猶如宇宙大爆炸,因此有人以數碼宇宙(Digital Universe)來形容大數據的世界。產生 Big Data 的數據來源,包括社交網站、流動平台等,最近再有新成員加入就是數據感應器。儲存系統供應商 EMC 估計,在 2020 年數據將比今天膨脹 10 倍,其中十分一將來自數據感應器。
未來七年數據量將暴增十倍
EMC 發表了第 7 份 EMC 數碼宇宙研究報告,也是目前唯一針對每年的數據增長概況作出量化和預測的研究。今年報告發現無線網絡技術、智能產品和軟件定義企業的冒起,將在急劇增長的數據量中扮演核心角色。物聯網的興起間接令數碼宇宙的數據量,每隔兩年翻一倍,在 2013 至 2020 年之間更激增 10 倍,由 4.4 兆 GB 攀升至 44 兆 GB。
負責是次調查的研究機構 IDC指,現時可連接互聯網的裝置和設備的數量正逼近 2,000 億,當中 7%(140 億)已能連接並透過互聯網溝通。這些已連接的裝置所產生數據量,接近全球數據量的 2%。但 IDC 預計到 2020 年時,連接互聯網的裝置將達 320 億台,並將佔全球數據量的 10%。
物聯網有用數據比例增
物聯網由數十億個日常物件所組成,它們擁有獨特識別器能自動記錄、報告和接收數據,例如安裝在鞋子的數據感應器能記錄你的跑步速度,而安裝在橋上的數據感應器則可監察交通狀況。2013 年數碼宇宙中只有 22% 數據被視為有用數據,而事實上有被用來分析的數據不足 5%。到 2020 年物聯網帶來的數據量增長,35% 以上將被視為有用數據,但是否利用這種數據將取決於企業的決策。
IDC 指這現象將大幅革新企業與顧客互動的模式、簡化業務周期、降低營運成本,並帶來數以億計美金的商機。從另一角度看,隨著企業尋求管理、儲存並保護這麼龐大和多樣化的數據,也為企業帶來了重大挑戰。舉例說 IDC 估計,數碼宇宙內 40% 數據需要一定程度的保護,由提高私隱保障以至數據全面加密,然而只有一半數據(約 20%)受到保護。
新興市場數據增長強勁
報告同時發現,現時數碼宇宙內 60% 數據來自成熟市場,如德國、日本和美國;但到了 2020 年這比例將逆轉,新興市場如巴西、中國、印度、墨西哥和俄羅斯將會是大部分數據的來源。2013 年數碼宇宙內只有少於 20% 與雲端連接,但到了 2020 年,連接雲端的數據將倍增至 40%。
全球可用儲存空間(即未用的byte)的增長速度則比數碼宇宙慢。在 2013 年可用儲存空間可容納數碼宇宙的 33%,到 2020 年能容納的數據少於 15%。幸運的是,全球大部分數據只屬於暫時性的數據(如 Netflix 或 Hulu stream、Xbox ONE 互動遊戲、數碼電視),無需儲存。