去年 Unwire.pro 採訪 Google I/O 時就報導過,Google 設計了專給機器學習的全新處理器 TPU,早前亦正式公布細節,更宣稱「比 GPU 和 CPU 快 15-30 倍」。對於 Google TPU 的出現,NVIDIA 並不感到是威脅,NVIDIA 全球副總裁、亞太區總裁 Raymond Teh 甚至笑言:歡迎 Google 的加入!
NVIDIA 股價去年因人工智能而大漲 2.2 倍
人工智能和機器學習成為這兩年科技界最炙手可熱的話題,幾乎每篇報導都會提到這兩個名詞,每家科技公司都想在業務中加入人工智能和機器學習概念。不過正如商業世界有一個說法:「在淘金熱時賺最多的不是採金礦的人,而是在旁邊賣鐵鏟的人」,未必每家想從人工智能分一杯羹的人都成功,但提供器材支持他們研究的晶片公司倒是先撈了一票。
事實上,以出產圖像處理器(GPU)知名的 NVIDIA,2016 年就因為人工智能熱潮而股價漲了 2.2 倍,股價從 31.8 美元升至 106.7 美元,漲幅達 228.7%。雖然今年初股價已稍為回落,但在任何一家真的在做人工智能產品的公司賺翻之前,NVIDIA 就已經先賺到笑了。
香港這年開始大談電競,但除了電腦遊戲對 GPU 有需求,其實 Bitcoin 和機器學習也為 GPU 帶來很大需求。不少 Bitcoin 採礦者(真的採礦!)大量利用 GPU 來生產 Bitcoin,而很多研究機器學習和無人駕駛的科技公司都運用 GPU 來處理數據,尤其圖像和影像分析並非單純「計數」,GPU就比傳統電腦處理器(CPU)更適合。
黃仁勳:「NVIDIA 已是一家人工智能運算公司」
雖然顯示卡依然是 NVIDIA 主要業務和收入來源,但 NVIDIA 實際已定位自己是一家「人工智能運算公司」。NVIDIA 創辦人兼行政總裁黃仁勳,去年 9 月在百度大會上曾表示「NVIDIA 已是一家人工智能運算公司」,GPU 的平行運算能力特別適合在深度學習和無人駕駛的領域上,大部分人工智能公司都透過 NVIDIA 的平台來開發自己的業務。
雖然多年來都受制於 Intel 和 Qualcomm 等晶片大廠,但由於正好吹起人工智能的風,在風口上的 NVIDIA 也因此騰雲而起。NVIDIA早在 5、6 年前已開始在深度學習領域研究,2011 年時就跟史丹福大學合作研究,發現只需 12 枚 GPU 的深度學習能力已抵得上當時 2,000 枚 CPU 的運算表現,而這也促成 NVIDIA 大力發展深度學習領域。
NVIDIA 推出專為深度學習設計的 Tesla P100 GPU 及以該 GPU 運算的深度學習超級電腦 NVIDIA DGX-1,更宣稱其效能相當於「250 台傳統採用Intel晶片的伺服器」。據報導 Tesla 已採用NVIDIA DGX-1 來負責其 OpenAI 人工智能項目,而 IBM 早前亦宣布會在其雲端平台提供 Tesla P100 GPU 的配置,藉由透過 NVIDIA GPU 與伺服器的 CPU 平行運算來提高性能。
Google TPU 宣稱比 GPU 和 CPU 快 30 倍
IBM 新一代 Power 系統 Minsky 支援兩枚 Power 處理器和四枚 NVIDIA Tesla 100 GPU,並全部以 NVLink 技術互連。NVLink 是 NVIDIA 研發用於連接多張 GPU 平行運算時作數據交換的技術,速度達 80GBps,比 Intel 的 PCI Express 快了四倍,也因此能用一台 Minsky 來取代多台 X86 電腦組成的叢集系統。
事實上除了 IBM 外,其他雲端運算平台都與 NVIDIA 合作提供 NVIDIA GPU 的配置,如 Microsoft Azure、Google 和 Amazon 都有類似合作,而中國的阿里巴巴和騰訊也有類似協議,將 NVIDIA GPU 帶到旗下的雲端平台。
不過 Google 這公司由於運算規模太大,其實早就在不同層面以自家的技術研究和組裝數據中心設備,而在人工智能和機器學習愈來愈熱的今天,研發自己的機器學習處理器 Tensor Processing Unit(TPU)就很合邏輯。Google 內部已使用 TPU 兩年,並應用在不同領域包括:Google 影像搜尋、Google 照片、Google 雲視覺 API、Google 翻譯及 AlphaGo 圍棋系統。
NVIDIA 亞太總裁:不介意 Google 一齊玩
Unwire.pro 去年就報導過 Google 自家研發了機器學習的 TPU 處理器,宣稱能比 Intel 的 CPU 和 NVIDIA 的 GPU 更高效地運行深度學習平台 TensorFlow。早前 Google 就公布了更多有關 TPU 的細節,宣稱比目前的 GPU 和 CPU 要快 15 到 30 倍、效能功耗比也高 30 倍,不過就被質疑拿來的比較對象並非市場效能最好的,並不公允。
Google 公開的是 2015 年時的測試數據,比較對象是 Intel Haswell E5-2699 v3 CPU伺服器處理器和 NVIDIA K80 GPU 繪圖處理器,當時的結果是採用 TPU 的運作速度提高 15 到 30 倍,效能提高了 30 到 80 倍。不過此報告一出就惹來 NVIDIA 創辦人黃仁勳的強烈不滿,他拿出 NVIDIA 最新一代的 Pascal P40 比較,指 P40 擁有 10 倍於 TPU 的頻寬,並不輸今天的 TPU。
不過 NVIDIA 倒不至於太擔心,畢竟 TPU 只是 Google 自家採用的處理器,並非要踩入這市場競爭。早前 Unwire.pro 訪問 NVIDIA 全球副總裁、亞太區總裁 Raymond Teh (下圖右)時,他就笑言「不介意一齊玩」,認為不可能只有一家 NVIDIA 能做這生意,有競爭者代表 NVIDIA 發展人工智能領域的方向無錯,而且 TPU 只針對執行 Tensorflow 負載,並不能跟 GPU放在一起比較。
Intel 收購機器學習初創公司 Nervana
事實上,在訪問時 IBM 就剛宣布把 NVIDIA Tesla P100 圖像處理器帶到 IBM Cloud 上提供給客戶,雙方亦會加強在 OpenPOWER 基金會的合作,NVIDIA 在這領域目前幾乎沒有有力的競爭對手。不過 NVIDIA 也不能太放心,畢竟有像 Google 相同思路的公司絕對不少,而且不同晶片廠也極欲追上 Intel 和 NVIDIA 而不斷努力。
例如百度就宣稱自己是第一家採用 ARM 架構來搭建大型數據中心的公司,並指其「百度大腦」自 2012 年起已開始採用 FPGA 設計人工智能訂製晶片。而 Amazon 亦在 2014 年從 ARM 架構伺服器晶片研發企業 Calxeda 挖走許多工程師,相信亦已在內部研究有關技術。
傳統伺服器處理器也不會坐以待斃,由於 GPU 在人工智能領域的重要性和需求均日增,Intel 不想市場被蠶食就不得不尋找對策。Intel 去年就收購了機器學習初創公司 Nervana Systems,研究開發人工智能 Nervana 平台,並預告在 2020 年前讓 Nervana 訓練深度學習模型時間比現行 GPU 縮短 100 倍。Intel 首款人工智能專用處理器 Lake Crest 亦將在 2017 年上半年推出。
總結:人工智能晶片競賽早已悄悄展開
至於另一大廠 Qualcomm 亦不落人後,Qualcomm 全球副總裁、創投董事總經理沈勁日前在北京就表示不會缺席機器學習這領域,除了以 470 億美元收購荷蘭汽車晶片公司 NXP 深耕自動駕駛領域,Facebook 亦在剛過去的 F8 大會上提到與 Qualcomm合作研究人工智能,利用 Snapdragon 於機器學習和視像分析之上。
有趣的是,本來作為新玩家進場的 Google,最近卻傳出 TPU 開發團隊 10 位成員中已有 8 位被初創公司 Groq 挖角,目標是做「下一代的人工智能晶片」。據 CNBC 指公司背後有風投基金支持,當連風投也願意涉足「晶片」這種研發時間長、風險高的領域,正好反映人工智能晶片產業很有前景,而 Google 這樣的大玩家也未必有優勢。
目前人工智能運算平台雖然仍是 Intel 和 NVIDIA 最具優勢,但相信隨著技術發展,幾家雲端和人工智能科技公司都會有自己的技術,要維持領導地位並不容易。尤其像 Google 這麼大規模數據中心的公司,更有很大誘因全面自行研發生產,當每一家公司都在談論人工智能時,背後的人工智能晶片競賽早已悄悄展開。
作者:Boris Lee
Unwire.pro 資深編輯。在企業 IT 科技報道範疇有十多年經驗。