在今年的 AI 模型競賽之中,Google 雖然向來也是科技界的巨頭,不過之前推出 Bard 的時候卻給人老貓燒鬚的感覺,直到最近終於推出目前為止最強勁的 LLM「Gemini」,號稱可以在多個方面超越 OpenAI 的 GPT-4V。
Google 新推出的 Gemini 大型語言模型 (LLM) 支援多模態分析,可以同時無縫理解文字、程式碼、聲音、圖片、影片等內容,而且在多項 AI 基準測試之中,表現都超越 GPT-4V,更是首個在大規模多任務語言理解 (MMLU) 基準測試之中表現超越 90% 的 LLM,相當不簡單。
Gemini 將會分為三個版本,分別是擁有完整強大功能的 Ultra、提供平衡表現的 Pro 以及可以部署在手機等較低效能裝置上運作的 Nano。Gemini 最初將會透過 Google Cloud 的 Gemini API 提供,客戶可以將其整合到自己的應用程式之中。同時 Google 的 Bard 聊天機械人也會採用 Gemini 作為核心,提供生成式搜尋體驗 (SGE)。之前曾經有傳聞指 Google 會延遲到明年才推出 Gemini,Google 表示至今才公佈 Gemini 的原因是要對其進行細緻的測試確保安全,尤其是針對高階版本。
而今次 Gemini 用作訓練的是 Google 的 TPU v4 和 v5e,而他們亦同時公佈全新的 TPU v5p,在性能和成本效益上都比上代有更佳的表現,將應用於雲端運算用途,這樣也代表着他們脫離對 Nvidia GPU 晶片的依賴,未來在成本控制上也有更大的自主能力。
來源:Google