Google 正式公佈全新 AI 模型 Gemini 號稱超越 GPT-4V

在今年的 AI 模型競賽之中，Google 雖然向來也是科技界的巨頭，不過之前推出 Bard 的時候卻給人老貓燒鬚的感覺，直到最近終於推出目前為止最強勁的 LLM「Gemini」，號稱可以在多個方面超越 OpenAI 的 GPT-4V。

Google 新推出的 Gemini 大型語言模型 (LLM) 支援多模態分析，可以同時無縫理解文字、程式碼、聲音、圖片、影片等內容，而且在多項 AI 基準測試之中，表現都超越 GPT-4V，更是首個在大規模多任務語言理解 (MMLU) 基準測試之中表現超越 90% 的 LLM，相當不簡單。

Gemini 將會分為三個版本，分別是擁有完整強大功能的 Ultra、提供平衡表現的 Pro 以及可以部署在手機等較低效能裝置上運作的 Nano。Gemini 最初將會透過 Google Cloud 的 Gemini API 提供，客戶可以將其整合到自己的應用程式之中。同時 Google 的 Bard 聊天機械人也會採用 Gemini 作為核心，提供生成式搜尋體驗 (SGE)。之前曾經有傳聞指 Google 會延遲到明年才推出 Gemini，Google 表示至今才公佈 Gemini 的原因是要對其進行細緻的測試確保安全，尤其是針對高階版本。

而今次 Gemini 用作訓練的是 Google 的 TPU v4 和 v5e，而他們亦同時公佈全新的 TPU v5p，在性能和成本效益上都比上代有更佳的表現，將應用於雲端運算用途，這樣也代表着他們脫離對 Nvidia GPU 晶片的依賴，未來在成本控制上也有更大的自主能力。

來源：Google

Google 正式公佈全新 AI 模型 Gemini 號稱超越 GPT-4V

數碼港成立二十周年累計融資逾 375 億

創新科技 (二)：促進樂齡科技的應用

Google 正式公佈全新 AI 模型 Gemini 號稱超越 GPT-4V

you might also like

Apple Business 免費登場 MDM 零月費、企業電郵自訂網域

揭秘北韓國家級求職詐騙： AI 換臉滲透西方企業 2024 年創收逾 60 億港元

Cursor 新模型被揭以 Kimi K2.5 為基礎 透明度與授權爭議敲響 AI 行業警鐘

人工智能潔淨城市水質：科技賦能監測全球水資源

Canon 辦公室升級整合 AI 檔案技術 藉「One Canon」策略拓展大灣區 B2B 市場

Cursor 新模型被揭以 Kimi K2.5 為基礎　透明度與授權爭議敲響 AI 行業警鐘

Canon 辦公室升級整合 AI 檔案技術藉「One Canon」策略拓展大灣區 B2B 市場