Google 近來在多模態 AI 模型開發方面投放了不少資源,之前公佈的 Gemini 也已經高速進化,最近宣佈推出 Gemini 1.5 版本,其中的 Pro 版本模型據稱效能大幅提升,甚至與 Gemini Ultra 1.0 版本相媲美。
今次 Google 推出的 Gemini 1.5 系列模型是之前 1.0 版本的強化版本,Google DeepMind 總裁 Demis Hassabis 強調,它採用了 Mixture-of-Experts(MoE)架構,從一開始就整合了各種數據模式,包括文字、形象和音訊,避免了在後期階段合併不同模型的複雜性,使用更少運算資源同時可以提升效能。據 Google 表示,系列中首個版本 Gemini 1.5 Pro 的效能與 Gemini 1.0 Ultra 在不同基準測試中相比,都有同等甚至更佳的表現。
Gemini 1.5 的強大之處還在於它能夠處理大量輸入,包括文字、程式碼、圖像、音訊和影片,從而能夠回應自然語言查詢並生成不同數據模式的內容,其處理多達 1,000 萬個標記的能力也非常出色,超越 Claude 2.1 和 GPT-4 Turbo 等其他模型。這個表現對於實際數據處理應用可以有相當實用的效果,例如能夠從大量數據集(如阿波羅 11 號飛行記錄等)中提取特定資訊,或者準確回應有關經典影片的複雜問題等等。目前 Gemini 1.5 Pro 仍然是在早期測試階段,相信不久之後就會加入到各種 Google 產品之中。