Google 近日低調公佈全新 AI 模型「Gemini 2.0 Flash Thinking」,在 Google AI Studio 以「Exp-01-21」代號進行試驗性免費推出。該模型在美國數學邀請賽(AIME)中取得 73.3% 的成績,在 GPQA Diamond 科學基準測試中更達到 74.2% 的分數,顯著超越先前的 AI 模型表現。
技術突破挑戰 OpenAI
這款新模型最令人矚目的特點是其能夠處理多達一百萬個字符,是 OpenAI o1 Pro 模型處理量的五倍,同時還保持較快的回應速度。Google DeepMind 總裁 Demis Hassabis 在 X.com 上表示:「從 AlphaGo 開始,我們在規劃系統方面已耕耘十多年,很高興看到這些理念與最先進的基礎模型完美結合。」
Gemini 2.0 Flash Thinking 具備原生程式碼執行功能,開發者可直接在系統內運行和測試程式碼。更重要的是,模型能夠展示其推理過程,使用者可以更容易理解和驗證其結論。在測試期間,Google 提供有限額度的免費使用權限,這項決策可能吸引正在尋找 OpenAI 替代方案的開發者和企業。
免費推出衝擊市場
Google 選擇在測試期間免費提供 Gemini 2.0 Flash Thinking(儘管有使用限制),這一決策可能會吸引那些正在尋找 OpenAI 月費 200 美元訂閱服務替代方案的開發者和企業。這種策略不僅體現了 Google 在 AI 市場的進取性,也為企業提供了更多選擇。
Gemini 2.0 Flash Thinking 與傳統的「黑盒」模型不同,新模型能夠展示其推理過程,使用戶更容易理解和驗證其結論。這一特性對於需要可解釋 AI 決策的企業來說極具吸引力。
其原生代碼執行能力對企業而言也相當重要。開發者可以直接在系統內運行和測試代碼,這大大提高了開發效率,為研究和商業應用提供了更大的可能性。此外免費推出雖然有一定限制,仍然為企業提供了充分的評估機會,有助於企業在選擇 AI 方案時做出更明智的決策。
競爭對手反應值得關注
AI 方案的競爭正在從純粹的性能比拚轉向更全面的價值主張。Google 這次的更新不僅展示了技術實力,更強調了可及性和實用性。這種轉變反映了 AI 產業的成熟,從追求極限性能轉向解決實際應用問題。現時 OpenAI 等對手都正在積極開發類似的「推理」模型,他們面對 Google 新模型的推出會而怎樣的新技術來回應,則仍然值得關注。
來源:VentureBeat