close

HUMAINE

人工智能

Gemini 3 信任評分大提升 牛津研究機構獨立測試揭示 AI 模型評估新標準

Google 旗下 Gemini 3 Pro 人工智能模型在由牛津大學研究人員創立的獨立研究機構 Prolific 進行的 HUMAINE 基準測試中取得突破,信任評分由上代 Gemini 2.5 Pro 的 16% 急升至 69%,創下該機構歷來最高分。不同於傳統學術基準測試,HUMAINE 採用 26,000 名真實用戶進行盲測,評估模型在信任度、安全性、適應性及溝通風格等實際應用層面表現。測試結果對企業部署 AI 具重大參考價值,因反映真實用戶體驗而非單純技術指標,助企業按不同用戶群體和應用場景選擇最合適 AI 模型。
read more