HUMAINE Archives - UNWIRE.PRO

Google 旗下 Gemini 3 Pro 人工智能模型在由牛津大學研究人員創立的獨立研究機構 Prolific 進行的 HUMAINE 基準測試中取得突破，信任評分由上代 Gemini 2.5 Pro 的 16% 急升至 69%，創下該機構歷來最高分。不同於傳統學術基準測試，HUMAINE 採用 26,000 名真實用戶進行盲測，評估模型在信任度、安全性、適應性及溝通風格等實際應用層面表現。測試結果對企業部署 AI 具重大參考價值，因反映真實用戶體驗而非單純技術指標，助企業按不同用戶群體和應用場景選擇最合適 AI 模型。

HUMAINE

Gemini 3 信任評分大提升 牛津研究機構獨立測試揭示 AI 模型評估新標準

Gemini 3 信任評分大提升　牛津研究機構獨立測試揭示 AI 模型評估新標準