Benchmark Archives - UNWIRE.PRO

close

Sony AI 推出全球首個道德數據集　揭示主流 AI 模型全面存在歧視問題

by Antony Shum on 6 十一月, 2025 人工智能 Benchmark Ethics Sony AI

Sony AI 於 11 月 5 日正式發佈 Fair Human-Centric Image Benchmark (FHIBE) 數據集，FHIBE 收錄超過 10,318 張經同意授權的影像，涵蓋來自 81 個國家及地區共 1,981 名受試者，成為首個公開、全球多元化且基於同意機制的電腦視覺公平性評估數據集。

AI 投資回報如何衡量？ Samsung TrueBench 以真實場景評估商業價值

by Serena Wong on 26 九月, 2025 人工智能 ai Benchmark LLM samsung TrueBench

Samsung 推出企業級 AI 生產力評估平台 TrueBench，旨在解決傳統基準測試的不足。此平台專為真實工作環境設計，支援 12 種語言及多種企業應用場景，為決策者提供準確的大型語言模型（LLM）生產力衡量標準。TrueBench 的出現，不僅有助企業更精準地評估 AI 投資回報，也標誌著 AI 評估正從技術指標轉向實際商業成果，為企業在 AI 時代搶佔先機提供關鍵工具。