AI 研究公司 Anthropic 推出最新小型語言模型 Claude Haiku 4.5,其編碼效能媲美頂尖模型,處理速度更快,成本卻大幅降低 67%。這項技術突破將重塑企業 AI 應用的成本結構,尤其在客戶服務、即時助理及程式編寫等場景。本文深入分析其技術、對企業部署策略的影響,以及 AI 產業如何進入高效能、低成本的新時代。
Samsung 推出企業級 AI 生產力評估平台 TrueBench,旨在解決傳統基準測試的不足。此平台專為真實工作環境設計,支援 12 種語言及多種企業應用場景,為決策者提供準確的大型語言模型(LLM)生產力衡量標準。TrueBench 的出現,不僅有助企業更精準地評估 AI 投資回報,也標誌著 AI 評估正從技術指標轉向實際商業成果,為企業在 AI 時代搶佔先機提供關鍵工具。