人工智能 AI 投資回報如何衡量? Samsung TrueBench 以真實場景評估商業價值 by Serena Wong on 26 九月, 2025 人工智能 ai Benchmark LLM samsung TrueBench Samsung 推出企業級 AI 生產力評估平台 TrueBench,旨在解決傳統基準測試的不足。此平台專為真實工作環境設計,支援 12 種語言及多種企業應用場景,為決策者提供準確的大型語言模型(LLM)生產力衡量標準。TrueBench 的出現,不僅有助企業更精準地評估 AI 投資回報,也標誌著 AI 評估正從技術指標轉向實際商業成果,為企業在 AI 時代搶佔先機提供關鍵工具。 read more
人工智能 AI 網絡爬蟲採集數據越發嚴重 機構網站不勝負荷營運困難 by Antony Shum on 17 六月, 2025 人工智能 AI bot LLM 大型語言模型需要使用大量數據訓練,在 AI 潮流下,為 AI 公司收集內容的爬蟲機械人激增,有報導指,情況已經惡化至全球 read more
人工智能 研究發現 AI 醫療診斷仍有缺陷 使用 LLM 進行問診準確率僅 34.5% by Antony Shum on 16 六月, 2025 人工智能 healthcare LLM 大型語言模型(LLM)在醫學考試中表現優異的報道近年不絕於耳。GPT-4 在 2023 年已能正確回答美國醫學執照考試題 read more
人工智能 Sam Altman:ChatGPT Pro 收費每月 200 美元仍然蝕錢 by Antony Shum on 6 一月, 2025 人工智能 ChatGPT LLM OpenAI OpenAI 之前推出全新 ChatGPT Pro 月費計劃,其 200 美元收費引起了不少討論。不過總裁 Sam Al read more
人工智能 中國開發開源模型 DeepSeek V3 自稱 GPT-4 惹爭議 by Antony Shum on 30 十二月, 2024 人工智能 DeepSeek V3 LLM 中國實驗室 DeepSeek 早前發佈的新一代語言模型 DeepSeek V3 在多項基準測試中表現突出,不過有測試發現 read more
人工智能 Google 推出 Gemini 2.0 Flash AI 模型 提升回應準確度等多個範疇 by Antony Shum on 12 十二月, 2024 人工智能 Gemini Gemini 2.0 google LLM Google 的 Gemini AI 模型是現在他們相當着重開發的核心模型,最近他們終於公佈了 Gemini 2.0 F read more
人工智能 Exo Labs 成功利用 Apple M4 裝置運作大型語言模型 by Antony Shum on 14 十一月, 2024 人工智能 ai Exo Labs LLM 除了大型雲端運算平台,在本機執行大型語言模型的需要也日漸增加,不過在消費者級數的產品上要順暢地執行這些模型有一定難度。最 read more
人工智能 Hugging Face 針對邊緣 AI 應用推出全新 SmolLM2 模型 by Antony Shum on 3 十一月, 2024 人工智能 Hugging Face LLM 在雲端運作的重量級 AI 模型固然強勁,但在日常使用中,可以在終端裝置例如手機或電腦上快速作出回應的輕量級 AI 模型同 read more
人工智能 消息指 OpenAI 將於 12 月公佈下一代 AI 模型 by Antony Shum on 25 十月, 2024 人工智能 ai LLM OpenAI OpenAI 自從推出 GPT-4 系列模型之後,何時會推出下一代的 GPT-5 模型一直收到關注,最近有消息指 Ope read more
人工智能 Meta 首席 AI 科學家楊立昆認為目前的 LLM 不能發展成 AGI by Antony Shum on 14 十月, 2024 人工智能 AGI ai LLM Meta Meta 首席 AI 科學家楊立昆 (Yann LeCun) 一直對於業界對於通用人工智能 (AGI) 的恐懼不以為然, read more