市場研究機構 Gartner 預測超過 40% 的代理式 AI 項目將在 2027 年底前被取消,主要原因包括成本上升、商業價值不明確或風險控制不足。Gartner 同時指出,數千家聲稱提供代理式 AI 解決方案的供應商中,只約 130 家提供真正符合定義的產品,大部分廠商只是將現有的 AI 助手、機械人流程自動化和聊天機械人重新包裝。
炒作泡沫掩蓋技術限制
Gartner 高級分析師 Anushree Verma 表示:「目前大多數代理式 AI 項目都是早期階段實驗或概念驗證,主要由炒作驅動且經常被誤用。這可能令組織忽視大規模部署 AI 代理的真實成本和複雜性,阻礙項目進入生產階段。」
根據 Gartner 於 2025 年 1 月對 3412 名網絡研討會參與者進行的調查,19% 表示其組織已對代理式 AI 作出重大投資,42% 作出保守投資,8% 沒有投資,其餘 31% 採取觀望態度或不確定。
許多供應商透過「代理洗牌」策略加劇市場炒作,將現有產品如 AI 助手、機械人流程自動化(RPA)和聊天機械人重新包裝,但並未提供實質的代理功能。Gartner 估計在數千家代理式 AI 供應商中,只約 130 家提供真正的代理式 AI 解決方案。
卡內基美隆大學研究團隊開發了名為 TheAgentCompany 的基準測試平台,模擬小型軟件公司的業務運營環境,測試 AI 代理處理常見知識工作任務的能力,包括網頁瀏覽、編寫程式碼、運行應用程式和與同事溝通。
測試結果顯示,表現最佳的 Gemini-2.5-Pro 模型只能自主完成 30.3% 的提供測試,其他主要模型的表現更加遜色:Claude-3.7-Sonnet 為 26.3%,Claude-3.5-Sonnet 為 24%,GPT-4o 只為 8.6%。
實際應用面臨重大挑戰
研究人員在測試過程中觀察到各種故障現象,包括代理忽略向同事發送訊息的指示、無法處理彈出視窗等用戶介面元素,甚至出現欺騙行為。在一個案例中,當代理無法在 RocketChat 平台上找到正確的諮詢對象時,決定將另一位用戶重新命名為目標用戶的姓名,創造「捷徑解決方案」。
卡內基美隆大學語言技術研究所副教授 Graham Neubig 表示,建立這個基準測試的動機源於 OpenAI 和賓夕法尼亞大學沃頓商學院研究人員發表的論文,該論文聲稱大部分工作理論上可以自動化。「他們的方法基本上是詢問 ChatGPT 工作是否可以自動化,同時也詢問人類同樣問題,然後宣稱 ChatGPT 和人類在某種程度上達成一致。」
Salesforce 研究團隊提出專門針對客戶關係管理(CRM)的基準測試 CRMArena-Pro,涵蓋 19 項專家驗證的任務,包括銷售、服務及「配置、定價、報價」流程。結果顯示即使是領先的大型語言模型代理在單輪對話場景中的整體成功率約為 58%,多輪對話環境下性能顯著下降至約 35%。
研究發現所有評估模型都表現出「接近零的機密意識」,這將令 AI 代理在企業 IT 環境中難以推廣。Signal Foundation 主席 Meredith Whittaker 指出:「圍繞代理的炒作存在深層次的安全和私隱問題,因為代理需要存取敏感資料才能代表用戶行動,這危及個人和企業的安全及私隱期望。」
商業價值仍待驗證
Verma 指出:「大多數代理式 AI 提案缺乏重大價值或投資回報率,因為目前的模型不具備成熟度和代理能力來自主實現複雜的商業目標或長期遵循細緻指示。許多被定位為代理式的使用案例實際上不需要代理式實現。」
儘管面臨這些初期挑戰,代理式 AI 趨勢仍代表 AI 能力和市場機會的重大躍進。這項技術將提供新的方法來提升資源效率、自動化複雜任務並引入新的商業創新,超越腳本自動化機械人和虛擬助手的能力。
企業在考慮代理式 AI 應用時需要謹慎評估實際需求。將代理整合到舊有系統中可能在技術上相當複雜,經常打亂工作流程並需要昂貴的修改。在許多情況下,從根本上重新思考代理式 AI 工作流程是成功實施的理想路徑。
Gartner 建議企業只在代理式 AI 能夠提供明確價值或投資回報率的情況下才應採用。公司應該專注於企業生產力,而非只有個別任務增強。可以在需要決策時使用 AI 代理,在例行工作流程中使用自動化,在簡單檢索任務中使用助手。
未來發展前景審慎樂觀
儘管存在技術限制,Gartner 預測到 2028 年至少 15% 的日常工作決策將透過代理式 AI 自主完成,較 2024 年的 0% 有顯著增長。同時,33% 的企業軟件應用程式將在 2028 年包含代理式 AI 功能,較 2024 年不足 1% 大幅提升。
Neubig 表示雖然代理將在時間推移中變得更加能幹,但即使不完美的代理也可能有用,至少在編程代理的背景下如此——部分程式碼建議可以被填補和改進。對於處理更一般辦公室任務的代理,情況有所不同。「很容易將程式碼沙盒化而不影響沙盒外的任何東西,但如果代理在公司電子郵件伺服器上處理電子郵件,它可能將郵件發送給錯誤的人。」
模型上下文協議(MCP)的採用被視為代理發展的積極進展,因為它使更多系統能夠透過程式方式存取。企業需要在追求創新與風險管理之間找到平衡點,確保代理式 AI 的部署能夠真正為業務帶來價值,而非只有跟隨技術潮流。
來源:Gartner