Google 9 月 24 日正式發布 Data Commons Model Context Protocol (MCP) Server,讓開發者、數據科學家及 AI 代理程式透過自然語言存取該公司龐大的公共資料庫。這項新工具標誌著 Google 在解決 AI 系統訓練數據質素及幻覺問題上踏出重要一步,開發者現可將經過驗證的真實世界統計資料直接整合至 AI 應用程式。
Data Commons 平台自 2018 年推出以來,一直整理來自政府調查、地方行政數據及聯合國等全球機構的公共數據集。MCP Server 推出後,開發者無需了解複雜的 API 運作或數據模型架構,直接使用簡單的自然語言提示便能查詢這些資料。
Google Data Commons 主管 Prem Ramaswami 接受訪問時表示,Model Context Protocol 讓大型語言模型能夠在適當時機挑選合適數據,無需理解數據建模方式或 API 運作原理。他形容這項技術如同為 AI 應用程式提供 USB-C 連接埠,實現數據源與 AI 系統之間的標準化連接。
非牟利組織 ONE Campaign 成為首批採用這項技術的機構。該組織專注改善非洲經濟機會及公共衛生,與 Google 合作推出 One Data Agent 工具。這個 AI 工具利用 MCP Server 以自然語言呈現數千萬個財務及健康數據點,用戶能在數秒內搜尋大量健康融資數據。
ONE Campaign 早前向 Google Data Commons 團隊展示其特製 MCP 伺服器的原型實作。Ramaswami 透露,這次交流成為團隊在 5 月份建立專用 MCP Server 的轉捩點。組織現可快速搜尋數千萬個健康融資數據點,大幅提升政策制定者存取關鍵發展數據的效率。
AI 幻覺問題促使業界尋求解決方案 高質素數據成關鍵
AI 系統經常在雜亂且未經驗證的網絡數據上進行訓練,再加上模型在缺乏資料來源時會「填補空白」的傾向,導致產生幻覺現象。企業若要針對特定用途微調 AI 系統,往往需要存取大型高質素數據集。
OpenAI 研究人員 9 月發表的研究證明,即使訓練數據完美無缺,大型語言模型的幻覺現象在數學上仍是無可避免。研究顯示生成錯誤率至少是 IIV (Is-It-Valid) 錯誤分類率的兩倍,證明 AI 系統無論技術如何改進都會出現一定比例的錯誤。
麻省理工學院專家指出,AI 幻覺源於多個因素,包括訓練數據不足或存在偏見、模型從變換器錯誤解碼,或無法識別任何可辨識模式。當模型架構缺乏深度或容量時,往往無法掌握語言的細微差別,產生過度簡化或過於籠統的輸出。
數據質素問題尤其嚴重。訓練數據不完整、過時或存在偏見會直接導致幻覺。模型在專門領域缺乏全面或準確資料時,難以產生可靠結果,經常以錯誤或虛構內容填補空白。IBM 研究顯示,確保 AI 模型在多樣化、平衡且結構良好的數據上訓練,有助減少輸出偏差並產生更有效結果。
業界正採用多種策略緩解幻覺問題。檢索增強生成 (RAG) 架構讓生成式 AI 工具從可信來源檢索相關資料後才生成輸出。研究顯示 RAG 能提高事實準確性及用戶對 AI 生成答案的信任。知識圖譜作為 LLM 的錨點,透過提供事實資訊基礎減少幻覺風險。
MCP 成業界標準 主要科技公司紛紛支援
Model Context Protocol 由 Anthropic 在 2024 年 11 月首次推出,作為連接 AI 助手與數據系統的開放標準。這個協議提供通用介面,用於讀取檔案、執行功能及處理上下文提示,解決資訊孤島及傳統系統的挑戰。
MCP 推出前,開發者需要為每個數據源或工具建立特製連接器,Anthropic 形容這造成「N×M」數據整合問題。隨著 AI 應用程式數量 (N) 及工具和數據源種類 (M) 增加,為每個組合創建特製整合的複雜性變得難以管理。
協議推出後迅速獲得業界採納。OpenAI 行政總裁 Sam Altman 3 月 26 日在 X 平台宣布,OpenAI 將在其產品中加入 MCP 支援,包括 ChatGPT 桌面應用程式、Agents SDK 及 Responses API。Altman 表示用戶喜愛 MCP,公司對在產品中加入支援感到興奮。
Microsoft 亦宣布支援 MCP,與 Anthropic 合作創建官方 C# SDK。公司發布 Playwright-MCP 伺服器,讓 AI 代理能夠與網頁互動而非僅回答相關問題。Microsoft 指 C# 在企業領域廣受歡迎,官方 SDK 讓開發者更容易將 AI 模型整合至 C# 應用程式。
其他早期採用者包括 Block、Apollo、Zed、Replit、Codeium 及 Sourcegraph 等公司。中國的 Alibaba 及 Baidu 亦已採用 MCP。分析師認為 MCP 首次提供相對簡單的方法,將組織的工具和知識連接至 AI 聊天應用程式。
Futurum Group 分析師 Bradley Shimmin 形容 Google 此舉「brilliant」,代表立即可用數據的成熟和爆發。他指出這讓數據科學家和開發者能輕鬆存取數據,消除直接 API 級別存取資源時通常遇到的困難。
企業應用前景廣闊 安全問題仍需關注
Google 提供多種方式讓開發者開始使用 MCP Server。開發者可透過 Agent Development Kit (ADK) 在 Colab notebook 中使用範例代理,亦可透過 Gemini CLI 或任何兼容 MCP 的客戶端直接存取伺服器。GitHub 儲存庫提供範例程式碼。
MCP Server 的開放性質使其兼容任何大型語言模型。Google 展示 AI 代理如何透過單一查詢系統地從 Data Commons 複雜數據集中提取資訊。平台設計著重無縫整合及最小化上手難度,自然融入 Google Cloud Platform 最新代理開發工作流程。
企業採用方面,專家認為安全和管治問題需要持續演進。Shimmin 指出企業不太可能將 MCP Server 連接至所有專有工具,特別是 MCP 仍是不斷發展的標準。他強調需要演進的主要方面之一是安全和管治。
網絡安全公司 Wiz 建立自己的 MCP 伺服器,提供完整雲端可見性、上下文智能及統一安全。公司同時批評協議存在從遠端程式碼執行到提示注入和命令劫持等問題。專家認為隨著 MCP 成為 GenAI 連接的標準,其成熟化不僅取決於 Anthropic。
業界觀察人士將 MCP 視為最新形式的「中介軟件」,這類軟件工具跨平台運作,經常在全行業平台轉變期間蓬勃發展。Microsoft 資深人士 Steven Sinofsky 認為中介軟件在實踐中從未完全兌現承諾,但承認其在 AI 快速發展期間的重要性。
展望未來,分析師預期 MCP 將在企業 AI 應用中扮演關鍵角色。協議提供標準化方法讓 AI 模型消費數據,開發者無需學習或直接與複雜的底層 API 互動。這大幅加速創建數據豐富的代理應用程式,減少 LLM 的幻覺率。
隨著更多公司採用 MCP,預期會出現針對安全問題的專門解決方案。業界需要在快速採用與安全設計之間取得平衡,確保協議在支援創新的同時保護企業數據和系統安全。Google Data Commons MCP Server 的推出代表 AI 系統與真實世界數據整合邁向新階段,為開發者提供強大工具應對 AI 幻覺挑戰。
來源:Google