close

應用方案

人工智能企業趨勢應用方案

Anthropic AI 引爆美股 單日蒸發 2,850 億美元的背後啟示

Anthropic AI 引爆美股 單日蒸發 2,850 億美元的背後啟示 12


Anthropic 推法律插件引爆 SaaS 危機 全球軟件股市值蒸發 2.2 兆

AI 巨頭 Anthropic 正式推出 Claude Cowork 法律自動化插件,這項能夠自動執行合約審查、法律摘要及合規追蹤的工具,在短短一個交易日內引發全球軟件及數據分析類股恐慌性拋售,美國市場單日市值蒸發高達2,850億美元(約港幣 2.22 兆元),歐洲及亞洲市場同步重挫。本文將深入剖析這場被華爾街交易員稱為「SaaSpocalypse」(SaaS 末日)的市場風暴成因、受創企業財務曝險、專家對 AI 顛覆傳統商業模式的分歧看法,以及企業如何在這場 AI 競賽中尋求生存之道。

 

unwire.pro 此文給決策者的重要啟示 :

SaaS「人頭費」模式崩解:AI 代理能獨立完成工作令軟件用戶數大減,企業採購需由「按人頭付費」轉向「按結果付費」思維。
避開「AI 薄殼」供應商:依賴 API 的中間商隨時被 Anthropic 等上游吞併,採購時必需審視對方是否擁有不可替代的技術護城河。
專有數據成唯一防線:當 AI 功能可被輕易複製,唯有累積獨家數據資產,企業才能在巨頭競爭下存活。
人力架構「去金字塔化」:AI 已由輔助轉為直接替代初級工作,企業需重組架構,將員工角色由「執行者」轉型為「AI 監督者」。

 

AI 由「增強工具」轉型為「工作取代者」關鍵時刻

這場拋售導火線源於 Anthropic 在 1 月 12 日推出的 Claude Cowork 桌面版 AI 代理工具,以及隨後於 2 月初發布的 11 款企業專用插件。與過往 AI 工具僅作輔助角色不同,Cowork 法律插件宣稱能獨立完成合約審查、風險標示、保密協議分類及合規追蹤等任務,直接挑戰傳統法律科技公司核心業務。Anthropic 在官方聲明中強調,這些插件讓 Claude 從「對話式聊天機械人」進化為「跨業務功能的專業隊友」,涵蓋銷售、財務、行銷、客戶服務及法律等領域。
根據《Legal IT Insider》報導,Anthropic 此舉標誌該公司從「模型供應商」轉型為「應用層及工作流程擁有者」的戰略轉變。Jefferies 股票交易部門 Jeffrey Favuzza 向 Bloomberg 表示:「我們稱之為 SaaSpocalypse,也就是 SaaS 股末日。交易情緒完全是『讓我離場』的恐慌性賣壓。」這種市場反應反映投資者對 AI 可能徹底取代而非僅增強現有軟件業務的深層憂慮。
Schroders 分析師 Jonathan McMullan 進一步解釋市場恐慌的結構性因素:「軟件及數據分析領域賣壓反映出一場深化的結構性辯論。投資者正積極重新定價這些領域,因為歷史上的『能見度溢價』正消退——AI 進步速度使長期估值越來越難以辯護,尤其是當 AI 工具讓企業能以更少員工完成更多工作時,直接威脅到按用戶收費的傳統軟件商業模式。」

 

法律數據巨頭首當其衝 Thomson Reuters 創單日最大跌幅

這場拋售對法律資訊服務產業造成毀滅性打擊。Thomson Reuters 股價暴跌 18%,創下該公司有史以來最大單日跌幅,股價回落至 2021 年 6 月以來最低水平。這家擁有 Westlaw 法律資料庫的多倫多資訊巨頭,其法律業務佔公司 EBIT(息稅前利潤)高達 45%,成為此次風暴中曝險最高企業。Morgan Stanley 分析師 Toni Kaplan 在研究報告中指出:「我們近期接觸的多數投資者對 Thomson Reuters 持壓倒性悲觀態度,市場共識擔憂該公司面對專業 AI 工具競爭加劇下,將難以維持法律業務成長動能。」
英國 RELX 集團(LexisNexis 母公司)同樣受重創,股價暴跌 14% 至 17%,創下 1988 年以來最大單日跌幅。該股自 2025 年 2 月高位以來已腰斬近半。荷蘭 Wolters Kluwer 下跌約 13%,而美國 LegalZoom.com 更重挫近 20%。倫敦證券交易所集團(LSEG)因其龐大數據分析業務,股價亦下跌 8.5% 至 13%。
然而,《Artificial Lawyer》專欄作者認為這波拋售屬「非理性」反應。該媒體指出,Thomson Reuters、RELX 及 Wolters Kluwer 本質上是「法律數據堡壘」——擁有數十年累積的專有案例法及合約數據,這些資產難以被任何 AI 插件輕易取代。同時,Anthropic 插件並非「開箱即用」簡單工具,任何律師事務所或法務團隊若要安全使用,很可能需要企業授權及技術團隊支援。Morningstar 分析則指出,雖然 Thomson Reuters 風險最高,但 RELX 及 Wolters Kluwer 法律業務僅佔各自 EBIT 的 10% 至 13%,實際曝險相對有限。

 

科技巨頭與私募基金同遭波及 AI 顛覆恐懼蔓延

這場拋售並未侷限於法律科技領域,迅速蔓延至整個軟件及金融服務產業。ServiceNow 單日重挫近 7%,年初至今跌幅擴大至 28%;Salesforce 同樣下跌約 7%,2026 年累計跌幅逼近 26%;TurboTax 母公司 Intuit 更暴跌近 11%,年初至今跌幅超過 34%。科技巨頭同樣未能倖免:Nvidia 下跌 2.8%、Microsoft 跌 2.9%、Meta 跌 2.1%、Oracle 跌 3.4%。
私募股權及另類投資公司更成為重災區。Blue Owl Capital Corp 連續九個交易日下跌,單日最大跌幅達 13%,股價跌至 2023 年以來最低點。Ares Management Corp、KKR 及 TPG 各一度下跌超過 10%,Apollo Global Management 及 Blackstone 跌幅也達 8%。市場擔憂這些私募基金對軟件產業大量曝險——業務發展公司(BDC)作為直接借貸市場公開交易實體,其股價表現成為外界觀察這個通常不透明市場的即時窗口。
廣告產業同樣遭池魚之殃。Omnicom 暴跌 11.2%,全球市值最大廣告集團 Publicis 在發布財報後下跌超過 9%。這家法國公司宣布已撥出約 9 億歐元(約 10.6 億美元,即港幣 82.7 億元)用於 2026 年AI相關技術及數據資產收購。Barclays 調查顯示,廣告代理商被認為是最易受 AI 衝擊行業之一,WPP、Omnicom 及 Publicis 均被標籤為潛在「AI 輸家」。

 

專家觀點分歧:末日預言與價值投資機會並存

面對這場市場風暴,業界專家看法呈現明顯分歧。Blue Whale Growth Fund 投資總監 Stephen Yiu 直言:「今年將是決定企業是 AI 贏家還是受害者的關鍵年份,核心技能在於避開輸家。在塵埃落定前,站在 AI 對立面是一條危險道路。」這種悲觀情緒與 Anthropic 行政總裁 Dario Amodei 警告相呼應——Amodei 曾預測 AI 可能在未來一至五年內消滅 50% 入門級白領工作,並可能將美國失業率推高至 10% 至 20%。
然而,Bank of America 全球研究部門對當前市場情緒提出尖銳批評。分析師 Vivek Arya 在研究報告指出,當前 SaaS 股拋售邏輯「內部不一致」:「市場同時定價兩個相互排斥情境——AI 資本開支惡化到投資回報率疲軟且成長不可持續,同時 AI 採用又將如此普及且提升生產力,以至於長期存在軟件工作流程和商業模式將變得過時。這兩種結果不可能同時發生。」
部分投資專家則將這波拋售視為買入機會。Sycomore Sustainable Tech 基金在下跌中買入 Microsoft 股票,該基金過去三年表現優於 99% 同類基金。基金經理認為 Microsoft 最終將成為 AI 贏家,且該股目前估值僅約 23 倍預期盈餘,為近三年最低水平。BTIG 首席市場技術分析師 Jonathan Krinsky 指出,軟件板塊「可能已超賣到足以反彈」,但他同時警告「修復並建立新基底需要很長時間」。
Nvidia 行政總裁 Jensen Huang 則公開駁斥 AI 將取代軟件論點,稱這種想法「不合邏輯」,並表示「時間會證明一切」。他強調 AI 實際上將為水電工、電工、建築工人及 AI 相關工廠建設人員創造大量就業機會,這些工作年薪可達六位數美元。

 

法律 AI 競賽白熱化 Harvey 與 Legora 面臨新威脅

Anthropic 進軍法律科技領域,對現有 AI 法律初創公司構成直接威脅。2025 年法律科技領域融資總額達 60 億美元(約港幣 468 億元),其中 Harvey AI 在一年內完成四輪融資共計 8.18 億美元(約港幣 63.8 億元),估值達 80 億美元(約港幣 624 億元);歐洲競爭對手 Legora 則在 2025 年 10 月以 18 億美元(約港幣 140 億元)估值完成 1.5 億美元(約港幣 11.7 億元)C 輪融資。Harvey 最近更完成 1.6 億美元(約港幣 12.5 億元)F 輪融資,由 Andreessen Horowitz 領投,使其總融資額突破 10 億美元(約港幣 78 億元)。
然而,《Law.com》分析指出,Anthropic 法律插件對這些試圖執行廣泛任務的法律科技公司威脅最大,而專注於特定細分領域初創公司可能相對安全。Harvey 共同創辦人暨行政總裁 Winston Weinberg 仍保持樂觀,描繪大型併購交易前 10% 工作可完全自動化願景——將盡職調查從六週壓縮至兩週。Harvey 最新推出「Shared Spaces」協作工作區,讓律師事務所與客戶能在同一安全空間內即時協作,直接與 Legora 的 Portal 產品競爭。
Anthropic 獨特優勢在於其同時是 AI 模型開發商,這使其能夠針對特定產業需求個人化模型,而 Harvey 及 Legora 等公司實際上依賴 Anthropic 等開發商底層模型。這種「上下游通吃」策略使 Anthropic 能同時威脅傳統法律資訊服務公司及 AI 法律初創公司。

 

這場 AI 顛覆對企業意味著甚麼?

這場市場風暴揭示 AI 發展正從「增強人類能力」階段加速進入「取代人類工作」階段關鍵轉折。對企業而言,短期內需重新評估對傳統軟件及數據服務供應商依賴程度,並審視自身在 AI 價值鏈中定位。那些擁有專有數據資產及深厚客戶關係企業,如 Thomson Reuters 及 RELX,仍保有一定護城河;但那些僅作為「AI 模型包裝器」應用層公司,則面臨被上游模型開發商直接替代生存危機。
中長期而言,企業需在「AI 採用」與「AI 防禦」之間取得平衡。一方面,導入 AI 工具可提升營運效率;另一方面,過度依賴外部 AI 供應商可能在未來遭遇類似今日法律科技公司困境。建立自有數據資產、培養 AI 整合能力、以及發展難以被 AI 取代高價值服務,將成為企業在這場轉型中存活關鍵策略。
最終這場拋售是否如 Bank of America 所言屬「非理性」反應,抑或如 Anthropic 行政總裁 Amodei 所警告「白領工作末日」前奏,仍有待時間驗證。但可以確定的是,AI 對商業世界顛覆已從理論走向現實,而 2026 年很可能成為決定企業是 AI 時代贏家或輸家分水嶺。

[最後更新:2026 年 2 月 5 日]
資料來源: Bloomberg Morningstar CNBC Artificial Lawyer Fortune

read more
企業趨勢應用方案資訊保安

歐洲政府全面棄用美國軟件:法國 250 萬公務員 2027 年前停用 Teams 與 Zoom

歐洲政府全面棄用美國軟件:法國 250 萬公務員 2027 年前停用 Teams 與 Zoom 13


歐洲政府全面棄用美國軟件:法國 250 萬公務員 2027 年前停用 Teams 與 Zoom

歐洲各國政府正展開史上最大規模「數碼主權」行動。法國本週宣布 250 萬名公務員將在 2027 年前全面停用 Zoom、Microsoft Teams 等美國視像會議工具,轉用本土平台 Visio。此舉標誌歐洲與矽谷科技巨頭長達十年依賴關係正式進入轉折點,美國企業在歐洲雲端服務市場高達 72% 市占率面臨前所未有挑戰。這場運動背後驅動力,既有對數據主權堅持,也有對美國 Donald Trump 政府科技政策不確定性的深層憂慮。

法國率先出擊:本土視像平台 Visio 年省億元成本

法國政府由公務事務部與數碼事務跨部門總局(DINUM)共同開發 Visio 平台,已完成為期一年測試,目前擁有約 4 萬名用戶。該平台將於 2027 年成為所有公務員唯一視像會議工具,屆時稅務及社會保障等大型公共部門美國軟件授權將不再續約。法國公務事務部長 David Amiel 在聲明中直言:「我們不能冒險讓科學交流、敏感數據和戰略創新暴露在非歐洲主體面前」。

Visio 平台採用法國初創企業 Pyannote 開發 AI 技術,具備自動會議轉錄和發言人識別功能,並託管於法國 Dassault Systèmes 子公司 Outscale 營運的主權雲端。法國政府估算,每 10 萬名用戶使用 Visio,每年可節省高達 100 萬歐元(約港幣 848 萬元)成本。此舉是法國「Suite Numérique」計劃一部分,該計劃目標是建立完整主權數碼生態系統,取代 Gmail、Slack 等廣泛使用美國服務。

德國與奧地利實戰經驗:開源軟件成主權首選

德國 Schleswig-Holstein 州案例更具示範意義。該州已成功將 4.4 萬名員工電郵系統從 Microsoft Exchange 遷移至開源軟件 Open-Xchange 和 Thunderbird,並將 Microsoft SharePoint 替換為 Nextcloud。州數碼化部長 Dirk Schrödter 透露,該州在 2026 年將進行 900 萬歐元(約港幣 7,632 萬元)一次性投資,但每年可節省 1,500 萬歐元(約港幣 1.27 億元)授權費,投資回報期不到一年。該州目前已完成 80% 工作站遷移,並計劃進一步以 Linux 替代 Windows 系統。

奧地利軍方則在 2025 年完成約 16,000 個系統(約佔其 IT 系統一半)從 Microsoft Office 遷移至 LibreOffice。奧地利軍方資訊科技與網絡防禦部門(Directorate 6)負責人 Michael Hillebrand 強調,這除成本考量,更是「確保在危機期間維持不間斷運作能力」戰略必要。軍方甚至向 LibreOffice 項目貢獻超過五年開發工作量,體現從單純使用者到生態系統參與者角色轉變。

Trump 效應:信任危機加速主權運動

2025 年美國總統 Donald Trump 對國際刑事法院(ICC)首席檢察官 Karim Khan 實施制裁後,Microsoft 隨即註銷 Khan 的 ICC 郵箱帳戶,事件成為歐洲數碼主權運動轉捩點。雖然 Microsoft 堅稱「始終與 ICC 保持溝通」且「從未暫停對 ICC 服務」,但此舉令歐洲各界對科技巨頭「終止開關」風險產生深層憂慮——即這些公司可能在政治壓力下隨時切斷服務。

Eurasia Group 分析師 Nick Reiners 指出:「如今降低對美國科技風險理念,背後政治推動力已大幅增強。能明顯感受到一種時代思潮轉變」。在 2026 年 1 月瑞士達沃斯世界經濟論壇上,歐盟科技主權事務官員 Henna Virkkunen 向全球精英警示:「歐洲對他國依賴可能被武器化,用來對付我們」。Trump 政府 2026 年 2 月更威脅若歐盟執行《數碼市場法》(Digital Markets Act)對 Apple、Google、Meta 開出超過 1,000 億歐元(約港幣 8,480 億元)罰款,將對歐洲汽車與奢侈品徵收 25% 報復性關稅。

美國科技巨頭反擊:主權雲能否挽回信任?

面對市場流失危機,美國雲端服務供應商紛紛推出「主權雲」業務應對。Microsoft 於 2025 年 6 月宣布推出 Microsoft 365 Local(完全運行於客戶自有數據中心)以及 Sovereign Public Cloud 服務,後者配備 Data Guardian 功能,確保歐盟客戶數據僅在歐洲境內儲存和處理,且僅由歐洲籍員工管理。Microsoft 總裁 Brad Smith 在達沃斯接受採訪時強調:「歐洲是美國科技業界僅次於本土最大市場。一切都取決於信任,而信任需要對話」。

然而市場數據顯示美國企業主導地位仍難以撼動。根據 2026 年 1 月最新數據,AWS 在全球雲端服務市場佔有 32% 份額,Microsoft Azure 為 23%,Google Cloud 為 10%。在歐洲市場,AWS 和 Azure 分別佔據 30% 和 28% 份額,而歐洲本土雲端服務供應商市占率已從 2017 年 27% 萎縮至 2025 年 13%。這種結構性失衡也促使法國與德國在 2025 年 11 月柏林數碼主權峰會上宣布成立「數碼主權工作組」,將在 2026 年法德部長理事會上提出具體促進措施。

2026:從口號到執行的關鍵年

歐洲數碼主權運動正從政策宣示進入實戰執行階段。《人工智能法案》(AI Act)自 2025 年 2 月生效後,2026 年 8 月將強制要求高風險 AI 系統合規。《數碼營運韌性法》(DORA)已對金融業實施網絡安全標準,《網絡與資訊系統安全指令 2》(NIS2)則將覆蓋數千家企業。法國總統 Emmanuel Macron 在柏林峰會上宣布:「數碼主權峰會發出明確信號:歐洲有能力引領數碼時代」。

然而執行挑戰依然嚴峻。德國 Schleswig-Holstein 州反對黨議員指出,雖然官方數據顯示 80% 工作站已完成遷移,但「遠少於 80% 員工能真正熟練使用這些系統」,遷移初期錯誤問題仍在持續。Linux Foundation 與歐洲公共部門開源項目報告也指出,雖然歐洲各國政府已建立開源項目辦公室(OSPOs),但公共部門在全面採納開源價值方面仍顯滯後。

多家智庫研究顯示,歐洲挑戰已不再是意識問題,而是執行力。要實現真正數碼主權,需要「史無前例大規模持續投資、促進創新務實監管,以及政府與大型企業在需求側協調行動」。否則,歐洲將因結構性惰性而非主動選擇,持續處於技術依賴狀態。這場歐洲史上最大規模軟件遷移運動,最終能否打破矽谷數據霸權,2026 年將是關鍵驗證年。

資料來源:
The Register
Global Banking and Finance
Heise Online
The Document Foundation
Netaxis Solutions

 

read more
企業趨勢應用方案業界消息

財政司司長陳茂波: 「智瞻 2026」推動科技產業融合 探討企業出海機遇

財政司司長陳茂波: 「智瞻 2026」推動科技產業融合 探討企業出海機遇 14


財政司司長陳茂波: 「智瞻 2026」推動科技產業融合 探討企業出海機遇

香港生產力促進局於 2026 年 2 月 4 日舉辦年度旗艦活動「智瞻 2026」,逾 500 位政商界代表出席,內地約 16,000 人次網上觀看。財政司司長陳茂波在主題演講中強調,國家「十五五」規劃明確支持香港建設國際創科中心,香港將繼續推動科技創新和產業創新深度融合,培育具國際視野的創新企業,推動經濟向高增值方向發展。

對接國家戰略的香港機遇

「十五五」規劃為香港創科發展帶來重大機遇。國家主席習近平提出「產業出題、科技答題」方針,為創新生態指明方向。生產力局主席陳祖恒議員在閉幕辭中表示,局方將緊密配合國家和特區政府整體發展策略,善用創新科技應對企業實際痛點,全方位協助企業加快升級轉型步伐。此戰略定位回應國家發展需求,亦突顯香港作為國際創科中心的獨特價值。

香港在「十四五」和「十五五」規劃中均獲國家明確支持建設國際創科中心。陳茂波指出,未來將積極配合國家發展策略,進一步強化科技與產業連結,鼓勵企業增加研發資源,擴大科技應用範圍。政府將推動經濟向高增值、多元化方向邁進,為企業創造更廣闊發展空間。

財政司司長陳茂波: 「智瞻 2026」推動科技產業融合 探討企業出海機遇 15

「引進-落地-成長-出海」服務生態鏈

生產力局與引進重點企業辦公室(引進辦)建立策略夥伴關係,共同構建「引進-落地-成長-出海」完整服務模式。引進辦主任任景信表示,香港擁有完善金融體系、人才優勢,以及與國際法規、標準接軌的國際場景,配合政府產業政策及海外網絡,為內地企業以香港為基地「走出去」提供獨特支援。引進辦致力吸引全球五大創科領域重點企業落戶,提供全面落地支援服務,充分發揮香港作為「超級連繫人」及「超級增值人」角色。

生產力局多年來成功協助多間內地及本地企業拓展海外市場,包括西井科技、雲迹科技、馭勢科技等,成功案例遍及東南亞、歐洲、東盟及中東等地區。這些企業透過香港平台,實現從技術研發到市場拓展的全方位升級。生產力局將繼續與引進辦合作,發揮「香港製造」優勢,協助企業經香港連接世界。

財政司司長陳茂波: 「智瞻 2026」推動科技產業融合 探討企業出海機遇 16

The Cradle 出海六招強化企業

生產力局作為香港特區政府「內地企業出海專班」成員,推出「The Cradle 出海服務中心」,為出海企業提供「出海六招」全面綜合服務。六項核心服務包括智能生產、技術研發及評估、國際標準及測試、專業服務、培訓及實地考察、資助計劃等,支援香港發揮自身獨特優勢,協助企業高質素出海。

自 2025 年 4 月成立以來,The Cradle 已吸引超過 350 間企業表示興趣使用服務,當中約 100 多宗進入具體跟進階段,連同成立前已協助的出海項目,累計超過 450 宗。成績充分證明香港作為企業出海橋頭堡的強大吸引力。生產力局透過提供產品、技術、製造及管理等關鍵需求的綜合服務,協助企業善用香港國際化優勢拓展全球市場。

領袖論壇凝聚產業智慧

「智瞻 2026」同場舉辦「智瞻領袖論壇」,由資深傳媒人黃永主持,邀請北京雲迹科技創始人支濤、河南東微電子材料創始人兼董事長王永超、施耐德電氣(香港)香港區總裁趙啟文、引進辦主任任景信,以及生產力局總裁畢堅文共同探討。議題圍繞企業出海、科技支援及人才發展三大主題,深入分析企業如何透過香港「橋頭堡」角色,在國家「十五五」規劃下實現創新驅動與高增值發展。

論壇分享中國品牌經香港走向國際的實戰經驗,探討香港在技術支援與創新人才聚集方面的優勢,以及如何為內地企業提供一站式升級與出海平台。這些專業見解為參會企業提供寶貴參考和啟發。

政產學研投協同創新

生產力局一直與「政、產、學、研、投」各界緊密協作,推動新型工業化,提升產業新質生產力。目前合作項目包括:與哈爾濱工業大學合作「循環經濟關鍵技術與設備」重點專項,為超大城市群的多源固廢提供動態識別與大數據資源池構建方案;與江蘇大學合作「小麥綠色智能加工與關鍵技術集成與產業化示範」項目,提供 AI 及物聯網等核心技術支援;與清華大學合作設立「香港生產力促進局卓越技術中心」,專注智能製造及 AI 技術產業轉化;與復旦大學祖泉研究院簽署合作協議,致力推動滬港之間的科技協同與成果轉化。

生產力局將持續推動政產學研投跨界對話,聚焦未來產業與科技應用落實,協助建立香港成為全球創科價值鏈關鍵節點。透過深化與本地工商界及國際頂尖研發機構協作,生產力局為產業創優增值,促進新質生產力發展。

企業出海的未來影響

「智瞻 2026」成功舉辦標誌著香港在國家「十五五」規劃中的戰略地位進一步鞏固。對於企業而言,香港不僅是進入國際市場門戶,更是技術升級、人才聚集、資金融通的綜合平台。未來,隨著生產力局與各界合作深化,香港將在新型工業化、環保科技、AI 應用等前沿領域發揮更大作用,為企業提供從研發到市場的全方位支援。此創新生態的建立,將推動更多中國企業成功走向世界,同時吸引更多國際企業經香港進入大灣區市場。

資料來源:香港生產力促進局

read more
企業趨勢應用方案資訊及通訊科技

Xcode 26.3 引進 Claude 與 Codex 雙引擎 (附 : 教你透過 MCP 加入其他 AI 輔助)

Xcode 26.3 引進 Claude 與 Codex 雙引擎 (附 : 教你透過 MCP 加入其他 AI 輔助) 17

Apple 於 2026 年 2 月 3 日正式發布 Xcode 26.3,首次原生整合 Anthropic 的 Claude Agent 和 OpenAI 的 Codex 兩大 AI 編碼引擎,標誌著企業軟件開發從「AI 輔助建議」跨越至「自主任務執行」的歷史性轉折。這次更新允許開發者在同一項目中靈活切換兩種 Agent,Claude 專注深度程式碼推理與重構,Codex 則擅長高速自主生成與端到端任務委派。對於全球 iOS 開發者而言,這不僅是工具升級,更是 Apple AI 戰略從封閉走向開放合作的重大轉向。在大中華整體 AI 支出於 2028 年預計達 1,029 億美元的背景下,這場由科技巨頭主導的平台整合戰,正在重新定義企業開發團隊的生產力標準與技術選型邏輯。

Xcode 26.3 引進 Claude 與 Codex 雙引擎 (附 : 教你透過 MCP 加入其他 AI 輔助) 18

雙 Agent 架構如何重構 Xcode 工作流

Xcode 26.3 的核心突破在於建立雙軌制 Agentic Coding 架構,允許 Claude Agent 和 OpenAI Codex 在相同 IDE 環境中提供差異化能力。根據 Apple 官方說明,兩種 Agent 均可搜索文檔、探索檔案結構、更新項目設定,並透過捕獲 Xcode Previews 進行視覺驗證與迭代修復。

但其技術哲學截然不同:Claude Agent 採用開發者引導型模式,深度整合本地終端與 IDE,在 200K 至 1M Token 上下文窗口中進行複雜單任務推理,特別適合需要理解整個程式碼庫架構的重構任務。

相比之下,OpenAI Codex 則是自主委派型雲端 Agent,運行於隔離沙箱環境中,可異步處理端到端開發任務並自動生成 Pull Request。在 SWE-Bench 真實工程任務測試中,其準確率達到 77%,代幣使用效率比 Claude 高 3 至 5 倍,同樣任務僅需 72,579 Tokens,對比 Claude 則需 234,772 Tokens。

實際應用場景進一步突顯差異化優勢。當開發者需要將 SwiftUI 列表視圖重構為響應式網格佈局並增加輔助功能支援時,Claude 會深入分析項目的 MVVM 架構、數據綁定邏輯和現有組件相依關係,提供詳細技術決策說明和生產級程式碼。而 Codex 更適合快速生成登入介面的單元測試腳手架,或將 30 個 API 端點的錯誤處理統一標準化這類明確定義的批量任務。

其雲端並行處理能力讓多個子任務同時運行,開發者可在後台委派任務後繼續其他工作。AppleInsider 實測報告證實,Xcode 26.3 讓這種 Agent 切換只需一鍵完成,開發者可根據具體任務特性選擇最優工具,甚至在同一項目的不同階段混合使用兩者。

開發者實戰指南:三步啟用 MCP 開放生態

Xcode 26.3 的革命性突破不僅在於內建 Claude 和 Codex,更在於透過 Model Context Protocol(MCP)開放標準,讓開發者可以接入任何兼容的 AI Agent 或工具。這種開放架構代表企業可以使用 Cursor、Windsurf 等第三方 IDE,甚至部署私有化 AI 模型,同時享受 Xcode 提供的 20 多個原生 MCP 工具,包括檔案讀寫、項目構建、測試運行、SwiftUI 預覽渲染和 Apple 官方文檔搜索。

配置過程極為簡潔,僅需三個步驟即可完成:

第一步,在 Xcode 中啟用 MCP 伺服器:打開 Xcode > Settings(或按 ⌘,),選擇側邊欄的 Intelligence 選項,在 Model Context Protocol 下切換 Xcode Tools 為開啟狀態。這一操作代表 Xcode 接受來自外部 Agent 的 MCP 連接請求。

第二步,將 Xcode MCP 橋接到目標 Agent:對於 Codex,在終端執行 codex mcp add –transport stdio xcode — xcrun mcpbridge;對於 Claude,執行 claude mcp add –transport stdio xcode — xcrun mcpbridge。這些指令會自動配置 mcpbridge 二進位檔案,將 MCP 協議請求轉換為 Xcode 內部 XPC 調用,系統會自動檢測正在運行的 Xcode 實例。

第三步,驗證配置成功:運行 codex mcp list 或 claude mcp list 確認 xcode-tools 伺服器已正確註冊。

當外部 Agent 首次嘗試連接時,Xcode 會彈出權限對話框顯示 Agent 完整路徑和程序 ID,開發者需點擊 Allow 授予存取權限。這是 Apple 確保安全的機制,防止未經授權的工具存取項目程式碼。對於使用 Cursor 或其他 VS Code 分支的開發者,可以透過一鍵安裝連結、GUI 介面或手動編輯 ~/.cursor/mcp.json 設定檔案完成設置。

特別值得注意,開發者可以在項目根目錄添加 AGENTS.md 或 CLAUDE.md 檔案,向 AI Agent 提供項目結構、架構決策和編碼規範的上下文提示,顯著提升 Agent 生成程式碼的準確性和一致性。這種開放架構讓企業 IT 團隊能在保持 Xcode 生態優勢的同時,靈活選擇最適合團隊工作流的 AI 工具組合,真正實現一次配置,多工具受益的效率最大化。

Apple AI 戰略從封閉轉向開放合作的深層邏輯

Xcode 26.3 同時引入兩家競爭對手的 AI 技術,反映出 Apple 在 AI 時代面臨的戰略困境與務實調整。2024 年 6 月 WWDC 推出的自研 Swift Assist 功能,原本計劃成為 Xcode 核心 AI 能力,但其程式碼生成品質和幻覺問題始終未達到生產標準。

2025 年 6 月 Bloomberg 報導顯示,Apple 同時與 Anthropic 和 OpenAI 進行 Siri 升級談判,但因 Anthropic 要求數十億美元年度授權費加逐年遞增的高昂條件,談判一度陷入僵局。最終 Apple 選擇在 Xcode 26.3 中採用雙供應商策略,由開發者自行選擇並支付 API 使用費,Apple 則專注於加強 Agent 代幣使用效率和切換流暢性。

這種模式巧妙規避了排他性授權的財務風險,同時將技術生態控制權保留在 Apple 手中。根據 Apple 開發者文檔,Xcode 26.3 為兩種 Agent 設計了統一的整合介面和自動更新機制,並針對 iOS 開發特性進行了底層改良。VentureBeat 分析指出,這標誌著 Apple 從全疊自研轉向平台中立的重大轉變,承認在某些技術領域依賴外部專業夥伴更符合開發者利益。ZDNet 實測證實,除了 Claude 和 Codex,Xcode 26.3 架構理論上也支援本地開源模型接入,代表企業客戶未來可能部署自有私有化 AI 編碼方案。

對企業軟件開發戰略的三大深遠影響

Xcode 26.3 代表的 Agentic Coding 範式將從三個維度重塑企業軟件工程實踐:

第一,技能需求重心從編寫程式碼轉向設計系統與驗證 AI 輸出。當 AI 可在數分鐘內完成過去需數小時的介面開發任務時,企業需重新定義工程師核心價值。架構決策能力、程式碼品質判斷和業務邏輯理解將成為稀缺技能。這要求人力資源部門調整招聘標準,從 5 年 Swift 開發經驗轉向 AI 協作系統設計能力與生成式程式碼審查專業知識。

第二,項目管理方法論需要根本性更新。傳統敏捷衝刺規劃基於人類開發速度估算,但當 Codex 可在後台自主運行完成整個微服務模組時,Story Point 估算將失去意義。企業需建立新進度追蹤指標,例如 AI 任務成功率和 Agent 上下文穩定性。同時,程式碼審查流程必須納入 AI 生成內容的品質評估標準,這也是導致審查時間增長 91% 的原因。

第三,AI 治理框架成為企業競爭力的差異化因素。Kong 研究顯示,89% 部署 AI Agents 的企業已建立或正在尋求治理方案,其中 54% 採用 AI 網關這類新興中間件。成功案例證明,投資於審查流程、治理政策和團隊培訓的企業,其 AI 工具投資回報率顯著較高。對於大中華區企業而言,Xcode 26.3 的雙 Agent 架構提供了寶貴風險分散選項,敏感金融程式碼可限制使用本地 Claude 模式,標準業務邏輯則利用 Codex 的成本效率優勢。

隨著 AI Agents 從實驗室走向生產環境,下一個競爭焦點將是多 Agent 協作編排的成熟度。未來可能出現專門負責前端、後端、測試和 DevOps 的 AI 團隊自動協作場景。對於企業決策者而言,現在是建立 AI 工具評估框架、制定程式碼治理政策、投資團隊 AI 協作培訓的關鍵窗口期。在這場由生產力革命驅動的變革中,最早建立有效治理機制並掌握混合 Agent 工作流的企業,將在 2026 至 2028 的軟件工程競賽中獲得領先優勢。

 

資料來源: Apple Newsroom TechCrunch Northflank Rudrank Riyam UiPath Hong Kong Survey

read more
企業趨勢低碳綠色應用方案

生產力局攜手 amfori 加深戰略合作 強化大灣區企業 ESG 競爭優勢

生產力局攜手 amfori 加深戰略合作 強化大灣區企業 ESG 競爭優勢 19


生產力局攜手 amfori 加深戰略合作 強化大灣區企業 ESG 競爭優勢

香港生產力促進局(生產力局)與全球貿易協會 amfori 於 2026 年 2 月 3 日續簽合作備忘錄。這代表雙方將在未來 2 年內加深戰略夥伴關係,重點協助香港及大灣區超過 2,400 家企業應對日益嚴格的 ESG 合規要求。是次合作聚焦於系統化管理供應鏈風險、提供實務培訓,並針對紡織及玩具等重點行業提供數碼化 ESG 管理工具。

整合全球網絡與本地專業實力

是次合作充分發揮 amfori 連繫全球超過 2,400 家零售商、品牌及進口商的龐大網絡優勢,結合生產力局在綠色科技、智慧製造、ESG 諮詢及技術研發的深厚實力。amfori 總裁 Linda Kromjong 指出,企業需要從評估及管理供應鏈風險開始,進行完善盡責管理,從而提升企業敏捷性、韌性與競爭優勢。生產力局首席技術總監張梓昌博士表示,合作將協助企業特別是大灣區城市企業建立更具可持續性、負責任及韌性的供應鏈。

生產力局攜手 amfori 加深戰略合作 強化大灣區企業 ESG 競爭優勢 20

四大協作領域鎖定實務培訓與行業支援

根據合作備忘錄,雙方將在未來 2 年聚焦四大協作領域。首先,聯合舉辦針對 ESG 法規、風險管理及可持續供應鏈的實務培訓、研討會與工作坊,強化企業在 ESG 的實踐能力。其次,重點支援紡織及玩具行業,提供可持續發展工具包、數碼化 ESG 管理工具及最佳實踐案例。第三,促進知識交流,協助企業接軌國際可持續貿易網絡與相關資源,並探索適用資助渠道。最後,共同推廣有助提升供應鏈環境與社會績效的創新解決方案與服務。

從合規挑戰轉化為市場優勢

這次戰略合作目標是協助企業應對 ESG 合規挑戰,並能主動管理風險,在全球供應鏈中建立可信、可持續的競爭優勢。張梓昌博士強調,合作將協助企業將可持續發展化為創新動力與市場優勢。Linda Kromjong 補充,amfori 與生產力局正攜手協助企業從認知邁向實踐,專注提供實用指導並合辦活動,協助企業應對市場與監管環境中不斷變化的要求。簽署儀式於生產力大樓舉行,由生產力局綠色生活與創新部總經理蔡劍虹博士與 amfori 總裁 Linda Kromjong 共同簽署,並由張梓昌博士及 amfori 東亞及太平洋地區總監李兆康見證。

 

資料來源:香港生產力促進局

 

read more
人工智能企業趨勢應用方案

自動化編程代理投入商業應用 OpenAI Codex 如何重構 126 億美元軟件開發市場

自動化編程代理投入商業應用 OpenAI Codex 如何重構 126 億美元軟件開發市場 21


自動化編程代理投入商業應用 OpenAI Codex 如何重構 126 億美元軟件開發市場

 

OpenAI 於 2026 年 2 月 2 日正式推出獨立版 Codex 應用程式,標誌 AI 編程工具由輔助功能演化為企業級開發平台的關鍵轉折點。這款專為 macOS 設計的應用程式配合 2025 年 12 月 17 日發布的 GPT-5.2-Codex 模型,讓開發團隊能同時管理多個 AI 代理(Agents)平行處理編程任務,範疇涵蓋撰寫功能程式碼、回答程式碼庫問題及執行測試。

此舉直接挑戰 GitHub Copilot 於企業市場的主導地位。過去一個月已有超過 100 萬名開發者使用 Codex,整體使用量自 GPT-5.2-Codex 發布後錄得增倍升幅。本文將從代理式開發架構、生產力實證數據及企業部署策略三大角度,分析這場影響 126 億美元市場的技術競賽如何重塑軟件開發產業。

代理式開發架構:從輔助工具到自主執行者

OpenAI Codex 核心創新在於「軟件工程代理」(Software Engineering Agent)概念的商業化實現。不同於傳統 AI 編程助手僅提供即時程式碼建議,Codex 能在雲端沙盒環境中獨立承接完整開發任務。

JetBrains 於 2026 年 1 月宣布將 Codex 原生整合至 IntelliJ 及 PyCharm 等 IDE 的 2025.3 版本,讓開發者可直接在編輯器內委派大型重構、程式碼遷移等複雜工作。GPT-5.2-Codex 模型處理長期任務時展現顯著進步,即使計劃變更或嘗試失敗也能保持完整上下文記憶。OpenAI 內部數據揭示,過去一個月已有超過 100 萬名開發者使用 Codex,當中包括小型工程團隊利用該工具完成流動應用程式開發。OpenAI 指出,開發者協調多個代理的方式已由「能執行什麼」轉向「如何規模化指導、監督及協作」。

生產力悖論:26% 提升與 19% 下降的數據辯證

AI 編程工具對開發者生產力的實際影響呈現矛盾證據,這對企業投資決策構成挑戰。Microsoft、Princeton 及 MIT 於 2024 年的聯合研究(涵蓋 4,867 名開發者)顯示,GitHub Copilot 讓受試者完成 26.08% 更多的 Pull Request。Docker 公司 2025 年調查亦指出,Stack Overflow 受訪者中 84% 正在使用或計劃使用 AI 開發工具。

然而 2025 年 7 月 METR 對 16 名開源開發者的實驗卻發現相反結果:使用 AI 工具(主要選擇 Cursor Pro 或 Claude 3.5)後,任務完成時間反而增加 19%,雖然開發者預期能節省 24% 時間。研究參與者 Philipp Burckhardt 坦承,其生產力可能未如預期獲得幫助。Faros.ai 分析師認為,2026 年產業共識正由「AI 速度年」轉向「AI 品質年」,企業越來越重視程式碼審查、安全控管及模型治理。

網絡安全強化:雙刃劍下的企業風險管理

GPT-5.2-Codex 於網絡安全領域的能力提升成為企業決策者關注重點。有媒體報導,來自 Privy(Stripe 旗下)的首席安全工程師 Andrew MacPherson 利用 GPT-5.1-Codex-Max 與 Codex CLI,僅用一週時間發現 React Server Components 中三個未知漏洞,並負責任地向 React 團隊揭露。

他透過引導 AI 代理執行標準防禦工作流程,包括建立本地測試環境及模糊測試(fuzzing),成功重現並擴展原有 React2Shell 漏洞研究。該模型在網絡安全評測中顯示能力錄得「三次跳躍式增長」,但 OpenAI 明確認定其未達到 High 等級網絡安全能力。企業部署時需實行最小權限原則、審計追蹤及限制性存取控制。Codex 代理預設只能編輯工作資料夾中的檔案,並使用快取網頁搜尋,需要許可才能執行需要提升權限的指令。

市場格局:Copilot 主導下的差異化競爭

在 AI 編程工具市場,GitHub Copilot 憑藉 2,000 萬用戶及財富 100 強企業 90% 採用率穩佔領導地位。Gartner 預測到 2028 年 AI 程式碼助手採用率將超過 90%。OpenAI 的 Codex 採取差異化策略,提供 Skills 技能系統讓開發者擴展至圖像生成、文件創建及 Figma 設計轉換等多元任務。

Codex 支援在 Figma 獲取設計上下文、於 Linear 進行項目管理,以及在 Cloudflare、Netlify、Render 與 Vercel 部署。Codex 同時提供兩種個人化選項:簡潔務實風格及對話共情風格,並可設定 Automations 自動化在後台按計劃執行重複性任務。根據 MarketsandMarkets 2023 年 10 月預測,全球 AI 程式碼工具市場規模將從 2023 年的 43 億美元(約港幣 335.4 億元)增長至 2028 年的 126 億美元(約港幣 982.8 億元),年複合增長率達 24%。

企業決策者需要關注的三個關鍵問題

對於企業技術領導者,Codex 的推出帶來三個亟需評估的戰略問題。首先是投資回報率的不確定性:雖然有 26% 生產力提升的數據支撐,但也存在 19% 效率下降的反證,這要求企業在大規模部署前進行試點測試。

其次是安全與合規框架:Codex 的代理式架構能自主執行複雜任務,企業需建立沙盒環境及網絡存取限制,Codex App 使用原生開源且可配置的系統級沙盒。第三是工具整合策略:Codex App 與 CLI、IDE 擴充功能共用對話紀錄及設定,內建支援 Worktrees 讓多個代理在隔離程式碼副本上工作且不衝突。Windows 版本應用程式已在開發規劃中。

[最後更新:2026 年 2 月 3 日]

 

資料來源: OpenAI Codex App 官方發布 OpenAI GPT-5.2-Codex 官方發布 InfoWorld JetBrains 整合 InfoQ MIT/Princeton 研究 Fortune METR 研究報導

 

read more
IT 基建人工智能應用方案

中國超冷卻技術 20 秒降溫 30 度:AI 數據中心散熱革命與全球算力競賽

中國超冷卻技術 20 秒降溫 30 度:AI 數據中心散熱革命與全球算力競賽 22


中國超冷卻技術 20 秒降溫 30 度:AI 數據中心散熱革命與全球算力競賽

中國突破性冷卻技術 20 秒降溫 30 度:AI 數據中心散熱革命能否改變全球競爭格局?

中國科學家最新發表的「溶解式壓致冷卻」技術,宣稱能在 20 秒內實現 30°C 超快速降溫,這項突破性創新直接針對 AI 數據中心面臨的嚴峻散熱挑戰。全球 AI 數據中心年度用電量預計在 2026 年達到 90 太瓦時(約為日本全國用電量七分之一),傳統冷卻系統已無法應對新一代 GPU 每機架功耗突破 30 千瓦的散熱需求。這項技術若成功商業化,除了能將 AI 工作負載成本降低 30-40%,更可能重塑中國在全球 AI 基礎設施競賽中的戰略地位。

壓力驅動的化學魔術:硫氰酸銨顛覆傳統冷卻邏輯

這項由中國科學院物理研究所李冰教授團隊開發的技術,核心在於利用硫氰酸銨(NH₄SCN)在水中的獨特溶解行為,創造出一種結合固態冷卻效率與液態流動性的創新系統。根據《自然·通訊》期刊發表的數據,當對飽和溶液施加壓力時,大量硫氰酸銨會溶解並釋放熱量;釋放壓力後,鹽分重新析出的過程會迅速吸收周圍熱能,在室溫環境下可實現近 30 開爾文(Kelvin)的溫降,而在更高溫條件下冷卻幅度甚至可達 54 開爾文。劍橋大學衍生企業 Barocal 聯合創辦人 William Averdieck 表示,這種「壓致冷卻」(barocaloric)技術將製冷劑與熱傳介質合而為一,徹底解決固態冷卻長期面臨的熱傳效率瓶頸問題。實驗測量顯示,該系統每克冷卻劑可提供 67 焦耳冷卻能力,製冷效率高達 77%,表現遠超現有固態壓致冷卻材料。

這項技術突破點在於模擬「擠壓濕海綿」的物理過程:施壓階段如同擠出海綿中的水分(鹽分溶解放熱),釋壓階段則像海綿重新吸水(鹽分析出吸熱)。當壓力施加於材料時,分子長鏈從無序狀態轉變為有序排列,伴隨能級變化釋放熱能;這個過程在環境溫度下可逆,無需像傳統壓縮式製冷般依賴高全球暖化潛勢(GWP)的化學冷媒。香港科技大學資訊科技服務中心總監關沛文博士表示,這類零碳排冷卻技術與該校 2024 年 10 月部署的全港最大液浸式冷卻系統形成互補,後者已將冷卻能耗降低 80% 以上,電力使用效率(PUE)低於 1.1。研究團隊指出,這種液態系統克服固態壓致冷卻材料導熱性差的致命弱點,因為液體既是製冷劑亦是熱傳載體,可直接接觸需要冷卻的表面。

中國超冷卻技術 20 秒降溫 30 度:AI 數據中心散熱革命與全球算力競賽 23

解決 AI 算力「發燒」難題:千億美元市場的技術競速

全球數據中心冷卻市場正經歷爆炸性增長,預計從 2025 年的 101.41 億美元(約港幣 791 億元)飆升至 2034 年的 313.44 億美元(約港幣 2,445 億元),年複合增長率達 13.43%,其中液冷解決方案(包括浸沒式與直接晶片冷卻)在新建高密度部署中佔比已超過 38%。這波需求激增的根本原因,是 AI 晶片功耗呈指數級攀升:NVIDIA H100 熱設計功耗(TDP)達 700 瓦,而新推出 Blackwell B200 系列更突破 1,000 瓦大關,令傳統氣冷系統徹底失效。Microsoft 於 2025 年 9 月宣布成功測試晶片內微流體冷卻系統,在模擬 Microsoft Teams 會議的伺服器測試中,散熱效能較先進冷板技術提升三倍,GPU 晶片內部溫升降低 65%。該公司雲端營運與創新部門副總裁 Christian Belady 強調,微流體技術允許在更小空間內實現更高功率密度設計,同時改善 PUE 指標並降低營運成本。

香港作為亞太數據中心樞紐,冷卻市場規模預計從 2026 年的 1.89 億美元(約港幣 14.7 億元)增長至 2031 年的 4.66 億美元(約港幣 36.3 億元),年複合增長率達 19.72%。市場研究機構指出,Schneider Electric 透過收購 Motivair 並將冷卻分配單元整合進 Galaxy 電力系統產品線,提供與 EcoStruxure 監控系統互鎖的交鑰匙液冷方案;專注於浸沒式冷卻的 LiquidStack 則在多個市場創下 PUE 1.01 的標竿紀錄。TrendForce 分析師預測,隨著北美雲端服務商加大投資以及全球主權雲計畫興起,2026 年 AI 伺服器出貨量將較前一年增長超過 20%,推動碳化矽(SiC)與氮化鎵(GaN)等第三代半導體在數據中心電源系統滲透率,從 2026 年的 17% 躍升至 2030 年的 30% 以上。

Deloitte《2025 科技、媒體與電信預測》報告指出,生成式 AI 正推動數據中心能源消耗激增,全球 AI 數據中心年度用電量預計在 2026 年達到 90 太瓦時,相當於荷蘭或阿根廷等中型國家的年度總用電量。國際能源署(IEA)研究顯示,當 AI 完全整合進 Google 等搜尋引擎時,單次查詢電力需求可能從傳統搜尋的 0.3 瓦時飆升至 2.9 瓦時(參照 ChatGPT),若以每日 90 億次搜尋計算,年度額外用電需求將達 10 太瓦時。這種能源壓力正倒逼產業尋找突破性冷卻解決方案,而中國超冷卻技術的 20 秒快速降溫特性,恰好契合 AI 訓練中突發性高負載的散熱需求。

技術自主化拼圖:從晶片到冷卻的全鏈條佈局

中國超冷卻技術突破與其半導體產業自給自足戰略高度契合,尤其在美國持續收緊高階晶片與高頻寬記憶體(HBM)對華出口管制之後。TrendForce 報導,中國最大 NAND 製造商長江存儲(YMTC)正利用矽穿孔(TSV)先進封裝技術進軍 DRAM 市場,目標生產 AI 處理器所需的 HBM 晶片,計劃在武漢新建第三座晶圓廠部分產能投入 DRAM 生產。同時,中國 DRAM 領導廠商長鑫存儲(CXMT)已重啟大規模資本投資,在合肥廠區擴建 DDR5 DRAM 與第四代 HBM3 生產線,預計於 2026 年底實現 HBM3 量產。Tom’s Hardware 報導指出,中國計劃在 2026 年底前實現國產 HBM3 生產,這是中國 AI 晶片自主化拼圖關鍵一環。

這種「從晶片到冷卻」的垂直整合策略,反映出中國科技政策深層邏輯。智庫分析指出,中國政府透過第三期國家積體電路產業投資基金,在 AI 晶片設計平台、半導體製造設備等領域持續投資,期望在 2027 年實現 AI 晶片 70% 自給率。在 HBM 等關鍵零組件進口受限背景下,中國企業如百度、阿里巴巴、華為和寒武紀正加速開發自主 AI 晶片,而高效冷卻技術掌握程度將直接影響這些晶片在超大規模運算叢集中的穩定運行能力。中國科學院物理研究所團隊在論文中特別強調,液態壓致冷卻系統可在 1 巴壓力變化下實現顯著冷卻效果,這種低壓操作特性有利系統安全性與商業化應用。

值得注意是,中國「東數西算」工程正推動數據中心向能源豐富地區遷移,配備儲能系統的 AI 數據中心將成為大型園區標配。市場研究顯示,全球 AI 數據中心儲能系統裝機容量預計從 2025 年的 1.57 吉瓦時暴增至 2030 年的 8.8 吉瓦時,年複合增長率達 46.1%,其中中長期儲能系統(1-4 小時)比例將大幅提升,以支援電力套利與電網服務。這種基礎設施層面的系統性升級,配合超冷卻技術可能帶來的成本降低,將為中國 AI 產業創造顯著總體擁有成本(TCO)優勢。

商業化前景:實驗室突破到產業應用的漫長征途

雖然實驗室數據亮眼,這項超冷卻技術商業可行性仍面臨多重挑戰。目前公開資訊未披露具體原型系統細節、循環壽命測試數據或商業化時程,這與已進入大規模部署階段的 Microsoft 微流體冷卻(2025 年 9 月宣布)和香港科大液浸式系統(2024 年 10 月啟用)形成對比。劍橋 Barocal 公司聯合創辦人 Averdieck 在評論類似技術時坦承,將理論潛力轉化為商業方案,關鍵在於確保系統安全性、可靠性、可維護性以及能源效率。液態壓致冷卻系統需要精密壓力控制機制、防腐蝕材料以及長期穩定性驗證,這些都是從實驗室走向數據中心的必經之路。

然而,全球數據中心冷卻產業快速整合為新技術創造機會窗口。市場領導者 Vertiv 和 Schneider Electric 透過持續研發投資與策略性併購鞏固地位,兩者合計市佔率接近 35%。但專注 AI/HPC 工作負載的創新者如 Envicool、iTeaq 和 Deep Green 正憑藉專業化方案在利基市場取得進展,例如 Deep Green 將數據中心餘熱用於加熱泳池的創新模式。中國本土廠商如深菱(Shenling)透過政府合作與氣候適應性特製方案在國內市場保持強勢地位。數據中心行業分析指出,AI 仍是驅動數據中心發展首要力量,但電力、水資源與土地限制正倒逼產業尋找突破性解決方案。

對企業決策者而言,這項技術戰略意義在於可能重新定義 AI 基礎設施經濟學。香港科大液浸式冷卻案例顯示,先進冷卻技術可將 PUE 從傳統數據中心 1.5-2.0 降至 1.1 以下,能耗降低幅度達 80%。若中國超冷卻系統能實現類似效能並保持快速響應特性,對於計劃在未來五年內部署數十萬張 GPU 的雲端服務商而言,其總體擁有成本優勢將極具吸引力。JLL 預測顯示,2026-2030 年全球數據中心容量將新增近 100 吉瓦,相當於現有規模翻倍,意味約 2,000 億美元(約港幣 1.56 兆元)基礎設施投資,其中冷卻系統約佔 15-20%,即 300-400 億美元(約港幣 2,340-3,120 億元)潛在市場空間。

地緣科技競賽新變數:冷卻技術撬動 AI 霸權的可能性

中國超冷卻技術發展時機耐人尋味——正值全球 AI 算力競賽進入白熱化、能源瓶頸日益突顯之際。這項技術若成功產業化,將與中國在機械人、半導體和 AI 晶片領域全面推進形成協同效應。北京清華大學學者指出,中國政府將半導體視為現代科技政策基石,透過國家投資基金推動從晶片設計、製造設備到材料產業全鏈條自主化,目標在 2030 年前建立完全依賴國產知識產權的半導體產業。在這個脈絡下,冷卻技術成為支撐國產 AI 晶片大規模部署的關鍵基礎設施要素。

技術突破與地緣政治優勢之間並非線性關係。Microsoft 與 NVIDIA 在 2025 年深化合作,部署採用 GB200 NVL72 機架級系統的 Blackwell GPU,並利用 AI 在 200 小時內發現具備浸沒式冷卻潛力的新型冷卻劑原型(傳統方法需數月至數年),展示西方科技巨頭在 AI 驅動創新循環上的系統性優勢。Microsoft 微流體冷卻技術已完成真實工作負載測試,能將冷卻液直接送入晶片內部微通道,實現前所未有散熱效率。相較之下,中國超冷卻技術尚未公開任何數據中心環境測試結果,或與現有液冷系統性能對比數據。

未來三年,數據中心冷卻技術演進路徑可能呈現「短期液冷擴散、中期混合系統、長期晶片級管理」特徵。麻省理工學院研究指出,AI 訓練一個大型語言模型(如 GPT-3 規模)可能產生超過 300 噸二氧化碳當量排放,冷卻系統能源效率直接影響 AI 產業碳足跡。在這個脈絡下,零碳製冷劑的超冷卻技術確實具備環境優勢,但其商業競爭力最終取決於系統整合成本、維護複雜度以及與現有數據中心基礎設施相容性。這場競賽終極問題不是誰先掌握單一突破性技術,而是誰能更快將創新整合進完整 AI 基礎設施生態系統——從晶片、冷卻、電力到軟件優化的全棧能力。

對於香港及亞太地區數據中心營運商而言,保持技術中立並關注多元冷卻方案驗證進展將是審慎策略。隨著香港科大計劃擴大液浸式冷卻應用至其八層樓高性能數據中心,本地市場正成為檢驗各類創新技術實戰場。這項超冷卻技術是否能從實驗室突破演變為產業標準,最終取決於能否在未來 12-24 個月內展示可規模化原型系統,並在可靠性、成本與能效三個維度同時達到商業部署門檻——正如 AI 本身必須在真實世界應用中兌現承諾那樣。

資料來源: CCTV South China Morning Post Mirage News Microsoft News 香港科技大學 Intel Market Research

 

read more
人工智能應用方案

Google Project Genie 商業解構 : AI 即時成生互動世界模型 兩句生成 GTA6 世界並可遊覧

Google Project Genie 商業解構 : AI 即時成生互動世界模型 兩句生成 GTA6 世界並可遊覧 24

Google DeepMind 於正式向美國地區 Google AI Ultra 訂閱用戶開放 Project Genie 測試權限。這款基於 Genie 3 世界模型的實驗性原型平台,標誌著科技巨頭在通用人工智能(AGI)競賽中最新佈局。與傳統 AI 工具不同,Project Genie 能夠從文字或圖像提示中實時生成可互動 3D 環境,用戶可在虛擬世界中探索、移動並重新混搭場景。這項技術突破不但改變內容創作模式,更為企業在產品原型開發、員工培訓模擬、供應鏈沙盤推演等場景開啟全新可能。本文將深入分析世界模型技術商業價值、競爭格局以及企業決策者需要關注的戰略要點。

Google Project Genie 商業解構 : AI 即時成生互動世界模型 兩句生成 GTA6 世界並可遊覧 25

從概念驗證到商業化:Genie 3 技術突破三大關鍵

Project Genie 背後核心技術 Genie 3,是 DeepMind 自 2025 年 8 月起與獲信任測試者合作驗證的世界模型系統。該模型能以每秒 24 幀速度生成持續互動 3D 環境,並在用戶移動時實時預測場景演變,與過去靜態 3D 快照體驗截然不同。Genie 3 整合階層式表示學習與多模態融合能力,能同步處理視覺、文字和感應器數據,建構出具備物理一致性虛擬世界。根據技術文件顯示,系統目前支援最長 60 秒連續生成。有媒體引述 Google 發言人表示,這個時長經測試能在保持高品質與一致性同時,提供足夠探索體驗。

技術層面三大創新奠定商業應用基礎:首先是「世界草圖」功能,透過整合 Nano Banana Pro 預覽工具,用戶可在進入虛擬環境前精細調整場景並選擇第一人稱或第三人稱視角。其次是實時路徑生成機制,當用戶在環境中移動時,系統根據行動動態產生前方場景,並模擬真實物理規律如重力、液體流動和光線行為。第三是「世界重混」能力,用戶可基於現有場景提示詞創建衍生版本,並下載探索過程影片記錄。Flowhunt 分析指出,Genie 3 在 AGI 研究中解決關鍵瓶頸,為訓練智能代理(Agents)提供無限多樣模擬環境,避免傳統方法需人手編寫程式碼或昂貴現實世界部署。

然而技術仍有明確限制:生成世界可能不完全符合提示詞或真實物理規律,角色控制有時出現延遲,且部分 8 月預告功能如「可提示動態事件」尚未納入此版本。Google 承認這是早期研究模型,目標是透過開放測試理解用戶如何應用世界模型於 AI 研究和生成媒體領域。對企業而言,這意味現階段適合用於概念驗證和創意探索,而非生產級應用。

網民 GTA6 作品展示

五強爭霸:世界模型賽道戰略版圖

2026 年初世界模型賽道呈現多極競爭格局,至少五家主要玩家採取差異化策略角逐市場。Google DeepMind 同時推進三條技術路線:除了 Genie 3 外,還有專注遊戲環境互動 SIMA 代理系統,以及用於精細圖像編輯 Nano Banana。Fei-Fei Li 創立 World Labs 於 2025 年推出 Marble 商業平台,提供從免費到每月 95 美元(約港幣 740 元)分級定價,成為首個商業化落地世界模型服務。

Runway 旗下 Gen-4.5 在 2025 年 12 月 Video Arena 基準測試中擊敗 Google Veo 3 和 OpenAI Sora 2 Pro 奪冠,該公司明確將產品定位為「理解物理規律的世界模型」而非單純影片生成工具,強調物體運動具備真實重量、動量和力學表現。NVIDIA 則在 2025 年 CES 發布 Cosmos 平台,專攻自動駕駛和機械人領域,截至 2026 年 1 月下載量突破 200 萬次。與此同時,Yann LeCun 為其新公司 AMI Labs 籌集 5 億歐元(約港幣 42.4 億元)開發 VL-JEPA 系統,而 Verses.ai 基於 Karl Friston 主動推理概念推出 AXIOM 平台。

Introl 產業分析報告指出,世界模型競賽標誌運算模式從文字處理轉向影片生成、物理模擬和具身推理。各家技術側重點不同:DeepMind Genie 3 強調實時互動性和 AGI 訓練環境,World Labs Marble 主打商業可用性和定價模式,Runway 追求影片質素與物理真實度,NVIDIA 鎖定工業級應用場景。對企業技術總監(CTO)而言,選擇供應商需評估三個維度:應用場景匹配度(內容創作 vs 模擬訓練 vs 產品原型)、整合成本(API 友善度、現有工作流相容性)、以及長期技術路線(是否與企業數碼轉型策略一致)。

企業場景應用:從沙盤推演到數碼孿生

世界模型技術為企業決策層提供「先模擬再行動」戰略工具。Predikly 企業 AI 解決方案報告強調,在供應鏈管理、醫療保健和金融規劃等領域,實際試錯成本高昂甚至危險,世界模型創建安全模擬環境讓領導者能探索多種情境、比較結果並選擇最佳方案。具體應用包括:零售商模擬假期需求變化、物流公司測試燃料價格波動對配送時程影響、製造商在虛擬工廠調整生產排程後再應用於實體營運。

香港企業 AI 採用數據顯示潛在市場需求。香港金融研究院 2025 年初調查 55 家金融機構發現,75% 受訪者已實施至少一個生成式 AI 應用或正在試點階段,預計三至五年內此比例將升至 87%。然而當前應用集中於內部非客戶面向場景,虛擬員工助理是最常見應用,反映業界將生成式 AI 視為提升生產力和營運效率工具(75% 受訪者),其次才是創新推動和決策支援(53%)。這與 2025 年 Google Cloud 香港峰會調查結果一致:內容創作(26%)和內部自動化洞察(27%)是最頻繁部署 AI 場景。

Mario Thomas 戰略分析指出,世界模型讓企業從被動營運轉向預測性優勢,董事會能透過模擬未來場景提前因應變化。成本效益同樣顯著:實體世界試點實驗需要時間、資金和人力,模擬環境可大幅降低成本同時保持洞察強度,企業能在數小時內運行數千次測試,加速產品推出市場、市場策略和流程改進。AI 業務顧問在此扮演關鍵角色,協助企業選擇正確世界模型應用、建立安全機制並整合至現有系統,確保採用策略安全且符合長期目標。

通往 AGI 路徑:DeepMind 五到十年時間表

DeepMind 行政總裁 Demis Hassabis 在 2025 年 12 月訪談中揭示 AGI 路線圖,明確指出 Genie 與 SIMA 系統整合是核心策略。他解釋 DeepMind 資源分配採「50/50」模式:一半投入擴大規模,一半專注創新突破,兩者結合才能達成 AGI。關於擴展極限,Hassabis 澄清並未遭遇「牆」,而是經歷「遞減回報」,進展既非漸近線也非指數級,需透過架構創新彌補差距。

「模擬理論」框架展現技術願景:DeepMind 正推進「無限訓練迴圈」,將 Genie 世界模型與 SIMA 代理系統整合,前者創建物理一致無限環境供後者運作,形成「模擬演化」機制,觀察智能是否有機出現以減少對人類生成數據依賴。這與 Hassabis 提出「鋸齒狀智能」概念相呼應,描述當前頂尖模型不均勻能力分佈。他重申 AGI 將在 5 至 10 年內實現,並將此轉變類比為工業革命,但速度快十倍。

DeepMind 安全措施包括由聯合創始人 Shane Legg 領導 AGI 安全委員會,負責分析風險並提出安全建議,同時與 Apollo、Redwood Research 等外部組織合作,並與政策制定者共同開發國際治理框架。安全策略聚焦四大風險領域:誤用(人類故意使用 AI 造成傷害)、系統性風險、價值對齊失敗和控制問題。對企業決策者而言,DeepMind 時間表意味未來五年需將 AGI 影響納入戰略規劃,評估組織如何適應更強大 AI 系統,並建立內部 AI 倫理與治理機制。

企業行動指南:三大戰略考量

Project Genie 開放測試為企業提供觀察窗口,但決策者需區分「技術展示」與「業務就緒」。目前系統 60 秒生成限制和一致性問題顯示,短期內適用於創意原型、概念驗證和內部創新實驗室,而非關鍵業務流程。企業應將世界模型視為中期技術投資(2-3 年視野),建立內部能力團隊熟悉工具,同時密切追蹤技術成熟度指標如生成時長延伸、物理精確度提升和 API 穩定性改善。

競爭情報收集至關重要。企業技術總監應建立世界模型技術雷達,定期評估 Google Genie、World Labs Marble、Runway Gen 系列和 NVIDIA Cosmos 功能更新與定價變動。特別關注垂直行業解決方案出現:例如製造業可能優先考慮 NVIDIA Cosmos 機械人訓練能力,創意產業傾向 Runway 影片質素,而需要快速商業部署者可選擇 World Labs 即用型服務。

跨部門協作框架必須提前建立。世界模型應用橫跨產品開發、市場營銷、培訓發展和營運優化,需由技術總監、營運總監和策略總監共同設計治理結構,明確界定實驗範圍、成功指標和資源分配機制。參考香港金融業實踐,優先從內部非客戶面向應用起步,累積經驗後逐步擴展至外部應用。同時建立 AI 倫理審查流程,特別是涉及模擬真實人員或敏感場景時,確保符合監管要求和社會責任標準。

隨著世界模型技術從實驗室走向實際應用,未來三年將出現數碼孿生企業雛形,領導者能在完整虛擬副本中測試策略、預測市場變化甚至自動化決策後再應用於現實。對於期望在 AI 時代保持競爭力企業而言,現在正是建立世界模型認知、培養相關人才並設計應用藍圖關鍵時刻。技術競賽已經開始,但真正勝負將取決於誰能最快將模擬能力轉化為商業價值。

 

資料來源:
Google Official Blog
The Register
Introl Research
Predikly Enterprise AI Analysis
FinTech News Hong Kong

 

read more
人工智能企業趨勢應用方案

Gemini 3 Flash 視覺升級:Agentic Vision 如何解決 AI 幻覺問題?

Gemini 3 Flash 視覺升級:Agentic Vision 如何解決 AI 幻覺問題? 26


Gemini 3 Flash 視覺升級:Agentic Vision 如何解決 AI 幻覺問題?

Google 於 2026 年 1 月 26 日發佈 Gemini 3 Flash 的 Agentic Vision 功能,這項技術突破將傳統 AI 的靜態圖像識別轉變為主動式視覺調查流程。與以往模型僅能「一瞥」處理圖像不同,新系統透過程式碼執行能力實現 5-10% 的視覺基準測試品質提升,已開始在 Gemini 應用程式和 API 中向開發者開放。值得留意,中國 DeepSeek 於翌日(1 月 27 日)推出 OCR 2 模型,兩大科技巨頭幾乎同步發佈視覺 AI 突破,顯示全球多模態 AI 能力競賽正進入白熱化階段。

AI 不再「猜測」:視覺推理的範式轉移

傳統前沿 AI 模型如 Gemini 在處理圖像時採取單次靜態掃描方式,當遇到晶片序號或遠處街道標誌等精細細節時,系統被迫依賴機率推測而非確定性分析。Agentic Vision 引入「思考-行動-觀察」循環機制,將視覺理解轉化為多步驟主動調查過程。

模型首先分析用戶查詢和初始圖像制定計劃,接著生成並執行 Python 程式碼進行圖像裁剪、旋轉或標註操作,最後將轉換後的圖像附加至 Context Window(內容視窗)供模型以更佳視角檢視數據。這種方法從根本上解決標準語言模型在多步驟視覺運算中常見的幻覺問題,透過將計算任務卸載至確定性 Python 環境實現可驗證執行。

Google AI 開發者文件顯示,該功能在 Gemini 3 Flash 中正式支援,需同時啟用程式碼執行工具和思考模式方能啟動圖像處理能力。有媒體報導指出,此技術於 1 月 26 日透過 Google AI Studio 開發工具和 Vertex AI 的 Gemini API 正式推出,標誌著 AI 處理圖像方式的根本性變革。

三大應用場景重塑行業標準

建築合規驗證平台 PlanCheckSolver.com 的實測數據展現 Agentic Vision 的商業價值。該公司透過啟用 Gemini 3 Flash 的程式碼執行功能,使 AI 驅動的建築圖則驗證準確率提升 5%。系統能夠迭代檢視高解像度輸入,自動生成 Python 程式碼裁剪並分析屋頂邊緣或建築區段等特定區域,將裁剪圖附加回 Context Window 以圖像化驗證複雜建築法規合規性。這種主動檢視機制取代傳統單次掃描模式,讓 AI 能夠像人類專家般聚焦關鍵細節。

在圖像標註應用中,Gemini 3 Flash 展現與環境互動的新能力。當系統被要求計算手部手指數量時,模型執行 Python 程式碼在每根識別的手指上繪製邊界框和數字標籤,這種「視覺草稿本」確保最終答案基於像素級精確理解而非估算。視覺數學處理能力則體現在高密度表格解析場景,系統能識別原始數據、編寫程式碼將先前的 SOTA 基準歸一化為 1.0 並生成專業 Matplotlib 長條圖,以可驗證執行取代機率猜測。

企業決策者需關注的競爭態勢

DeepSeek 於 1 月 27 日發佈的 OCR 2 模型採用 DeepEncoder V2 架構,以語意推理方法取代傳統掃描式視覺編碼,僅需 256 至 1,120 個視覺 Tokens 即可處理複雜文檔頁面,在 OmniDocBench v1.5 基準測試中取得 91.09% 總分,較前代提升 3.73%。這種「視覺感知壓縮」策略實現 7 至 20 倍的 Tokens 減少,顯著降低大型語言模型的計算成本。相較之下,Google 的策略聚焦於透過程式碼執行實現動態圖像操作,兩種路徑代表多模態 AI 發展的不同技術哲學。

企業 AI 策略專家指出,2026 年成功的 AI 策略將混合基礎模型的神經直覺與符號及語意系統的結構化推理,這種混合架構結合大型語言模型的創造力與領域特定邏輯的治理、精確性和可解釋性。Gartner 預測到 2026 年,超過 60% 的企業應用程式將嵌入生成式 AI 以增強工作流程。在此背景下,Agentic Vision 的可驗證執行特性為企業提供關鍵的審計能力和合規保障。

Gemini 3 Flash 在 SWE-bench Verified 代理編碼測試中達到 78% 分數,不僅超越 2.5 系列,更勝過 Gemini 3 Pro。該模型以不到 Gemini 3 Pro 四分之一的成本推動品質與成本效能的帕累托前沿(Pareto frontier),為高頻開發任務提供新的效能標準。

技術演進路徑與擴展計劃

Google 透露目前 Gemini 3 Flash 在檢測精細細節時已能隱式執行縮放操作,但旋轉圖像或執行視覺數學等其他功能仍需明確提示觸發。團隊正致力於在未來更新中使這些行為完全隱式化,並探索為 Gemini 模型配備更多工具,包括網上搜尋和反向圖像搜尋功能以進一步奠定其對世界的理解基礎。該能力計劃從 Gemini 3 Flash 擴展至其他模型尺寸。

DataCamp 發佈的 2026 年視覺語言模型排行榜顯示,Gemini 2.5 Pro 目前在 LMArena 和 WebDevArena 排行榜上領先,在開放 LLM 排行榜中的視覺語言能力位居頂級模型之列。然而 Anthropic 的 Claude 4 在圖像化推理和視覺問答方面超越多數頂級模型,顯示市場競爭持續白熱化。

電腦視覺技術趨勢分析指出,2026 年從邊緣到雲端的協同作業、私隱優先 AI 和自訂視覺策略將成為最具影響力的發展方向。企業需建立能夠在雲端、開源生態系統和專有系統間協調的 AI 編排層,這將成為企業適應性的骨幹,能夠在模型間切換、執行合規並以業務邏輯背景化每個決策。

對企業的策略意涵

Agentic Vision的可驗證執行特性為企業帶來三重優勢:更快的法規對齊、更佳的成本控制和顯著改善的可審計性。建築、製造、醫療影像和金融文件處理等需要精確視覺檢視的產業,可透過此技術減少人工驗證成本並提升合規準確度。IBM 專家預測 2026 年 AI 和技術趨勢將重塑多個產業的運作模式,而視覺 AI 的主動調查能力正是此轉型的關鍵驅動因素之一。

企業決策者應評估現有視覺處理工作流程中哪些環節可受益於主動式圖像調查,特別是涉及高解像度文檔分析、品質控制檢驗和複雜視覺數學計算的場景。開發團隊可透過 Google AI Studio 的示範應用程式體驗此功能,或在 AI Studio Playground 中啟用「程式碼執行」工具進行實驗。隨著此技術從單一模型擴展至整個 Gemini 系列,早期採用者將在建立 AI 驅動視覺分析能力方面取得先發優勢。

未來企業需思考的問題不僅是 AI 能變得多聰明,更是如何智慧地選擇構建和治理這些系統。Agentic Vision 的可驗證執行框架為此提供一個可行的答案,將 AI 從黑盒機率系統轉變為可追溯、可審計的決策支援工具。

資料來源: google, sina

read more
人工智能企業趨勢應用方案

Kimi K2.5 Agent Swarm 技術解構:企業級多模態自動化從單點工具邁向群體智能生態

Kimi K2.5 Agent Swarm 技術解構:企業級多模態自動化從單點工具邁向群體智能生態 27


Kimi K2.5 Agent Swarm 技術解構:企業級多模態自動化從單點工具邁向群體智能生態

Moonshot AI 正式釋出 Kimi K2.5 多模態大模型,標誌著生成式 AI 從「對話機器人」正式跨入「蜂群智能體」(Agent Swarm)時代。這款基於 15 萬億混合視覺文本 token 訓練的開源巨獸,在 Humanity’s Last Exam (HLE) 基準測試中,配合工具調用取得 50.2% 的驚人成績,成功超越 OpenAI 與 Anthropic 的當前旗艦模型。本文將深入剖析 Kimi K2.5 如何透過其獨有的 PARL 技術(並行智能體強化學習)將任務執行速度提升 4.5 倍,並探討其對企業自動化架構的顛覆性影響、開源生態下的技術選型建議,以及在香港企業環境中的落地潛力。

 

蜂群智能體引爆效能革命:並行運算重塑自動化邊界

Kimi K2.5 的核心突破在於其「Agent Swarm(蜂群智能體)」技術,這項創新將 AI 的運作邏輯從線性序列徹底轉變為大規模並行協作。傳統的 AI 智能體在面對複雜任務時,通常採用單執行緒的思考模式,一旦步驟出錯或需要長路徑檢索,效率便會大幅下降。根據 Moonshot AI 發布的技術報告,Kimi K2.5 搭載的編排器(Orchestrator)能在不依賴預設工作流的情況下,針對單一指令自主生成、調度高達 100 個子代理 並執行 1,500 次工具調用。在記者模擬的企業調研測試中,過去需要數小時處理的市場數據掃描與多維度財報比對,透過蜂群並行處理,其端到端執行時間縮短了將近 80% [來源:Constellation Research]。這種架構不僅解決了長程推理中的「序列崩潰」問題,更讓 AI 從單兵作戰轉化為一支隨調隨用的專業團隊,實現真正意義上的「數字員工群」。

Kimi K2.5 Agent Swarm 技術解構:企業級多模態自動化從單點工具邁向群體智能生態 28

原生多模態架構:消弭視覺與代碼間的「翻譯損耗」

在企業 IT 技術選型的視角下,Kimi K2.5 採用的原生多模態架構(Native Multimodality)是區別於其他「拼接型」模型的關鍵指標。傳統模型多數是將視覺編碼器外掛於語言模型,導致在處理複雜視覺指令時容易產生語義流失;而 Kimi K2.5 透過 MoonViT 視覺編碼器,在預訓練階段即實現 15 萬億 token 的深度融合。這項技術優勢直接轉化為「視覺到代碼」(Vision-to-Code)的強大能力。資深技術顧問指出,該模型在 MMMU-Pro 視覺問答中取得 78.5% 的高分,甚至優於 GPT-5.2 的表現 [來源:Together AI]。對於正積極轉型數字化的香港企業而言,這意味著開發團隊只需上傳一張手繪 UI 草圖或一段網站演示視頻,Kimi K2.5 就能直接生成具備響應式布局與動態效果的前端代碼。這種「視覺優先」的開發範式,正顯著降低製造業視覺檢測報告自動化與金融圖表智能解析的技術門檻。

算力效益與開源戰略:企業在封閉生態外的「逃生艙」

面對全球 AI 監管趨嚴與資料私隱要求,Kimi K2.5 選擇在 Hugging Face 釋出開源權重,無疑為企業決策者提供了極具吸引力的「去中心化」選項。雖然其總參數高達 1.04 萬億,但受益於優化的混合專家架構(MoE),每次推論僅需激活 320 億 個參數,極大地優化了硬體成本效益。在記者採訪多家香港初創企業時發現,開發者對 Kimi K2.5 的 256,000 token 超長上下文窗口反響熱烈,這使其在處理整份法律合約集或完整代碼庫時,無需頻繁進行 RAG(檢索增強生成)切片。目前,Kimi K2.5 在 SWE-bench Verified 軟件工程測試中以 71.3% 的解決率領先業界 [來源:NVIDIA NIM]。與閉源模型如 GPT-5 相比,Kimi K2.5 提供的私有化部署能力,使金融、醫療等高敏感行業能在保障本地數據安全的同時,享受與頂尖 SaaS 模型比肩的智能水平,成功打破了 Vendor Lock-in(供應商鎖定)的技術枷鎖。

歷史轉折點:從單點 AI 工具向自主組織智能的跨越

回顧 AI 發展歷程,2024 年是「單模態大模型」的軍備競賽,而 2026 年則是以 Kimi K2.5 為代表的「智能體群」元年。與 2024 年底僅能處理簡單文本任務的 AI 不同,K2.5 在代碼生成與視覺推理的組合測試中,已展現出類人的協作直覺。數據顯示,在跨語言編程基準測試中,Kimi K2.5 以 73.0% 的成績超越了 Google Gemini 3 Pro,這在以往的開源模型中是難以想像的 [來源:The Tech Buzz]。這種性能飛躍不僅僅是參數量的增加,更是訓練策略的根本轉移。隨著中國 AI 團隊如 Moonshot AI 持續向全球開源社區輸出具備「思考與執行」雙重能力的高質量模型,企業 AI 的競爭焦點已不再是單純的算法比拼,而是如何將這些「智能蜂群」無縫融入現有的業務邏輯與組織治理框架中。

當企業能夠以十分之一的成本,部署一支具備專業視覺理解與自動化執行能力的 AI 蜂群隊伍時,傳統的人力資源與流程管理模式是否已做好準備迎接這一場「自動化奇點」的到來?

資料來源:
TechCrunch
Constellation Research
Hugging Face
NVIDIA NIM API
The Tech Buzz

read more