Anthropic 早前發表一份名為「Labor market impacts of AI: A new measure and early evidence」的研究報告,透過結合大型語言模型(LLM)的理論能力評估與 Claude 模型的實際使用數據,建立了一套全新的「觀察曝露度」(observed exposure)指標,用以衡量 AI 對不同職業的實際滲透程度,研究結果顯示 AI 目前對就業市場的實質影響遠低於理論上的自動化潛力,暫時未有證據顯示高曝露職業的失業率出現系統性上升,但年輕白領求職者的入職率已出現初步放緩跡象,反映 AI 對勞動市場的衝擊可能正以一種較隱蔽的方式展開。
理論潛力與實際應用之間的巨大落差
Anthropic 的研究團隊以 Tyna Eloundou 於 2023 年帶領的 OpenAI 開創性研究為理論基礎,該研究評估了 LLM 在技術層面上能否將特定工作任務的效率提升至少 1 倍,根據這套理論框架,電腦與數學相關職業約有 94% 的任務在理論上可由 LLM 執行,辦公室與行政支援職業則達到約 90%。
然而 Anthropic 團隊將理論數據與 Claude 模型的實際使用記錄進行比對後發現,現實中的 AI 滲透程度與理論預測之間存在極大差距,以電腦與數學職業為例,理論曝露度高達 94%,但實際覆蓋率僅為 33%。研究人員將這種落差歸因於多重實際障礙,包括模型本身的局限、法律與監管限制、需要額外軟件配合、人工審核需求,以及機構採用 AI 的速度較預期緩慢等因素。
報告舉出一個具體例子:Eloundou 的研究將「授權藥物補充處方並向藥房提供處方資訊」這項任務評為完全曝露(β=1),意味 LLM 在理論上可完全加速處理該任務,但 Anthropic 在其 Claude 使用數據中從未觀察到有用戶實際使用 AI 執行這項工作,說明理論上的技術可行性與實際職場應用之間往往隔着多重制度性和操作性的門檻。
全新「觀察曝露度」指標的建構邏輯
Anthropic 今次研究最核心的貢獻在於提出「觀察曝露度」這個新指標,有別於過往僅依賴研究員主觀評估 AI 能否完成某項任務的理論模型,這套新方法將 3 組數據來源整合:美國勞工部 O*NET 資料庫所列出的約 800 個職業及其對應任務、Anthropic Economic Index 所記錄的 Claude 實際使用數據,以及 Eloundou 等人提出的任務級理論曝露度評分。
這套指標的設計考慮了多個影響就業的關鍵維度,假如一個職業的任務在理論上可由 AI 執行,同時在 Anthropic Economic Index 中錄得足夠的使用頻率,而且使用場景屬於工作相關範疇,那麼該職業的觀察曝露度便會相應提高。研究團隊對自動化用途(即用戶將任務完全交由 AI 重複執行)賦予完整權重,而增強型用途(即用戶在過程中持續指導 AI 協作完成任務)則只計算一半權重,因為後者代表 AI 輔助人類而非取代人類的工作模式。
根據這套指標,電腦程式員以 75% 的任務覆蓋率位居最高曝露度職業之首,客戶服務代表排名第 2,數據輸入員以 67% 的覆蓋率排名第 3,相比之下約 30% 的美國勞動人口所從事的職業錄得零覆蓋率,意味其工作任務在 Claude 使用數據中出現的頻率低於最低門檻。這類職業包括廚師、電單車維修技師、救生員、酒保和洗碗工等,清一色屬於需要體力操作的崗位。
失業數據未見惡化但年輕白領入職放緩
研究團隊將觀察曝露度指標應用於美國 Current Population Survey 的勞動市場數據後發現,高曝露度職業的工人與低曝露度職業的工人之間失業率走勢並無顯著分歧,自 2022 年底 ChatGPT 推出以來,兩組工人的失業率差距變化幅度非常小,在統計學上與零無異。
然而針對 22 至 25 歲年輕工人的分析卻呈現較為值得關注的訊號,研究發現年輕工人進入高曝露度職業的入職率自 2024 年起出現相對下降,幅度約為 14%。同時進入低曝露度職業的入職率則保持穩定。這項發現與 Erik Brynjolfsson 等學者利用薪資處理公司 ADP 數據所得出的結論相呼應,後者報告指出 22 至 25 歲年輕工人在高曝露職業中的就業人數下降了 6% 至 16%,而且主要原因是招聘放緩而非裁員增加。
研究人員審慎地指出,這個訊號仍然只屬初步證據,因為未能入職高曝露度行業的年輕工人可能選擇留在現有崗位、轉投其他行業或重返校園進修,25 歲以上的工人群體則未有出現類似的入職放緩現象。
高曝露度工人的人口特徵分析
研究報告揭示了一個值得深思的發現:最容易受 AI 影響的工人群體,恰恰是傳統上被視為勞動市場中較具優勢的一群,根據 2022 年 8 月至 10 月(即 ChatGPT 發布前)的 Current Population Survey 數據,處於觀察曝露度最高 25% 的工人與零曝露度工人之間存在顯著差異。
高曝露度組別中女性比例高出 16 個百分點,白人比例高出 11 個百分點,亞裔比例接近零曝露度組別的 2 倍,在收入方面,高曝露度工人的平均薪酬較零曝露度工人高出 47%。教育程度差異更為明顯:持有研究生學位者在高曝露度組別中佔 17.4%,在零曝露度組別中僅佔 4.5%,相差接近 4 倍。
這些數據反映 AI 對就業市場的潛在衝擊主要集中於知識型白領職業,包括軟件開發、金融分析、研究及數據處理等領域,過去數十年間,藍領工人因全球化和自動化而承受巨大壓力,如今同樣的結構性威脅正逐步蔓延至白領階層。Anthropic 行政總裁 Dario Amodei 曾於去年表示,AI 技術可能會顛覆多達一半的初級白領工作。Microsoft AI 總監 Mustafa Suleyman 亦作出類似預測,認為大部分涉及電腦操作的專業工作將在 12 至 18 個月內被 AI 完全自動化。
美國勞工統計局的就業預測與 AI 曝露度的關聯
Anthropic 的研究團隊將其觀察曝露度指標與美國勞工統計局(BLS)2025 年發布的 2024 至 2034 年就業預測進行交叉比對,發現兩者之間存在一定的負相關,AI 曝露度每上升 10 個百分點,BLS 的就業增長預測便下降約 0.6 個百分點。
BLS 的最新預測顯示,美國經濟在未來 10 年將新增約 520 萬個就業崗位,總就業人數預計由 1.7 億增長至 1.752 億,增幅為 3.1%,遠低於過去 10 年 13% 的增幅,醫療及社會服務行業預計增長最快,達 8.4%。電腦與數學職業的預測增幅為 10.1%,是整體經濟增幅的 3 倍以上,因為企業對 AI 模型開發、數據分析和應用整合的需求正在推動相關人才的需求。
值得注意的是 BLS 在其預測中已開始將 AI 納入考量因素,局方承認 AI 的廣泛應用預計將抑制銷售、設計和行政支援等領域的勞動需求,但同時會帶動與 AI 開發和維護相關的技術崗位增長。數據科學家被列為增長第 4 快的職業,反映市場對 AI 相關技能的需求正在急速上升。
企業應如何解讀這份研究
對於企業管理層而言,Anthropic 這份研究傳遞了幾個重要的策略啟示,AI 技術的實際部署進度遠比理論預測緩慢,企業在規劃 AI 轉型時不應過度依賴理論曝露度評估。法規限制、軟件整合需求、人工審核流程和組織文化等因素,均會大幅減慢 AI 在職場的實際滲透速度。企業若單純根據理論預測進行大規模裁員或重組,可能會過早失去關鍵人才。
Anthropic Economic Index 的數據顯示,約 57% 的 Claude 使用屬於增強型用途,43% 屬於自動化用途,這意味 AI 在現階段更多是提升現有員工的工作效率,而非直接取代整個崗位。企業應優先考慮如何利用 AI 工具提升員工生產力,而非急於削減人手。
年輕白領工人入職率放緩的跡象值得人力資源部門密切關注,企業可能需要重新設計初級崗位的工作內容和培訓計劃,確保新入職員工能夠掌握與 AI 協作的技能,而非僅僅執行容易被自動化的重複性任務。
研究同時顯示,具備較高教育程度和技能水平的用戶能更有效地運用 AI 工具,Anthropic Economic Index 發現用戶輸入的複雜程度與 AI 輸出的質素之間存在高度正相關。企業在推行 AI 培訓時,應著重提升員工的 AI 協作能力,因為有效使用 AI 本身已成為一項需要培養的專業技能。
「白領大衰退」的可能情景
Anthropic 的研究人員在報告中明確提出了一個值得所有知識型經濟參與者警惕的情景:白領工人的「大衰退」,報告指出 2007 至 2009 年金融危機期間,美國失業率由 5% 倍增至 10%。假如 AI 曝露度最高的 25% 職業出現類似的失業率倍增(由 3% 升至 6%),該研究框架將能夠清楚偵測到這種變化。
這個情景目前尚未發生,但研究人員認為其屬於合理的風險範圍,考慮到理論曝露度與實際應用之間仍存在巨大差距,隨着 AI 技術持續進步、企業採用率逐步提升、部署深度不斷加強,實際滲透率的紅色區域將逐漸擴展至覆蓋理論能力的藍色區域。
美國聯儲局理事 Michael S. Barr 在最近一次演講中亦將白領就業大幅萎縮列為 AI 採用可能帶來的 3 種情景之一,政界方面,美國多位政治人物已開始關注白領工人面臨的潛在威脅。Florida 州長 Ron DeSantis 多次公開表達對白領工作可能因 AI 而「過時」的擔憂。前總統候選人 Andrew Yang 更在社交媒體上預測,數以百萬計的白領工人將在未來 12 至 18 個月內因 AI 而失去工作。
研究的局限性與前瞻
Financial Times 分析指出,Anthropic 這份報告所採用的雷達圖已成為一種觀點測試,不同立場的觀察者從同一組數據中得出截然相反的結論:樂觀者認為紅色區域(實際使用)遠小於藍色區域(理論潛力),證明 AI 對就業的即時威脅被嚴重誇大;悲觀者則着眼於兩個區域之間的巨大差距,認為這代表未來還有大量尚未實現的顛覆空間。
研究本身亦存在重要的局限性,數據僅涵蓋 Anthropic 的 Claude 產品使用記錄,並未包括 ChatGPT、Gemini、Microsoft Copilot 等其他 AI 平台的使用數據,意味 AI 對勞動市場的總體影響很可能比單一供應商的數據所能反映的更大。理論曝露度評估基於 2023 年初的 LLM 能力水平,自那時起 AI 技術已經歷多次重大躍進,該評估可能需要更新。
Anthropic 的研究團隊表示,這份報告是建立長期追蹤框架的第 1 步,團隊計劃定期更新使用數據,形成一幅不斷演進的任務覆蓋圖景。鑑於年輕工人和新入職者方面出現的初步訊號,團隊下一步可能會研究在高曝露度領域持有相關學歷的應屆畢業生如何在當前勞動市場中尋找出路。
對於香港及亞太地區的企業而言,這份研究提供了一個及早部署的窗口期,AI 對白領職業的滲透雖然進度較預期緩慢,但方向已經明確。企業應把握目前理論潛力與實際應用之間的緩衝期,積極投資員工 AI 技能培訓、重新設計工作流程,並制定應對 AI 深度滲透的長遠人力資源策略,冀能在技術全面成熟時佔據有利位置。