Microsoft Research 最新發表的論文《LLMs Corrupt Your Documents When You Delegate》揭示一個令企業決策層必須正視的事實,即使是市面上最頂尖的大型語言模型(LLM)在處理長時間及多步驟的檔案編輯工作時平均會默默損壞 25% 的檔案內容,而所有受測模型的平均檔案劣化幅度更高達 50% 。
Anthropic 早前發表一份名為「Labor market impacts of AI: A new measure and early evidence」的研究報告,透過結合大型語言模型(LLM)的理論能力評估與 Claude 模型的實際使用數據,建立了一套全新的「觀察曝露度」(observed exposure)指標,用以衡量 AI 對不同職業的實際滲透程度,研究結果顯示 AI 目前對就業市場的實質影響遠低於理論上的自動化潛力,暫時未有證據顯示高曝露職業的失業率出現系統性上升,但年輕白領求職者的入職率已出現初步放緩跡象,反映 AI 對勞動市場的衝擊可能正以一種較隱蔽的方式展開。