如何辨認內容屬於 AI 生成還是真人創作,已經變得越來越困難。Google 最近就發表最新的文字浮水印技術 SynthID Text,讓開發者為生成式 AI 模型所撰寫的文字加上浮水印,方便進行偵測。
SynthID Text 的運作原理是透過調整文字生成模型的標記(token)分佈來實現。當模型根據提示如「你最喜歡的水果是什麼?」來生成文字時,它會預測每個標記出現的機率,而 SynthID Text 則在這個分佈中插入額外資訊,形成獨特的浮水印模式。
Google 表示,SynthID Text 已整合到其 Gemini 模型中,且不會影響文字生成的品質、準確度和速度。即使文字被裁剪、改寫或修改,浮水印仍然有效。不過該技術在處理短文、翻譯文字或事實性回答時的表現較差。這項技術現已可從 Hugging Face 及 Google 更新版的 Responsible GenAI Toolkit 中下載使用。
根據歐盟執法機構的報告,到 2026 年,網路上 90% 的內容可能由 AI 生成,因此類似的分析偵測技術就變得更加重要。其中中國已開始強制要求為 AI 生成內容加上浮水印,加州也正在考慮類似措施,不過實際成效就仍然需要觀察。
來源:TechCrunch