Google 漏洞賞金計劃加入生成式 AI 威脅

Google 的漏洞賞金計劃一直是不少白帽黑客的活躍平台,找出不同產品的安全漏洞,就可以獲得獎金。最近 Google 着重於在這個計劃中,加入生成式 AI 的範疇,鼓勵社群找出潛在問題。

據報導指,Google 的漏洞賞金計劃 (Vulnerability Rewards Program) 將會把生成式 AI 的漏洞加入在獎金範疇。Google 指,「我們相信,擴充 VRP 將激勵圍繞 AI 安全和保安的研究,並將潛在問題公之於眾,最終讓 AI 對每個人都更加安全。」除了鼓勵社群進行研究外,Google 早前已經成立 AI Red Team 專門模擬各種黑客的攻擊,最近更針對 ChatGPT 和 Google Bard 等生成式 AI 服務進行測試。

AI Red Team 表示,大型語言模型容易受到指示注入攻擊,也就是透過特別設計的指示來影響模型的行為,使本來的安全規範被繞過,黑客可以直接輸入指示來取得想要的敏感或機密資料,或者直接從訓練數據庫中提取原有內容。

指示注入攻擊、訓練數據提取攻擊、模型操縱以及模型竊取攻擊,都在 Google 新的 VRP 範疇之內,不過 Google 表示,如果只是發現與版權問題相關的漏洞,或重建非敏感或公共資料的數據提取的話,則不會提供獎金。

來源:TechCrunch