Google 的漏洞賞金計劃一直是不少白帽黑客的活躍平台,找出不同產品的安全漏洞,就可以獲得獎金。最近 Google 着重於在這個計劃中,加入生成式 AI 的範疇,鼓勵社群找出潛在問題。
據報導指,Google 的漏洞賞金計劃 (Vulnerability Rewards Program) 將會把生成式 AI 的漏洞加入在獎金範疇。Google 指,「我們相信,擴充 VRP 將激勵圍繞 AI 安全和保安的研究,並將潛在問題公之於眾,最終讓 AI 對每個人都更加安全。」除了鼓勵社群進行研究外,Google 早前已經成立 AI Red Team 專門模擬各種黑客的攻擊,最近更針對 ChatGPT 和 Google Bard 等生成式 AI 服務進行測試。
AI Red Team 表示,大型語言模型容易受到指示注入攻擊,也就是透過特別設計的指示來影響模型的行為,使本來的安全規範被繞過,黑客可以直接輸入指示來取得想要的敏感或機密資料,或者直接從訓練數據庫中提取原有內容。
指示注入攻擊、訓練數據提取攻擊、模型操縱以及模型竊取攻擊,都在 Google 新的 VRP 範疇之內,不過 Google 表示,如果只是發現與版權問題相關的漏洞,或重建非敏感或公共資料的數據提取的話,則不會提供獎金。
來源:TechCrunch