Google 的優勢是其強勁的搜尋引擎和相關技術,如果用來訓練 AI 模型,效果應該頗為理想。最近他們就更新了私隱政策,明確表示他們會利用網上搜刮得來的數據訓練自家 AI 模型。
Google 的新版本私隱政策中提到,網上搜刮 (Scraping) 所得的數據,會用於改善服務和開發新產品、功能和技術,其中包括訓練 AI 模型,以及開發功能和產品如 Bard、Google 翻譯和 Cloud AI 等等。不過 Google 當面並沒有明確指出他們會如何處理收版權保護的內容,不少網站都有明確標示禁止使用其數據來訓練 AI 模型,不過 Google 會否能夠避開讀取這些內容則仍然是個疑問。
近來對於大型語言模型訓練所使用的數據,已經有愈來愈多的版權和私隱爭議,包括 OpenAI 等公司已經先後開始面對相關的法律訴訟,今次 Google 明確表示會收集網絡數據用作訓練模型,又會否引起類似的法律問題,就仍然有待觀察了。
來源:Gizmodo