Reddit 作為全球最大型的英文討論區之一,其擁有的內容量當然相當龐大,OpenAI 最近就終於與 Reddit 達成協議,授權使用論壇上的內容來訓練 AI 模型。
OpenAI 表示,今次合作可以讓他們使用 Reddit「實時、結構化和獨特的內容」,授權的內容包括討論串和回覆,而 OpenAI 亦計劃與 Reddit 為 Reddit 用戶和版主開發新的 AI 功能,OpenAI 也會成為 Reddit 的廣告合作夥伴。不過對於 Reddit 的 AI 功能方面就未有進一步解釋。
AI 模型規模在越來越龐大的同時,可以使用的訓練資源卻逐漸短缺,雖然可以使用 AI 生成的內容「反芻」進行訓練,但效果比真人編寫的實際內容差得多。今次 Reddit 上極為龐大的真人編寫內容就可以成為珍貴的訓練材料。而 OpenAI 近來對於數據授權協議越來越重視,也是促成今次交易的原因之一。除了 OpenAI 之外,Reddit 已經向 Google 等其他公司授權內容,成為平台的一大收入來源。不過平台將內容產品化的舉動,受到不少用家反對,未來這些反對聲音會否影響發展方向,則有待觀察,
來源:OpenAI