色情圖片電腦識分 Yahoo 開源首個 NSFW 圖像識別深度學習方案

機器學習、深度學習這些人工智能相關的解決方案用途甚廣,早前我們報導過有色情網站用演算法讓用戶可透過「以圖搜尋」找出相似女星,其實搜尋引擎上篩選不雅內容時亦會用到類似的技術。近日 Yahoo 就宣佈在 GitHub 上開源其偵測不適宜工作場所 (NSFW) 圖像的深度學習方案,據指這可能是首個識別 NSFW 圖像的開源演算法。

機器學習、深度學習這些人工智能相關的解決方案用途甚廣,早前我們報導過有色情網站用演算法讓用戶可透過「以圖搜尋」找出相似女星,其實在搜尋引擎上篩選不雅內容亦會用到類似技術。近日 Yahoo 就宣佈在 GitHub 上開源其用於識別不適宜工作場所 (NSFW) 圖像的深度學習方案,據指這可能是首個識別 NSFW 圖像的開源演算法。

 

Yahoo 開源首個 NSFW 圖像識別深度學習方案

所謂的不適宜工作場所內容 (Not suitable/safe for work, NSFW) 包括血腥、暴力及色情等各種露骨及不雅內容,大部分搜尋引擎均會預設啟用安全搜尋模式將這些內容過濾,以免用戶在不適宜的場合看到。而人工智能無疑在篩選這些內容當中擔當重要著角色。

近日 Yahoo 就透過官方 Blog 宣佈開源其用於識別 NSFW 圖片的深度學習方案。Yahoo 在文章中表示,在現今由圖片和用戶生成內容主導的網絡,過濾 NSFW 圖像已成為互聯網不可缺少的一部分。隨著電腦視覺、深度學習演算法和不斷改善的訓練數據,電腦現時已可非常精準地自動識別、過濾 NSFW 圖像內容。

今次 Yahoo 開源的深度學習方案,主要針對 NSFW 中色情圖片這一範疇,該公司指希望透過開源方案,讓更多開發者能參與到 NSFW 內容識別、分類的測試中,並提供反饋意見進一步完善分類機制。

方案的主要原理是利用演算法為提供識別的圖片評分 (0-1),如低於 0.2 分屬於安全內容,高於 0.8 分則很有可能屬於 NSFW 內容,同時亦會參考特定案例的 ROC 曲線來協助判定評分。Yahoo 方面亦表示,現時尚未有用於識別 NSFW 圖片的開源學習模型或演算法,換言之這可能是首個相關範疇的開源方案。

 

Source: Yahoo  GitHub