Facebook 應用非監督式機器學習訓練智能翻譯

人工智能應用廣泛,其中一個實用的範疇就是自動翻譯功能。Facebook 最近在開發其英語到烏爾都語的翻譯功能時,就使用了非監督式機器學習技術,解決翻譯範例不足的問題。

這個翻譯開發計劃是由 Facebook AI 研究部門(FAIR)與應用機器學習部門共同進行。他們在非監督式機器學習系統上輸入了兩個語言間的 10 萬個翻譯範例,其效果比監督式機器學習更佳。研究負責人 Antoine Bordes 表示,由於英語及烏爾都語之間只有很少的範例可以輸入,這情況下非監督式機器學習系統可以有更好的表現。

這次開發的成果將會在秋天的 EMNLP 2018 大會上發表。Antoine Bordes 認為,今次的嘗試意味着未來甚至可以翻譯沒有人會說的語言,例如外星語言或者古籍上的文字,讓人大致上理解其意思,是個相當重要的技術突破。FAIR 的開發項目都會開源並分享至 GitHub 上,今次的研究項目亦不例外。

與傳統透過大量既有資料進行分析的機器學習不同,這個系統結合逐字翻譯、語言模型和反向翻譯方式,自我改善翻譯質素,在持續運算之下,翻譯會變得越來越準確。Facebook 會繼續探索這個人工智能系統能否對應更多的翻譯種類,不過將會需要更多的資料搜集和翻譯專家去驗證結果。

來源:VentureBeat