close
人工智能企業趨勢

中國發展語音智能助理最大挑戰,MIT:學中文太難

人工智能,中國有自己的那一套。阿里巴巴推出的語音揚聲器 Tmall Genie 類似亞馬遜的 Echo,搭載語音助理 AliGenie,可以線上購物、查看天氣、放音樂、控制家中的智能裝置。百度也有對話平台叫做 DuerOS,可以添加在家用機器人、電視機上盒、HTC 智能手機上,中國科技巨擎期待自家語音助理可以吸引投資者,與亞馬遜互別苗頭。

 

事實上這個市場潛力無窮,IDC 預期 2020 年 51% 的中國智能駕駛產業,68% 的電話與穿戴產業會搭載語音人工智能系統。麻省理工科技評論 (MIT Technology Review) 報導認為,中國發展語音系統有跡可循,因為中文輸入相對麻煩,這也是為何中國消費者早就習慣語音留言取代文字輸入使用 WeChat。

但是現在中國的語音助理技術可以執行命令,但無法對話,因為對話運算沒那麼簡單,必須先解決中文的複雜性。報導舉例,在中文世界當中,同樣的單字安排在不同的順序上意義就會不同,即使順序相同,意思也會隨上下文而出現差異。此外,中文沒有像英文的空格,所以中國自然語言處理研究人員必須教育演算法在哪裡插入空格,以建立句子適當的意義,且中文沒有時態,所以機器很難識別句子的時間意義。

更別說中國有許多方言,對機器學習而言也是一大挑戰。研究自然語言處理的清華大學副教授指出,為了真正了解人類講話者的意圖並進行適當的溝通,電腦將不得不採用語調和壓力等細微的線索。 他們也必須了解情緒,因為人類的決策不是完全依賴於邏輯。

為了使系統更加智能,百度在平台上引入培訓師模式,讓軟體開發人員透過內建的註釋機器人即時提供語言數據,機器人接收到開發者反饋從中學習,然後更正系統。

報導認為,中國研究人員解決這些問題的一個優勢是大量數據,由於支持當今電腦語言理解的神經網絡需要大量的數據進行訓練,因此擁有的數據愈多,其神經網絡將更加智慧化。截至 2016 年底,百度每月活躍行動用戶達到 6.65 億戶,截至今年 3 月份,阿里巴巴每月有5.07 億行動用戶。

但是阿里巴巴的人工智能科學家王剛表示,研究人員必須設計不需要大量數據的神經網絡,才能讓機器語言學習更有效率。他說,畢竟在現實世界中,人們用不同方式表達同樣意義,電腦不可能學會所有解釋。

王剛與研究團隊開發一種不需龐大數據,只要相關主題的數據就可訓練電腦理解主題的方法,例如為了訓練神經網絡了解運動醫學中的文本,只需使用運動與醫學數據,就特定主題訓練神經網絡。雖然使用特定主題資料的效果不如大量數據,但是在數據量有限的情況下,這種方法特別有用。

由於對話介面的互動更自然,將可吸引更多人進入聯網世界,而最終語音助理成功的關鍵就是內容和服務。如在中國推出小魚聲控家庭助理機器人的 Ainemo,計劃透過百度的 DuerOS 對話平台在家庭語音助理中建立教育和醫療保健項目,目標是為不太會使用電腦與智能手機上網,特別是老人與幼兒提供基於語音的服務。

(本文由 TechNews 援權轉載)

 

Tags : alibabaBaidu
Technews

The author Technews

科技新報 (TechNews)於 2013 年下半年成立,是一群對資訊科技、能源、半導體、行動運算、網際網路、醫療、生物科技具有高度熱忱與興趣的產業與新媒體人士所共同組成的時代新媒體,以產出有觀點與特色的原創文章為主要任務。