中國發展語音智能助理最大挑戰，MIT：學中文太難

人工智能，中國有自己的那一套。阿里巴巴推出的語音揚聲器 Tmall Genie 類似亞馬遜的 Echo，搭載語音助理 AliGenie，可以線上購物、查看天氣、放音樂、控制家中的智能裝置。百度也有對話平台叫做 DuerOS，可以添加在家用機器人、電視機上盒、HTC 智能手機上，中國科技巨擎期待自家語音助理可以吸引投資者，與亞馬遜互別苗頭。

事實上這個市場潛力無窮，IDC 預期 2020 年 51% 的中國智能駕駛產業，68% 的電話與穿戴產業會搭載語音人工智能系統。麻省理工科技評論 (MIT Technology Review) 報導認為，中國發展語音系統有跡可循，因為中文輸入相對麻煩，這也是為何中國消費者早就習慣語音留言取代文字輸入使用 WeChat。

但是現在中國的語音助理技術可以執行命令，但無法對話，因為對話運算沒那麼簡單，必須先解決中文的複雜性。報導舉例，在中文世界當中，同樣的單字安排在不同的順序上意義就會不同，即使順序相同，意思也會隨上下文而出現差異。此外，中文沒有像英文的空格，所以中國自然語言處理研究人員必須教育演算法在哪裡插入空格，以建立句子適當的意義，且中文沒有時態，所以機器很難識別句子的時間意義。

更別說中國有許多方言，對機器學習而言也是一大挑戰。研究自然語言處理的清華大學副教授指出，為了真正了解人類講話者的意圖並進行適當的溝通，電腦將不得不採用語調和壓力等細微的線索。他們也必須了解情緒，因為人類的決策不是完全依賴於邏輯。

為了使系統更加智能，百度在平台上引入培訓師模式，讓軟體開發人員透過內建的註釋機器人即時提供語言數據，機器人接收到開發者反饋從中學習，然後更正系統。

報導認為，中國研究人員解決這些問題的一個優勢是大量數據，由於支持當今電腦語言理解的神經網絡需要大量的數據進行訓練，因此擁有的數據愈多，其神經網絡將更加智慧化。截至 2016 年底，百度每月活躍行動用戶達到 6.65 億戶，截至今年 3 月份，阿里巴巴每月有5.07 億行動用戶。

但是阿里巴巴的人工智能科學家王剛表示，研究人員必須設計不需要大量數據的神經網絡，才能讓機器語言學習更有效率。他說，畢竟在現實世界中，人們用不同方式表達同樣意義，電腦不可能學會所有解釋。

王剛與研究團隊開發一種不需龐大數據，只要相關主題的數據就可訓練電腦理解主題的方法，例如為了訓練神經網絡了解運動醫學中的文本，只需使用運動與醫學數據，就特定主題訓練神經網絡。雖然使用特定主題資料的效果不如大量數據，但是在數據量有限的情況下，這種方法特別有用。

由於對話介面的互動更自然，將可吸引更多人進入聯網世界，而最終語音助理成功的關鍵就是內容和服務。如在中國推出小魚聲控家庭助理機器人的 Ainemo，計劃透過百度的 DuerOS 對話平台在家庭語音助理中建立教育和醫療保健項目，目標是為不太會使用電腦與智能手機上網，特別是老人與幼兒提供基於語音的服務。

（本文由 TechNews 援權轉載）

中國發展語音智能助理最大挑戰，MIT：學中文太難

Mastercard 計劃在港推出二維碼支付服務

助下一代重溫互聯網歷史　開發者於 GitHub 爭取 Flash 開源

The author Technews

中國發展語音智能助理最大挑戰，MIT：學中文太難

The author Technews

you might also like

阿里通義千問獲 NeurIPS 最佳論文獎 首個中國團隊奪此殊榮

阿里巴巴開源 Wan2.2-S2V 語音驅動影片模型 可生成電影級數碼人像影片

阿里巴巴全球數學競賽首次設立 AI 挑戰賽

透明與開放：構建安全和公平 AI 創新生態

張勇接任阿里雲總裁不久後離職 由蔡崇信接任

阿里通義千問獲 NeurIPS 最佳論文獎　首個中國團隊奪此殊榮

阿里巴巴開源 Wan2.2-S2V 語音驅動影片模型可生成電影級數碼人像影片

張勇接任阿里雲總裁不久後離職　由蔡崇信接任