從 Siri 和微軟小冰,再到 Amazon 的 Alexa,以及數以萬計的人工智慧語音服務,此種服務已經漸漸崛起並成為人類生活的一部分了。但無論語言或文字,由於人類很多話語都跟常識及上下文有關,因此造成人工智慧常遭遇理解上的困難,不過研究人員近日發現一招可提升機器認知能力的方法:訓練它們使用第二種語言!
Salesforce(企業雲計算公司)的研究團隊研發出一個機器學習模型,先訓練這個模型在英語和德語之間翻譯的能力,也就是讓它學會德語和英語,之後運用此模型做不同工作,像是「判斷一段文字中作者的心情」、分類問題的種類以及回答問題等各項任務,結果顯示經過雙語訓練的機器學習模型,表現超過一般的機器學習模型。
研究人員之一 Bryan McCann 表示:「翻譯能力和語言間有重要的關聯性,此外,訓練機器學習翻譯能力證明對自然語言運算有很大的幫助。」Salesforce 首席科學家 Richard Socher 也說:「雖然我們是訓練機器學習翻譯,但是基本上等於訓練它理解文字及內容。」
Salesforce 的商用人工智慧平台 Einstein
Salesforce 為一管理客商業活動的雲端平台,提供一系列商用人工智慧工具,像是能根據銷售資料推薦企業主下一步行銷策略、自動分類重要的信件或聊天紀錄等。Richard Socher 表示,這次研究成果,對自家人工智慧平台服務的提升非常有助益。
為什麼人的語言這麼難懂?
儘管現在語言處理系統如 Siri 及 Watson 等,能根據人類的話或輸入的字反應,但其實它們只是根據稱為深度學習的演算法,經由統計法做出結論回應,而不是真正理解自己講了什麼話,也無法與用戶聊天。
像 Google 研究人員 Quoc Le 曾用 18,900 部電影對話訓練機器學習模型,結果問它「生命的意義是什麼?」機器學習卻回答「服務高階層的人」這種奇怪的答案。
MIT 知名語言學家 Noam Chomsky 表示,由於人類對自己語言的原理了解也極為有限,更何況教會機器理解並運用。「語言的特別在於不只和了解語言本身有關,也跟大量世界常識有緊密關聯。」Noam 說。
MIT 認知神經科學家 Tenenbaum 則表示,目前我們對人類心智的了解極其有限,他推測人類學習語言的歷程可能從嬰兒時期開始「看」到這世界、「接觸」這世界都有關。
如果這個想法是對的,那要讓機器理解人類語言可是比想像中還要困難的龐大工程,需要橫跨心理學、心智模型的建立,來模擬人類從小的學習情況。
(首圖來源:pixabay)