LINE 努力訓練 AI 聽說能力，要成為 LINE Bank 等服務重要的技術支架

由

2019-12-06

語言助理是這年代熱門話題，但不是每家企業有工程團隊能寫程式串接 Chatbot，提供語音問答服務。因此提供工具協助一般企業建議 Chatbot 是 AI 應用普及的重要一步。台灣人常用的 LINE 通訊與網路入口服務布局未來，推出 Chatbot Builder Framework，能不用寫程式只要餵資料，就能建構 Chatbot，服務不同應用場景。

NAVER Clova 資料科學家李在元負責帶領 Chatbot Builder Framework，解釋他們推出 LINE Partners 計畫要積極招商，尋求不同領域的公司來合作，建構 Chatbot 生態。而台灣不少人很關心 Clova 的中文語音辨識的狀況，李在元指出他們拿韓語的訓練資料集 chitchat 來訓練，並且將 Chitchat 資料集翻譯成英文和台灣中文，訓練英文和台灣中文的問答。結果發現中文情境下，測試的次數越多，辨識的成功率下降。要能推出台灣人滿意而且辨識率達一定程度，還需要努力。

另外 Chitchat 資料集翻譯成英文、台灣中文，也會發生中文有的句型，並不會存在翻譯過來的 Chitchat 資料集當中，造成 Chitchat 訓練出來的中文語音辨識會缺句型，需要另外補上缺漏的句型資料來訓練。

LINE 努力訓練 AI 聽說能力，要成為 LINE Bank 等服務重要的技術支架

▲ 李在元解釋中文辨識度的問題，希望能隨著時間能夠逐步改善。(Source：科技新報)

李在元指出，他們總共用 4 種模型訓練出適合的語音辨識模型，並且透過 AutoML 模型再選擇最適合、辨識度最高的模型，來服務使用者。

LINE 推 LINE Partners 語音服務計畫，至於 Chatbot Builder Framework 的收費模式，李在元指出要依案例來談，有很多種雙方都能獲益，資源交換的型式，客戶資料如金融業狀況，不能隨便上雲端，也能用 on-premise 的型式安裝在合作客戶的機器。

李在元指出，目前語音辨識模型在多語言混雜情境當中，因為模型針對單一語言訓練，隨著混雜的語言比重越高效果不好，像是 90% 英語搭配 10% 中文，相比 80% 英文搭配 20% 中文，後者辨識效果會比較差。不過搭配 superdomain 模型，判斷講者主要是講什麼語言，再搭配特定語言的模型，能達到比較好的語音辨識效果。

LINE 由於有即時通訊軟體的優勢，可以運用 LINE ID 提供的身份認證機制，對於語音辨識衍生的應用，來說，能夠方便的口語介面。像是 LINE 提出的 LINE Brain 與之後要上線的 LINE Bank，語音辨識與語音服務是他們各自業務重要的核心，LINE 與他們母集團 NAVER 必須要做出辨識正確率高的語音辨識程度，才能達成這兩項計畫給予技術支援，滿足使用者的期待。

(首圖來源：科技新報)

Perspective Box 透視箱