Google 翻譯又出包,China breaks promise 譯成「中國信守諾言」問題出在哪?

38

轉載從: Tech News 科技新報

Google 翻譯又出包,China breaks promise 譯成「中國信守諾言」問題出在哪?

Google 翻譯(Google Translate)是不少網友愛用的翻譯工具,其支援超過 100 種語言,可讓用戶輕鬆翻譯文字、手寫字跡、照片文字等內容,能夠消弭語言之間的隔閡。不過,由於 Google 翻譯背後採用機器學習技術,過去就不斷發生錯誤翻譯的狀況引發熱議,這次則被發現把「China breaks promise」(中國破壞承諾)翻譯成「中國信守諾言」,牽動用戶們的敏感神經。

這 2 天在網路上引起熱烈討論的是,Google 翻譯竟把「China breaks promise」(中國破壞承諾)翻譯成「中國信守諾言」,然而測試如「US breaks promise(美國破壞承諾)」則會翻譯成「美國違約」;其他測試如換成香港也有同樣的「信守」狀況,但若換成英國、德國等則恢復正常的翻譯內容。不過截稿前筆者觀察,上述錯誤翻譯狀況已經修正成「中國違反承諾」。

今日網上瘋傳,Google Translate 將 China breaks promise 翻譯做「中國信守諾言」,但 US breaks promise 就會翻譯做「美國違約」。

哈,今次仲捉唔到 don’t do evil 做…

前線科技人員發佈於 2021年1月17日 星期日

由香港科技界人士所組成的「前線科技人員」透過粉絲專頁點出,當數十年前開始有人研究電腦翻譯,主要方法是透過電腦程式辨認不同文法,但人類語言的特色就在於有許多特別用法,無法只從文法得出真正意涵,所以翻譯效果總是差強人意。直到大概十幾年前,因為硬體提升使得機器學習(Machine Learning)技術普及,研究人員開始以大量語言數據建立模型,再把翻譯的語句與模型比對得出結論。

翻譯工具採用機器學習技術雖然效果比傳統方法更好,但可能會有「Garbage in, garbage out」的問題發生。以 Google 翻譯來看,其數據庫大部份資料是從公開途徑取得,如有某一國家或某種語言經常將「China breaks promise」翻譯成「中國信守諾言」並放上網,被有心人士操弄使大量錯誤的語言數據就會造成誤判,久而久之就讓 Google 翻譯中招。

Google 官方則回應「Google 翻譯是一種自動翻譯工具,透過使用數百萬種現有翻譯中的模式,來幫助決定最佳翻譯結果。這類型的自動系統有時會產生無心的錯誤,例如將否定詞翻譯成肯定詞。我們很感謝使用者的回饋,並正在努力改善我們的技術。」

這也不是 Google 翻譯第一次出錯,最近一次是在香港反送中活動期間,被網友發現 Google 翻譯竟把「so sad to see Hong Kong becoming China」,翻譯成「很高興香港變成中國」,這與翻譯的意思與原文完全相反,而引發熱議的錯誤狀況總是牽動用戶們的敏感神經。

Tried it myself. “So sad to see Hong Kong become China” is mistranslated to “very happy (很高兴) to see Hong Kong become China” https://t.co/qqqt67LWoN

— Laurent Thomet 卢鸿 (@LThometAFP) June 14, 2019

如果懂了 Google 翻譯背後的運作原理,對於出現這樣的狀況或許就不會感到過於吃驚。Google 翻譯仍需要大量地回報修正,才能改善翻譯品質,實際上用戶可向「Google 翻譯貢獻」提交個人意見回饋,以協助其他用戶了解不同的語言。

編按:文中加入 Google 官方正式回應。(2021/01/18 PM 06:00)

(首圖來源:shutterstock)