谷歌AI擊敗棋王後再進化！會開口說話、語調超像真人

7 年前

谷歌人工智慧(AI)系統「AlphaGo」，先前擊敗南韓圍棋棋王Lee Se-dol揚名國際。如今研發AlphaGo的團隊再下一城，宣稱能讓電腦說話的聲音更貼近人類，或許未來人們能和AI對話聊天。

CNBC、每日郵報、英國金融時報報導，谷歌母公司Alphabet旗下的DeepMind 8日宣布研發新技術，能讓電腦合成語音和人類聲音的差距減少一半。DeepMind表示，長久以來，人機互動的夢想就是讓人類能和機器對話。

當前的語音合成技術錄製人們實際說話的聲音，存放在資料庫，需要時把字句打散重組，合成為完整句子，此種方式生成的語音聽起來生硬不自然，也缺乏感情。

DeepMind的「WaveNet」技術，能分析原始聲波，使用類神經網路(Neural Network)加以修正。此種技術需要龐大的運算能力，每秒要1.6萬個範本才能轉成數據、合成為語音。DeepMind表示，WaveNet生成的中英文，聽起來比谷歌現行技術自然許多。

英文

https://storage.googleapis.com/deepmind-media/pixie/us-english/wavenet-1.wav

中文

https://storage.googleapis.com/deepmind-media/pixie/mandarin-chinese/wavenet-1.wav

DeepMind說，Wavenet能模仿所有人的聲音，還能加入感情和語調，讓電腦生成語音聽來更豐富多變。不此如此，他們還用該技術製造出類似鋼琴的琴聲。不過內情人士指出，WaveNet需要極大的運算能力，可預見的未來或許還無法使用在真實世界，目前也未用於谷歌產品。

人工智慧(AI)再次締造里程碑，谷歌人工智慧系統「AlphaGo」，3月9日擊敗世界圍棋棋王Lee Se-dol，寫下歷史新頁。

金融時報(FT)、衛報報導，電腦早已征服西洋棋，1997年IBM深藍(Deep Blue)打敗了西洋棋王Garry Kasparov。圍棋比西洋棋更複雜，有上兆種可能性，需要靠直覺推演情勢，即便超級電腦都不容易上手。研發AlphaGo的谷歌DeepMind執行總裁Demis Hassabis說，AlphaGo的勝利是歷史性時刻。韓國解說員認為，AlphaGo下法神祕莫測，致勝關鍵在於不會受到情緒干擾。AlphaGo就算犯錯，仍能保持冷靜，不影響後面棋局。相反的，Lee因為一開始的失誤，苦吞敗仗。

AlphaGo的勝利，可能意味人工智慧將更廣泛運用，人類工作岌岌可危。CNBC報導，人工智慧不斷進化，新創公司Thumbtack報告稱，當前所謂的「零工經濟」，將在20年消失。未來物流公司無需聘請人類駕駛，改用自駕車和無人機取代，叫車軟體優步(Uber)、零售巨擘亞馬遜(Amazon)都會加入此一潮流。另外，當前的高階工作者，如律師、會計等，工作也不再穩固，將成為新的零工經濟成員。

（本文由 MoneyDJ新聞授權轉載；首圖來源：Google）