從 AlphaGo 說起，DeepMind 官方回顧 2016 年大事紀

由

2019-06-13

這個時代變化多端、複雜多樣，我們正在經歷氣候變遷，也曾忍受新疾病出現。而在智慧系統的說明下，人類會逐漸解開全新技術的面紗，推動社會向更完善的方向發展。在這一過程中，我們需要一個能夠從零開始對現階段不同問題的理解逐漸加深的通用性系統，以此辨識出那些有可能被遺漏的科學突破。這正是 DeepMind 一直以來所關注的焦點。

對於 Google DeepMind ，眾人也一直關注著它的研究和進展。在 2017 年開始之際，DeepMind 官方發表文章回顧了 2016 年該公司的大事紀。雷鋒網根據原文順序對每個計畫進行編譯和適當補充。

Perspective Box 透視箱

在過去一年裡，DeepMind 已經在不少領域取得了令人興奮的進展。

內容目錄 隱藏

AlphaGo

相信很多人都是因為 AlphaGo 才知道 DeepMind 的。2016 年， AlphaGo 在古老的圍棋比賽中以 4:1 的高分擊敗了世界大師級冠軍李世乭，從此一炮而紅，並且二度登上《Nature》雜誌封面。許多專家認為，人類至少提前十年完成了這一壯舉。對於 DeepMind 以及世界圍棋界而言，最激動人心的是 AlphaGo 在博弈過程中所表現出來的創造力，甚至有時候它的招數對古老的圍棋智慧都造成了挑戰。要知道，一直以來圍棋都被認為是最需要人類深思熟慮的遊戲之一， AlphaGO 的勝利彰顯了人工智慧的巨大可能性。此外，DeepMind 表示 2017 年也將帶來更多機器參與人類遊戲的研究。

生成模型領域：WaveNet

在生成模型領域，DeepMind 也取得了意義非凡的進展。研發團隊在發表了圖像生成 PixelCNN 論文之後，又發表了最新原始音訊波形深度生成模型音訊 WaveNet 的研究論文。WaveNets 是一種卷積神經網路，能夠類比任意一種人類聲音，生成的語音聽起來比現存的最優文本（語音系統）更為自然，將類比生成的語音與人類聲音之間的差異降低了 50% 以上。這種深度生成模型能夠模仿人類的聲音，生成的原始音訊品質優於目前 Google 採用的兩種最優文本──語音模型 Parameric TTS 與 Concatenative TTS 。由於 WaveNet 不是將錄下的語音樣本拼接起來，而是創造出的新的音訊波形，所以它很有可能會達到世界上最動聽的語音合成。

目前，DeepMind 正計劃將這一成果融入穀歌產品中，藉此提升數百萬使用者的產品體驗。

可微分電腦 DNC

2016 年，DeepMind 在儲存（memory）領域也取得不小的進步，尤其是在解決如何將神經網路的智慧決策和複雜結構化資料的儲存、推理能力結合起來的難題。實驗室團隊提出了可微分神經電腦的神經網路模型（Differentiable Neural Computer，簡稱 DNC）。這種新型模型將神經網路與可讀寫的外部記憶體結合，既能像神經網路那樣透過試錯和樣本訓練進行深度學習，又能像傳統電腦一樣處理資料。

目前，這些模型已經學會回答有關資料結構（從家譜到地鐵交通地圖）的問題。DeepMind 表示，這讓人類距離使用人工智慧在複雜資料組中進行科學發現又近了一步。

開源 DeepMind Lab

去年 12 月， DeepMind 宣布向大眾及其他開發者開放其用於眾多實驗的迷宮類遊戲平台，把訓練環境的整個原始程式碼發表至開源社群 GitHub，並將其名稱由 Labyrinth 更改為 DeepMind Lab。屆時，所有開發者都能下載原始程式碼並對其進行個性化設置，以此訓練和測試原有的 AI 系統。此外，11 月，該公司還宣布了與動視暴雪 ( Activision Blizzard ) 合作的消息，兩者將聯手把遊戲《星海爭霸 II 》轉換為一個測試平台，以便所有 AI 研究人員都有機會製作出這款複雜遊戲的人工智慧系統。

用技術改善醫療

2016 年，DeepMind 與英國國家醫療服務體系 NHS 旗下的基金會 Royal Free London 簽訂了為期 5 年的合約，目標處理 172 萬患者的醫療紀錄。同時，DeepMind 還獲得了來自倫敦醫院的兩個資料庫，一個是讓 AI 軟體確定退化性眼病早期徵兆的 100 萬張視網膜掃描報告，一個是訓練 AI 軟體來辨識健康組織和癌變組織的頭頸部癌症圖像。

DeepMind 希望探索出運用先進技術來改善數百萬患者醫療條件的方案，並且透過其開發的行動應用程式和基礎設施改進臨床護理。

其他

此外，DeepMind 還參與建立了非盈利 AI 合作組織（Partnership on AI），與 Facebook、亞馬遜、IBM、微軟等科技巨頭一起，在諸如演算法的透明性和安全性等領域探索出最好的實踐方式，進而找到用 AI 達到社會利益最大化的方法。

DeepMind 在推動智慧系統運用於現實世界的同時，也關注如何提升自身的學習效率。2016 年，Google 宣布 DeepMind 研發的學習軟體已經成功讓 Google 資料中心的能耗減少了大約五分之二。據悉，這種軟體透過學習資料中心的操作日誌進行壓縮，進行大規模的模擬操作，最終達到了過程的優化。

此外，DeepMind 前不久還發表了論文《非監督輔助任務中的強化學習》（”REINFORCEMENT LEARNING WITH UNSUPERVISED AUXILIARY TASKS”），介紹了一種極大提高代理學習速度和最終成效的方法。研究人員透過讓代理在訓練中執行兩個附加任務，對標準的深度強化學習方法進行增強。