Deepmind 今年稍早「一戰成名」,在中國烏鎮圍棋峰會上,AlphaGo 戰勝了世界冠軍柯潔九段。在這之後,我們知道 Deepmind 會把 AlphaGo 的技術運用在疾病診斷等造福人類的領域。
所以,Deepmind 最近在做什麼「高大上」的事呢?
……他們在教 AI「跑酷」。
最近,Deepmind 放出一段「搞笑影片」。其中的火柴人看似將以酷炫的動作翻越路上的障礙物,但不幸演出各類「花式摔跤」。在影片中,還有 4 條腿的「螞蟻」和只有身體和腿的「走路器」。
Deepmind 表示,這些小人的動作都是 AI 控制的。在 AI 的幫助下,小人能做走路、跳躍等一連串動作,甚至能模仿行動不便的老人走路的樣子。
為什麼 Deepmind 的 AI 不下圍棋,而是開發新愛好「跑酷」呢?
Deepmind 發表的文章中,研究人員稱「跑酷」和圍棋在目的上顯著不同,這點就是他們希望 AI 學習的。研究人員這麼解釋:
在一些 AI 問題中,比如玩雅達利(Atari)的遊戲和下圍棋,目標非常容易定義──就是贏。但你如何解釋後空翻的目標?或跳躍動作?
在訓練自動化系統運動時,如何向 AI 清楚解釋複雜動作,是經常遇到的問題。
在實驗中,研究人員在火柴人的必經之路上擺放「矮牆」、鬆動的「地磚」等障礙物。AI 控制的小人在一次次翻越障礙不成功後,也學會了如何「安全」跑到終點。
Deepmind 將這項技能形容為:
我們的實驗對象在不接受指令的情況下演化出複雜技能。這是一個能用於訓練系統不同、模擬人體運動的技術。
Deepmind 補充,他們採用一種「回饋學習演算法」(reinforcement learning algorithm)。這種演算法能幫助未來 AI 在不同環境中靈活自然地運動。
在研究者的眼中,人工智慧控制的靈活行為是人工智慧擁有「運動智慧」的指標。在這技術的助力下,電腦很快就能勝任更複雜的工作,甚至變得和人類越來越像。
▲ 你走路時是這樣嗎?
Deepmind 對這項技術有不少期望。研究者在文章最後寫道:
未來,我們可以將這些技術運用在複雜環境中,調控更多(機器)行為。
調控一大堆模仿人類行為的機器?聽起來它們能做很多事,比如說……組成一個《西方極樂園》般的遊樂園?所以,Deepmind 今天還在花式摔跤的火柴人,能變成明日《西方極樂園》裡心思縝密、行動靈活的機器人嗎?
(本文由 36Kr 授權轉載;首圖來源:影片截圖)