近日,加州大學柏克萊分校的電腦科學家研發出「可以預見未來要發生的事情」的機器人技術,利用這項技術,機器可以做到:操控以前沒有見過的物件;並且在未來,這項技術可以應用在自動駕駛汽車的預測事件,並幫助生產更多家庭機器人。
這個機器人的名字叫 Vestri,利用的技術是視覺預見技術。運用視覺預見技術,機器人可以在完全自主學習的情況下,看到如果它們執行特定動作會產生怎樣的結果。據了解,研究者在 NIPS 2017 展示了這項技術。
目前,機器人的預測能力還比較簡單,只能預見未來幾秒內發生的事情──但足夠讓機器人弄清楚如何在桌子上移動物體,而不會碰到障礙物。目前,機器人專注於從完全自主的遊戲中學習簡單的動手技能,最重要的是,機器人要學會在沒有人幫助或事先不知道有關物理、環境、物體知識的情況下執行任務。
要讓機器人學會在桌面上操控物體,這需要在無人監督狀態下探索學習,培養視覺的想像力,像嬰兒一樣,從零開始學習理解世界,用物體進行實驗,找出如何以最好的路徑移動物體。
在歷經遊戲階段之後,機器人可構建一個預測世界的模型,並可利用這模型操作一些以前沒見過的新物體。
柏克萊分校電子工程和電腦科學系助理教授 Sergey Levine 說:「人類可以想像移動物體的動作,這種方法也可以使用於機器人,機器人可以想像不同的動作將如何影響周圍環境。」
Sergey Levine 補充說:「這項視覺預見可在複雜的現實環境中達成高度的智慧規畫。」
這個機器人主要依靠深度學習技術(稱為 dynamic neural advection,簡稱 DNA)。這個基於 DNA 的模型,根據機器人的動作預測圖像中的圖像,如何從這一幀移動到下一幀。使用這個模型,機器人能執行複雜的任務,例如在障礙物周圍滑動玩具並重新定位多個物體。Levine 實驗室的博士學生和原 DNA 模型的發明人 Chelsea Finn 說,「過去,機器人已經學會了在人類幫助和提供反饋的條件下掌握技能。」
這項技術的刺激之處,就是使得機器人在完全自主的情況下學會怎麼處理物件。據了解,有了這項新技術,機器人可在桌上移動物體,然後利用預測模型來移動選擇將物體移動到所需位置的動作。機器人利用從原始攝影機觀察的學習模型,來自學如何避開障礙物,並在障礙物周圍推動物體。
Levine 說:「嬰兒可以透過玩玩具、擺動玩具、抓握等來理解世界。我們的目標是讓機器人做同樣的事:透過自主互動來了解世界如何運作。」
(Source:pixabay)
Levine 補充:「目前,機器人的學習能力仍然有限,但它的技能完全是自動學習,並可透過建立在先前觀察到的模式,來預測如何操作沒有控制過的物體。」
值得一提的是,創造出 Vestri 的 Sergey Levine,今年 8 月 23 日入選了第 16 屆 TR35 榜單(即全球 35 名 35 歲以下青年創新者榜單),不僅如此,之前 Sergey Levine 在 Google Brain team 的時候,曾和來自 Alphabet 的 DeepMind 和 Google X 實驗室的高手通力合作,打造一個叫「多機器人通用技能學習」機制。
也正是之前在 Google 研究所的工作,奠定了 Vestri 的基礎。未來 Vestri 如果能進一步突破,相信會撼動整個機器人產業。
(本文由 雷鋒網 授權轉載;首圖來源:影片截圖)