Pokémon GO 雖然好玩,但它並不是真正的 AR

30

最近,Pokémon Go 成功吸引了人們的注意力,這款遊戲的火爆讓用戶體驗到 AR 遊戲的魅力,但是 AR 與現實世界的交互遠不只於此。 AI 驅動的圖像辨識技術公司 Cortica 的聯合創始人兼CEO Igal Raichelgauz 發表了對未來 AR 的看法。

真正的 AR 需要電腦視覺和對現實環境的動態映射。

Pokémon GO 中的角色只依賴 Google Maps 中的固定緯度和經度。如果在遊戲中應用真正的 AR 技術,即時深度映射和物體識別功能會讓遊戲角色與現實世界互動,而不是將他們放在不協調的遊樂區之外。

真正的 AR 仍然是一個聖杯,讓 AR 技術真正發揮作用的關鍵是 AI 驅動的圖像辨識技術,這種技術可以進行「無監督學習」,人們可以使用裝置即時觀看任何圖像和影片,並盡可能的理解內容。

 

當前 AI 的侷限性

在了解「無監督學習」之前,首先讓我們來了解一下目前的狀況。Google、IBM 和 Facebook 等大公司一直致力於開發、實踐 AI 技術,改善圖像辨識能力,但是他們都有缺陷,當前該領域的大部分工作主要集中在「深度學習」技術上。

深度學習提供了海量的計算能力,但是有兩個重要的缺陷:

第一,當深度學習系統觸達第 1,000 個計算層之後,計算能力達到頂峰,但是沒有繼續形成規模的能力。

第二,機器學習需要讓人們進行數百個小時的指導,我們將其稱之為「監督學習」。電腦科學家會修正錯誤的答案,最終該系統會從錯誤中進行學習。針對特定的資料集,這是有效的,例如,回答智力競賽節目中的問題,或者玩棋盤遊戲,但是它無法被應用到不斷變化的環境中,例如自然界。

 

「人性化」AI

我們需要考慮的一個關鍵字語是:自然。將深度學習應用到 AR 中不太適用,因為這是讓人工系統了解自然環境。當然,這些任務對人類來說並不是困難。為了確保電腦可以精確地理解環境,這需要一個過程,就像人類的自然進化一樣。最新的腦部研究表明,無監督學習才是答案。

無監督學習與深度學習不同,因為它不需要人類的參與,不需要給它一定的資料集,從問題中得到正確或錯誤的答案──「這是一隻貓,這不是一隻貓」,無人監督的學習系統會基於每張圖片相同 / 不相同的特點,分析出上千個特徵,包括顏色、形狀、複雜組合等。

 

真正的 AI 驅動的 AR 可以做什麼?

透過對此更加深入的了解,AI 驅動的 AR 遊戲將會把虛構角色的活動和遊戲設定整合到自然場景中。但是完善的遊戲設定只是冰山一角。

由 AI 驅動的 AR 是強大的技術,可以顛覆無數產業。例如,消費者很快就能很好地利用自己手機和其他裝置中的照片。想像一下,內嵌的 AI 助手可以自動管理圖片和影片,在一毫秒的時間內進行精確的搜尋,根據圖片的主題進行分享推薦。數百萬張被遺忘的照片突然獲得了新生,視覺化搜尋的潛力被釋放。

透過無監督學習進行圖像辨識可以讓自動駕駛汽車的安全性成指數倍增長。汽車可以完全看清行人,完美辨別道路障礙。

在醫療領域,手術過程中,醫生可以獲知更及時的資訊,並與上百個相關的操作進行對比,基於世界範圍內的解決方案指導醫生進行操作。

AR 是一種趨勢,但是只有當這種技術完美無瑕地整合在社會中時,才能發揮更大的作用。Pokémon GO 遠沒有達到這種水準,但是這種技術很快就會被使用。透過非監督學習的驅動,可以讓一個虛擬的皮卡丘藏在一棵真正的樹下,這種突破將會從根本上改變 AI、AR 在世界中的運行方式。

(本文由 36Kr 授權轉載;首圖來源:達志影像)