宣佈不再保密後,蘋果公開發表了第一篇 AI 研究論文

24

蘋果在月初曾表示,將會公開發表他們的 AI 研究成果。而首份論文也在日前亮相,主題是電腦的「視覺辨識」。

這篇名為「Learning from Simulated and Unsupervised Images through Adversarial Training」的論文,內容闡述了蘋果對圖片辨識的看法。傳統上讓電腦「學習」辨識影像,通常會使用電玩照之類的合成圖,而不是真實照片,原因是合成圖會編上預設的標籤,比如「狗」。相比之下,直接看真實影像,電腦就需要先透過人工重新對照片中的物件下標籤,再從一片背景裡判斷出「狗」。這會導致辨識的效率下降很多。

不過這麼一來也有個缺點。由於電腦平時「學習」看的圖片是合成影像,但事後要拿去辨識的卻是真實照片,導致這一類圖像辨識的演算法效果都差強人意。因此,蘋果的研究員在這篇論文想出的辦法,是讓合成圖更逼近真實。

這個方法首先是先建立兩組 AI 神經網絡,一組負責資料輸入(generator),另一組則是辨識器(discriminator),負責辨識 generator 產製的資料,以及一般「學習用」的圖像,最後再讓兩組 AI 互相對抗,逼生更接近真實的影像。實際上,這樣的資料處理方式,就是 Generative Adversarial Networks(GANs)的基礎手法。

有趣的是,這批研究員有的是蘋果收購來的新創公司成員,有的則來自大學。例如論文的共同作者 Joss Susskind,就是 Emotient 的創辦人。它們的技術是透過 AI,從表情辨識人的情緒,但在今年一月時被蘋果收購。蘋果的研究員亦表示,他們希望接下來可以從圖片進展到影片辨識。

這篇論文是由康乃爾大學出版。蘋果在日前的宣佈中,也開放旗下的研究員或學者,可以自由投稿自己的 AI 研究成果,一反過往的保密傳統。

註:由於已經公開發佈,短期內應該沒有引進商用產品的想法。

(首圖來源:蘋果

延伸閱讀: