宣佈不再保密後，蘋果公開發表了第一篇 AI 研究論文

由

2019-06-13

蘋果在月初曾表示，將會公開發表他們的 AI 研究成果。而首份論文也在日前亮相，主題是電腦的「視覺辨識」。

這篇名為「Learning from Simulated and Unsupervised Images through Adversarial Training」的論文，內容闡述了蘋果對圖片辨識的看法。傳統上讓電腦「學習」辨識影像，通常會使用電玩照之類的合成圖，而不是真實照片，原因是合成圖會編上預設的標籤，比如「狗」。相比之下，直接看真實影像，電腦就需要先透過人工重新對照片中的物件下標籤，再從一片背景裡判斷出「狗」。這會導致辨識的效率下降很多。

Perspective Box 透視箱

不過這麼一來也有個缺點。由於電腦平時「學習」看的圖片是合成影像，但事後要拿去辨識的卻是真實照片，導致這一類圖像辨識的演算法效果都差強人意。因此，蘋果的研究員在這篇論文想出的辦法，是讓合成圖更逼近真實。

這個方法首先是先建立兩組 AI 神經網絡，一組負責資料輸入（generator），另一組則是辨識器（discriminator），負責辨識 generator 產製的資料，以及一般「學習用」的圖像，最後再讓兩組 AI 互相對抗，逼生更接近真實的影像。實際上，這樣的資料處理方式，就是 Generative Adversarial Networks（GANs）的基礎手法。

有趣的是，這批研究員有的是蘋果收購來的新創公司成員，有的則來自大學。例如論文的共同作者 Joss Susskind，就是 Emotient 的創辦人。它們的技術是透過 AI，從表情辨識人的情緒，但在今年一月時被蘋果收購。蘋果的研究員亦表示，他們希望接下來可以從圖片進展到影片辨識。

這篇論文是由康乃爾大學出版。蘋果在日前的宣佈中，也開放旗下的研究員或學者，可以自由投稿自己的 AI 研究成果，一反過往的保密傳統。

內容目錄 隱藏

1 註：由於已經公開發佈，短期內應該沒有引進商用產品的想法。

2 延伸閱讀：