馬斯克又被玩壞了，這個「變臉」AI 比 StyleGAN 還溜

由

Auto Post

2021-01-16

轉載從: Tech News 科技新報

Perspective Box 透視箱

給人像「P」上濃密的鬍鬚，需要多久？

這個 AI 只需要一秒，而且效果逼真，看不出一點破綻。

最近，一則馬斯克的惡搞影片在 YouTube 上火了。

（Source：影片截圖，下同）

一位 YouTuber 用 AI「P」出了多個版本的馬斯克，重點是效果驚人。比如，這個中年光頭版。

恐怕連馬斯克本人見了都會相信吧？

還有長髮飄飄的馬斯克。不得不說，女版馬斯克也散發著一股女強人的氣質。

這個 AI 是來自 Adobe Research 和阿卜杜拉國王科技大學（KAUST）的一項最新研發成果——StyleFlow 演算法。

它非常更擅長在合成圖像或真實圖像的基礎上重新編輯面部屬性。除了上述馬斯克的面部毛髮、年齡、性別處理外，它還可以改變拍照角度、光照、人物表情等等。

（Source：arXiv.org）

值得一提的是，StyleFlow不僅可以用於人像處理，也可以修改汽車等其他圖像屬性。

比如這款汽車圖像可以一秒切換車身顏色。

（Source：影片截圖）

接下來，我們來看看這個硬核 AI 是如何做到的？

內容目錄 隱藏

1 比 StyleGAN 還溜的 AI

2 實驗結果

比 StyleGAN 還溜的 AI

提到 Style 系列不免讓人想到 StyleGAN，StyleGAN 是 GAN（生成對抗網路）的變種，它通過生成器和鑑別器的相互 battle，也可以達到令人驚嘆的面部合成效果。

而 StyleFlow 可以說是 StyleGAN 圖像合成的進階版。

研究人員在論文中稱，GANs（如 StyleGAN）在保證高品質輸出的條件下，使用（語義）屬性控制生成過程的選項有限。同時，由於 GAN 潛在空間的糾纏性質，沿著一個屬性執行編輯很容易導致沿著其他屬性的改變。

因此，他們提出了基於屬性條件採樣（Attribute-Conditioned Sampling）和屬性控制編輯（Attribute-Controlled editing）的 StyleFlow。

其中，屬性條件採樣，是對具有目標屬性的高質量真實圖像進行採樣；屬性控制編輯，是指編輯給定圖像，並使其具有目標屬性，同時最好地保留源圖像的特性。

以下為 StyleFlow 實現兩種任務的完整框架：

▲z 表示先驗分佈變量，w 表示StyleGAN的中間權重向量。（Source：arXiv.org，下同）

從源圖像開始，通過使用反向推理和一系列 CNF（Continuous Normalizing Flow）功能模塊的正向推理來支持屬性條件編輯。

另外，需要注意的是，反向推理和正向推理是由 ODE 解算器通過計算時間變量上的 CNF 函數來解決的。

CNF（連續歸一流）功能塊可以作為神經網路塊來實現。其中，以屬性向量 at 為條件的學習函數，既可以可用於正向推理，也可以用於反向推理。

實驗結果

基於以上原理，研究人員通過使用 StyleFlow 對給定圖像進行了屬性條件採樣。論文中展示了固定目標姿勢下戴眼鏡女性的圖像（上）；面部有毛髮的 50 歲男性圖像（中）；固定姿勢下 5 歲男孩的微笑圖像（下）三類屬性的抽樣結果。

可以注意到採樣的品質非常高，未編輯的屬性在很大程度上保持不變，它驗證了網路能夠學習底層的語義表示，並進一步用於對圖像進行語義編輯。

接下來，研究人員使用 StyleGAN 生成的人臉和汽車的潛在空間對 StyleFlow 進行了評估，並展示了對各類屬性進行細粒度分離編輯的結果。

他們採用了兩個評估資料集 FFHQ 和 LSUN Car。前者是 1024×1024 高解析度人臉圖像資料集，由 70,000 張圖像組成，這些圖像在種族、年齡和配件方面都是不同的。LSUN-Car 是一個 512×384 解析度的汽車圖像資料集，由 16,185 幅圖像組成，這些圖像在汽車姿態、顏色和類型方面有很大的差別。

在定性比較上，StyleFlow 對人像角度、光照、表情、性別和年齡的處理，與現有 Image2StyleGAN 、 InterfaceGAN 、 GANSpace 方法相比均表現出了一定的優越性。