台大人工智慧幫,全球搶挖角

38

過去 3 年,IBM、GE、微軟搶人工智慧人才搶到台灣來,台灣畢業的土博士,挖到美國工作,年薪 12 萬美元起跳,讓自己站上國際舞台,讓能力被看見,讓他們身價從此不同。

在美國,人工智慧(AI)相關人才炙手可熱,一名懂人工智慧技術的博士生,一畢業,年薪至少 12 萬美元(約 380 萬元台幣)起跳。這股人工智慧挖角風,竟跨海吹進台大。

過去 3 年,台大資工系徐宏民教授的實驗室訓練出來的台灣「土」博士,已有 4 人分別被美國 IBM Spark 技術中心、奇異全球研究中心、美國微軟和位於矽谷的 Fuji Xerox 研究中心挖走,還有一位即將畢業的博士生,已被 Google 和微軟看上,爭相邀請加入團隊。

9 月底,NVIDIA 執行長黃仁勳宣布和台大合作成立人工智慧實驗室(Nvidia AI Lab),計畫負責人正是徐宏民,「徐教授和他的團隊,在這個領域有突破性的成就」,黃仁勳在演講中說。

微軟、英特爾  競相取經

宣布時,徐宏民不在國內,因為他人正在美國紐約州的 IBM 研究中心。IBM 剛發表全世界第一支用人工智慧剪接的電影預告片《魔詭》,IBM 給電腦看過 100 支恐怖片預告後,再把拍好的新片交給電腦,電腦就模仿看過的作品,組合出一支 6 分鐘的預告片。其中,就用了徐宏民研發的技術。

過去幾年,從微軟、英特爾、聯發科、光寶科,甚至台灣的金控公司代表,都曾造訪徐宏民在台大資工系的研究室,採用他們的新技術為自己公司加值。

徐宏民曾是訊連第八號工程師,早期是產品經理,他的強項是帶領團隊開發影像處理程式;直到有一次,公司要他開發能自動管理影片的新功能,他才發現「這個很難」,意識到這是有潛力的關鍵技術,開始鑽研用人工智慧處理影像的新技術。

「我研究的應該叫機器智慧(Machine Intelligence)。」徐宏民解釋,人工智慧給人一種機器無所不能的錯覺;但現實狀況是,機器目前只能解決特定問題,「這是一個突破,只要給電腦足夠資料,就能訓練電腦解決問題。」徐宏民說。

「我做的事情,是教電腦自動從資料裡去學,如何判斷照片裡的內容。」徐宏民說,他的專長就是教電腦擁有看懂照片和影片的新能力。

這有多難?以一個最簡單的例子,要電腦辨認照片裡有沒有貓,都是一個困難的挑戰;因為電腦只能接受死板的命令,當設計者告訴電腦,「貓,有兩隻眼睛,一個嘴巴」,那麼,當照片裡的貓只露出半邊臉,甚至只露出兩隻耳朵的時候,電腦就認不得。史丹佛大學人工智慧實驗室與視覺實驗室負責人李飛飛曾坦言,這個 3 歲小孩都能回答的問題,卻花了他們多年時間才得到解答。

現在,最新的挑戰是,不只教電腦看懂照片裡有什麼物品,還要能正確解讀照片的內容,把每樣物品的關係正確串聯起來;譬如,輸入一張在廚房做菜的照片,電腦必須正確說出,「照片裡有兩個女人,正在廚房煮飯」,而且,不是一、兩張照片判斷正確就好,是幾千萬、上億張照片都正確解讀。

就像 AlphaGo 教電腦從無數棋譜中學習下圍棋一樣,徐宏民的工作之一,就是開發影像版 AlphaGo,教電腦自己學習看照片。

影像版 AlphaGo  屢屢獲獎

2013 年,徐宏民團隊就曾拿下微軟舉辦的影像辨識大賽首獎,擊敗全球的團隊。

回憶當時參與比賽,陳殷盈說,微軟的考題是把 8 萬張照片放在網路上,要求在 12 秒內全部辨識完成,讓全球團隊去較量,看誰的辨識正確率最高。這個挑戰不比 AlphaGo 對決南韓九段棋士李世乭簡單,因為 AlphaGo 挑戰的是人腦,他們面對的卻是全世界的人工智慧團隊。

「老師喜歡學生有企圖心,能提出有創意的方法。」陳殷盈說。徐宏民平常就鼓勵學生,參加國際上有難度、有影響力的挑戰,這次比賽也是他操練學生能力的關卡之一。

軟體比的是想法。剛開始,台大團隊用世界通用的方法,想開發一套辨識所有東西的技術,只要不斷改善這套技術,就能解決所有問題。走別人都走的路,卻讓他們辨識率停滯不前,離比賽只有幾周時間,怎麼可能在短時間內找到突破性的解法?

在反覆討論後,有人提出,影像辨識最常出現的主題是「人」,既然不能一次解決所有問題,乾脆在原有技術上,加上另一套辨識人形的新技術。等於別人只帶一把刀上場,他們卻準備了兩把刀,台大團隊因此榮獲首獎,第二名是來自俄羅斯的資訊公司。

這些被挖角到國外工作的學生,都有豐富的國際經驗。陳殷盈畢業後,就被 Fuji Xerox 研究中心,邀請到矽谷做研究;陳殷盈分析,她的論文多次被這個領域的頂尖學術會議 ACM Multimedia 接受,「Fuji Xerox 正是會議贊助者。」她說,Fuji Xerox 連續幾年都看到她出現,就直接網羅她到矽谷工作。

在大公司眼中,這些技術潛力無窮。將到奇異公司研究中心上班的林彥良解釋,奇異正在研究,在無人機上加裝判讀影像的人工智慧功能,「只要無人機飛過去,就能自動判斷牆壁上是否有裂痕,設備是否受損。」

硬體結合 AI  台灣新出路

同樣的功能,還能用來判斷流行趨勢。徐宏民團隊的研究,去年曾獲《紐約郵報》報導,研究團隊比對紐約時裝周上最新的流行趨勢照片,和當地社群媒體刊登的時尚照片,發現紐約時裝周過後幾個月,街上就能看到類似的流行時尚。用這種分析方法,分析臉書上的照片,如果發現某個地方類似的流行服飾照片大量增加,就知道流行擴散的方向,甚至能精確知道是哪個城市的哪個地區,正在流行什麼,這正是行銷人員最感興趣的資訊,「文章刊出後,有美國公司上門要求授權。」徐宏民說。

聯發科和他們合作多年,希望把人工智慧功能加進手機裡。徐宏民解釋,未來你可以告訴系統,你要找的照片裡「有穿紅衣服的人」,或是你要看的影片裡「有一輛黑色轎車」,系統就能自動幫你找到。

類似技術也用在醫學上,台大分子生醫影像研究中心主任曾文毅指出,他們現在用機器學習(一種初階人工智慧技術)判讀病人的腦部核磁共振攝影(MRI),能看到醫師用肉眼看不到的細微變化,「能在阿茲海默症病人沒意識到症狀之前,發現問題。」正確率達 75%,他們計畫成立新公司,開發這項新技術。

「台大研究人工智慧已有數十年。」台大資訊工程系系主任趙坤茂表示,台灣唯一的人工智慧協會院士(AAAI Fellow)林智仁,是台大資工系特聘教授,他開發的人工智慧軟體,連 Google 等大公司都採用;台大還有許永真、林守德教授,鑽研機器人以及社群網路相關的人工智慧技術,「台灣 4 位自己培養的美國計算機學會會士(ACM Fellow)中,台大資工系就佔了 3 位。」趙坤茂說。

和台大相比,清大資工系則把重心放在用人工智慧做文章分析、翻譯;也和長庚合作,做醫療生醫資訊分析;還和工研院合作,控制機器人如何看清楚物體位置、教機器人怎麼拿東西。在中國,2008 年已有人工智慧公司掛牌交易,這家公司叫科大訊飛,今年在人工智慧競賽中,勇奪語音辨識類別 3 項冠軍。

趙坤茂認為,台灣有好的研究基礎,讓硬體產業和人工智慧技術結合,是台灣相關產業的大未來。高科技產業的下一波競賽,就要靠實驗室的頂尖頭腦,才能勝出。

(本文由 財訊 授權轉載)