星期三, 28 1 月, 2026

旅 TRIVEL

日前,在一項人工智慧(AI)運算評比中,聯發科新推的 Helio P90 處理器獨占鰲頭,打敗競爭對手高通驍龍 855 及華為海思的麒麟 980 處理器,技驚四座,也使得市場上開始對於聯發科新一代的處理器寄予厚望。聯發科也表示,藉由目前定位中階的 P 系列處理器其優越的人工智慧運算性能,未來擴展到其他不僅是手機的應用,甚至恢復高階 X 系列處理器的發展,都是可以進一步想像的。針對當前的處理器發展,以人工運算為主要發展主軸,聯發科計算與人工智慧智能技術群本部協理林宗瑤指出,在目前許多的人工智慧運用因為需要立即可用,或者是安全問題的情況下,必須從過去的雲端下放到終端時,這時候處理器本身的效能就面臨到了許多的考驗。包括能耗、處理速度、以及傳輸能力等等都是其中的關鍵。林宗瑤還進一步指出,在將人工智慧下放到終端之後,終端的即時人工智慧應用在同一時間還不只一個的情況下,更是考驗處理器的能力。因此,聯發科在這樣的需求上藉由 NeuroPilot 的人工智慧架構,在與 Google 合作了解未來的人工智慧發展趨勢之後,進一步優化了 Helio P90 處理器的人工智慧運算引擎,再加上軟體、硬體、生態系的配合,使得 Helio P90 處理器的人工智慧運算可以達到最佳化的效果。除此之外,聯發科也擺脫過去只是做「turnkey」相同功能的印象,這次在 Helio P90 處理器平台上納入多樣化演算法架構下,可以提供客戶客製化的任何應用處理。也就是在 Helio P90 平台上可以利用 NeuroPilot SDK 工具,自行設計出需要的應用方式,使應用的彈性更大。而且未來不僅是在手機的應用上,未來包括監控攝影機、智慧音箱、智慧電視等設備,也都可以應用該項平台,達到新創或優化功能的做法。在展示 Helio P90 處理器的現場,聯發科除了展示透過 Helio P90 處理器的人工運算效能,由手機相機即時辨識目標人物的動作,立即在虛擬世界中所創造出的人物,也會執行相同的動作,以便未來在虛擬實境(VR),或者是擴增實境(AR)上的應用之外,還利用這樣的即使影像辨識,在辨識目標人物的動作之後,傳輸到人形機器人上,以做出相同動作,模擬出類似電影《鋼鐵擂台 的情境,顯示其 Helio P90 處理器的強大效能。聯發科最後指出,雖然當前聯發科主打中階的 P 系列處理器。但是由新發表的 Helio P90 處理器在人工智慧效能上的突出成績,可以了解以 12 奈米製程打造出來的 Helio P90 處理器,其功能絕不遜於競爭對手以 7 奈米所打造出來的頂級處理器。尤其,在相關生態系的完整性、研發實力以及相關智財權上,聯發科都是目前市面上唯三的廠商之一。因此,未來的發展潛力將不容小覷。至於,Helio P90 處理器的終端設備問世,將在...
傳統觀點認為,採用更先進的技術,那些從事低技術工作的人將成為最大受害者,學術研究大多支持這一點,但這並不代表技術必然會取代所有工作,譬如 AI 需要大量數據來學習和辨別模式,要教授演算法如何準確辨識蘋果是一個蘋果,它需要成千上萬的蘋果圖片,而這些數據無論是照片、影片或聲音檔都需要有人做貼標籤的工作,由此催生中國內陸城市誕生許多小型數據貼標公司。據 VICE Media 旗下網站 Motherboard 報導,這些從事數據貼標的人每天坐在電腦前 8 小時,點擊幾十張照片,根據客戶要求的規格,標示背景、前景和特定物品,有些人可能會標記醫療掃描檔案,有些人標示風景和樹木照片,有些人標示無人駕駛車輛的道路圖片。這是讓 AI 演算法學習看數據的基礎教材,AI 產業發展仍然需要仰賴這種廉價的人工,因為演算法和機器學習在很多情況下都是由人來訓練。這是中國 AI 蓬勃發展的冰山一角。去年風險資本家向中國 AI 新創公司投入 50 億美元,超過美國。中國政府已將該領域做為優先事項,並宣布到 2030 年將投入 1,500 億美元。AI 也是中國製造 2025 中列出的十大重點產業之一。中國也是現在是世界上最有價值的 AI 公司商湯科技的所在地,商湯科技專注臉部和圖像識別,並與全國各地的地方政府合作進行監控,據研究公司 CB Insights 稱,商湯科技估值高達 45 億美元。而風光的 AI 公司幕後推手也包括上述這些勞動密集型數據標籤企業,這些企業為演算法提供和處理大量數據。許多中國年輕人正湧向數據標籤產業,報導訪問一家有 100 多名員工,設在河南鄭州的數據標籤公司老闆表示,雖然標籤工作是相當低級別的工作,但進入門檻相對較低,而且仍然是 AI 產業,「如果可以從這裡開始,我們可以慢慢地,一步一步地走向更高價值的東西。」數據貼標者的月工資從 2 千人民幣到 4 千人民幣不等,與中國工人的平均可支配收入或稅後帶回家收入相當,2017 年為 2,164 人民幣。現在 AI 照片辨識教學的標準是使用 ImageNet 的圖像,這是一個由史丹佛大學教授李飛飛和她的團隊創建的超過 1,400 萬張圖像的資料庫,該資料庫根據亞馬遜的 Mechanical Turk,Mechanical Turk...
年底最具指標性的科技大展「107 年資訊月」最後一站來到高雄國際會議中心,於 12.27 – 01.01 熱鬧登場。今年的經濟部主題館以 DIGI+ 方案、臺灣 AI 行動計畫、前瞻基礎建設-數位建設智慧城鄉的相關成果,展出體感科技、AIOT 及智慧城鄉等創新科技應用。由中央、地方攜手學生與業者協力共創在地產業跨域應用,成就初步成果。 經濟部透過前瞻基礎建設之「體感園區計畫」,4 年投入 10 億元經費,以「前店研發,後廠體驗」概念於高雄市落實「體感科技產業園區」,包含充滿娛樂的 KOSMOS(體感奇點艙)園區、富文化科技的 VR FILM LAB(VR 體感劇院)、及體感新創孵育基地,並核定主題試煉補助廠商共計 22 案簽約件數,以帶動新興科技於區域產業發展,期望能在高雄創造數位經濟「Fun Park」。中央地方與業者攜手合作產業聯合推動辦公室,位於高捷大樓 2 樓的體感奇點艙(後廠),設有商務中心及技術支援中心,還有體感實驗場域位於大魯閣草衙道的體感奇點站(前店),並與學校合作規劃體感學院(虛擬形式),協助培育我國體感科技種子人才,透過產業基礎環境、政府補助、人才孵育,以協助業者在地試煉並促進整案輸出,以期將高雄打造成為全球體感科技聚落。▲經濟部王美花次長(左二)、高雄市電腦商業同業公會莊連豪理事長(右一)及國立中山大學南區促進產業發展研究中心林根煌主任(左一),擔任經濟部主題館開幕嘉賓,正式宣告主題館開幕。本次活動產學研共計 21 個單位參展,其中 4 家獲得今年度體感補助,例如結合智慧醫療議題的哈瑪星科技、天影數位媒體的英語情境教室學習、及聯新亞洲臨床病人問診系統,與方陣聯合之 SPA VR 舒壓療程等;另在智慧農業方面,擎壤科技與國立成功大學無人機實驗室合作開發農業噴灑無人機,以及寬緯科技的智慧養殖系統;在長照與觀光議題上,美維科技的智慧健康照護系統,及佐臻公司智慧眼鏡應用於旅遊導覽等;在學界包括國立中山大學暨智崴資訊聯合研發中心、實踐大學等展示自主研發穿梭於虛實之間的健身、遊戲等 VR 體感內容。▲經濟部主題館由中央、地方攜手學生與業者協力共創在地產業跨域應用,展出體感科技、AIOT及智慧城鄉等創新科技應用。經濟部主題館於高雄資訊月除了前述摘要展示內容外,現場另備有體驗闖關扭蛋活動,及豐富且實用的多項好禮,讓參觀主題館的大、小朋友歡喜帶回家;此外,歡迎至經濟部工業局臉書粉絲團,關注 107 年資訊月經濟部主題館「城鄉創新•智造樂活」系列貼文按「讚」、「留言」及「分享」,即可參加智崴全球提供的 i-Ride 飛行劇院體驗券(200張)及高雄 VR 體感劇院「VR 電影限時兌換券」等最夯好禮抽獎活動。 高雄資訊月展期自 107 年 12 月 27 日至 108 年 1 月 1 日,每日 10:00...
台灣因醫療發達,再加上有全國等級的保險制度全民健保,有大量的資料能夠運用。近年 AI 技術成為新的熱門名詞,結合既有的健保資料庫,幫助建立精準醫學。AI Labs 與台灣微軟合作建置 TaiGenomics 基因分析平台,初期與台大醫院合作,分析先天性耳聾的病歷與醫療數據。台灣有相當堅強的資通訊產業,而且健保造就的大數據資料庫。AI Labs 與微軟合作建置開發 TaiGenomics,初期先與台大團隊合作,用他們長期做先天性耳聾研究成果,在 TaiGenomics 上面分析。TaiGenomics 藉由國際學術社群分享的 200 萬筆文獻資料,用 AI 進行文獻分析,還有各個醫院長期治療病患,收錄的病人病例資料。TaiGenomics 也收錄收錄基因定序結果,與 AI 分析的文獻結果比對, 能夠加速醫師分析與診斷的效能,並且累積病人的病例資料,建置資料庫邁向精準醫學的道路。醫師假若有自己收錄的論文,也能匯入 TaiGenomics 做分析處理。 ▲ TaiGenomics 能分析大量論文內容,幫忙醫生讀論文。AI Labs 產品經理林盈宏在展示系統時,提及 TaiGenomics 操作簡便,資料分析流程採拖拉式的介面設計,不用寫程式,減低醫護人員、研究者進入的門檻。 ▲ TaiGenomics 強調能大量減低基因分析成本。台灣人工智慧實驗室創辦人杜奕瑾表示:「我們與微軟合作、運用 Azure 的優勢開發 TaiGenomics,將醫療大數據分析所需的空間及運算資源雲端化,也希望藉由本次合作,讓 TaiGenomics 能發揮台灣的優勢,連結產業利害關係人,透過醫療生態的整合帶動新的生態誕生,進而讓台灣建立世界級的精準醫療生態圈。」台灣微軟總經理孫基康說,微軟致力打造 AI 平台,並且與專家社群連結,新創連結起來。微軟的平台讓路究者不用擔心儲存、運算等資源,並且有機會 scale up,到達全球等級。資安方面微軟也有下功夫,去識別化,然後重要資料研究者可決定留在地端。孫基康補充說 AI engine 可與不同平台整合,像是像上下游的研究者開放,自身有 R server 也能提供統計工具,也有收錄現成的資料集能夠馬上運用。TaiGenomics 與台大先合作,並且要提供資料。領人好奇之後會不會有後續的合作者,以及是否要收費的問題。杜奕瑾說,他們與台大先合作算是拋磚引玉,歡迎有興趣的學術單位跟他們洽談。至於收費方面目前是還沒有想到,未來會視情況制訂相關辦法。 ▲ AI Labs...
現代消費者越來越習慣使用智慧音箱做各式各樣的事情,如今連用來購物的人也日漸增加。Amazon 表示 2018 年聖誕假期期間,使用智慧語音助理 Alexa 聲控購物的數量大幅上升到 2017 年的 3 倍。Amazon Alexa 12 月 26 日在美國地區成為蘋果(Apple)App Store 應用程式商店最受歡迎的應用程式,可見在聖誕節當天有多少人在使用 Amazon 的裝置。Alexa 除了用來購物的數量快速增加之外,在聖誕假期也為廣大用戶查詢了數十萬次的雞尾酒食譜,其中蛋酒和莫斯科騾子是在假期中被查詢最多次的飲料。光是在美國 Amazon 就為 Prime 會員出貨超過 10 億件商品,由此可知美國消費者對 Amazon 有多麼依賴。除了公開驚人的銷售數量之外,Amazon 也公布了各類型商品中賣得最好的種類。驚喜寶貝蛋娃娃(L.O.L. Surprise! Glam Glitter Series Doll with 7 Surprises)是賣得最好的玩具,Nerf N-Strike Elite Strongarm Blaster 玩具槍則排名第二。電子產品方面則由 Bose QuietComfort 35 II 無線耳機拔得頭籌,三星(Samsung)的 65 吋 4K UHD 8 系列電視摘下第二名,蘋果的 32GB Wi-Fi...
從有電腦開始,就有理論指出電腦病毒的可能,惡意程式的歷史與電腦一樣久,用近期熱門科技 AI 來偵測惡意程式也成顯學。但資安專家警告,如果不注意 AI 訓練資料的侷限性,將受制於資料,容易做出錯誤的結果出來。在 12 月 12 至 13 日舉行的 HITCON Pacific 大會上,大會演講上奧義智慧創辦人邱銘彰 Jeremy 提及 AI 訓練不夠嚴謹的狀況。像是餵給 AI 的資料多樣性不夠,會造成演算法訓練出問題。像是用虎斑貓來訓練 AI 辨識,如果突然叫訓練好的 AI 看酪梨的照片,由於酪梨的顏色很像虎斑貓,很大的機會將酪梨辨識成虎斑貓。如果上述例子要訓練好的 AI 辨識浩克的圖片,可能也會不小心辨識成完全不同的事物。這就告訴我們訓練樣本的多樣性其實是相當重要的事情。儘管辨識圖片還不是什麼生命攸關之事,但 AI 用在民生相關之事,AI 的訓練也就要越嚴謹。 ▲ 講者提及 AI 的盲點,人類能輕易辨別之物,對機器卻是相當困難,需有充分有代表性的訓練資料才不會出錯。(Source:科技新報)自駕車是時下熱門的技術,而且將是實際生活中最貼近人生活的 AI。近期特斯拉的鏡頭辨識不出三角椎,導致車子沒有像人類駕駛看到三角椎減速甚至停下來,最終造成車禍。回到防毒程式運用 AI 的例子,Jeremy 則舉最近防毒公司推銷用 AI 做行為分析型的防護方案,卻不是萬靈丹。你以為你的辦公室環境是乾淨的,拿來當背景值訓練演算法找出異常行為。卻忽略公司網路早已經是毒窟了。行為分析再怎麼做,分析網路流量也糾不出異常連線。Jeremy 還提及 AI 為基礎的防毒軟體還有時候遇到簡單狀況誤判的情形,簡單的 Hello World 程式,卻因為非正規寫法,被誤判成惡意程式。不少人想靠 AI 去分析股票走勢,卻由於自己是局內人也在做交易,所以預測結果並不準。反倒是可以從大戶的交易行為,訓練演算法預測大戶未來的交易行為。或者是不要做精準的股票指數預測,預測是漲或是跌的走勢。整場演講告訴我們台下的聽眾,AI 並非萬靈丹,而且需要很堅強的統計學基礎。在防毒程式中就是會漏掉,像是型 1 錯誤,實際上有惡意程式存在,卻沒被偵測到。如果不注意資料問題,所謂 garbage in garbage out,反映輸入資料的本質,像是人類偏見影響資料而誤判。(首圖來源:科技新報)
美國消費電子展(CES)即將於 2019 年 1 月 8 日登場,包括聯發科、鈺創與義隆電等多家 IC 設計廠都將參展,各家廠商多以人工智慧(AI)為參展重點。義隆電今年將是第 12 度參加 CES,並再度由董事長葉儀皓率團。義隆電子公司一碩科技將展出奪下新竹科學園區管理局首座智慧園區創新規劃獎的 360 度魚眼影像智慧車流偵測技術應用產品。一碩科技是運用 AI 影像車流辨識及自動號誌分析技術,節省人力與縮短時制重整程序,解決路口交通壅塞問題。義隆電本身則將展出手機與筆記型電腦相關技術產品;手機方面,包括有手機指紋辨識、屏下指紋辨識、智慧卡用指紋辨識、臉部辨識與帶筆的面板驅動及觸控整合單晶片(TDDI)。筆記型電腦方面,除觸控板與觸控螢幕控制晶片產品外,義隆電還將展出具加密功能的指紋辨識晶片產品,這款產品將可滿足資訊與網路安全的安全需求,確保支付安全性,預計明年量產出貨。鈺創也將由董事長盧超群領軍參展,今年以 3D 影像深度圖技術為展出重點,可達超廣角 180 度,精準度達 1 微米,特別的是鈺創還將展出與露西德(Lucid)及耐能智慧(Kneron)兩家美國新創企業合作成果。鈺創與 Lucid 合作開發 3D 感測開發者套件,期有助開發者快速發展 3D 掃描、物件辨識、手勢控制、3D 人臉解鎖等 3D 視覺性應用,普及於智慧零售、安全監控及無人機,加速 3D 感測開發創新。鈺創與耐能智慧合作開發終端人工智慧的 3D 感測解決方案,提供人臉辨識及體感辨識,期能加速人工智慧的電腦視覺與機器學習的應用普及。聯發科則將展出導入 AI 應用的智慧手機、智慧家庭與車用產品,聯發科 12 月推出的曦力 P90 處理器內建升級版 AI 引擎 APU2.0,AI 算力較 P70 提高 4 倍,搭載 P90 的終端產品預計明年第 1 季上市,備受市場關注。(作者:張建中;首圖來源:shutterstock)
進入 2019 年之後,分析師們對於半導體產業的看法是否如同先前所提出一樣的保守。根據摩根士丹利(Morgan Stanley,大摩)的分析師團隊於 2018 年 12 月所發布報告指出,2019 年全球半導體產業週期性低潮尚未見底,對北美和亞太市場均持保留態度,將預期成長從 -1% 下調至 -5%;至於,中國半導體產業仍存在著機會,整體未來成長點,將在於人工智慧與機器學習以及無人駕駛等兩大領域。根據報告指出,2019 年半導體產業整體銷售金額將比 2018 年下降 4.7%,這與 2017 及 2018 年各自有 22% 及 14% 雙位數的年度成長率形成鮮明的反差。從個別產業來分析,記憶體設備的銷售金額在經歷前兩年各自 60% 及 30% 的高幅度成長之後,將在 2019 年急劇下滑至僅有 18%。對此,大摩認為,在未來 5 年內,全球半導體產業的成長率將圍繞著 GDP 成長率上下波動。不過,對於 2019 年的半導體產業景氣則不抱持樂觀的看法,因為大摩認為,形勢將比 2015 年的產業低潮的情況更加嚴重。原因是半導體產業存貨和供應過剩,加上需求不足,導致 2019 年供需不平衡。這部分從 2018 年年初實際生產增加了 22%,但市場僅消化了 15% 的增加量。因此,2019 年的開年,需求面要如何消化這 7% 的過剩產能,將是個很大的挑戰。另外,在需求放緩的部分,是由於汽車和工業的垂直需求減少,以及整個供應鏈的庫存調整。此外,智慧型手機方面的成長疲軟,特別是來自蘋果 iPhone 的銷售不如預期,以及中國廠商的市場需求縮小,更是對半導體需求方面的進一步造成壓力。報告指出,全球半導體產業未來兩大長期成長點,關鍵在於人工智慧與機器學習以及無人駕駛方面。其中。機器學習的應用正在升級,從資料中心擴展到邊緣運算上。而目前的機器學習相對處於早期的發展階段,但是在接下來的 3 到 5 年中,重點將從會用於演算法開發、培訓的半導體工具轉向電腦解決方案,以取代人力資本。另外,人工智慧及機器學習還有基於電腦視覺構建的...
對於聽障者來說,最主要面臨的問題有二。第一是助聽器價格高昂,以全球六大品牌為例,平均價格約在 6 萬台幣左右,高階的甚至要 15 萬,負擔相當沉重。第二,許多傳統助聽器的效果不夠好,一旦周遭環境音量太大聲,想清楚聽見談話者講話難度就會相當高。本身也是聽障者的陳柏儒(Blue Chen)為了解決這些困境,集合一群專精 AI 演算法的團隊,創立 RelaJet 洞見未來,要以「多人聲分離」引擎,協助聽障者擁有更好的聆聽體驗。辨識聲音特徵值,助聽障者聆聽特定對象從人耳接收聲音,到大腦獲取有意義的訊息,整個聽覺歷程(auditory hierarchy)中有任一個環節出錯,都算是聽覺障礙。陳柏儒解釋道,通常聽障者在喧鬧環境使用助聽器時,所有的聲音都會被麥克風接收,聽障者很難分辨聆聽對象的聲音。但一般人的聽覺系統,具備了專注於某人談話的能力,能夠自動忽略背景其他對話與噪音。例如在人聲鼎沸的宴會上,我們不但可以聽見面前朋友的講話聲,也可以聽到遠方有人呼喊我們。只要是我們「正在注意」的聲源所發出的音量,感覺通常是其他同音量聲源的三倍,這就是所謂的「雞尾酒會效應(cocktail party effect)」。RelaJet 的技術,就是要幫聽障者改善聽覺歷程中「察覺」、「區辨」及「辨識」等階段的問題。 要達到改善的效果,首先就是找出聆聽對象的聲音特徵值,才能讓聽障者專注聆聽特定對象談話。透過 Relajet 採用神經網路引擎(neural network engine),聲音的輸入及輸出都是透過脈波編碼調變(pulse-code modulation,PCM);經由深度學習的方法,10 毫秒以內就能完成「多人聲分離」,找出聲音特徵值。而處理的方式主要有以下兩種:第一種是「預先儲存聲音特徵值」。假設在吵鬧的室內我需要跟 John 對話,就可以先請 John 在手機 APP 上錄下 2~3 秒的音檔,多人聲分離引擎記錄 John 的聲音特徵值後,從此只要麥克風接收到他的聲音就會加強,其他的聲音則會被消除。第二種則是所謂的「盲聽」。手機 APP 不用事先標註某人的聲音特徵值,而是藉由多人聲分離引擎即時感測出有多少人在講話,然後使用者再選取想要談話對象的聲音特徵值,引擎就會加強這些聲音,並將其他人的聲音消除。 作為聽障者的同理心,卻讓創新在最嚴苛的條件中發生能夠在 10 毫秒內完成所有特徵值辨識的運算,是 RelaJet 多人聲分離引擎最大的優勢。至於為什麼是 10 毫秒?因為助聽器處理語音的時間若超過這極限,人耳就會感受到延遲,產生頭暈的現象,所以被歸類在醫療器材的助聽器,都要求必須在 10 毫秒以內完成所有的處理步驟。陳柏儒指著自己耳朵上戴的助聽器說道:「我比較幸運,助聽器一耳要 14 萬台幣,兩耳就是 28 萬,家裡還能夠負擔得起這筆花費,但我依然沒有辦法像一般人聽得清楚、發音標準。更何況是那些沒戴助聽器或是買不起的人呢?」幫助比他還要不幸的聽障者,成為他創業的初衷,因此 RelaJet 要求自家技術必須經得起醫療器材等級規範的考驗,首要目標就是將這套引擎導入全球六大品牌的助聽器中。當然,若能在醫材市場立足,往後也再往藍芽耳機、智慧音箱等需求較低的消費性市場邁進,也不會是個難題。 ▲...
我們都知道電腦會完全按照我們的要求去做,這點在神經網路的訓練也是如此,AI 會嘗試各種方法達成團隊設定的目標,然而史丹佛大學和 Google 團隊在 2017 年訓練 AI 轉換地圖的研究發現,如果表達不夠清楚,AI 也是會找到方法「偷吃步」達成目標。 2017 年的這項研究中,研究團隊開發出稱為 CycleGAN 的神經網路,希望透過大量訓練,讓 CycleGAN 學會有效準確地將地圖在「衛星地圖」和「街道地圖」間互相轉換。訓練過程中,CycleGAN 的表現都非常好,甚至有些太好了──即使團隊要求 CycleGAN 從轉換完成的街道地圖重建衛星照片時,CycleGAN 也能「完美」做到,甚至一些在街道地圖消失的細節又平空冒出,這引起團隊的懷疑。雖然我們難以深入了解 AI 神經網路的處理訊息過程,但團隊還是可以輕鬆審核生成的數據,透過一些實驗,他們終究發現 CycleGAN 究竟動了什麼手腳讓自己表現完美。訓練 CycleGAN 轉換兩種地圖過程中,團隊目的是希望 AI 能解讀兩種地圖的任何一種特徵,並且將其與另一種地圖的正確特徵互相匹配,然而實際上 CycleGAN 被評分的關鍵是「衛星地圖與原始地圖有多接近」以及「街道地圖有多清晰」,而問題正出於此。CycleGAN 並沒有達成團隊希望達成的目標,學會如何將一個地圖轉換為另一個。相反的,CycleGAN 學會的,是如何在評分時取得高分:透過將特徵巧妙編碼到另一張圖片,CycleGAN 讓衛星地圖的細節變成在街道地圖只有 AI 可見的「小抄」。▲ (a)為來源圖片,(b)為 CycleGAN 製作的街道圖片,(c)是電腦展現的可視化細微差別,(d)為 CycleGAN 用街景圖重建的衛星圖片。(Source:arXiv via Stanford University and Google)從(c)圖你可看到 CycleGAN 在街道地圖暗藏了和衛星地圖一樣的形狀,但除非這些差別仔細放大並突顯,人們永遠無法注意到,但這些人眼難以察覺的數千個微小顏色變化,電腦卻可以輕鬆偵測並使用。事實上,電腦非常擅長將這些細節藏入街道地圖,CycleGAN 已學會將任何衛星地圖編碼成為任何街道地圖,它甚至不必知道相對街道地圖長得如何,研究人員證實,CycleGAN 可將衛星照片的所有數據無差別疊加在完全不同的街道地圖上。將數據編碼到圖像的做法並不新鮮,這種技術稱為「隱寫術」(steganography),經常用於浮水印圖片或在相片加入拍攝的相機相關設定,但 AI 能找到方式創造自己的隱寫術,以另一種方式達到任務目標還是很新奇。有些人可能會認為這顯示機器越來越聰明,然而事實上是,就像人類在一些情況下選擇「偷吃步」或「作弊」,這反而意味著 CycleGAN 並不夠聰明,正因為無法做到將這些複雜的圖像類型相互轉換,它取而代之找到一種人類難以察覺其中異樣的方式來達成任務。可想見研究者未來將會以更嚴格的評估方式來避免這種情況,這也為我們提供一個觀點:與往常一樣,電腦完全按照人類的要求操作,因此在開口前,你最好非常非常具體了解自己要求了什麼。在這種情況下,電腦選擇了一個有趣的解決方案,揭示了這類型的神經網路可能有的弱點,也就是如果沒有明確禁止這麼做,電腦基本上會找到一種方法將細節傳輸給自己,以便快速輕鬆解決特定問題。 This clever AI hid data...