星期日, 25 1 月, 2026

旅 TRIVEL

等了 4 年,世界盃終於來了,這個牽動超數十億美元產業,吸引全球超過一半人口關注的賽事,正在俄羅斯境內如火如荼進行,同時,32 支來自 5 大洲球隊亦在綠茵賽場上為爭奪大力神杯揮灑汗水。從球場裁判輔助、資料收集,到球場外的觀賞體驗,這場全球性體壇盛宴,也隨著各種高新科技的發展而「升級」了一次。(Source:FIFA)除了法國對澳洲那場小組賽「聲名大噪」的 VAR 影片助理裁判技術(Video Assistant Referees),這屆俄羅斯世界盃還使用了不少智慧硬體,且與體育競技緊密結合。(Source:latercera)愛迪達 Telstar 18 智慧足球2018 年俄羅斯世界盃的官方比賽用球,是去年年底愛迪達公布的名為 Telstar 18 智慧足球。▲ Telstar 18。(Source:Adidas)從設計到命名,這顆足球,是愛迪達致敬首款登陸世界杯的比賽用球──1970 年愛迪達首次為世界盃製作的比賽用球 Telstar。外觀採用經典黑白兩色設計,印有 Telstar、愛迪達、俄羅斯世界盃等金色 Logo,並在深色球面使用馬賽克圖案。(Source:SoccerBible)最大亮點在於球內嵌了 NFC 晶片,也是世界盃用球第一次引入的技術。不過,相比於先前愛迪達推出的利用感測器監測速度和彈道指標的 miCoach Small Ball 智慧足球,這顆加入 NFC 晶片的 Telstar 18 比賽用球,就沒有那麼智慧了。Telstar 18 只能與智慧手機簡單互動,包含取得 Telstar 18 的產品資訊以及特殊的小遊戲挑戰。裁判員價值 5,200 美元的智慧手錶除了球員腳下的智慧足球,跟著滿場跑的裁判手上也戴了一款表──Hublot 推出的 The Big Bang Referee 智慧手錶。(Source:影片截圖)這是 2018 年俄羅斯世界盃官方指定的裁判智慧手錶,基於 Wear OS 作業系統,並附帶一些世界杯相關的主題錶帶。根據 Hublot 資料顯示,The Big Bang...
在 AI 技術不斷發展的大趨勢面前,幾乎所有科技巨頭都要面臨愈加嚴苛的道德評判和輿論──之前不得不接受美國國會聽證的 Facebook 如此,被迫放棄與國防部合約的 Google 也是如此。現在,輪到另一個巨頭了,這次是電商老大亞馬遜。當臉部辨識被警方使用事情不是突然發生的,而是長期醞釀。2016 年,亞馬遜推出一款臉部辨識工具 Rekognition,能辨識圖像和影片,分類內容, 比如人物面孔、場景、文字、物體等;當然,背後還是亞馬遜強大的人工智慧技術和 AWS。技術本身看起來沒什麼問題,且帶來很多好處,問題在於實際應用場景會引起人們的不同反應;比如說警察部門。的確,亞馬遜 Rekognition 已用於美國相關政府部門,亞馬遜官網的介紹頁面,Rekognition 已用於 Washington County Sheriff’s Office in Oregon(華盛頓郡警長辦公室),當然該頁面介紹的是正面案例:利用該工具成功捕獲商店扒手。2017 年 6 月,亞馬遜在官方部落格發表一篇來自警長辦公室分析師撰寫的文章,介紹如何利用 Amazon Rekognition 辨識案件嫌疑人。文章提到兩個案例:第一個案例,銀行監控鏡頭捕捉到失竊信用卡用來領現的影像,但光線和角度問題,辦案人員無法人工辨識,透過 Amazon Rekognition 則達成 95% 的人物符合度。另一個案例是,利用 Amazon Rekognition,辦案人員成功在 Facebook 找到一名使用假名發表內容的個人。文章最後強調利用 AWS 進行人臉辨識的便利性,並表示 Amazon Rekognition 已成為警長辦公室辨認嫌疑人的有利工具,並希望它成為法律案件臉部辨識的標準工具。當然,除了上述案例,Amazon Rekognition 也用於其他警察相關機構,比如說奧蘭多警察局。亞馬遜聲明也提到,不少機構利用這項技術找到被拐騙人員和走失兒童。另外,其實 Amazon Rekognition 也有很多非執法類的商業用戶,比如 Pinterest 和 C-SPAN。亞馬遜面臨的輿論即使如此,Amazon Rekognition 與美國執法部門合作的負面輿論效應漸漸發酵,尤其涉及隱私層面,已有不少機構和個人對亞馬遜表達不滿。2018 年 5 月下旬,美國公民自由同盟(American Civil Liberties Union,簡稱 ACLU)和其他隱私保護團體,要求亞馬遜停止對警察機構售賣 Amazon Rekognition,原因是執法部門可能會利用這技術,簡單地構建能辨識並即時監控任何人行蹤的系統。ACLU...
魔術方塊是非常有趣的益智玩具,但從難度來說,其實不比其他棋類遊戲困難,如果人工智慧(AI)演算法可在西洋棋或圍棋輕鬆打敗人類,那麼復原魔術方塊也不是困難的事。 但是對演算法來說,要解出魔術方塊的謎題和下棋是完全不同種類的任務。過去在棋類遊戲展現出超人類表現的演算法,都是屬於傳統的「強化學習」(RL)系統,這類型 AI 確定某些特定一步是實現整體目標的積極步驟時,便會獲得獎勵,進而使系統產生追求最大利益的習慣性行為,然而當 AI 無法確定這一步是否有益,強化學習自然無法發揮作用。如果還是無法理解,試著這麼想吧:玩棋類遊戲時,系統可輕易判定一個動作究竟屬於「好棋」或「壞棋」,但轉動魔術方塊時,你能說出任何特定的一步,是改善整體難題的關鍵嗎?從外觀來看,魔術方塊是很單純的益智玩具,然而因為 3D 立體的特性,這讓一般常見的 3 階魔術方塊就已有驚人的近 4.33×1019 種組合,其中只有六面都是相同顏色的狀態才能成為「正確解答」。過去人們已研究出許多不同算法和策略來解決這項難題,但 AI 研究人員真正的目標還是希望能像 AlphaGo Zero 那樣,讓 AI 在沒有任何歷史知識的情況下,學會自行應對隨機的魔術方塊難題。近期加州大學 Stephen McAleer 和團隊透過一種稱為「自學疊代」(autodidactic iteration)的 AI 技術打造「DeepCube」系統,成功讓 AI 面對任何亂序 3 階魔術方塊時,都能成功找出正確解答。根據團隊解釋,自學疊代是一種全新的強化學習演算法,與過去棋類遊戲演算法的處理方式不同,採取「反著看」的內部獎勵判斷機制:當 AI 提出一個動作建議時,演算法便會跳至完成的圖形往前推導,直到到達提出的動作建議,藉以判斷每一步動作的強度。雖然聽來相當繁雜,但這讓系統更熟悉每一步動作,並得以評估整體強度,一旦獲得足夠的數據,系統便能以傳統的樹狀搜索方式找出如何移動最好的方法。▲ DeepCube 自行找出的策略 aba-1,許多玩家也經常使用。(Source:arXiv via Stephen McAleer)團隊研究發現,DeepCube 系統在訓練時自己找出許多與人類玩家相同的策略,並在經過 44 小時的自學訓練後,已能在沒有任何人為干預下,平均 30 步以內復原任何隨機亂序魔術方塊──這些「最佳解答」不是和人類最佳表現一樣好,就是比這些表現更好。McAleer 和團隊打算未來進階測試更大、更難解決的 16 階魔術方塊,這項全新的系統將有助於 AI 應用更全面化,像是生物物理學重要的蛋白質摺疊(Protein Folding)問題或也有望得以解決。 Machines can now finish the Rubik’s Cube without...
2014 年上映的電影《雲端情人》(Her)中,男主角西奧多帶著搭載 AI 操作系統「莎曼珊」的手機,走在擁擠的遊樂場裡。他突然心血來潮,決定閉上眼睛,讓莎曼珊指揮他的路線。西奧多伸直手舉著手機,莎曼珊完美的指引他避開迎面而來的人群,繞過廣場的柱子,抵達他的目的地──一家披薩店。電影裡這個場景很溫馨,單獨拿出來看,這畫面很詭異。但無論如何,這樣的功能離我們越來越近。想做到 AI 即時指路,背後需有兩個關鍵技術。首先,AI 要能用最高效的方式辨識周圍空間;其次,它還要像人一樣,基於視線所及的圖像來「腦補」整個空間格局。最近,AI 在這兩個能力上取得重大進展,帶頭的又是 Google 旗下的 AI 明星公司 DeepMind。週四出版的《科學》(Science)雜誌,DeepMind 發表了一篇論文,向世界介紹名叫 GQN 的新 AI 系統。GQN 的全稱為「Generative Query Network」,直譯為「生成式查詢網路」,改進了現有的機器視覺研究方式:目前的機器視覺在訓練時,還是依賴「吃進」人為標記好標籤的圖像數據來訓練,大部分屬於監督式學習,而 GQN 的方法則是讓機器自我訓練,屬於無監督機器學習。這是一種更接近人類行為模式的系統:當我們走進一個空間時,可根據雙眼看到的簡單畫面,快速對所處空間有整體的認知。比如,眼睛看到的可能只是衣櫃正面,但在我們的腦中,衣櫃的全貌、在房間所處的位置、陽光下的陰影樣子,其實都已同步生成並存於腦海。這對人類來說很簡單,但沒人能說清人類大腦如何處理這些資訊。當 AI 嘗試復刻人類大腦流程時,若依然採取輸入規則、監督式的學習方式,顯然十分困難。GQN 選擇神經網路的方法,決定讓機器自己學習,就像它們在圍棋、翻譯等領域做的那樣。具體來看,GQN 由兩個模型構成,一個叫做表徵網路(representation network),另一個叫做生成網路(generation network)。前者其實可視為模仿人類的眼睛,後者則嘗試複製人類大腦處理空間資訊的方式。表徵網路透過圖像感測器觀察世界,把空間中看到的二維圖像,以數據形式輸入系統,之後生成網路會基於這些數據學習,然後嘗試預測某​陌生視角下這空間的樣子,渲染後以三維形式呈現。簡單說就是,表徵網路看見一張桌子的正面,包括它的構造、顏色、高低等,然後生成網路要據此「猜出」桌子側面、底面等其他角度的樣子,就像人類無時無刻做的那樣。由於採用無監督學習模式,表徵網路在「看」東西時並不知道生成網路最後需要從哪個視角預測,為了更幫助後者完成任務,它需要在不斷的訓練中,提升觀察和記錄能力,最終保證提供的輸入最高效。過程中它慢慢積累經驗,對整個空間各物體之間的透視規律、陽光陰影關係等都有認知(事先並沒有任何人為干預告訴機器什麼是「顏色」、「位置」、「大小」等這些概念,全靠機器自己「開悟」),並最終用一種電腦能理解、最濃縮最高效的數據形式完成輸入。而生成網路在一次次訓練中,將這些輸入數據再次轉換成圖像。且這圖像不再是二維,需要轉成立體的空間畫面,物體的尺寸、定位、光影關係、透視關係都要準確呈現。過程中生成網路逐漸學習成了有渲染能力的圖像神經網路。經過一段時間自主學習後,DeepMind 測試 GQN 在虛擬環境的成果,結果驚人。下圖是第一種測試,在一類似小廣場的簡單虛擬三維空間,GQN 的表徵網路從一個視角輸入一組二維圖像,而生成網路達成了清晰精確的三維「還原」──包括二維圖片以外的空間。接下來,DeepMind 又做了第二種測試,有點類似念書時都做過的空間感覺測試。表徵網路對一多個立方體組成的「積木」觀察輸入,而生成網路需要回答這個物體由幾個立方體組成。GQN 也完成了測試。第三種測試,DeepMind 把 GQN 從開放的小廣場趕到一個更複雜的「迷宮」,在這裡,視野受到限制,但 GQN 可以來回走動,找到它認為最好的視角觀測,進而幫助生成網路還原整個空間。可以看到,GQN 就像玩拼圖,隨著表徵網路觀察角度增多,逐漸完美「腦補」出整個空間的全貌。這已經和人類非常接近,近到有點嚇人。DeepMind 聯合創始人、CEO 傑米斯‧哈薩比斯(Demis Hassabis)說:「GQN 已可從任何角度想像和呈現場景。」其實,如果拉長時間來看,這次 GQN 的突破,其實是最近 DeepMind 在 AI 辨識空間方面的一系列嘗試中一環。就在 5 月,DeepMind 曾在《自然》發文,表示他們在 AI...
邊界問題一直以來都是美國和墨西哥爭論的焦點,美國總統川普(Donald Trump)在競選時甚至說出要在邊境蓋上一堵牆的豪語。許多人對這個想法嗤之以鼻,不過有人打算用 VR 和人工智慧(AI)技術,打造出科技式的解方。提出另類解決方法的人,就是 VR 頭戴式裝置公司 Oculus 的共同創辦人 Palmer Luckey。Luckey 在 2011 年研發出第一代 VR 頭戴式裝置,後來才創立了 Oculus,並在 2014 年將公司賣給了 Facebook。Luckey 曾經引發過一些政治上的爭議,他在 2016 年美國總統大選期間曾經捐款幾千美元給攻擊希拉蕊‧柯林頓(Hillary Clinton)的組織,後來就離開了 Oculus。這套虛擬長城由結合 VR 和 AI 技術的高塔所組成,並首度在 2017 年公開,近來科技雜誌《Wired》的報導揭露了城牆系統的面紗。這家 Luckey 投資的 Anduril Industries 正在推銷這套稱為 Lattice 的監視系統,系統可以從兩英里外就能監控到意圖跨越邊境的偷渡客。Lattice 配備有攝影鏡頭、雷達和紅外線感測器,可以記錄邊界的影像和數據,接著利用 AI 進行分析。AI 能夠根據移動的方式等條件,來判斷偵測到的是人、車子、郊狼或是風滾草。監控者戴上 VR 頭戴式裝置之後,Lattice 就能顯示邊界實際狀況。如果有任何人、動物或車輛意圖穿越邊界,系統就會以綠色方框標記來警告監控者。Lattice 系統目前在德州的私人牧場進行測試,並在 10 週的時間裡,就幫助美墨邊界的警方逮捕 55 人,並查緝了 982 磅的大麻,不過被捕的其中 39 人與毒品無關。這種利用科技來建造虛擬邊界的方法其實不算太新穎,早在 2006 年美國國土安全部(DHS)就有過類似的計畫稱為...
6 月 18 日,舊金山的 IBM 辦公室,人工智慧在一場辯論賽擊敗了人類頂尖辯手。參戰的是 IBM Research 新推出的 AI 系統 Project Debater,對手則是以色列國際辯論協會主席 Dan Zafrir 和 2016 年以色列國家辯論冠軍 Noa Ovadia。IBM 研究對話式人工智慧已多年,之前推出過「華生」(Watson),Project Debater 是最新的成果。據 IBM 官方介紹,Project Debater 是第一個可在複雜話題與人類辯論的 AI 系統。Project Debater 透過處理大量文字,就特定主題構建良好架構的演講,提供清晰明確目的,並反駁對手。最終,Project Debater 將透過提供引人注目、以證據為基礎的論點,並限制情感、偏見或模稜兩可的影響來幫助人們推理。Project Debater 外形不得不說有些「嚴肅」,如影片所示,Project Debater 像一塊黑色大石頭,在螢幕上有 3 個漂浮的藍色小圓。Project Debater 進行了兩場表演賽,第一個話題中,Project Debater 持正方觀點「政府應該增加太空探索的費用」,而人類辯手持反方觀點「政府不應該增加太空探索的費用」。第二個話題,Project Debater 持「遠端醫療會在醫療占更大比例」觀點,人類辯手反之。辯論賽的流程是 4 分鐘開場演講,4 分鐘反駁和 2 分鐘論證總結。人類辯手首先發言,然後 Project Debater 反駁。據外媒 Engadget 報導,Project Debater 拋出不少觀點,同時還根據對手的發言反駁。VentureBeat 記者稱,太空探索的話題,Project Debater 並不是簡單參考 Wikipedia 的資料,而是嘗試理解題目,整合多方資訊。Project Debater 能參考沙烏地阿拉伯 Sheikh 的系列言論,或是德國經濟事務部長報告指出太空探索所能提供的工作數量。但為了避免犯錯,Project Debater 沒有直接參考對手的言論。一共有 40 名成員參與投票,太空探索這題,Project Debater 比 Dan Zafrir 多獲得 9 票,贏得比賽。Project Debater 也犯了一些錯,或做出過於大膽的論斷,例如它論證,太空探索比更好的公路、更先進的學校、更好的醫療更重要;又或者,它在辯論中說出「Scott Pelley 配音」,這通常是哥倫比亞廣播公司新聞播報員會說的話。IBM Research 首席調查員兼 Project Debater 創造者 Noam Slonim 說,Project Debater 專案 6 年前就開始了,而在兩年前才能參與人們辯論。Debater 的辯論智慧來自數以億計的期刊和報紙文章。比賽之前,Project Debater 並不知道辯題。除了辯論開始的問候和笑話,陳述都是 Project Debater 自由發揮,沒有固定的陳述詞。當 Project Debater 獲得新話題時,會在其文章語料庫搜尋與該主題相關的句子和線索,用來支援辯方論點。根據相關內容,它會嘗試理解辯論主題,然後組織自己的陳述。據了解,這天的展示之後,Project Debrator 將在今年稍晚參加延長辯論,隨後可能會舉行一次研討會,學者可提供他們對 Debater 的評論。此次,科技記者已經有一些簡短評論。VentureBeat 記者評論,Project Debater 具備一定的幽默感,懂一些小把戲,偶爾也能做出有力論點。Engadget 記者表示 Project Debater 的思路和回覆讓人印象深刻,但不是所有時候都讓人感覺自然。MIT Technology Review 記者的反應則較冷淡,認為 Project Debater 並沒有理解題目,只是東拼西湊。顯然,Project Debater 還是一個實驗性項目,它的可能性在哪裡?最重要的一點或許是,AlphaGo 證明了 AI 可以涉足棋類競技,而 Project Debater 則向人類最至關重要的一項技藝──辯論,發起進攻。從蘇格拉底時期,辯論就是人類生活重要的部分,人們透過辯論來制定國家戰略、道德準則;透過辯論來明辨是非、抒發己見。在辯論中,理性和智慧的光輝得以閃耀。然而,人們很難不受利益影響。辯論上,AI 或許比人更優越的一點是,它可以提供「無偏頗」的觀點,為決策者提供更中立,不受利益影響的資訊。會辯論的 AI 另一個顯然用途是,幫助人們辯論。AI 可快速提供大量正反方觀點,進行大量辯論模擬。這是 AI 進入內容創作、內容生產領域的一大重點──與人類合作創意。(本文由 雷鋒網...
「小愛同學,提醒我 15 分鐘後拿下面膜!」愛美的小玲說。「小愛同學,幫我打開掃地機器人!」愛乾淨的小敏說。「小愛同學,來一段經典的戲曲!」愛聽京劇的爺爺說。「小愛同學,我想聽蠟筆小新的聲音!」愛玩遊戲的阿寶說。「小愛同學,幫我記下這個窗簾的高度,高 1.5 公尺,寬 0.6 公尺!」忙著安置新居的大明說。上面的這些台詞出現在中國小米音箱的廣告,搭配各種不同的生活場景需求,描繪出有人工智慧助理能力,透過智慧音箱互動裝置,所塑造的未來智慧家庭面貌。2017 年美國的智慧音箱賣了超過 2,500 萬台,滲透將近 15% 的家庭,其中 Amazon 的 Echo 系列占了七成,Google 和蘋果等大廠緊追在後(2018 年 Google Home 快速攀升)。中國廠商也立即跟進,雖然數量還不及歐美市場(約 300 萬台),但在小米、京東、阿里等零售巨頭紛紛投下龐大行銷,以超低的價格(299~499 人民幣,比 Echo 便宜一半以上)來搶占市場的情形下,也已造成市場風潮。當筆者詢問中國朋友對於這種智慧音箱的使用滿意程度時,多半獲得不太正面的評價,許多人嘗鮮買回去,用了幾天發現不太實用,多半束之高閣。相對的,Amazon Echo 在美國的使用率就大很多,產生的商業價值也被大家高度認可,公司股價不斷衝向新高。為什麼這個智慧音箱(本質是智慧助理)的戰場這麼重要,可能改變未來多個產業的格局,和人們生活的方式?又為什麼 Amazon 目前還能獨占鰲頭,其他大廠及中國公司學著畫皮容易,但還學不到其中精髓?以下筆者從 3 個方面來做一些剖析:1. 語音是人機互動最自然的介面,將成為人工智慧的新 「入口」,自然是兵家必爭之地。用自然的口語來操控電腦,執行生活上或工作上的任務,是許多軟體科學家數十年來努力的一個重要領域。從早期 Office 的指令,到近期的 iPhone Siri,即使是簡單的指令動作,經常因為無法辨識各種口音,或稍微複雜的語意,而讓使用者頻頻失望,難以成為實用的習慣。智慧音箱因著 AI 在自然語言處理(NLP)技術的突破,經過大量數據的建置和訓練,已經具備在特定的情境和知識體系下,省去手眼的操作(觸控、打字等),能有效地與人們進行溝通。加上串聯在各種應用場景背後相關的內容服務和環境控制,不僅比手機或電腦更方便完成任務(例如查詢資料、上網購物),也為許多原本不適合操作電子裝置的人和情境(例如臨時或長期行動不便者),掃除障礙。更威的是,厲害的智慧助理系統,能不斷從使用者操作方式和生活習慣的熟悉,增加用戶的以來,建立不容易被置換的門檻,比手機還要高。因此這一塊領域(不只是音箱這個裝置,更是整個助理系統),所有企圖掌握市場寶座的企業,莫不投下重資,期望成為未來每個人的 AI「操作系統」。這戰場不僅在家庭應用上,在企業應用(各垂直產業)、教育、醫療、或公部門中,都可能誕生少數的超級平台公司,掌控我們未來的人機互動入口。2. 不僅提供購物及服務,平台生態包括了智慧裝置,成為家庭生活,甚至其他應用場景的控制中心。不少科技巨頭(例如微軟、蘋果等)曾提出多種「家庭控制中心」的方案,描繪許多看來很夢幻,讓生活更美好的使用情境,但至今無一成真。除了前述的人機介面技術問題之外,裝置及網路間的標準不一致,服務和控制體驗不能無縫銜接,是更重要的商業原因。Amazon 挾著多年來累積的幾項優勢(線上購物、數位內容服務、雲端平台服務以及大量用戶等),並且在推出音箱的同時,「開放」這個以人工智慧為基礎的 Alexa 平台,邀請廣泛的協作廠商,建立一個生態系統,因此能在很短的時間內聚集相當多的合作夥伴,提供能與 Echo 流暢地串接的軟體、硬體以及服務,終於實現了家庭控制中心的角色。我們也可以相比中國的市場狀況,雖然大廠能推出低價的音箱產品,整體銷售以及使用量,還是遠不及 Echo 的普及,就是因為服務及裝置的生態圈建立非常困難,門檻很高,必須有具備開放平台經營,了解軟體與硬體銜接,又充分掌握使用者體驗的廠商,才有辦法做到。展望後市,諸多廠商中筆者認為小米的機會比較大。3. 打通消費及使用數據,整合銷售和行銷的上下行溝通,為線上線下完整的新零售場景補足最後一塊拼圖。這幾年「新零售」的口號喊得很響,雖然每個人的倡導和理解可能不同,但努力提供消費者「完整且無縫的購物及使用體驗」,則是所有人都一致同意的。除了把實體店面智慧化,網路及行動購物流暢化,線上線下的通路整合之外,運用這種位在使用現場的智慧音箱、智慧助理或類似形式的智慧裝置,能將過去無法企及的使用者接觸點(Touch...
總有許多美好的瞬間,想用慢動作錄影記錄下來,再慢慢重播欣賞。但手機拍攝的慢動作影片,總是讓我們不太滿意。這回輝達的人工智慧可以解決這個遺憾。6 月 18 日,Nvidia 發表一支影片,顯示正搭建的人工智慧可將普通影片轉為平滑自然的慢動作影片。轉換一段汽車飄移的影片時,可明顯看到使用 30fps 拍攝的再用 12.5% 速度慢動作播放時,有明顯的卡頓。下方轉換後的影片,使用 240fps 效果播放,汽車飄移過程真是「順滑如絲」。女舞者跳舞的影片,也可看到轉換後的慢動作影片,人物旋轉時頭髮及衣裙的細節更清晰。這段影片還有兩個場景,是將知名慢動作 YouTuber「The Slow Mo Guys」的影片轉換並對比。一個場景是人往下跳,壓破氣球,一個用網球拍擊打彩色水球。從影片看來,人工智慧對定位物體及補幀技術都相當不錯。Nvidia 還表示,該技術可最佳化各種規格的慢動作影片。此人工智慧主要由 Tesla V100 GPU 及 cuDNN 加速的 PyTorch 深度學習框架組成。透過使用 1.1 萬段 240fps 影片訓練,內容包括日常生活及體育活動。不得不說,黃仁勳領導下的 Nvidia 研發的人工智慧,在影像辨識方面,一直領先業界。今年 1 月,Nvidia 推出新訓練方式,讓人工智慧從已有影像生成新影像,甚至可利用不同人像生成新肖像,且影像依然穩定又高品質。除了這種無中生有成人像的技術,Nvidia 的人工智慧還能在影片「偷天換日」修改天氣,樹木、路燈等其他物體卻無太大變化。去年底,Nvidia 就展示過其影片人工智慧特技,可將白天變成黑夜,下雪變成晴天,還能修改動物斑紋,將美洲豹變成非洲獅。這次 Nvidia 展示的新能力,如果真的可在消費層級使用,對影視產業的朋友而言,影片後製就更省事了。(本文由 愛范兒 授權轉載;首圖來源:影片截圖)延伸閱讀: 黃仁勳:NVIDIA 專心發展 AI,不在意虛擬貨幣市場,邊緣運算也非目標 照片也變臉,NVIDIA FastPhotoStyle 演算法將氛圍轉移到另一張照片 AI 憑空捏造「真人面孔」,交友網站的「美女照騙」更不靠譜了?
身為頂尖的人工智慧研究公司,DeepMind 近年申請了一堆國際專利,但專利內容和申請數量就不得而知了。最近,DeepMind 首次披露一系列國際專利,涉及現代機器學習基礎面,對正在人工智慧領域商業化活動的任何人都有潛在意義。DeepMind 背景DeepMind 總部位於倫敦,是公認為處於 AI 領域最前線的頂尖人工智慧研究公司。DeepMind 成立於 2010 年,2014 年被 Google 以 4 億英鎊收購。2017 年,DeepMind 因開發打敗人類世界圍棋冠軍的 AlphaGo 而聲名大噪。關於 DeepMind 的人工智慧方法,可參考 The Verge 訪問創始人 Demis Hassabis 博士的文章《DeepMind founder Demis Hassabis on how AI will shape the future》,Demis Hassabis 博士詳細介紹了 DeepMind 的人工智慧方法,這篇文章也適用外行人了解一般意義的人工智慧和機器語言。Hassabis 博士人氣頗高,《衛報》稱他為「人工智慧的超級英雄」和「天才」,《金融時報》稱他為「現代博學家」,《倫敦晚旗報》還送給他「倫敦超人」(London’s megamind)稱號。他甚至還上過 BBC 的《荒島唱片》節目。▲ 人工智慧有多種用途,包括進行藝術創作。圖為 AI 畫作《Rose Hungry Cat》。DeepMind 披露專利申請 WO 2018/048934,「利用神經網路生成音訊」,優先權日期:2016 年 9 月 6 日。 WO 2018/048945,「利用卷積神經網路處理串列」,優先權日期:2016 年 9...
Amazon 在 6 月 19 日宣布與萬豪國際合作,推出專為高級旅館設計的「旅館版」Alexa,可以用來要求客房服務、查詢旅館設施的開放時間和推薦旅館附近的餐廳等等。自從智慧音箱 Echo 上市以來,Amazon 就大舉在智慧家居市場攻城掠地,現在還開始提供滿足特定需求的特別版 Alexa,像是車用版和兒童版,如今則有了旅館版。「旅館版」Alexa 將率先在美國 10 家萬豪酒店上線,未來也能適用其他旅館業者,讓 Alexa 滲透到每個地方,能讓 Amazon 在智慧音箱市場的地位更加穩固,並與蘋果(Apple)和 Google 的戰爭中搶占有利位置。Amazon 智慧家居副總裁 Daniel Rausch 表示,Amazon 願意為不同旅館量身打造「旅館版」Alexa,推薦旅客當地特殊景點和餐廳,以及提供飯店本身的特定資訊。Amazon 還開發一套管理系統,協助旅館業者管控所有 Echo 設施。未來 Amazon 很快就會讓旅客在旅館 Echo 智慧音箱使用他們的 Amazon 帳戶,並使用 Amazon 的相關服務,退房之後也會自動登出帳戶。為了維護旅客隱私,旅館版的 Alexa 不會與亞馬遜共享旅客的語音資料,而且會每天刪除資料。不過 Alexa 要進入這些地方也不是觸手可及,畢竟不是每個人旅遊時都想使用智慧家居產品。但到目前為止,使用過的顧客整體給予正面評價。當旅客第一次進入房間時,房內的 Echo 智慧音箱會處於靜音模式。如果旅客不想使用 Echo 智慧音箱,也可以維持靜音或拔掉插頭,或一開始就選擇沒有「旅館版」Alexa 的房間。為了降低駭客入侵的風險,旅館版 Alexa 只有連線到飯店的無線網路才能使用,要是插頭被拔除飯店也會收到通知。 Amazon’s Alexa for Hospitality handles hotel checkout, pool time...