人工智慧在眼科領域又有一項新進展。4 月,美國 FDA 批准了世界第一款視網膜篩查 AI 設備 IDx-DR,可獨立檢測不需要醫生解釋結果。就在上週,奧勒岡健康科學大學(OHSU)和麻薩諸塞州總醫院(MGH)的研究人員在《美國醫學會眼科雜誌》也發表了一項成果:新開發的一種演算法能自動檢測導致兒童失明症的潛在病變原因,準確率遠高於人類醫生。根據美國國家眼科研究所的數據,多達 16,000 名美國嬰兒被診斷患有 ROP(早產兒視網膜病變)。ROP 是妊娠 31 週前出生的嬰兒可能患有的一種疾病,由視網膜附近的異常血管生長引起,是兒童失明的主要原因。每年大約有 600 名患者因此失明,音樂家史提夫‧汪達(Stevie Wonder)就是因此病失明。以往的診斷過程,醫生通常會用光線照射嬰兒的眼睛,然而該方法可能不準確,因為帶有很強的主觀性。據了解,這套演算法的數據來源於嬰兒在眼科醫生就診時拍攝的 5,511 張照片。麻薩諸塞州總醫院研究人員將現有的兩種人工智慧模型結合創建演算法,而奧勒岡健康科學大學研究人員開發了廣泛的參考標準來訓練演算法,隨後研究人員就讓演算法來區分健康血管和患病血管。在雙方通力合作下,該演算法可以透過辨識嬰兒眼球照片的情況,診斷是否患有該種疾病,準確率達 91%。但同期測試中,由 8 位醫生組成的對照組診斷同樣的眼球照片,準確率只有 82%。Kalpathy-Cramer 是哈佛醫學院的教授,也在麻省總醫院工作,她表示,「該演算法提升了熟練辨識 ROP,並將其納入數學模型的眼科醫生的知識,因此經驗沒有那麼豐富的臨床醫生仍然可以幫助嬰兒獲得及時、準確的診斷。」牽線該研究的聯合首席研究員是眼科學和醫學資訊學和臨床流行病學教授 Michael Chiang 博士,他同時也是 OHSU 醫學院和 OHSU 凱西眼科研究所 Elks 兒童眼科診所的醫生。他認為,「我們缺乏經過訓練並願意診斷 ROP 的眼科醫生,這造成在醫病供需上的巨大差距,即使在美國也是如此。可悲的是,全世界有太多的兒童未得到及時診斷。」▲ Michael Chiang 博士(右)檢查眼部掃描圖像。據了解,整個研究團隊現在正與印度夥伴合作,看看該演算法是否可以診斷印度嬰兒的 ROP,因為在這項研究涉及的主要是高加索嬰兒群體。他們還在探索該演算法是否可診斷視網膜中除血管外的其他情況,最終目標是使醫生將技術融入臨床實踐。(本文由 雷鋒網 授權轉載;首圖來源:pixabay)
一年一度的 Google I/O 2018 開發者大會 8 日由執行長桑德爾·皮蔡(Sundar Pichai)正式揭幕,並針對 AI 人工智慧相關主題展示 Google 的最新服務。挑戰人工智慧的極限以解決現實生活中的問題2 年前 Google 開發了一款能利用眼部圖像,來檢測糖尿病視網膜病變的神經網路;今年其人工智慧團隊分享了能用相同技術預測病患心臟病發、或中風風險的深度學習模型,並在 2 月份已發表關於這項研究的論文。Google 的人工智慧模型更透過分析嵌入在「去識別化」(De-identification)健康紀錄上的資訊,預測何時可能會再生病以及住院天數等醫療事件,將成為對病患健康產生重大影響的強大工具。另一個利用人工智慧來解決問題的例子是降低阻礙,以替影片上字幕為例,當人們打開電視節目,常看到許多人同時講話,這使得要專注在一段對話上變得相對困難;但 Google 同時使用聲音與視覺作為線索,可輕易分辨出不同的人聲並配上對應的字幕,這項技術稱為 Looking to Listen。Gmail、Google 相簿以及 Google Assistant 利用人工智慧以節省時間人工智慧在各種 Google 產品當中幫助用戶節省時間,例如 Gmail 新的智慧撰寫(Smart Compose)功能,透過理解信件中的內容提供簡短的建議回覆,幫助用戶在回信時更有效率;而在 Google 相簿中,可透過內建的建議功能,讓即時分享相片給好友更容易,還有快速提升相片亮度、變換色彩、甚至是讓黑白圖片呈現彩色效果等。▲ Gmail 的智慧撰寫新功能。由於語言理解技術的進展,用戶將能與 Googles Assistant 進行一段自然且流暢的對話,而且不用在詢問每個問題前重複「Hey Google」指令。Google 也為 Googles Assistant 加入 6 個新的聲音,其中更包括知名歌手約翰傳奇(John Legend),用戶將能聽到他迷人的嗓音來回答問題。Google Assistant 在 Smart Displays 或手機上以更視覺化的形式呈現,像是在手機上,Google Assistant 根據用戶的所在位置、時段、以及近期的互動內容提供一整天的建議;Google 也將...
你是否曾有過以下這些經歷? 參加電話會議,結果因為對面不會接入,被迫轉到 LINE。終於轉到 LINE 了,卻因為有人訊號不好或各種原因,最後只能改時間,或變成文字聊天。 和另一個人交流程式碼時,你必須走到他的桌子前,看著他的螢幕,聽他講。你肯定想過,有沒有辦法像看直播,在你自己的電腦看他怎樣寫程式碼,就像遠端作業? 寫一份文件,要查很多資料,於是你開啟了 Google、維基百科、十幾個網頁。你發現有資料網上查不到,但同事之前發給你一個 Excel 檔,於是你又要找到和開啟這個檔案。 大量檔案,幾十個視窗,你的電腦桌面很快變得雜亂不堪。突然你的電腦藍天白雲了,而你剛想存檔……幾個小時加班的成果,一下都沒了。相信很多人都遇過類似情況。在這個科技先進的時代,有大量技術和工具讓工作更高效有條理。然而在提高生產力的道路上,總有某些時候,那些科技產品卻成了最大的敵人。身為 Word、PPT 和 Excel 的開發者、地球最大的辦公軟體和服務提供商,微軟這家公司,就是生產力的代表。今年 Build 2018 全球開發者大會,微軟不負眾望,推出幾個新產品和功能,力求斬草除根這些工作中經常出現的尷尬。首先,面對幾十年沒有長進的 Concall 裝置,微軟突發奇想,以智慧喇叭為基礎,跟合作夥伴一起打造了全新的解決方案。智慧增強版視訊會議電話就是桌子上那個錐體。視訊會議電話已經不是什麼新東西了,但微軟這台會議電話,四周有幾台鏡頭,把各畫面接成全景。而且,它還能辨識與會者的臉,確保沒有不該出現的人進入會議室。當有人進入房間,電話也會大聲喊歡迎(會議室裡除了一大堆人,還有一台會說話的電話倒是挺奇怪的)。規模較大的公司,會議室都要預訂,而各公司的系統通常都有員工資料,包括大頭照──將大頭照/人臉辨識和會議室預約系統連在一起,這功能完全可以做,只是不知道為何之前沒有人想到。除了偵測人臉,鏡頭還有更重要的作用:和指向性麥克風陣列結合,這台電話就變成一台速記機!有人講話時,鏡頭、麥克風和語音辨識技術可辨識這個人是誰,聽寫,然後在與會者的電腦或會議室電腦記錄所有人的發言。考慮到微軟的語音辨識技術已非常先進,速記效果可說非常準確,畢竟人工速記也有錯誤率,長期來看還是微軟這套方案成本更有優勢。如果覺得這還不夠厲害……請感受雙語會議速記+同步翻譯:這個功能特別方便跨國公司使用,不需要會公司的官方語言,也可以跟總部開會。大螢幕的畫面上方是會議室視訊影像,下方左邊是速記內容,右邊還有一個 Insights & Notes。沒錯,基於語義分析技術的會議記要功能。記錄與會者發言後,這台電話還可語義分析,擷取可能對與會者重要的重點:打電話/發郵件給誰、找誰要某個檔案、跟進某件事等。有了速記和記要功能,就算沒有秘書,也不會忘記討論過的事情。最後總結一下,這台會議電話取代了速記、同步翻譯和秘書。這其實並不是一件壞事,因為對大多數職場人士而言,會議很耗費精力、效率低下。而現在,與會者不必擔心自己的語言不過關,或忘了帶電腦沒法做筆記。更多時間和專注在創造和執行,而不是浪費在討論,這才是生產力的解放。最後,你一定想問,這麼厲害的會議電話,哪裡能買到?有關這款電話的資訊還較少,不過確定的是,微軟是和合作夥伴一起,OEM 負責生產組裝硬體,微軟負責後端雲服務。至於現在已有 Surface 品牌的電腦、螢幕,會不會也出微軟自家品牌的會議電話……目前來看可能性不大。增強版程式碼直播你可能聽說,在唱歌、跳舞和遊戲主導的直播浪潮裡,也有一種獨特的直播內容種類:寫程式碼。當然,我們說的不是普通直播,而是另一種軟體工程師工作中可利用的直播寫程式碼功能。比方說兩個工程師需要對接,一個在美國,一個在台灣,見面不方便。這就是微軟的 Visual Studio Live Share(即時分享)功能。工程師 A 開啟自己的項目,新版 VS 和 VS Code 可以分享連接。當工程師 B 用 VS 或 VS Code 開啟連接,程式碼就可以直接對映到工程師 B 的電腦了。如下圖,右邊是工程師 A(初始畫面),左邊是工程師 B(直播畫面)。程式碼原作者和觀看者,可即時看到對方作業,並不限於滑鼠選取、標注、增加斷點(breakpoint)及增加和移除程式碼。觀看者也可像在本地寫程式碼一樣,檢查程式碼的各種函數、依賴等。你可以看到,編輯程式(程式碼框)和項目的檔案目錄對映過去,但視覺主題沒有,因為每個工程師都有各自習慣。同樣沒有對映過去的還有依賴程式庫,因為這個功能主要還是用作程式碼展示和溝通,而不是程式碼共用和托管。但如果你覺得這只是程式碼協同編輯程式,就低估它了。微軟稱其為體驗完整的程式碼協作平台。任意一方都可點擊播放按鈕測試執行程式碼,雙方電腦都會跑測試,如果有斷點,都會跑到斷點那一句停止。測試日誌會同步,雙方都可以 debug,結果也會同步。前面提到只有程式碼和目錄對映,直播的觀看者這邊缺少依賴程式庫等,也就是說就算觀看者只能看到這些程式碼,無法正常編譯和執行程式,這樣似乎體驗不完整。所以微軟增加 local host 功能:原作者可在自己和觀看者之間建立私密 local host,告知一個他自己設定的通訊埠(如 3000)。然後,觀看者就可在 VS 裡透過此通訊埠,在瀏覽器裡開啟程式(如果是 Web App)。透過這種方式,既能保證雙方的程式碼協作體驗完整,也保護程式碼的隱私和著作權。Visual Studio Live...
你是那種一打電話就緊張害羞、偏好發郵件和訊息的人嗎?如果是的話,恭喜你!人工智慧已經可以完美解決你的困擾了。Google 的人工智慧助理 Google Assistant,最近學會了一項新技能:冒充真人給餐廳、髮廊、酒店、咖啡館、電影院……你能想到的所有各種消費場所打電話,幫你預約、查詢訊息……不信?請看下面的影片:明明就是真人對不對!這段對話是真的,而對話中的顧客一方,的確是由 Google Assistant 扮演的……我們應該都聽過 Google Assistant 的聲音是什麼樣子。這段對話是女聲,聲音的背後是一位真的女生(姓名未知),在 Google 的總部花了幾個月的時間錄製,才將虛擬助手訓練成現在的聲音。在過去,Google Assistant 以及包括 Siri、Cortana、Alexa 在內的所有虛擬語音助手,用的都是一種標準的、近似於語言課上標準發音、語速等的發音方式。然而人類在現實中說話,有著各種各樣的口音、語速,語調在不同字和詞上有輕有重,在思考跟不上說話的時候會用「嗯」、「那個」、「you know」之類的填空詞。這也是為什麼當和虛擬語音助理聊天時總感覺怪怪的,因為儘管你在心理上強迫自己將語音助手當成是人,他們給你的回覆卻總是自信而標準。這讓你下意識立刻察覺到他們不是人,繼而產生一種近似於「自說自話」的尷尬感。在 2018 年 Google 開發者大會( I/O)的主題演講中,Google CEO 桑德爾·皮蔡(Sundar Pichai)表示,Google Assistant 部門的一個最重要的目標,就是讓用戶和虛擬助手的對話變得更加自然,就像和真人交流那樣。(Source:Google)注意到在剛才的電話中,扮演顧客的 Google Assistant 在整個對話中多次出現了類似於真人的反應。比如一開始,對方說出了「好的,請稍待一會兒」,之後是短暫的沉默。對方雖然說出了一個請等候的祈使句,在正常的人際交流中,顧客這邊應該表示「好的」、「沒問題」之類的意思,但對於虛擬助理這種以完成指令和回答問題為主要工作的人工智慧而言,它沒有理由對這一句做出任何覆,然而它還是在稍等了大約一秒鐘後做出了一個「嗯哼」(Mm-hmm)的表達。在通話接近尾聲的位置,對方多次給出了問句,而 Google Assistant 這邊儘管一直用的是陳述句來回答,卻都在句尾用了升調,和人類使用英文進行對話表達時的習慣極為相似。再比如,在通話中間,對方告知中午 12 點左右沒有空,最近的是下午 1 點多。Google Assistant 的應變方式不是接受 1 點多,而是給了對方一個新的時間範圍,並最終完成了預約。以假亂真的語音生成能力之外,即興是 Google Duplex 技術的另一個最主要的特色。在第二個案例中,這種即興能力得到了更加充分的展示:首先,有經驗的朋友們大概已經聽出來了,對方像是個中餐廳……餐廳老闆的英文表達能力有限,並沒有嚴格符合標準的英語語法,但扮演顧客的虛擬助理還是能夠理解。注意通話中間,餐廳老闆告知「4 個人不用訂位,可以直接來」時,原則上虛擬助理到這裡就可以掛電話了,因為訂位的任務已經完成。然而它沒有掛掉,而是做出了一個堪稱優秀的即興追問:「通常候位時間有多久」。如果之前就掛掉,這只是一個普通的通話而已,而這個即興的存在,在...
TechCrunch 報導,Google 執行長 Sundar Pichai 8 日在 2018 年 Google I/O 大會發表第三代 TPU(Tensor Processor Unit,TPU3)。他說,TPU 3 機架叢集(Pod)的效能較去年 TPU 2 Pod 高出 8 倍,最高可達 100petaFLOPS。Venture Beat 報導,Pichai 還提到 TPU 3 效能太強大了,為此旗下資料中心破天荒安裝了液體冷卻設備。CNBC 報導,新款 TPU 可協助 Google 改善人工智慧(AI)語音辨識度,找出照片與影片當中的特定物體並能理解文字背後所隱藏的情緒。Google 是在 2016 年發表第一代 TPU。日前公布的測試結果顯示,在特定情境下 TPU 2 的效能表現優於現有的 GPU 選項。Google 等科技大廠所力推的深度學習(deep learning)通常包括兩個階段。首先,研究人員透過給予大量數據的方式訓練內建 GPU 電腦學會辨識照片中的汽車。完成訓練後,研究人員在第二階段(稱為推論 Inference)要求電腦依據新數據做出預測。TPU 1 只能應用在深度學習的推論階段,去年發表的 TPU 2 則是能夠處理訓練(第一階段)以及推論。亞馬遜創辦人暨執行長貝佐斯(Jeff Bezos)上個月在寫給股東的年度信件中提到,在美國、英國以及德國,亞馬遜透過提升機器學習元件並使用半監督學習(Semi-Supervised...
人工智慧為全球產業帶來了許多轉變,各國政府都在努力推動相關政策計畫發展,做為許多知名企業 AI 實驗室選擇落腳的地區,加拿大駐台北貿易辦事處(CTOT)、亞伯達省駐台辦事處特別與台灣相關協會合作,舉辦 AI 研討會來互相了解兩地的 AI 發展概況,並期盼能藉此促進雙方合作、創造雙贏局面。為了推動 AI 產業發展、確保加拿大在發展 AI 領先地位,加拿大政府在去年推動了「泛加拿大 AI 策略」(Pan-Canadian AI Strategy),斥資 1.25 億加元(約台幣 28.75 億元),協助多倫多、蒙特婁、亞伯達省等多座城市進行發展。在加拿大政府的政策帶動下,現在蒙特婁有著全球最多的深度學習領域研究者與學生,多倫多則有著全球最多的 AI 新創公司駐紮,包含微軟、Google、亞馬遜、IBM 等大廠都選擇前來加拿大設立 AI 實驗室。CTOT 貿易暨投資處處長樹大衛表示,台灣在傳統 ICT、半導體及製造業上都具有堅強實力,在科技部 5 年投入台幣 160 億元推動 AI 發展的計畫下,他相信台灣與加拿大有著許多合作機會,雙方將能聯手為全球帶來下一次的 AI 產業革命。這場活動也特別邀請到台大資工系教授、CMLab 及 NVIDIA AI Lab 計畫主持人徐宏民博士來介紹台灣產學合作的情況,他過去曾經協助光寶、訊連在內多家大型企業成立 AI 團隊,在徐宏民看來,AI 所帶來的是增強智慧(Augmented Intelligence),協助人們在產能、安全性和效率上進行提升,因此 AI 的好處只是 IT 產業,事實上對於所有產業來說都有發展優勢。徐宏民指出,由於商業模式的差異,台灣許多領導業界的品牌過去都未曾體驗過 AI 所帶來的優勢,但從團隊先前與台灣大廠合作的經驗來看,其實台灣企業、研究者對於運用新技術的態度都是非常開放的,因為他們看到這些技術能夠為產品帶來的價值;除此之外,台灣也有著許多像 LibSVM 開發者台大教授林智仁(CJ Lin)一樣在全球知名的 AI 人才,對於發展 AI...
2017 年停產的微軟 Kinect,又復活了。5 月 8 日凌晨,微軟 Build 開發者大會在美國華盛頓州西雅圖市舉行,CEO 納德拉宣布推出 Project Kinect for Azure,據介紹,這是一組包含微軟新一代深度鏡頭的感測器套件,並具備在邊緣環境進行人工智慧計算的能力。憑著 HoloLens 發揚光大的 Kinect 技術,Project Kinect for Azure 能幫助開發者利用環境智慧創造出豐富多彩的應用場景。包括業界領先的微軟時差測距(TOF)深度感測器等多種感測器整合於大尺寸、功耗低的裝置,豐富的 Azure 人工智慧可幫助 Project Kinect For Azure 顯著提升洞察和執行能力,可追蹤所有手部關節運動,還能繪製畫質清晰的空間圖,讓更高精準度的解決方案成為可能。▲ Alex Kipman。3 個半小時的 Keynote 內容太多,納德拉只簡單介紹 Project Kinect。微軟 Kinect 之父 Alex Kipman 特地在 Linkedin 發文,詳細闡述了重新復活的 Project Kinect。以下編譯 Alex Kipman 全文供讀者參考。大家好!一年一度的微軟 Build 大會又來臨了。這是我一年中最開心的時候,因為能將微軟最新的工具介紹給開發者,賦予開發者加速世界的數位化進程、創造未來的能力,我感到十分激動。納德拉的 Keynote 演講,向大家介紹了一個聽起來很熟悉的工具:Project Kinect for Azure。我想花時間詳細介紹下這個項目,關於這個項目的含義和這個項目,如何賦能開發者在現實世界應用 AI。納德拉說明的是智慧邊緣演進的重要進展:裝置能感知周圍的人、地點和事物。讓 Project Kinect for Azure 獨特、引人注目的是,我們類別定義的深度感測器與 Azure AI 服務結合,這些服務一起使開發人員使智慧邊緣比以往更具感知能力。我們的時差測距(TOF)深度感測器技術突破,意味著智慧邊緣裝置能以更低功耗確保更高精準度。深度感測器資料和 AI 的組合還有其他好處,深入學習深度影像可導致相同品質結果所需的網路顯著縮小,就可以更低成本部署人工智慧演算法和更智慧的邊緣。今年稍早,我們的架構師 Cyrus Bamji 向國際固態電路會議(ISSCC)提交一篇深受好評的論文,關於我們最新的深度感測器。這正是納德拉在 Build 大會說明的感測器,這個感測器也將為新 HoloLens 提供新功能。這種新型深度感測器的最佳技術特徴包括: 最高像素(萬像素解析度 1,024×1,024) 。 最好的品質(最高調制頻率和調制對比度導致低功耗,整個系統功率為 225~950mw)。 每像素自動增益選擇可達成大動態範圍,進而清晰捕捉近處和遠處物體。 全域快門允許改善陽光下的表現。 即使在晶片、光學器和電源變化的情況下,多相深度計算法也可達到穩定精準度。 即使高頻率下,低峰值電流作業也會降低模組成本。 Kinect 品牌擁有悠久歷史,是 Xbox 遊戲機外部裝置和開發者技術、全球首款 MR 頭顯 Microsoft HoloLens 內部的深度感應技術。 HoloLens 重點發展由 Kinect 硬體演變而來的深度相機技術,該技術與其他尖端技術結合,已透過混合現實真正地改變商業。當我們為 Xbox 360 建立 Kinect 時,我們的願景是生產一種能辨識和理解人的裝置,以便電腦學習以人為中心的互動。創意開發人員意識到 Kinect 的技術(包括深度感應相機)可用於遠超出遊戲範圍的事。第二代 Kinect 中,我們改進了遊戲周邊裝置,同時也為開發人員提供可透過 Kinect for Windows 連線 PC 的版本,激發開發者社群的創新和創造力。去年我們停產第二代 Kinect,但我們與英特爾合作,確保 Windows 開發人員可繼續使用英特爾的深度即時鏡頭構建 PC 解決方案。當我們將 Kinect 技術應用到混合實境,創造的 HoloLens 取得令人難以置信的成果。目前版本的 HoloLens 使用第三代 Kinect 深度感測技術,能在現實世界放置全息圖。藉助 HoloLens,我們擁有了解人和環境的裝置,以凝視、手勢和語音的形式匯入資訊,並以 3D 全息圖和沉浸式空間音響的形式匯出。利用 Kinect for Azure 項目,第四代 Kinect 現在與我們的智慧雲和智慧邊緣平台整合,為我們的開發人員社群提供同樣的創新機會。Kinect for Azure 項目開放無數新機遇,讓開發者利用機器學習,認知服務和物聯網邊緣。我們預見 Kinect for Azure 項目將促進微軟和合作夥伴生態系統產生新 AI 解決方案,這些解決方案構建在越來越多與 Azure AI 服務整合的感測器上。我迫不及待想知道開發人員如何利用它建立實用、智慧和有趣的解決方案,比以往跨越更多產業和場景。(本文由 雷鋒網 授權轉載;首圖來源:Alex Kipman)
上週,中國科技巨頭阿里巴巴也宣布正在研發 AI 晶片──Ali-NPU,之前美國科技巨頭 Google、蘋果、微軟、Facebook 也紛紛開始研發 AI 晶片。Google 的 TPU 已升級到第二代,這是否意味著 AI 晶片戰即將開打?科技巨頭製造晶片背後的目的有何不同?科技巨頭紛紛造「芯」 深度學習運算要求高,Google TPU 已升級到第二代從發表的產品來看,Google 的 AI 晶片在各大科技巨頭中稍微領先。據了解,2011 年 Google 開始認真考慮使用深度學習網路,這些網路的運算要求使計算資源變得緊張。更具體來說,Google 計算發現,如果每位用戶每天使用 3 分鐘 Google 提供的利用深度學習語音辨識模型的語音搜尋服務,就必須把現有資料中心擴大兩倍。Google 需要更強大、更高效的處理晶片,但已有的 CPU 和 GPU 都不能滿足需求,因此 Google 決定自己研發更高效的晶片。2016 年 5 月 Google I/O 大會,Google 首次公布自行設計的 TPU,並稱在 Google 資料中心已使用了一年。發表一年後,關於 Google 機器學習客製晶片的神祕面紗才最終揭開,Google 資深硬體工程師 Norman Jouppi 刊文指出,Google TPU 處理速度要比 GPU 和 CPU 快...
能調整照片的軟體很常見,但你見過可為有缺陷的圖片「填空」的技術嗎?NVIDIA 研究團隊近日公布了稱為「圖片修復」(image inpainting)的內容,除了像一般編輯軟體可去除不需要的部分,還可以透過演算法模型,為有缺陷的照片填補內容。NVIDIA 團隊指出,過去的深度學習方法主要焦點都落在圖片中心附近的矩形區域,並且往往得仰賴昂貴的後期處理進行,但團隊研發的模型可優雅處理巨大的空白。「任何形狀、大小、位置或與邊界距離的孔洞,我們的模型都可以牢固的處理。」與過去其他軟體常見的處理方式不同,NVIDIA 使用的技術在填補圖片空白區域時,不會使用周遭環境填補空間,而是會用電腦生成的圖片填補,因此鼻子部位還會是鼻子,眼睛部分也還會是眼睛,這種獨特的填補特性讓使用者也可以透過移除內容中的特定物品來編輯圖片。目前 NVIDIA 還沒有提供這種技術的相關發表時間,但他們確實認為這將在未來應用到照片編輯軟體,「據我們所知,我們是第一批展示深度學習在修復不規則形狀孔洞圖片的實際功效的團隊。」 New AI Imaging Technique Reconstructs Photos with Realistic Results – NVIDIA Developer News Center (首圖來源:影片截圖)
Google 母公司 Alphabet 公布了 2018 年第一季財報,表現相當亮眼,每年都不斷成長的廣告業務更是讓財報優於分析師預期的首要功臣。不過在漂亮的財務數字下,一項虧損數字可看出 Google 對硬體設備的決心,那就是智慧家居公司 Nest 的損益。Nest 在 2018 年 2 月重回 Google 旗下,營收約為 7.26 億美元,但最終在財報帶來 6.21 億美元的虧損。也就是說 Google 在 2017 年花了超過 6 億美元,來維持 Nest 在監控鏡頭等智慧家居市場的地位。除了 Nest 之外,表現不算理想的還有智慧音箱 Google Home、智慧型手機 Pixel 系列、Pixel Buds 耳機和筆記型電腦,這些硬體設備對 Google 而言幾乎全都是賠錢貨。Google 在這些硬體市場不好過一部分也是因為要和其他科技巨頭競爭,在手機要對抗蘋果(Apple),電腦方面則要力拚微軟(Microsoft),智慧音箱和家具更是和 Amazon 打出火氣來,甚至還爆出互相封鎖的事件。筆電和手機市場已相當飽和,即使 Google 再怎麼努力,應該也不會有人期待 Pixel 系列可以賣贏 iPhone。不過相較那些成熟期的產業,Google 在人工智慧(AI)相關設備還有優勢,要在智慧音箱這類的市場打敗 Amazon 並非癡人說夢。這大概是為什麼 Nest 會併回 Google 的原因,如此一來能讓 Google...

