星期二, 14 1 月, 2025

科技新知 人工智慧

在追逐自動駕駛的道路上,Uber 真是一刻也不敢耽誤。最近,這公司又在多倫多建立了一支新的人工智慧團隊,隸屬於 Uber ATG 部門。據了解,領導該團隊的是多倫多的 AI 專家 Raquel Urtasun,她是多倫多大學教授,還是機器學習和電腦視覺領域的加拿大首席科學家。Urtasun 的加入對 Uber 的 ATG 部門來說發揮了定海神針的作用,眼下,Uber 陷入了與 Waymo 曠日持久的專利戰,正處於風雨飄搖中。Urtasun 精於自動駕駛領域的感知演算法技術,這一技術可以幫助自動駕駛車輛更了解周邊環境。正是這項技術,讓 Urtasun 成了自動駕駛界有影響力的重要角色。據了解,從多倫多大學出走的頂級 AI 研究人員還真不少,Geoffrey Hinton 現在就是 Google Brain 在加拿大的營運負責人。Uber 在多倫多開「分店」對新成立的向量研究所(Vector Institute)也是重大利多,該研究機構拿到加拿大聯邦和地方政府不少資源,同時還獲得加拿大本地和國際科技巨頭 Google 的支持。 Urtasun 就是向量研究所的奠基人之一,她將該研究所稱為多倫多和加拿大繼續留在世界 AI 研究第一梯隊的關鍵一步。加入 Uber 後,Urtasun 會繼續在多倫多大學授課,同時她在向量研究所的工作也不會弄丟,不過這位女強人的新目標已換成了早日達到全自動駕駛。「在自動駕駛領域做研究,學術環境限制太多了。」在接受採訪時 Urtasun 說。「所以要想做大事,你得找些真正的從業者當合作夥伴。」 被問到為何選擇 Uber 時,Urtasun 稱 Uber 的團隊,特別 ATG 是吸引力的最大來源。「我第一次造訪 ATG 時,就愛上了這個團隊。」她說道。「團隊中每個人都個性十足、工作努力,這裡合作的氛圍很強。同時,我們在多倫多也從事類似工作,這也是我加入 Uber 的原因之一。」除了 Urtasun,Uber 還招募了 8...
綜觀整個科技行業,巨頭之間的關係歷來複雜難耐。有直接舞槍弄棒的,也有曖昧不清的,當然更多的還是相互扶持走向「康莊大道」的。 Facebook 和輝達(Nvidia)就是這樣一種互利向上的關係,因為在人工智慧領域擁有共同的目標,然後就走在了一起。在 AI 成為全球熱點的大環境下,各大巨頭之間紛紛布局,以期在未來能奪得一席之地,而 Facebook 和 Nvidia 也早已不復當年的「單純」。不復「單純」的 Facebook、Nvidia先來看 Facebook。這幾年,Facebook 在人工智慧的動作頻頻,不僅為其 Messenger 推出了聊天機器人,發表了 Camera Effects、AR Studio 等 AR 平台,而且在 VR 社群上也一直有自己的想法:早年展示了 VR 社群應用,在今年的 F8 大會上則推出了 Facebook Spaces 虛擬實境社群平台。此外,已有 13 年創立歷史的 Facebook,從其最新一季的財報數據來看,月活用戶已達 19.4 億,新發表的 Live 功能也讓流量急速躥升,這些大量的數據都需要更多的高性能伺服器來支撐。再來看 Nvidia。擁有二十餘年成長歷史的它,早已從一個小小的電腦顯卡廠商,發展成如今支撐 AI 領域快速發展的重要基石。在 AI 世界裡,Nvidia 擁有的 GPU 技術一直佔據中心地位。這幾年,Nvidia 不僅為 Microsoft Cognitive Toolkit 搭建新的 AI 框架,提供自研 DGX-1 AI 超算服務,而且也一直專注在深度學習的演算法研究上。Nvidia 還投資了大大小小涵蓋...
晶片開發商 NVIDIA Corporation 10 日宣布與豐田汽車公司(Toyota)合作,提供可強化數年內上市自主駕駛系統所需的人工智慧(AI)軟硬體技術。豐田是全球最大汽車製造商之一,它將使用 NVIDIA DRIVE PX AI 汽車電腦平台為計劃上市的先進自主駕駛系統提供支援。來自兩家公司的工程團隊已經在 NVIDIA 的高性能 AI 平台上開發複雜的軟體,這些軟體未來將可用來強化豐田汽車的功能,讓車輛可以更能理解車中感應器所創造出來的龐大資料,進而有能力處理各種自動駕駛情境。豐田執行總經理 Ken Koibuchi 表示,豐田開發自駕技術已有超過 20 年的時間,希望透過與 NVIDIA 的合作能加快更安全,更強大自駕系統的開發進度。NVIDIA Corporation 執行長黃仁勳 10 日表示,與豐田汽車的合作聲明明確顯示自駕車即將在不久後成為現實。(本文由 MoneyDJ新聞 授權轉載;首圖來源:NVIDIA)延伸閱讀: Nvidia 大賺 AI 財,營收成長近 5 成
最近一段時間微軟很忙。繼上週一個教育主題發表會上推出的 Surface Laptop、Windows 10 S 後,10 日晚上微軟 Build 2017 大會正式召開。11 日 HoloLens 也正式進入中國,而再往後的 5 月底,微軟還會在上海舉辦一場活動,很可能是發表 Surface Pro 5(編按:微軟副總裁是否認 Surface Pro 會這快到來)。而發表會上的微軟更忙,Keynote 環節長達 3 個小時,CEO 納德拉、雲端服務部門負責人 Scott Guthrie,以及人工智慧與研究部門負責人沈向洋輪番登台。會中發表了一系列你可能不太感興趣的產品,因為它們主要面向開發者,但它們無疑會影響到微軟的未來。其實從上台的部門負責人就可以看出,這次大會的主題是雲端與 AI,但更重要的是無處不在的雲端,與無處不在的 AI。智慧雲與智慧邊緣一開場,納德拉以自己一張連女兒都認不出來的 1992 年照片為笑料,來展現世界發展變化之快。他表示,在運算能力的飛速發展中,微軟要做的就是將計算的能力賦權給普通用戶,讓技術為更多用戶所用,讓電腦視覺、文本理解等技術變得更加普惠(inclusive) ,同時構建對技術的信任。這也是微軟「雲端至上,行動優先」戰略的出發點。目前,Windows 10 的月活躍設備數是 5 億,Cortana 每月有 1.4 億用戶,Office 365 的月活用戶是 1 億,財富 500 強企業中 90% 都使用微軟的雲端服務。在這種情況下,納德拉稱,微軟預見到了一個新的世界,它是智慧雲(Intelligent Cloud)與智慧邊緣(Intelligent Edge)的世界,它會改變所有的事。這種改變會帶來兩個變化。一是用戶體驗與互動上的變化,同樣的體驗會普及到各設備中,就像個人助理 Cortana,可以在所有設備上運行,無論 PC、手機、汽車。二是運算能力要到邊緣去,因為物聯網終端數據越來越多,會要求更多的運算能力下沉,這也意味著更加分散式的 AI(distributed AI)和分散式的計算(distributed computing )。為此,微軟在...
微軟日前發表了新版的 Skype 與開發工具。儘管仍然是預覽版,但新版工具可以讓開發者用 AI 來視訊──類似打視訊電話給機器人。 新版機器人支援 1 對 1 或是多對多通訊。由於新增支援了視訊通話,在微軟的示範中,開發者可以用一個簡單的 SDK 製作動畫真人,來營造與活人通話的感覺。微軟在 Skype 部落格中談到:這項開發平台支援即時的音訊與視訊 Skype 通話,同時能讓開發者為個人服務與品牌打造個人化的溝通方式。言下之意,其實微軟設想的使用情境就是行銷,或是讓 Bot 為企業處理一些制式的通話工作,像是為顧客做簡單的客服,以及接線秘書。微軟甚至還談到一個有點進階的場景:讓 Skype 機器人做簡單的面試工具,然後透過臉部追蹤工具判斷情緒,為受試者初步評分。除了這項有點新奇的功能,微軟也強化了 Skype Bot 的平台性,例如可以把 Skype 的 API 嵌入到一般網站──不論是 Bot 或是一般的真人通話,然後讓用戶直接在網站上與客服對話,有點類似 Facebook Messenger 在粉專上的功能。此外,Skype 現在也支援把第三方 App 與網頁服務嵌進 Skype 通話,但都還是預覽版就是。今年取向明顯傾向開發者的微軟 Build 2017 除了 Skype,也翻新了一系列 Bot 平台。其中對一般消費者比較有感的應該會是 Cortan Skill Kit。透過它,Cortana 將可以類似 Alexa 支援第三方 App 以 Cortana 操作。除了 Harman Kardon,微軟宣佈會與 HP、Intel 合作新的...
亞馬遜(Amazon)創辦人 Jeff Bezos 日前在公開會議上宣告,現在是人工智慧(AI)應用的黃金時代,是人工智慧復興時期,聲稱電腦運算已經準備改變所有的商業模式。事實上,現在人工智慧幕前幕後都戰況激烈,Nvidia、Intel、Google 等大廠在晶片領域也都虎視眈眈。MIT 報導,Nvidia 為遊戲和圖形製作使用的繪圖晶片,過去幾年促成許多機器學習的突破性應用,大幅推升企業利潤和股價,但未來的路可能不會這麼順遂,因為幾家晶片龍頭都在主打新產品可加速人工智慧應用,連軟體大廠也都在自己打造適合自家軟體的硬體核心。由於保險和金融等許多行業的公司,正在投資機器學習基礎設施,因此 Google、亞馬遜和微軟都認定,未來許多企業會向他們購買人工智慧軟體,因此在硬體上也必須砸大錢來支持軟體運作。報導認為,Nvidia 佔有人工智慧晶片市場優勢是運氣好,因為電腦圖形所需的基本數學運算,與被稱為人工神經網絡的機器學習方法相同。從 2012 年開始,研究人員發現,將新技術置於這種技術之上,繪圖晶片可讓軟體在解釋圖像或語音等任務上變得聰明很多。隨著人工智慧市場成長,Nvidia 已調整晶片設計以支持神經網絡,本週宣布的新 V100 晶片是這一努力的頂峰,並具專門用於加速深入學習數學的新核心。Nvidia 強調其電力和能源效率將有助於企業或雲供應商大幅提升使用人工智慧的能力,聲稱「可以將數據中心的吞吐量提高 15 倍,而不必建立新的數據中心。」而 Nvidia 的新競爭對手認為,他們可以直接為加速處理人工智慧軟體的硬體運算能力與效率來從頭設計晶片,而不是調整繪圖晶片技術。例如英特爾去年購併 Nervana 之後,承諾今年會發表深度學習晶片。英特爾花了 167 億美元購併全球可程式邏輯(FPGA)晶片製造商拓朗半導體(Altera),準備藉 FPGA 技術發表加速深度學習的產品。微軟也是以 FPGA 為機器學習軟體提供動力,並將其做為雲端平台 Azure 的核心部分。Google 也在去年夏天表示已經在使用內部開發,為人工智慧訂製的晶片 TPU,去年已經替 AlphaGo 贏得棋盤遊戲冠勝利,Google 表示不會出售 TPU,但使用 Google 雲服務企業將會獲得 TPU 的電力和能源效率的好處。打造 Google 晶片的幾名工程師已經離職,成立一家擁有 1 千萬美元資金的創業公司 Groq,製作專門的機器學習晶片。其他類似的新創公司包括 Wave Computing,表示其產品已經在客戶測試階段。不過 Nvidia 執行長黃仁勳趁機批評競爭對手的技術,他說如 Google TPU 這種自定義晶片的靈活性不夠,無法在不同種類的神經網絡上達到同樣運算水準,認為這是一個重大缺點,而微軟與英特爾青睞的 FPGA 則太耗能。黃仁勳聲稱 Nvidia 正在為深度學習創造最有成效的平台,且現在已經比競爭對手更快到達技術甜蜜點,但其他競爭廠商今年也將在人工智慧晶片上有大動作,這一戰場勢必將受到市場密切關注。 Battle...
今年的 GTC 2017(GPU Technology Conference 2017)中,Nvidia CEO 黃仁勳帶來了全新的 GPU 架構 Volta。1.5 倍的雙精度浮點數計算效能提升,以及採用特化架構所帶來的 12 倍人工智慧計算效能提升,為計算市場帶來震撼的消息。Nvidia 在 2016 年的 GTC 中,便發表了新的 GPU 架構 Pascal。其中,讓人印象最深刻的,莫過採用 8 張 Tesla P100 的人工智慧訓練機 DGX-1。一台機器便帶來以往需要數台伺服器才能達到的效能,為人工智慧發展帶來新氣象。然而,短短的一年間,Nvidia 又帶來新消息──新的 GPU 架構 Volta。強悍的 R&D 團隊,將其主要競爭對手遠遠拋在後頭。同時,也讓世人見識到,在後莫爾定律的年代,GPU 將承接 CPU 的發展速度,推進電腦的計算效能。新技術突破,奠定 Volta 於人工智慧的王者之姿這次 Volta 架構帶來數個新技術。 其中,最重要的莫過 Tenser Core。其他還有細部硬體架構調整、第 2 代 NVLink 以及新軟體支援,讓 Nvidia 在人工智慧領域扮演領導者。首先,從硬體架構來看,這次 GPU 架構和前一代 P100 相比,V100 將整數計算單元和浮點數計算單元獨立出來,讓整數計算和浮點數計算可同時運行,物盡其用。此外,每個...
微軟 CEO Satya Nadella 於 10 日晚上在美國華盛頓會展中心舉辦的微軟 Build 2017 開發者大會上發表主題演講,除了介紹 AI、智慧雲、Windows 系統、EDGE、聊天機器人等最新研究開發成果及未來發展方向,他還對科技帶給人類的社會影響表示擔憂,在現場向所有技術開發人員發出了警告。無處不在的 AI微軟年度 Build 大會伊始,就展示了其新型人工智慧應用程式,可以接進網路「雲」服務,甚至是利用附近機器進行運算。人工智慧執行副總裁及研究員 Harry Shum 表示,微軟會將其所有產品和服務與人工智慧相接,從而使平台上的開發者在產品中加載客製功能。他說,「二十多年來,我們為當前 AI 技術取得的突破奠定了基礎。」微軟的研究已經深入到機器學習、語音辨識、機器辨識等領域。他還說,「我們現在處於得天獨厚的地位,可以利用過去幾十年來取得的研究突破。」微軟的競爭對手亞馬遜、蘋果、Google 和 IBM 都在積極兌現自己在人工智慧領域許下的承諾,並最大限度發揮自己的潛力。人工智慧正逐漸在人類家居中立足,數位助手為你解答問題,控制家電或燈泡等連網裝置。數位助手早就可以根據用戶事先在日曆上的設定提醒用戶按時赴約,如果交通可能堵塞的話還會提醒用戶早點動身出門。「AI 對社會有何意義」這問題在科技界有過很多討論,尤其是從它快速帶來的改變來看──很多就業機會消失,無人車和聊天機器人接管很多技能型工作。Gartner 負責應用程序開發的研究主管 Jason Wong 問:「藍領階級會受到什麼影響呢?」「AI 的突然崛起,導致反烏托邦也可能出現這種情況;不出 30 年,我們就能在日常生活中見到無人車這類技術。」無處不在的雲微軟本次會議的目標人群是企業和軟體開發者,既包括開發手機遊戲的學生,也包括專業的技術團隊。Moor Insights 戰略首席分析師 Patrick Moorhead 說,「微軟正嘗試使用人工智慧為企業解決業務問題,幫助應用程序開發者做出更好的應用程式。」「和 Amazon、Facebook 還有 Google 不同的是,他的主要商業模式是利用人工智慧收集的個人資訊賣東西給你,或者向你推送廣告。」他還說,微軟讓開發者定製手勢指令和語音辨識等,而不是讓它們符合「現成的」AI 設置。微軟高層描繪了一個不遠的未來:聯網人工智慧設備,如建築工地的鏡頭,可以線上向工人提示危險、哪些工具可用,或者哪些活動未經授權。智慧監控鏡頭、智慧手機或工廠車間的機器等設備被稱為「edge 計算」,和「雲端計算」合作,可以提高地面生產協調性以及安全性。Windows 新進展近期,使用微軟最新的 Windows 10 操作系統裝置已達 5 億,微軟開發的軟體用戶也大大增加。微軟在線 Office 365 服務每月約有 1 億商業用戶使用,而 Cortana 數位助理每月約有...
Facebook 的使命是讓世界變得更加開放,讓每個人都能以最高的準確性和最快的速度使用自己喜歡的語言來發帖子和影片互動,語言翻譯對此十分重要。10 日,Facebook 的人工智慧研究團隊發表了他們的研究成果 Fairseq,使用一種新型卷積神經網路做語言翻譯,比循環神經網路的速度快了 9 倍,且準確性也是現有模型中最高的。此外,FAIR 序列建模工具包的源代碼和訓練好的系統都已經在開源平台 GitHub 上公布,其他的研究者可以在此基礎上建立自己的關於翻譯、文本總結和其他任務的模型。為什麼選擇卷積神經網路?卷積神經網路在數十年前由 Yann Lecun 提出,已經在諸如圖像處理之類的領域取得了成功。循環神經網路卻是文本領域的現有技術,並且由於其極高的效率而成為語言翻譯的首選。儘管循環神經網路以前在語言翻譯上比卷積神經網路表現更好,但是其設計具固有的局限性,這可以透過它們怎麼處理資訊來理解。電腦一句一句翻譯一個文本,然後預測另外一種語言具有相同意思的單詞序列。循環神經網路以嚴格的從左到右或從右到左運算,一次處理一個單詞。這和現在高度並行的 GPU 硬體有點不符合。由於單詞只能一個接著一個進行處理,計算不能完全並行。而卷積神經網路可以同時計算所有的元素,充分利用 GPU 的並行性。CNN 的另一個優點是它對信息進行分層處理,這可以更容易獲得數據之間的複雜關係。雷鋒網獲悉,在先前的研究中,卷積神經網路在翻譯任務上的表現要差於循環神經網路。然而,由於卷積神經網路架構上的潛力,FAIR 開始研究,發現所設計的翻譯模型顯示了 CNN 在翻譯方面的優異性能。CNN 優異的計算性能將有可能會擴展可翻譯的語言,將包括全球 6,500 種語言。最快最好的結果Facebook 團隊的結果表明,在廣泛應用的標準測試數據集(WMT 會議提供)上,其比 RNN 表現更好。尤其是卷積神經網路比先前在 WMT 發表的結果都要好。在英語─法語任務上提高了 1.5 BLEU,在英語─德語任務上提高了 0.5BLEU,在 WMT 2016 的英語─羅馬尼亞語任務上,提高了 1.8BLEU。對神經機器學習實際應用考慮的一個方面在於翻譯一個句子所需要的時間。FAIR 的卷積神經網路模型計算相當快速,比循環神經網路快整整 9 倍。許多研究都透過量化權重或其他方法來加速神經網路,這也同樣可以用於卷積神經網路。用多跳注意和門控來獲得更好的翻譯效果團隊的架構重要部分就是多跳注意。注意力的機制類似一個人在翻譯句子的時候會把句子分開翻譯,而不僅看一次句子然後直接寫下完整的翻譯。設計的網路會重複掃描句子來決定要翻譯的下一個單詞。多跳注意是這種機制的加強版,讓網路更多掃描句子產生更好的結果。每一次掃描間都相互影響。舉個例子,第一次掃描會注意到一個動詞,然後第二次掃描會注意到相關聯的助動詞。在下面這幅圖中,Facebook 團隊展示了一個系統是怎麼閱讀法語短語然後再翻譯成英語。首先,用卷積神經網路生成每個法語單詞的對應向量,在此同時進行計算。然後解碼的 CNN 再生成對應的英語單詞。每一步都掃描一下法語單詞,看一下哪些詞語與下一個要翻譯的英文單詞關係最密切。在解碼器中有兩層,下面的動畫說明了每層的注意力機制是怎麼完成的。綠線的強度表現網路對每個法語單詞的注意力。當網路訓練好之後,也就可以翻譯了,英文單詞的計算也可以同時進行。系統的另一個方面是門控,其控制神經網路裡的訊息流。在每個神經網路中,訊息都流過所謂的隱藏單元。門控機制精確控制傳向下一單元的訊息,一個好的翻譯才因此產生。例如,當預測下一個單詞的時候,網路會把前面的翻譯部分考慮進去。門控允許翻譯放大特定方向──這一切都取決於網路認為其在上下文中合不合適。以後的發展這種方法是機器翻譯的一種替代框架,也給其他文本處理任務提供新思路。例如,多跳機制在對話系統中允許網路注意對話的不同部分。例如對兩個沒有聯繫的事實,可以把它們聯繫在一起,以回答複雜的問題。 A novel approach to neural machine translation (本文由 雷鋒網 授權轉載,圖片來源:Facebook)延伸閱讀: 一分鐘看懂 Facebook、Nvidia...
醫療一直是大家重視的行業,不論是從業人員的素質,還是投注的資源都是名列前矛的狀況。如今進入資訊時代,病人資料也變成電子病歷資料的一部分,但其他可電子化處理的資料,在醫療場所上面的使用情況就沒那麼普及,到底是有什麼限制。微軟亞洲醫療事業部副總經理(Microsoft Asia Healthcare Lead)Danny Yang(楊啟平)要來談微軟在智慧醫療這一塊,究竟有什麼獨到的看法。比爾‧蓋茲的遠見:醫療方案群在 2008 年時,比爾蓋茲相當看重健康資訊,於是微軟這家軟體公司,在 2009 年組成 Health Solution Group 這個相當不傳統的部門,直屬比爾蓋茲,類似孵化器角色。Health Solution Group 找來不少曾在醫療現場的醫生參與。微軟也曾推出完整 HIS(Health Information System)方案團隊,專門販售相關方案,但後來經過重整,重新調整重心。其中最重要的一點是重視 Health Care Security。蓋茲相當注重醫療資訊,但當年還處於剛萌芽,因此用特別的方式,讓 HIS 不必歸在微軟一般業務單位下。如今大家越來越重視醫療資訊這一塊,雲端方案也越來越成熟,漸漸 HIS 變成微軟的一般業務單位。前面提到健康資訊安全,標準就是即便國家要求資料,平臺業者不能、也沒辦法弄到資料。儘管醫療機構還沒碰到國家要求案例資料,但也不是檢察官、警察隨意要求就可以拿到資料。由於醫療是相當因地制宜的產業,醫療資訊要符合各地的醫療法規規範,還有資料保護法規。隨著雲端應用越來越普及,醫療資訊可能被雲端存取、運算,仍然需監管誰能存取病人的資料。醫療資訊的規範,有相當嚴格的 ISO-27002,美國有 HISPA,新加坡有 MTSC(The Multi-Tier Cloud Security),微軟都有通過這些規範。除了分析大量病人的資訊,找出跟特定疾病的關聯之外,醫療場所的數據,還能幫助病人有更好的就醫體驗。像是從長期數據分析,找出病人就醫的高峰時間,協調更多醫護人員和行政人員。AI 協助人找出保險詐騙和即早預測患病機率不少國家由政府或公司提供醫療保險,難免有詐騙狀況發生。醫療保險提供者藉由機器學習,抓出可能的保險詐騙狀況。以往是由 30~40 人的團隊抓詐騙,轉由教 AI 怎麼找詐騙的方法,從 1,000 個保險申請案,由 20 個抓出有詐騙的申請案,從中抽出 10 個案子交給 AI 辨識。經過一段時間訓練 AI,變成先由 AI 抓保險詐騙,再人工覆核方式確認,省下不少時間。AI 用在醫療本身也有相關例子。小孩辨識文字有困難,叫做失讀症(Dyslexia),常常要到小孩進入學校後才會發現,往往已經太遲了,需要花很多時間才能改善。用 AI 看小孩的眼球運動模式,能偵測小孩是否得到失讀症的機率,及早發現就能早期採取補救措施。印度也有用 AI 判斷小孩散光的機率,不必做所有的散光測驗,就能預測小孩散光,能在低成本的狀況下,幫忙印度貧窮小孩及早找出有散光徵狀。談到各國的狀況對醫療資訊的影響,政府往往在法規的解讀比較保守,因此對比較新的技術沒那麼快採用。新加坡曾進行一項實驗,將新加坡的醫療管理分成東西兩邊,西邊由企業背景的人掌舵,東邊由醫療背景的人來執掌。經過幾年後,發現西邊的醫院運作有效率,而東邊有相當先進的醫療技術。兩邊各有長處,因此新加坡分成 6 塊,保持每一地區都有強項,確保整體有多樣性的醫療表現。此外聊天機器人技術用在不少場域上,在醫療方面,醫療...