星期二, 5 5 月, 2026

旅 TRIVEL

我們日常的網路活動中,有不少都是在進行搜尋,而文字搜尋之外,非文字搜尋例如聲音或者圖像搜尋變得越來越普及。這些功能需要人工智慧輔助以分析聲音或者圖像內容,微軟的搜尋用人工智慧演算法 SPTAG 最近終於開源化,讓開發社群可以參與和使用這技術。微軟的 Space Partition Tree And Graph(SPTAG)人工智慧演算法可以使開發人員能夠以毫秒為單位篩選向量,也就是單詞、圖像像素和其他數據點的數學表示形式。微軟表示,SPTAG(用 C++ 編寫並用 Python 包裝)是眾多 Bing 搜尋服務的核心,已應用協助公司的研究人員更深入理解數十億個網路搜尋「背後的目標」,並提供更準確的結果。微軟表示,Bing Search 至今已對超過 1,500 億條數據進行了編目,包括單個單詞、字符、網頁代碼和完整查詢。Bing 團隊期望開源 SPTAG 可用於建立可辨識基於聲音片段所說語言的應用方式,或類似拍攝花卉照片時可以辨識品種的功能。Bing 計畫經理 Rangan Majumder 表示,探索深度矢量搜尋真正潛力的研究也只是個開始,認為這個技術未來可以有更多應用。 Microsoft open-sources key Bing Search search algorithm (本文由 Unwire Pro 授權轉載;首圖來源:Bing)
中華電信舉辦的 2019 數位創新應用系列賽 5 大賽事即日起正式開跑,結合物聯網、程式開發、數位內容與影音創作等領域,總獎金高達台幣 800 萬元以上。2019 數位創新應用系列賽 5 大賽事開跑中華電信在 2018 數位創新應用系列賽,共吸引近 2,000 件作品參賽,當時首次舉辦的 IoT 大平台創意應用大賽中,徵得具商轉效益的作品,其 IoT 大平台會員數與專案數也倍數成長;而 MOD 微電影暨金片子創作大賽吸引全國的創意團隊甚至是知名演員共襄盛舉,有 316 部作品參賽,其中更有 39 部作品以 4K 規格拍攝,並以高畫質上架至 MOD 播放。今年的 2019 數位創新應用系列賽則是以「創意不設限,想像無極限」為主題展開 5 大賽事,除了延續「IoT 大平台創意應用大賽」、「MOD 微電影暨金片子創作大賽」、「FunPark 創意說故事數位繪本創作大賽」,更新增「AIoT 黑客松大賽」、「HiNet 光世代虛擬偶像創作大賽」,針對科技、文創、數位內容等產業提供完整比賽項目,總獎金從去年的 600 萬元提高到今年的 800 萬元以上。其中,IoT 大平台創意應用大賽更新增 NB-IoT 創新組,預計 IoT 大平台專案數與會員數可再成長 50% 以上,並為 IoT 相關營收額帶來 20%-30% 成長;而物聯網與人工智慧正在改變你我的生活模式,中華電信希望藉由學生組隊參加 2 天 1...
5 月 6 日,一年一度微軟 Build 開發者大會開幕。大會最重要的 Keynote,微軟執行長納德拉(Satya Nadella)的開場演講無疑展示這家巨頭對未來科技發展趨勢的洞察和判斷,並讓人更清晰看到微軟在 Azure 雲端計算、AI 、IoT 等領域的未來發展思路。本次大會,微軟也發表了一系列重量級產品動態,讓人應接不暇,而微軟在 Build 大會開幕前一週就陸續發表了 Azure 雲端計算多項新動向。而雷鋒網受邀參加本次大會 Keynote,來看看微軟為這個世界帶來了什麼。以 Azure 為基礎,撐起三大平台美國時間 8 點 50 分,Build 大會 Keynote 開始。在失敗又尷尬的 AR 展示之後,微軟 CEO 納德拉登場,介紹他眼中的微軟與開發者的未來機會,重申微軟的使命(賦予全球每個人和每個組織強大的力量,使其取得更大成就),以及相應的責任(隱私、網路安全和負責任的 AI)。納德拉藉此介紹微軟的全新平台架構:以 Azure 為基礎,支撐 Microsoft 365、Microsoft Dynamics 365 & Power Platform 和 Microsoft Gaming 三大平台。顯然,Azure 已成為微軟所有業務的根基和支撐性業務,重要性再次得到強調。納德拉表示:隨著計算技術融入生活,開發人員所做的選擇將定義我們的世界,微軟致力為開發人員提供跨越現代技術堆疊每一層的可信工具和平台,以建立神奇的體驗,為每個人創造新的機會。伴隨上述架構,微軟重點介紹以下技術和產品動態。Microsoft Graph 資料連線服務Microsoft Graph 發表於 2015 年,是 Microsoft 365 資料和智慧閘道。Microsoft Graph...
Google 在 2019 年的 I/O 開發者大會公布了許多新產品和新功能,包括最引入注目的手機 Pixel 3a 和 Pixel 3a XL,以及新版本的 Android Q。此外,這次 Google Lens 也更新了不少功能,讓智慧鏡頭成為用戶生活中的好幫手。Google Lens 是內建於 Google Pixel 裝置的功能,其他手機也能以應用程式的方式下載。利用 Google Lens 新增的功能,只要將手機的鏡頭對準餐廳的菜單,Google Lens 就會自動標記出餐廳的熱門餐點,選取特定的餐點還會顯示 Google 地圖提供的照片和評價。吃飽喝足要結帳的時候,把可以把手機的鏡頭對準賬單,Google Lens 就會顯示出菜單,幫助用戶計算小費和各自付帳要出的金額。 Today’s special: Google Lens. ?️ Automatically highlighting what’s popular on a menu, when you tap on a dish you can see what it looks...
英國腎臟病 AI 診斷公司 RenalityixAI 宣布,診斷產品 KidneyIntelX 已被美國 FDA 授予突破性裝置(breakthrough device)稱號,這是市面第一個宣布此消息的腎臟病 AI 診斷系統。最近和 RenalityixAI 有相似經歷的是數位病理公司 Paige.AI,這家公司在 4 月初獲得這稱號。什麼是 FDA 突破性裝置計畫?FDA 頒發的突破性裝置是原本 FDA 快速通道(Expedited Access Pathway,EAP)的代替品,這計畫是為醫療裝置及以醫療裝置為中心的組合所設計──這些產品要能為病人提供更有效的治療。突破裝置計畫包含 EAP 的舊有特點並強調創新,旨在促進突破技術的發展和加快這些突破技術的審查,同時保留法定標準的上市前批准,510(k) 批准和 DeNovo 行銷授權。據了解,獲得這個稱號的產品在提交審查時,將在佇列中按更高優先級排列,並在需要時獲得額外審查資源。2018 年 5 月,總部位於紐約的創業公司 RenalilytixAI 與西乃山伊坎醫學院(Mount Sinai School of Medicine at Mount Sinai)、西奈山醫療系統醫學院(Mount Sinai Health System)達成基礎合作。同年,RenalytixAI 完成 A 輪融資,金額為 2,900 萬美元。2019 年開始,公司進入產品開發和商業化過程。1 月底,RenalityixAI 宣布開始臨床驗證研究產品 KidneyIntelX。RenalityixAI 選擇腎臟病為突破口是很好的思路。腎臟病被認為是影響全球 8.5...
目前預計在未來 10 年內斥資 1,140 億美元進行投資,預計在 2030 年成為全球非記憶體半導體領導者的南韓三星,除了將積極發展晶圓代工業務,挑戰台積電之外,在自研晶片業務上,除了目前既有的 Exynos 處理器與基頻晶片之外,目前更加觸角延伸到繪圖晶片(GPU),預計未來三星的 Galaxy S 系列智慧型手機將會搭載自行研發的繪圖晶片。根據南韓媒體《BusinessKorea》報導,繪圖晶片的重要性是除了在智慧型手機上不可或缺的重要零組件之外,還是發展人工智慧(AI)的關鍵設備。因此,自 2018 年開始,就有消息指出,三星計劃開發自家的繪圖晶片,並且搭載在三星的 Galaxy 系列智慧型手機。事實上,由當前三星在美國奧斯汀研發中心新的徵才內容中可發現,目前該中心正在徵求具備繪圖晶片開發專業知識的員工,因此這項計畫的確在進行中。報導進一步指出,目前正使用 ARM 架構繪圖晶片的三星,搭配自家 Exynos 處理器時,因架構的繪圖晶片占據太多 Exynos 處理器空間。與高通或蘋果處理器相較,三星 Exynos 處理器性能相對落後。為改善這情況,三星期望在 2020 年與 ARM 合約到期之後,開始使用自家研發的繪圖晶片,並在 Galaxy S 系列智慧手機搭載測試。而除了藉由自行研發的繪圖晶片來改善自家的 Exynos 處理器效能之外,三星自行研發的繪圖晶片還有一個重要目的,那就是搶攻人工智慧及自駕車的晶片市場。報導表示,這兩塊市場都是未來半導體發展的重要區塊,尤其,是在目前由輝達(NVIDIA)主導的自駕車市場,根據市場研究調查機構 IHS Markit 的預測,市場規模將由 2018 年的 256 億美元,成長至 2023 年的 355 億美元,成長率高達 35.8%,這也是三星希望能積極搶攻的市場。(首圖來源:Flickr/Jamie McCall CC BY 2.0)
Google 在 2019 I/O 大會發表新系統和首款低階手機 Pixel 3a 系列,希望以性價比推動 Google 萎靡不振的手機銷量。一個月前,Cloud Next 時 Google 也顯示加碼雲端運算的決心。雖然 Google 看起來像個無法無天的巨頭,但在目前能變現的業務,Google 手機與雲端運算業務的課補得有點晚了。Google 的多元化始終不太順暢。在手機業務,2016 年,Google 發表 Pixel,重返手機市場,雖然軟硬一體設計加上原生系統吸引到一批死忠用戶,但手機已成紅海之際,難有大作為。前三代機型始終堅持高價路線,也增加 Google 破局的難度。若更早一些推出低價手機,或許更取得更多市占率。Pixel 手機從來沒有很好的市場機會,相比之下,Google 在雲端運算方面原本有一手好牌。2006 年 8 月,時任 CEO 艾瑞克‧施密特首次提出雲端運算概念,但很久未付諸行動,以至錯失先機。同年,亞馬遜開始布局,微軟也在 2010 年 2 月推出 Windows Azure 平台。直到 2013 年底,Google 運算引擎才發表,這是 Google 雲端的核心套件之一。那時若將雲端運算算升至核心地位,對 Google 來說也為時未晚。微軟從 2014 年開始改革,確立了雲端運算為核心業務,讓微軟雲成為第二大公有雲端服務商,形成從 IaaS 到 PaaS 到 SaaS 一套完整的雲端生態體系。微軟也憑雲端運算的成功重回巔峰,2018 年一度躍居全球市值第一。但 Google 並未給予雲端運算同樣的重視,反倒把市場拱手讓給亞馬遜、微軟,甚至後來的阿里巴巴。錯過了最佳時間後,Google...
如果一個資訊量爆炸的博物館與先進人工智慧結合,會碰撞出什麼樣的火花?NVIDIA Blog 文章《以色列大屠殺博物館擁抱人工智慧,幫助遊客從龐大檔案獲得啟發》或許可以告訴你,全文編譯如下。上週,世界各地人們紀念大屠殺紀念日。除了緬懷受害者,還向冒著生命危險試圖拯救他們的非猶太人致敬。數據是國會圖書館的 2 倍世上最著名的大屠殺紀念中心 Yad Vashem 每年吸引 100 萬遊客,有 6 位美國總統訪問過,致力於為後代保存 600 萬名死於德國納粹及合作者之手的猶太人記憶。Yad Vashem 的檔案包括獨特強烈的影片證詞、短片、照片、個人書面紀錄、納粹文件和語音文件。這 8 億的數位資產,包含 4pb 的數據,是美國國會圖書館數據的 2 倍。世界大屠殺紀念中心是供全世界學者使用文獻的地方,儲存大量關於受害者和倖存者的數位媒體檔,確實難以訪問和查找。研究人員跟上編制歷史的步伐都是艱鉅的挑戰,更不用說更年輕的一輩接觸到它。由於這些文獻是幾十年來陸續發現的,經過完全數位化後將會成為全球大屠殺學者的資料來源。這家總部位於耶路撒冷的組織正在尋求人工智慧的幫助,讓其從大量數據中幫助辨識、組織和連結照片和其他歷史文件。Yad Vashem 團隊利用深度神經網路,讓圖像辨識演算法幫助索引和分類數位歷史。Yad Vashem 首席資訊長 Michael Lieber 表示,這可能有助於找到大屠殺受害者的新關係和故事。Lieber 說:「我們是世界上第一家處理文化遺產的機構,我們決定把所有東西數位復刻,因為這是在全球獲得更廣泛受眾的途徑。」他樂觀地認為,人工智慧將有助於辨識資源,在社群媒體帳號講述大屠殺受害者和倖存者的故事。他說,這可能有助於與更年輕的觀眾保持聯繫。另外,他還希望研究人員利用深度學習揭示一些無法輕易發現的新歷史資訊。改進家族史搜尋法許多人訪問 Yad Vashem 是為了研究祖父母和曾祖父母的遭遇,並拼湊出中斷的家族史。現在的問題是,數位化數據的收集未來幾年可能會翻倍,這將更難搜尋。Yad Vashem 技術團隊旨在透過利用高性能計算驅動的深度學習來改變現狀。利用 NVIDIA DGX-1 人工智慧系統的超級計算能力,透過深度學習幫助組織和擴充歷史,DGX-1 在系統中提供數百台基於 CPU 伺服器的能力,人工智慧計算能力可超過每秒千兆次。NVIDIA 高級解決方案架構師 Yuval Mazor 表示,DGX-1 把 Yad Vashem 和全球最具創新性的組織放在一起,部署人工智慧以應付挑戰。他說:「他們從人工智慧的應用獲得實在的好處。例如,Yad Vashem 使用影片分析來理解和預測博物館的客流量和單件展品的影響,並從豐富的歷史數據提取深刻的見解。這些可幫助 Yad Vashem 完成首要任務,即接觸和教育盡可能多的人。」Lieber 說,無監督學習為訓練有素的神經網路帶來為數位產品創建標籤的希望,允許深度學習將各種資訊的點連接起來。「如果你設法在...
5 月 7 日,在微軟 Build 2019 開發者大會上,微軟宣布推出第一個應用微軟 AI 的自主系統(Autonomous systems)。該系統建立在微軟之前收購的 Bonsai 公司的基礎能力上,可幫助開發人員使用微軟的 AI 和 Azure 相應工具,訓練可以自主執行的系統模型。據悉,該系統主要應用了微軟的機器教學和仿真技術兩項技術,以模擬真實環境進行模型 / 系統訓練。微軟 AI 自主系統,機器教學+仿真技術透過微軟這個自主系統,開發人員還可以應用微軟的 Azure IoT、ROS for Windows 等服務,以在雲端或裝置端構建智慧機器人系統。在此次系統首個預覽版本發表之前,微軟就這個系統已與豐田旗下 Toyota Material Handling 公司、Sarcos 公司合作,分別對兩者的自動堆高機機器人、遠程視覺檢測機器人進行了智慧化改進。以 Sarcos 的遠程視覺檢測機器人為例,該機器人為一款蛇形機器人,可用於深入地震現場、搬運坍塌材料以及救尋傷者。但是 Guardian S 機器人之前必須由人遠程操控,以引導其穿過狹窄空間和複雜地形。據官方介紹,透過使用微軟這個系統,工程師能夠開發出一種自動控制系統,使蛇形機器人能夠自主避開障礙物,甚至自行爬樓梯、爬牆。前文有提到,這個系統的關鍵技術之一是「機器教學」。要讓機器人實現自主控制,當下主流方式是應用深度學習,但這在動態環境中仍存在一定難度,微軟這個系統即透過其「機器教學」實現機器人在複雜環境中的自主控制。微軟認為,AI 的下一階段,訓練機器學習模型時將融入人類專業知識,即所謂「機器教學」。機器教學旨在從專業人員那裡獲取知識,而不僅是從數據中提取知識。微軟之前曾表示,十年前,微軟研究人員已經開始探索機器教學原理,微軟現在也正將這些概念逐步應用到機器人及自動化生產相關產品或系統中。據了解,自然語言理解(Language Understanding)是微軟最早採用機器教學概念的應用之一,這是 Azure 認知服務中的一種工具,可以從短文本中辨識意圖和關鍵概念。據官方消息顯示,該應用已被 UPS、Progressive Insurance 等公司用於開發智慧客戶服務機器人。此次,在微軟 Build 2019 上,機器教學這個技術也再次被微軟應用到構建其自主機器人系統中。這個系統的另一關鍵技術為仿真技術,包括微軟自己的 AirSim 模擬工具或第三方模擬器。在演算法或系統構建完成後,進入真實環境工作之前,需要先將系統放入模擬環境中進行測試。其中,AirSim 為微軟在 2017 年 2 月對外公布的開源仿真平台,主要用於為無人機、自動駕駛汽車、機器人構建模擬環境。微軟研究人員表示,「透過創建模擬器,提供更加真實的環境視圖。機器人平台的模擬器可以精確渲染細微環境,如陰影、反射等,這些都會對計算機視覺演算法產生重大影響。」而在之前,豐田旗下 Toyota Material Handling...
麻省理工(MIT)電腦科學與 AI 實驗室(MIT CSAIL)開發出一款風險預測 AI 模型,可以識別乳房組織的細微變化,並確定在未來五年發展為乳腺癌的可能性。據了解,這款深度學習模型接受了超過 9 萬張乳房 X 光照片的訓練,也因此能在 X 光照片中辨識出人類醫生無法辨識出的微小圖案,以目前來說,能夠辨識出 31% 在未來 5 年發展為乳腺癌風險最高的患者。雖然比例聽起來並不高,但與現行醫生可用的任何模型相比(早期階段只能辨識出 18%),結果明顯要好上許多。研究共同作者 Constance Lehman 表示,自 1960 年代以來,放射科醫生便已經注意到女性乳房 X 光照片上可見的乳房組織有獨特和廣泛變化的模式,而這些模式會受到可以遺傳、荷爾蒙、懷孕、哺乳、飲食、體重減輕或增加等多種因素的影響,一旦能夠運用這些詳細資訊,對個別女性的風險評估將能更加準確。除此之外,新的 AI 模型還有另一個優勢。由於過去多數評估工具在訓練過程中使用的數據多來自白人群體,因此對非白人患者的評估效果較差,而新 AI 則沒有這項問題。史丹佛大學醫學院 Allison Kurian 表示,這次的模型最令人驚豔的地方便在於此,與現有的風險評估工具不同,這款 AI 使用在黑人和白人身上表現一樣出色。「如果經過認證且使工具廣泛使用,將可以真正改善我們目前估算風險的策略。」儘管系統在實用前還需進行廣泛驗證,但深度學習模型可以透過訓練辨認出乳房 X 光照片數據中的模式,而人類靠肉眼並無法做到,隨著訓練數據越大,模型辨認的結果也將更加準確,可想見未來在預測應用上將更為廣泛。研究已經刊載於《放射學》(Radiology)期刊。 MIT’s new AI model detects future breast cancer risk better than current models Using AI to predict breast cancer and...