由於雲端和資訊化程度越來越高,資安的威脅造成更大的問題,而不少公司也關注資安防護專案。而在 SIEM (安全資訊與事件管理) 市場中,被 Gartner 列為領導者的 IBM,則在今日 (4/19) 在台灣舉行資安大會,展現他們在資安 SIEM 市場的領先地位。隨著 AI 技術逐漸有進展,要把 AI 用在資安上面,有沒有足夠份量的資料集,用來訓練 AI 就相當重要。資安威脅情報除了用來得知最新資安威脅之外,對於訓練 AI 也相當重要。 AI 結合 IBM 的 Watson,Watson CyberSecurity 為IBM 提供給客戶的資安方案。IBM 的資安部門 X-Force 具備相當的資安防護,以及收集資安威脅情報,結合 IBM SIEM 旅艦產品 QRadar,提供企業完整的資安事件的處理機制。IBM 表示,想辦類似 HITCON 那樣的活動,提供社群參與,但希望參與者的門檻較低,歡迎各公司的 MIS 參與。Gartner 定義 SIEM 市場需求為:即時分析事件資料,以便早期偵測蓄意攻擊與 資料洩露,並且收集、儲存、分析、調查、回報事件資料,提供事件回應、鑑識、合規所用。IBM QRadar 提供多項進階功能,包括使用者行為分析 (User Behavior Analytics, UBA) 、網路活動與異常檢測分析 (Network Insights)、機器學習(Machine Learning)分析應用、認知安全 (Watson CyberSecurity)應用等。並且透過...
德國明斯特大學(University of Münster)研究團隊近期透過研究證實,結合 AI 神經網路與蒙地卡羅樹搜尋(MCTS)的搜索方式非常適用於化學合成的規劃,尤其是逆合成分析(retrosyntheses),更能以前所未見的效率進行。對於非化工領域的人來說,逆合成分析可能聽來有些陌生,但這其實是有機合成中設計化合物生產的標準方法,透過對目標分子結構的分析與拆解、推導出基本的組成成分,進而完成化合物合成路線設計。儘管這是有機合成路線設計的標準方法,但主要作者 Marwin Segler 表示,逆合成分析其實是有機化學的終極挑戰,化學家往往需要數年時間才有辦法掌握運用得很好。「這就像下棋,除了直觀的專業知識,你還需要很好的直覺與創造力去發揮。」如果以烹飪來形容,就像從一道完成的菜推敲出材料與做法,然後在實驗室中實際從基本成分試著「煮」出相同的目標分子;雖然理論上很簡單,但在實踐的過程中總是會遇到許多困難,每一步都有許多選擇必須進行,而化學問題又比烹飪或下棋還複雜許多。 ▲苯乙酸的逆合成分析範例。(Source:Wikimedia/Roland Mattern)運用電腦來計算合成的想法其實已經非常久遠,過去幾乎所有人都認為除非專家手工編程成千上萬條規則,否則電腦就無法進行計算合成──但過去的實際案例顯示,即使有規則協助的電腦也無法做到這些事。這是因為化學合成過程非常複雜,無法單純用簡單的規則來理解,更別提合成反應的相關出版物數量每十年就增加一倍,無論化學家或是編寫程式者,都無法讓單純的電腦跟上腳步。然而隨著深度學習與神經網路的出現,用電腦協助進行逆合成分析不再是空想,Segler 已證明即使只靠從現有資料和應用學習,機器仍可以學會進行分析,而不需人類編程規則的協助。為了做到這一點,團隊先是運用過去發表的所有化學文獻(其中約有近 1,200 萬種化學反應)對機器進行深度學習訓練,然後將 DNN 神經網路與蒙地卡羅樹搜尋連結,以類似在棋類遊戲評估變體的方式,逆向分析尋找有機化學合成的最佳解。與傳統的人工推導方式相比,這個全新方式的速度大約快了 30 倍,並且找到 2 倍以上的潛在合成途徑,在一項雙盲測試中,團隊發現化學家普遍認為這些電腦找出的合成路線,與現有經過實驗和測試的路線一樣好。這項研究已發表在最新一期的《自然》(Nature)期刊。Segler 指出,團隊希望藉由這個全新的方式,節省去化學家在實驗室嘗試的時間,「如此一來,化學家能使用更少的資源,製造出協助提高人們生活水準的化合物。」 Chemical synthesis with artificial intelligence: Researchers develop new computer method (首圖來源:shutterstock)
隨著 Facebook 等平台進一步打擊虛假資訊,使假新聞成為廣受各界關注的問題,AI 等技術日漸成熟,網路假新聞也愈來愈難以分辨。Jordan Peele 和 BuzzFeed 攜手製作一條偽造的政府公告,片段中的前美國總統歐巴馬是由換臉軟體製作,擬真程度極高。有關影片糅合了新舊技術,以 Adobe After Effects 和 AI 換臉工具 FakeApp 製成。FakeApp 是一套出現在 Reddit 的人工智慧程式,剛開始時是以製作移花接木明星的臉和 AV 女星而在網路成名,但時至今日,已成為製作假新聞的神兵利器。雖然在 FakeApp 誕生前,假新聞已充斥網路,但這類人工智慧軟體的出現無疑讓製作假新聞的難度大大降低。Adobe 也正在開發一款編輯音效的軟體,讓使用者可像使用「Photoshop」,輕易修改對話內容。一間名為 Lyrebird 的加拿大公司,更推出偽造聲音的服務。技術專家 Aviv Ovadya 表示這些技術讓任何人都可輕易製造具說服力的假新聞,情況令人恐懼。面對這個情況,科學家正開發一個自動分辨 AI 假新聞的工具。但面世前,分辨假新聞的最佳做法,就是從觀眾自己入手,對新聞片段多抱懷疑態度,並多以不同平台的消息進行比對。 ▲ 由台灣翻譯團隊 B.C. & Lowy 加上字幕的中譯版(本文由 Unwire HK 授權轉載;首圖來源:影片截圖)
據 The Information 報導,Intel 確認計劃關閉新設備部門(New Devices Group),並且停止研發 Vaunt 智慧眼鏡,部門 200 多人將面臨裁員。Intel 表示:「Intel 不斷致力於新技術和新體驗,但並非所有這些都發展成我們選擇上市的產品。 Superlight(Vaunt 代號)項目是英特爾開發真正差異化消費 AR 眼鏡的一個很好例子。在我們不斷發明和探索新技術時,我們必須遵守市場規律,當市場動態不支持進一步的投資時,這些新技術有時需要艱難的選擇。」Vaunt 智慧眼鏡,其確實如 Intel 所言是一款差異化的、消費級別的智慧眼鏡。Vaunt 智慧眼鏡最大的特點就是外形酷似普通眼鏡,應該是目前市面能見到的最輕便智慧眼鏡,重量僅 50g。不像 Google Glass、HoloLens、Magic Leap 這些以強大 AR 功能為主的眼鏡,Vaunt 並不打算為大家提供炫酷的 3D 視覺,只希望以文字顯示一些輔助訊息。因此 Vaunt 眼鏡沒有安裝鏡頭,也沒有複雜的光學顯示零件,採用雷射投影(VCSEL),直接投射在人眼視網膜,能顯示 400×150 畫素的紅色單色圖像。而這些文字只會顯示在你的視線下方,你抬頭時內容就會消失。此外,Vaunt 眼鏡關注生活場景的使用需求,採用 Intel 的 AI 晶片,有多種感應器,能感知位置、運動訊息。你的手機知道你的位置,而 Vaunt 眼鏡知道你在看什麼方向,這樣就能在戶外提供複雜的導航和訊息顯示。例如當你走在街上看到一間餐廳,Vaunt 可以直接顯示 Yelp 上關於該餐廳的訊息。Vaunt 眼鏡的思路與目前市面的眼鏡都不同,目前的 AR 眼鏡主要用於工業領域,攝影鏡頭不可少,只顯示文字的 Vaunt 眼鏡需要自己找到有剛需的應用場景。這一點,似乎並不是 Intel 擅長的部分。Intel 曾希望透過尋找開發者和合作夥伴共同完成 Vaunt 的硬體和軟體生態。2...
19 日台積電的法人說明會,對法人關心的 7 奈米發展狀況,台積電表示,目前正在進行製程轉換,目前 10 奈米製程設備未來會陸續轉到 7 奈米製程,因此加緊以這些設備趕製 10 奈米產品,造成 2018 年第 1 季庫存較高。未來轉換完成之後,預期 7 奈米製程可貢獻全年營收的 10%,第 4 季甚至可貢獻單季營收 20%。台積電共同執行長魏哲家表示,台積電至 2018 年底估計 7 奈米製程將有 50 個客戶產品設計定案(Tape out),產品涵蓋伺服器、遊戲機、人工智慧(AI)等領域。目前第 1 季 10 奈米製程營收比重約 19%,預期至第 4 季單季營收比重將滑落到個位數百分點。相反的,7 奈米製程預期全年可貢獻 10% 營收之外,第 4 季甚至可貢獻單季營收 20%。台積電發言人暨財務長何麗梅指出,預計應用在 7 奈米加強版的極紫外線 EUV 技術,目前測試狀況一切按照計畫進行。2019 年開始採用 EUV 的 7 奈米加強版製程之際,將可依照計畫進行沒有問題。另外,2020 年啟用 5 奈米製程也會一樣順利。大家關心的 2018 年加密貨幣,何麗梅指出,受整體加密貨幣價格影響,將對加密貨幣挖礦機專屬晶片造成不確定性。何麗梅強調,因加密貨幣的專屬晶片是以運算能力來評估作業效益,目前比特幣每單位價值 8,000...
人工智慧(AI)的發展越來越快速,在人類生活的各個層面上──從醫療、教育到氣候變遷控制和作物產量──都帶來深遠的進展。透過人工智慧與人類智慧的結合,我們能極大化每個人的潛能,使他們能夠成就更大、更多。例如,我們坐落於世界各地的研究實驗室正在努力解決人類最致命的疾病之一:癌症;而這不是透過試管和醫療設備,而是以人工智慧和機器學習來進行。經由機器學習和自然語言處理,微軟提供全球頂尖的腫瘤學家能以最直觀的方式來理解所有可用的研究資料與數據,進而為病人找到最有效、最個人化的癌症治療方法。微軟正在研究的另一個項目是結合機器學習與電腦視覺,讓放射學家更完整地瞭解病人的腫瘤是如何發展的,更重要的是,如何治療它。人工智慧引發關於倫理與互信的複雜問題人工智慧顯然有潛力能幫助克服社會上一些最艱鉅的挑戰。但要人工智慧能被激發更大潛能的前提,是數據要能夠被大規模蒐集、彙總並分享。而這引發了圍繞著(資料)獲取、安全、隱私、透明度等的倫理問題。在某種程度上,人工智慧顛覆了我們以往與科技的關係,我們對科技的信任程度也該被重新審視。此外,在社會議題的層面上,隨著人工智慧持續參與我們的決策過程,我們該如何確保它公平地對待每個人?我們該如何確保人們和組織能對那些不僅更加普遍,而且更加智慧、更加強大的、由 AI 驅動的系統負責?這些都是個人、企業和政府需要思考、分析和釐清的關鍵問題,因為人工智慧的發展和擴散仍在加速當中。微軟相信,為了讓人工智慧的潛力能充分釋放,必須建立一個牢固的信任基礎。如果用戶不相信它符合安全、隱私和安全的最高標準,那麼用戶將不會使用新的人工智慧解決方案。為了實現人工智慧能帶給人們的美好願景,大家需要共同努力找尋這些問題的答案,並創建值得信賴的系統。建立對人工智慧的信任為了讓人工智慧值得被信賴,微軟認為它不僅應該透明、安全且富有包容性,而且要保持最高程度的隱私保護。微軟制定了六項原則,這些原則應該是任何發展和部署人工智慧解決方案的核心: 隱私和安全:與其他雲端科技一樣,人工智慧系統必須遵守所有保護資料收集、使用和存儲的法律,並確保個人資訊按照隱私標準使用,避免被濫用或盜竊。 透明化:隨著人工智慧對人們生活的影響越來越大,必須提供有關人工智慧系統如何運作的相關資訊,以便人們理解決策是如何做出的,並能更容易地識別潛在的偏差、錯誤和意外結果。 保持中立客觀性:當人工智慧系統做出有關醫療或雇員的決定時,他們應該對所有具有相似症狀或資格的人提出同樣的建議。為了確保公平,我們必須瞭解人工智慧系統是否可能被任何偏差認知影響運作。 可靠性:人工智慧系統必須被設計成能夠在清晰的參數範圍內運行,並進行嚴格的測試,以確保它們能夠安全地回應未預料到的情況,並且不會以與原始期望不同的方式發展。人們應該是決定人工智慧系統將如何以及在何時被部署最重要的一角。 包容性:人工智慧解決方案必須通過實踐包容性來處理廣泛的人類需求和經驗,可以預見的是在產品或環境中可能存在一些潛在障礙,而這些障礙可能會無意地將人們排除在外。 當責:設計和部署人工智慧系統的人必須對其系統的運作負責。人工智慧的責任規範應該借鑒其他行業的經驗與做法,例如醫療領域的隱私。除此之外,不論是在系統被設計或之後在世界上運行時,這個規範都應該要被遵守。 這六項原則規範了微軟在設計人工智慧的產品和服務時的準則,微軟還創建了 AI 倫理工程和研究委員會來確保其產品與服務能符合這些核心價值。若想更多地瞭解這六個人工智慧原則,鼓勵閱讀由微軟總裁兼首席法務官 Brad Smith 和微軟全球執行副總裁、人工智慧及研究事業部負責人沈向洋共同編寫的《未來運算,人工智慧及其在社會中的角色》。本書探討了我們如何為未來的人工智慧做準備,可以按此免費下載。此外,微軟深入參與人工智慧相關的社群工作,並協助共同創立了人工智慧的夥伴關係,旨在為人工智慧設計出最佳的應用方式,提高其關注度,並探討其對人類和社會的影響。所有以上的舉動都反映了微軟渴望實現的目標:主導具備感知與當責任的人工智慧。而這與微軟「幫助全世界的每個人、每個組織都能貢獻更多、成就更大。」的使命一致。最後,微軟相信人工智慧的進步可以解決比目前更多的挑戰,其創造的人工智慧工具和服務必能協助人類,增強我們的能力。微軟對人工智慧的未來感到樂觀,也對它提供的、能為所有人創造更美好未來的機會感到期待。但為了確保達成這些美好願景,政府、企業、學術界和民間組織必須共同努力,建立值得信賴的人工智慧系統。
不知道各位手上拍攝的影片或相簿採用什麼方式整理。除了依據日期和主題之外,有沒有另外用文字標籤方式標示?根據調研機構 IDC 預測,2025 年全球資料領域將只有 15% 的資料會被加以標籤,其中更僅僅只有五分之一會被用來分析。這顯示企業如何有效運用資料,從中萃取出對商業夥伴和消費者更有價值的洞見,已成重要課題,也是未來商業模式中的致勝關鍵。傳統用 meta data 的方式整理影片、圖像,其實是間接的方式進行,不是直接以影片本身性質整理。台灣的新創 Viscovery 創意引晴,專注影音資料裡出現事物的分析判斷,直接「看懂」影片到底在做什麼。正當全球最大的影音分享平台,被有心人士操弄演算法,被盯的滿天包之下,台灣的影像辨識新創公司 Viscovery,則在這幾年之下,除了分析影片出現的商品,快速推薦購物商品。而在 Seagate 贊助 IDC 《Data Age 2025》白皮書中預測,資料量的產生到了2025年將暴增至163ZB,意味著以資料價值為王的世代來臨。消費者和企業在各種裝置和雲端之間創造、分享和存取的資料將持續增長,並且遠超過原先的預期。Viscovery 創意引擎的創辦人黃俊傑 Amos 話不多,訪問的時候大部分的時間都交給技術長陳彥呈 Albert 說明。廣告系出身的 Amos,訪談時解說 Viscovery 創辦緣起,以及中間經過的重要時刻,以及最近幾起資料風波,如何資料處理方法的看法。Viscovery 會專注在容易變現的廣告相關技術,還要加上 Amos 自身背景的因素。 機器幫忙整理影片,找出影片中的商品 找出有明星出場、劇集中主角穿得的衣服,或是使用的商品,透過 Viscovery 影像辨識的技術,都能辨識而且一一自動標示出來,不用花太多人工檢視的成本,提供廣告商、代理商機會顯示相關商品的廣告。 在前面提到的 IDC 報告, IDC 預測 2025 年全球資料領域將只有15%的資料會被加以標籤,其中更僅僅只有五分之一會被用來分析。這顯示企業如何有效運用資料,從中萃取出對商業夥伴和消費者更有價值的洞見,已成重要課題,也是未來商業模式中的致勝關鍵。 最近 Viscovery 還有其他計畫,要協助媒體整理手頭的影片,從中找出新的趨勢和洞見。Viscovery 說這不是像臉書那樣很粗略的辨識,加上很泛泛的描述,如出現三個人,而是協助媒體找出明星在影片出現的片段,不論是化妝、整型前後,不同造型的劇照,或是在畫面中以不同角度出現的影片。並自動化歸類,減輕這些影片資產管理和調閱出來的成本。 Viscovery 強調,只要有類似 IMDB 的影星資料庫的話,不論是好萊塢還是東南亞市場,只要手上有足夠的影星出現的影片,就可以訓練 AI,讓 AI 能找出還有那些影片有這些影星出現。 談到 YouTube 被演算法搞到的問題,是不少家靠 user generated content 為生的公司痛腳。 Viscovery 說他們的技術能避免偶爾出現的畫面中物品干擾,導致 AI 被誤導的問題,像是貓喵影片中隨便插一張不相干的汽車圖像,就能干擾 AI,AI...
在非洲,河盲症是一種因為寄生蟲引發的疾病,也是全球第二大的失明原因。理論上,寄生蟲引發的疾病,只要吃抗生素就好,但事情沒這麼簡單。寄生蟲造成的失明在非洲,河盲症(river blindness)──或稱為「蟠尾絲蟲病」(Onchocerciasis)──造成了很大的問題。當人類被蟠尾絲蟲感染後,最初的症狀是皮膚癢到不行或潰爛,最後甚至會讓人失明,而河盲症正是世界上第二大失明的成因。透過黑蠅傳播河盲症的傳播途徑是透過黑蠅,當黑蠅叮咬河盲症患者後,會將河盲症患者體內的寄生蟲幼蟲傳播出去。這種黑蠅主要聚集在河川附近,這也是為何這種疾病又被稱為「河盲症」的原因。只要吃藥就能根治既然河盲症是因寄生蟲引起的疾病,只要有藥物能有效殺死蟠尾絲蟲等類型的寄生蟲就能痊癒。目前已知,只要讓河盲症流行地區的所有人,連續十年每年都吃一次伊維菌素(ivermectin)這種特效藥,就能有效根絕河盲症。▲ 雖然有專門對付河盲症的特效藥,但如果患者身上還有其他的寄生蟲,這種藥物很有可能會致命。上為 2014 年 3 月,在埃及開羅一名 32 歲的盲人媽媽把女兒抱了起來。(Source:達志影像)問題出在別種寄生蟲然而,問題就出在這裡──伊維菌素這種特效藥不只會殺死蟠尾絲蟲的幼蟲而已。如果河盲症患者身上同時帶有「羅阿絲蟲」(Loa loa)這種在非洲也很常見的寄生蟲,患者只要一服用伊維菌素,使「羅阿絲蟲」幼蟲在短時間死光光,就有可能讓患者因腦腫脹(brain swelling)致死。不吃藥只是失明 吃了藥還可能會死掉這也就是為何既然有對付河盲症的特效藥,還是有不少民眾不願接受治療的主因:不吃伊維菌素頂多失明而已,吃了藥有可能會死掉。那就先找羅阿絲蟲吧所以,只要能預先知道哪些人身上帶有「羅阿絲蟲」,讓這些人不要吃伊維菌素的話,問題是不是就解決了呢?為了事先診斷出哪些人身上帶有「羅阿絲蟲」,美國加州大學柏克萊分校(UC Berkeley)發展了一項新技術「LoaScope」,且這項技術只需要一支智慧型手機就能搞定。▲ 肯亞維多利亞湖(Lake Victoria)姆凡加諾島(Mfangano Island)的孩子開心地笑著。(Source:Flickr/Dietmar Temps CC BY 2.0) 只要一支智慧型手機就能搞定搭載「LoaScope」功能的智慧型手機,在相機鏡頭上多了顯微鏡功能,並外接一個由 3D 列印技術打造出來的塑膠小盒子當檢測室。只要受試者提供一滴血為檢體放進檢驗室,再透過這台搭載「LoaScope」的智慧型手機按下相機快門,這張照片就會上傳到雲端演算系統,自動檢測患者血液被寄生蟲感染的程度有多少嚴重。羅阿絲蟲篩檢成功這項研究發表於《新英格蘭醫學雜誌》,研究團隊利用「LoaScope」技術,在喀麥隆(Cameroon)進行寄生蟲篩檢。這項技術使村裡超過 15,000 名河盲症患者不需要擔憂「羅阿絲蟲」的潛在威脅下,透過伊維菌素投藥,成功根治河盲症,當中沒有任何一個人因服用伊維菌素而死。▲ 顯微鏡下,患者血液中能觀察到的「羅阿絲蟲」。讓電腦來挑寄生蟲研究團隊的德安布羅西奧(Mike D’Ambrosio)表示,他們一開始想到的作法是,請當地醫生協助拍攝照片,這些照片上傳到雲端之後,就能由遠在加州的檢測人員看樣本裡有沒有寄生蟲。但是這個念頭沒有持續太久,因為沒有人想要一直看到樣本出現寄生蟲。所以他們決定想出一套讓電腦自動辨別「羅阿絲蟲」的辦法。利用幼蟲蠕動速度來辨別德安布羅西奧說:「這就是為何我們想到要利用蠕蟲運動的方式觀察牠。」他解釋道,「羅阿絲蟲」的幼蟲比其他蠕蟲在血液裡蠕動的速度更快更劇烈,利用「羅阿絲蟲」幼蟲的特徵,他們就能利用電腦設計出一套演算法,用來辨別這些「羅阿絲蟲」。▲「LoaScope」的特色就是對慣於使用智慧型手機的年輕人來說,操作方式非常容易上手。圖為 2010 年 7 月,喀麥隆足球員艾托奧(Samuel Eto’o)正在講電話。(Source:達志影像)有手機的年輕人學得很快喀麥隆的寄生蟲權威坎明諾(Joseph Kamgno)醫生在 2016 年拿到這台搭載「LoaScope」功能的智慧型手機,他形容這是「革命性」的發明。坎明諾表示,他們很驚訝也很高興居民在兩天培訓以後,都能學會「LoaScope」該如何操作,並回到自己的社區裡協助檢測。他說:「幾乎所有年輕人都有手機,而且他們很快就學會(操作)『LoaScope』。」把這項技術推廣出去負責這項計畫的共同作者柏克萊分校生醫科學教授弗萊徹(Daniel Fletcher)說:「這不僅是為打擊河盲症往前邁進一步,這也證明了搭載在智慧型手機的行動式顯微鏡,可安全且有效擴展到醫療保健。」他也說,這項技術不只能應用在河盲症,透過行動式顯微鏡,不只醫療資源匱乏的地區甚至美國,都可以用於改善其他疾病的診斷或治療。 New tech revolutionizes fight against old diseases Applying Silicon Valley Smarts To Age-Old Diseases...
當語音助理 Alexa 成為智慧家庭的中心,它幫用戶遠端控制智慧燈泡、智慧監控相機、智慧洗衣機等,用戶當然也會希望 Alexa 能開始,舉例來說,跟小孩玩趣味問答、跟褓姆說尿布擺放的新位置等。然而,每家所需要的問題及回答都不同,對此,為了打造更客製化的智慧助理,亞馬遜再推出新功能「Alexa Blueprints」,讓不會寫程式的家中成員,都能打造屬於自己的 Alexa 問答功能。亞馬遜打造了一個 Alexa Blueprints 網頁,提供一些客製問答的範本,如說笑話、猜謎、給保姆、給家中訪客等,讓 Alexa 的主人自己套範本、提供自己的答案。▲ 亞馬遜推新功能,讓所有不會寫程式的家中用戶,都能打造專屬自己的 Alexa 問答功能。舉例來說,在給家中訪客問答功能中,頁面會告訴用戶該給哪些相關資訊來完成客製功能,包含告訴他們怎麼倒垃圾、家中遙控器放在哪、重要聯絡人的聯絡電話等,大約幾分鐘給予資訊後,就能完成客製功能。除了跟小孩玩遊戲之外,大學學生也可以打造自己的 Alexa 記憶考驗問答,作為測驗複習;Airbnb 屋主也可以利用家中訪客問答功能,幫住客熟悉住處、提供基本資訊。其他智慧助理如 Google Assistant、Apple 的 Siri 等,都還沒有推出類似這樣的功能,讓亞馬遜更進一步把自己與他人在相當競爭的語音助理市場中,區分開來。Alexa Blueprints 目前只先推出給美國用戶,在此區域,Amazon Alexa 的市場佔有率約為 70%。 Amazon’s new ‘Alexa Blueprints’ let anyone create custom Alexa skills and responses Alexa is becoming more personal with custom responses 5 Cool Things You Can Do...
近來人工智慧、機器學習與深度學習等技術,在影像處理與語音處理上,已經展現出遠比傳統方法優秀的效能。而在各種公開教育訓練資源中,日常生活的影像辨識(例如辨識手寫數字、門牌號碼等),也已經成為學習這項領域技術的常見材料。但是如何將深度學習技術使用到目前科技難以解決的問題,尤其是醫療上,幫助我們改善醫療品質與效果?在這個大方向上,世界各國的科學家與工程師持續積極地與臨床醫學從業人員合作中。就在最近,位於美國麻省總醫院的科學家發表了一份使用深度學習來進行醫學影像重建的研究。這項研究的特色在於,在沒有給予明確物理模型的情況之下,電腦也可以經由大量的學習,將各種偵測器所收到的資料重建出影像來。以電腦斷層為例,傳統方法是如何重建出橫斷人體的影像呢?在收到 X 光的資料後,我們必須有一個明確的物理模型,來描述偵測器收到的資料與影像之間的關係:我們所收到的 X 光訊號,會被任何位於從 X 光發射器到接受器的直線路徑上的物質阻礙而衰減。而各種物質的密度、大小與位置,都會改變信號的衰減程度。基於這個物理模型,加上電腦斷層系統的描述(例如 X 光發射器與接收器的位置),我們就可以利用數學工具「解出」人體的斷層影像。上述的例子也可推廣到其他的種類的醫學影像上,像是核磁共振影像(magnetic resonance imaging,MRI)的影像重建,也需要知道人體各個部分是如何產生不同的核磁共振信號(信號的大小與隨時間衰減的快慢)。在結合 MRI 系統的成像參數後,我們才能建立一套明確的物理模型,將影像重建出來。▲ 要先得知人體各個部分是如何產生不同的核磁共振信號,結合 MRI 系統的成像參數後,我們才能建立一套明確的物理模型並將影像重建。(Source:Flickr/Gerwin Sturm CC BY 2.0)如此看來,要重建出各種不同的醫學影像,需要有各類醫學影像相關的物理模型描述,而更重要的是,各個物理模型在描述真實世界收到的資料會有所偏差。例如,完美的物理模型知識並沒有考慮到在收集資料時不可避免的雜訊影像。更甚者,我們對於醫學影像系統的描述常常都會有各種因為工程技術限制所產生誤差。而這些誤差在多半的情況下我們並不清楚他們的大小為何,所以也沒有辦法提供一個完美的物理模型來描述資料。但這個限制可以藉由此研究所提出的方法加以克服。這群科學家利用深度學習的架構:包含前三層完全連結的神經網路,,以及後面三層比較小範圍的卷積神經網路,就可以重建出影像出來。這項技術其中一個有趣的地方在於,由信號偵測器資料到成像的過程當中,完全不需告知資料該如何轉變成影像,電腦就可以經由大量資料的學習自動找到這個轉變過程。例如在本研究的例子中,科學家嘗試重建核磁共振影像,但以往我們必須明確告知 MRI 的感測器資料與影像間存在傅立葉變換(Fourier transform)關係,才能完成影像重建。如今在新的架構下,傅立葉變換關係可以自動由資料學習而來。採用這項技術進行影像重建的另一個好處在於:重建出的影像對於箇中誤差與雜訊的容忍度比過往的技術都來得高。此外,當我們觀察訓練好的神經網路,能發現神經網路在進行影像重建時,較後端神經網路的活化現象會以比較稀疏的方式來作用。這項稀疏特性也是由資料學習的過程自動習得,而不是外加強制發生的(例如使用壓縮感知技術 compressed sensing 就會強調稀疏性的重要,使得感測器到成像的轉換過程必然有稀疏性的存在)。稀疏性的神經網路活動在科學家的觀點中,也代表學習的成果能比較有效率地以少量資料來完成工作。這項論文展示了由各種不同的核磁共振成像法取得的資料,都可以被同一個訓練好的神經網路重建出來。重建的影像也比傳統的方式來的精確(誤差更小)。即使核磁共振影像系統有所誤差,還是可以獲得比傳統方式更高品質的影像。除了核磁共振影像之外,論文也展示了這個深度學習架構可以重建正子斷層掃描影像。再度說明在不需要明確描述物理模型的情況下,也可順利完成影像重建。在可預期的未來,此項技術將可望進一步應用在其他的醫學影像(例如低強度電腦斷層、光學同調影像等),幫助我們在高雜訊的狀況下獲得好的醫學影像,提供醫療人員進行更有效精準的診斷與治療。(作者:林發暄博士,台灣大學醫學工程學研究所教授;首圖來源:shutterstock)延伸閱讀: fMRI 漏洞讓人看不清真相?在台灣,更缺的是縱觀全局的視野 對 fMRI 研究風波的省思