星期三, 6 5 月, 2026

旅 TRIVEL

很多競技射擊遊戲中,都能看到名為「奪旗」玩法。這源於西方傳統運動,玩家分成兩支隊伍,目標是把對方基地的旗幟帶回自己基地,同時要保護自己旗子不被搶走。規則看似簡單,可比起強調擊殺得分的玩法,奪旗對團隊配合和戰術執行會要求更高,這往往需要幾名玩家在進攻和防守間取得平衡點。但這依舊沒有難倒開發 AlphaGo 的 DeepMind 實驗室。據 Arstechnica 報導,5 月 30 日《Science》期刊有一篇新論文,稱新設計的 AI 程式已能在《雷神之錘 III 競技場》展現和人類一樣的行動模式,還能在奪旗遊戲戰勝人類隊伍。這也是繼《星海爭霸 II》和《Dota 2》後,DeepMind 又攻破的複雜競技遊戲。想讓 AI 玩好競技射擊類遊戲,難點是什麼?《AlphaGo》影片中,DeepMind 創始人 Demis Hassabis 曾簡單說明讓 AI 理解圍棋玩法的難點。他說,相比西洋棋,圍棋每顆棋子都有更多可走的路徑,最終整個棋局變化數目,比全宇宙的原子總數還多。DeepMind 實驗室的挑戰,就在於發明效仿人類直覺的進階演算法,最終讓它們像人類一樣決策,展開行動。換成第一人稱射擊遊戲的奪旗,AI 需要有更快的即時決策能力,比如思考什麼時間點做什麼事才正確?如果兩隊的比數差較大,又該如何協調隊友,採取什麼策略才能扳回分數?為了解決這個問題,DeepMind 實驗室建立一套新的雙層學習系統。在內層,DeepMind 會讓 AI 專注競技比賽的核心目標,也就是贏得勝利,基於這點,AI 會再為整個遊戲建立數個次級目標,尋求取勝的最短路徑,比如跟隨隊友,或在敵人基地附近遊走。這有一些具象化的東西,比如訓練過程中,DeepMind 團隊採取「優勝劣汰」,讓 AI 淘汰每一輪模擬賽表現最差的方案,然後再把最優秀方案的突出部分取出來,反覆改進決策樹。外層部分,根據內層的決策情況來調整其他模組。比如說當內層認為防守戰術是現在最好的選擇,外層就會提升 AI 對四周環境的視覺感知能力,這樣當敵人靠近基地時,AI 便能更快射殺。這麼看下來,DeepMind 開發的這套 AI 還是和人類很相似,內層就像人類「大腦」,主要負責戰術策略;外層可當作人類的「眼睛和雙手」,負責執行。確定模型後,接下來就是一遍又一遍訓練了。這次 DeepMind 團隊投入約 3 週時間,讓 AI 進行 45 萬局遊戲,相當於人類玩家花 4 年積累的時數,效率驚人。進行到約 10 萬場訓練時,AI 隊伍已達普通人類玩家的水準;20 萬局訓練後,AI...
花了 5,000 萬美元,華為鯨吞了國際老牌安防廠商 Vocord 。俄羅斯《消息報》3 日報導稱,華為已完成收購 Vocord 臉部辨識技術專利及開發團隊,目前 Vokord 部分員工正陸續調往華為。創建於 1999 年的 Vocord,是俄羅斯基於人工智慧生物辨識技術的專業視訊監控系統開發製造公司。身為俄羅斯臉部辨識領域「種子」選手,長期盤踞國際權威臉部辨識測試集 FRVT 第一名。自創立以來,Vocord 不僅開發臉部辨識系統,還在此基礎上創建了智慧視訊監控系統和交通違規、交通流量分析等系統。目前,Vocord 開發的人工智慧系統應用於 2,000 多個商業及政府項目、俄羅斯國內外 70 多個城市安全計畫,客戶包括俄羅斯內務部、聯邦安全局、行動通訊公司和部分銀行。5,000 萬美元的背後如果說產業經營是「加法」,那麼投資購併就是「乘法」。在 AI 安防市場,華為此次購併發揮的作用遠超出個人英雄式的單打獨鬥,從某種意義來說,並不是簡單追求規模效益的推動,而是為未來合作發展打好基礎。從技術角度出發,場景優先,技術先行,技術是場景的催化劑、場景是技術的煉火石,想要在安防行業更好、更穩地走下去,一定要有「拿得出手」的核心技術。於華為而言,雖然在通訊等技術市場有優勢,每年投入研發費用高到令人咋舌,但就安防行業的臉部辨識等相關技術來說,目前華為的競爭力還遠遠不夠。另外,現階段,與安防相關的 AI 技術精準度還沒有達到天花板,基於安防場景的不斷變化,對演算法更新的要求非常嚴苛。在這個市場,誰能看到演算法精準度提升解鎖的更多場景,並根據場景的變化做到快速精準的反應,誰就能走得更遠。眼下,AI 在安防領域的研究應用主要針對幾個核心問題:分類檢測、分割及分類整個圖像區域。以往來看,AI 神經網路中觸發函數、非線性單元、權重矩陣的應用形成非常高維的非線性函數,可完成非常複雜的任務;與此同時,在這基礎上,GPU 的出現讓神經網路的發展如虎添翼。即便如此,相關 AI 技術在安防市場的應用還有幾個挑戰:認知問題相較感知問題較難解決。感知問題可以用神經網路函數逼近,相比之下認知問題比較棘手。比如如何教會機器辨識一張椅子。如果定義為四條腿,很多椅子並不滿足此描述;如果定義為可以坐的物體,也行不通。所以說簡單的檢測物體問題,背後都蘊含更深層次的認知問題,很多還尚未解決。在弱線索、遮擋、模糊、對象追踪等情況下,人類在辨識的過程中通常會依據常識,並加入豐富的想像及推理。但是想要將這些能力傳授給機器非常困難;即使實現,辨識能力與人類相比也相差甚遠。電腦視覺技術帶給機器的能力不只是用來觀察世界,而是需要與世界建立聯繫,進而互動。某個機器人解決一件重要的問題需要用到手眼協調,需要連續的關鍵決策,而不停觀察、決策和控制,這是機器智慧目前非常難做到的事。隨著安防行業的多元化發展,未來很多細分場景對精準度要求之高勢必讓人咋舌,基於背景知識的圖像內容描述,挑戰都非常巨大。也就是說,AI 在安防行業的探索才剛剛開始,如果此時只是準備現有場景且剛剛達標的技術儲備,未來在這個市場會比較被動。透過本次收購,華為能在最短時間獲得可應用的全球頂尖 AI 安防技術。做為俄羅斯種子選手,過去 20 年,這家公司在人臉辨識領域沉澱頗豐,截至目前,其擁有 11 項設備專利與 6 項軟體專利。從行業市場來看,任何一個行業隨著時間的推移,市場增速都會放緩,這是必然的趨勢,也是商業鐵律。2008 金融危機之後,世界格局開始了新一輪的更新,自由市場經濟被越來越多的國家競爭所替代,每個國家都在強化自身力量,國際局勢劍拔弩張。對於安防行業來說,近兩年海外市場稍不太平,受全球市場(特別是北美市場)等政治因素影響,海外對於中國公司的部分業務的接受程度逐步收緊。一方面中國資源有限;另一方面海外部分市場受限。對於一個高速成長的企業來說,必須要在最短的時間內找到一個更加合適的突破口,「俄羅斯」無疑是最佳選擇之一,無論是從區域市場環境還是技術應用趨勢來看都比較符合所需。通常來說,想要進軍某個海外市場,透過購併往往都是上上之策,如此可以更好規避關稅和非關稅壁壘,同時克服地緣障礙。比如海康威視曾收購英國公司 SHL,進一步開拓海外市場;大華股份也曾以 2,900 萬美元收購 FLIR 旗下 Lorex 品牌,擴張北美銷售網路等。正如俄自由財經投資公司分析師阿納斯塔西婭・索斯諾娃所預測,中國企業(包括華為)在人臉辨識方面一直擁有很強的研發實力,因此這筆交易可能是做為進入俄羅斯市場的「手段」,而不是將俄羅斯技術引入中國。「華為公司目前極需新的大市場,因為其正被美國政府以行政手段拒止於美國市場之外。收購擁有專利技術的開發企業,可幫助其解決與智慧財產權有關的某些問題,例如歐洲臉部圖像庫等。」AI 安防需要持續廣度與深度「暫定個小目標,在智慧視訊領域,我們會用兩到三年的時間做到全球第三。」之前接受雷鋒網專訪時,華為 EBG 中國區企業雲端通訊解決方案銷售部部長彭曉東信心滿滿。在這個「小目標」的驅動下,2018 年,華為在智慧視訊領域針對主流市場發表了近百款攝影機;另外還生產高清解碼器、影片雲節點、影片內容管理平台等產品,可以為安防客戶提供視訊監控的端到端服務。做好安防需要一定的偶然及必然,偶然是所謂的運氣,必然是絕對的實力。從過去一段時間在行業市場的布局來看,華為安防的衝鋒聲已經越來越大,也在慢慢構築自己的深度和廣度,從實驗室到實際應用、從硬體到軟體,逐步推進人工智慧在應用層面落地。(本文由 雷鋒網 授權轉載;首圖來源:shutterstock)
美國 FDA 希望針對 AI 快速迭代的技術特性,擬議有關 AI 軟體醫材產品監管框架,並於 2019 年 4 月發表以 IMDRF(國際醫療器械監管機構論壇)對軟體醫材的分級為基礎之討論文件,為 AI 驅動軟體醫材上市前審查奠定潛在監管原則,FDA 也提出問題討論,期望相關廠商對此提交意見。FDA 將更新監管框架,以適應快速的 AI 産品更迭目前 FDA 監管框架中,將 AI 驅動醫療設備軟體做為軟體醫材(Software as a Medical Device,SaMD)進行上市前審查。FDA 基於風險分類來判斷 SaMD 在每次軟體更新,或進行其他對設備性能可能產生重大影響的軟體變更時,是否需進行 FDA 上市前審查。就 AI 而言,演算法可不斷利用新獲取的資料精進系統性能,產品可能隨著時間與新數據的重新訓練而改變,且無需透過傳統的軟體更新,因此 FDA 目前對 SaMD 監管模式並不適用於快速更迭的 AI 技術。FDA 採用 IMDRF「基於風險」的分類方式,依據 SaMD「提供的訊息對醫療照護决策的重要性」與「適用之醫療照護情境」(分為危急、嚴重、非嚴重)進行 SaMD 分級,AI 軟體醫材的分級亦與 SaMD 類似,此種風險分級並非取代醫材分級,而是區分並提供適合產品的參考建議。▲ 軟體醫療器材分級。FDA 將透過演算法的分類分級,給予不同監管途徑與彈性FDA 不僅依據風險進行 AI 軟體醫材分級,也根據產品的自主持續學習程度,將產品分為鎖定(Locked)或適應性(Adaptive)/持續學習(Continuously Learning)演算法,並有不同監管方式。鎖定演算法如靜態查表或複雜疾病分類等,由開發人員進行演算法手動更新,更新後的產品功能需再經驗證;而適應性/持續學習演算法,可透過自主學習與自動化驗證提高產品性能。觀察 FDA 目前核准的...
科技部繼法國新創展 Viva Tech 2019 成功接軌台灣科技新創與法國市場後,接續轉戰盧森堡 ICT Spring 挑戰全球科技專業人士匯聚的商務,並且於參會期間促成台灣科技新創鉅怡智慧(FaceHeart)與瑞士 Becare 及 Johnson & Johnson 子公司 Janssen 達成 450 萬歐元之合作協定,更於展期間由科技部代表領軍與盧森堡新創投資相關資源進行交流,期許創造台灣科技新創拓展歐盟市場機會。台盧雙國新創資源對接 互補全球科技新創生態圈盧森堡每年舉辦之 ICT Spring,已逐漸成為歐洲科技新創圈最具指標的展會之一,並吸引來自全球專業人士定期匯聚於此一科技新創大會中。今年的 ICT Spring 2019 吸引了來自 72 個國家的 500 家創業公司及 5,000 位產業代表與會,科技部也首次帶領台灣科技新創前進盧森堡,不僅創造台灣科技新創連接歐盟市場的重要入口,更進而與盧森堡經濟部數位創業署及新創投資處等相關單位進行雙邊科技新創交流與合作之研議,期許透過台灣新創技術及亞洲通路優勢,結合盧森堡資金與歐盟市場優勢,聯手打造全球科技新創新契機。而這次鉅怡智慧(FaceHeart)與瑞士法國醫療產業達成 450 萬歐元之訂單,也創造了台灣科技新創與歐洲市場鏈結之成功案例。 台灣科技創新擁技術優勢,創造歐盟智慧產業新需求科技部產學及園區業務司司長邱求慧表示:「近年來,科技部積極了解與培育台灣科技新創團隊與全球科技產業之定位,台灣科技新創團隊,透過國際重要展會與相關產業建立成互利的夥伴關係,並顯現台灣新創圈走向國際的決心。同時,也透過首次參與盧森堡 ICT Spring 2019,讓科技部以 TTA 為台灣科技新創品牌向世界溝通。TTA 善用科技新創,形塑台灣科技新創國台灣科技新創基地(TTA)自成立以來已吸引來自國際科技新創相關之 French Tech Taiwan、Canadian Technology Macerator(CTA)、MOX、SparkLab、IAPS 和 BE Accelerator 等國際新創夥伴陸續進駐,再透過引介全球新創業師資源、協助團隊進行矽谷模式的新創培訓、以及矽谷思維的國際市場思維外,更加強國際行銷技巧來強化團隊拓展海外市場的能力,進而獲得國際創投與產業的合作機會。TTA 除了鏈結台灣科技新創與全球新創生態圈,更積極提升科技新創於人工智慧、軟體及半導體等應用領域的發展,透過 TTA 品牌的國際型鄉策略,讓台灣科技新創團隊受到全球產業與投資人的關注,開啟台灣科技新創與全球合作機會,進而轉動台灣科技產業為台灣科技新創,用科技新創新勢力於全球生態圈為台灣發聲,並加速科技新創投入於全球產業中。(首圖來源:科技部)
天氣幾乎影響地球上的每一個人,不論是農業、航空、航運、交通、運輸、零售、物流、能源或各種公共事業都必須看老天的臉色吃飯,尤其隨著氣候暖化與氣候變遷的影響,具備「看天吃飯」的本領愈形重要。對此,IBM 推出兩款基於華生(Watson)人工智慧的決策軟體工具:天氣信號(Weather Signals)及華生農業決策平台(Watson Decision Platform for Agriculture)。Weather Signals 是一款人工智慧工具,開發這款軟體的目的在提供消費者如何即時回應各種天氣狀況的預測資訊。對於企業來說,也可透過 Weather Signals 能更好地規劃生產、物流、庫存和供應鏈。以「天氣預報──The Weather Channel」App 著稱於世的 IBM 子公司 The Weather Company 指出,該工具可使公司利潤增加 12% 到 20%。以往天氣因素不時成為公司營運不佳的元兇之一,如今 Weather Signals 能夠協助企業(尤以零售業為然)將天氣化為有利的因素與機會,進而更好地預測他們需要什麼樣的庫存,並以適當的人員配置來精準地因應未來的趨勢。天氣大數據分析適用於多種產業Weather Signals 要如何協助企業呢?首先企業必須先註冊使用 Weather Signals,然後將出貨、庫存及銷售資料提交給 The Weather Company。這些資訊會與 IBM 超級電腦系統 Watson 所收集有關全球天氣資訊的數十億個資料點合併。然後,Weather Signals 會為每個企業分別創建獨一無二的模型,以顯示溫度波動以及惡劣大風暴可能對業務的影響性,這類資訊可以幫助企業賺更多錢。進一步而言,基於歷史區域銷售資料與 The Weather Company 歷史資料相整合而構建的 Weather Signals,將會進一步與諸如 Tableau 等大數據分析工具相整合。IBM 認為,天氣數據分析適用於多種產業。(Source:IBM)一般天氣預報的準確率多半在 55% 左右,The Weather Company 指出,如今他們的準確率已達 86%,這是提供更好決策的關鍵,協助零售業者對供應鏈做出更好的決策可以為他們省下數百萬美元。此外,Weather...
Facebook 在 AI 人工智慧投放不少資源開發,成果也陸續開源化,最近就將旗下深度學習框架 Pythia 開源,可用於圖像及語言分析,方便建立、複製和測試相關人工智慧模型。Facebook 介紹,Pythia 是基於 PyTorch 機器學習框架的工具,主要針對視覺和語言分析,例如處理視障數據相關查詢,或自動生成圖像介紹等。這工具也整合 Facebook AI 旗下各種得獎技術,如 LoRRA 視覺及語言模型等。Pythia 也支援分散式訓練和多重數據組,內建 VQA、VizWiz、TextVQA 和 VisualDialog 素材。開源化後,Facebook 表示日後會推出更多工具、數據組和其他參考模型。Facebook 表示,這將使開發社群更容易在成功的系統上構建和測試基準。他們希望消除障礙,使研究人員更快地為人們和智慧機器開發新交流方式。這項工作還應該幫助研究人員開發自適應的人工智慧,將多種理解融合到更基於情境的多模式理解。 Facebook open-sources deep learning framework Pythia for image and language models (本文由 Unwire Pro 授權轉載;首圖來源:Facebook)
去年在 Google 開發者大會大放異彩的 Google Duplex AI,能幫忙人類自動撥號,向餐廳訂位,揭露未來數位語音助理的可能性。但最近 Google 的願景卻被餐廳發現不是那麼美好,現階段還不完善。其實電話另一頭其實是 call center 的人,用人工方式向餐廳訂位。紐約時報向 Google 確認有四分之一 Duplex AI 打出去的電話,其實是位於愛爾蘭 call center 的人,以傳統方式人工打電話訂位。另外 15% 仍需要或多或少,真實人類介入,才能成功訂到餐廳。報導的記者實地測試 Google Duplex,發現的確有不少通訂位電話,在過程中要有人力介入。成功用 AI 訂位的幾次,餐廳也以為是一般人類打來的。Duplex 會仍需要人類協助有不少原因,一個是技術仍未成熟,在還沒有足夠資料訓練好的時候,就放出來讓使用者使用。另外就是如同早期的 Google 產品,產品週期還在早期階段,本來就需要人類協助。Google Duplex 先從有在 OpenTable、Resy 和 Yelp 上的餐廳,接受 Duplex 服務,因為這些網址上列的餐廳都有提供訂位服務。如果餐廳沒有接受訂位,或是需要大於多少人去光顧,才需要訂位,造成 Duplex 需要人類打電話訂位的情形。其他的情形還有餐廳員工覺得同一筆訂位,卻是由不同口音的 bot 打來確認訂位,造成詭異的感受。或者來電太像廣告電話的號碼。雖然各大科技公司都提出 AI 將幅提升人類生活便利程度,但現今 AI 的表現沒宣稱的聰明,仍然還是 narrow AI 的程度,能夠在特定事物做得不錯,但無法推廣到其他事物。AI 缺乏背景知識,表現不如人類。未來 Duplex 要進入下一階段,能夠開始預約髮廊理髮,還有一段路。 Google’s Duplex Uses A.I. to...
Google 所打造的 Pixel 系列手機僅搭載單一鏡頭,以軟體搭配硬體創造各種拍攝的可能性。Google 官方 24 日邀請到史丹佛大學電腦科學榮譽退休教授、同時也是 Google 傑出工程師的 Marc Levoy 來台,深入講解 Pixel 手機深入運用機器學習等技術搭配硬體,開發出更高水準的功能。觀察手機相機系統的發展趨勢,其中 Pixel 手機採用的是以軟體定義(Software-defined)為主的相機系統,在圖像計算上不再單靠硬體功能,更運用計算攝影(Computational Photography)整合連拍的幀數。此外,導入機器學習技術取代傳統演算法,並在機器學習的訓練過程中獲得更多數據,有助於提升拍照的準確度。一般手機相機進行拍照時需遵守的基本原則,包括整體執行必須很迅速,深入來說像是即時觀景器(Live Viewfinder)大於 15fps、快門延遲時間小於 150 毫秒、照片成像時間小於 5 秒;還有相機的預設模式絕不能失敗,必須具有可靠的曝光、對焦以及白平衡,並且避免鬼影或視覺殘影等狀況發生。Pixel 手機不僅符合這些基本原則,更深入運用機器學習等技術搭配硬體,開發出更高水準的功能表現。HDR+手機相機應用程式的 HDR(High Dynamic Range Imaging,高動態範圍成像)功能相當常見,典型的作法是採取包圍曝光(Exposure Bracketing),將曝光時間短的影像所捕捉的亮處細節,以及曝光時間長的影像所捕捉到的暗處細節結合成為最終影像。但手持時難免會晃動到手機,使得拍照影像的曝光程度不同,因此 Google 不使用包圍曝光的作法。Pixel 手機相機應用的 HDR+ 功能是透過捕捉相同曝光程度下的連拍影像,同時避免亮處過度曝光,再進行校準與合併;採用色調映射 (Tonemap)增強陰影並降低亮處,雖犧牲整體色調、保留局部對比度,但使照片呈現更符合人們的視覺。▲ 左圖為沒有開啟 HDR+ 的影像,右圖為開啟 HDR+ 的影像。(Source:Google AI Blog)肖像模式肖像模式是將拍照重點集中在眼前的人物或物體上,使其從模糊的背景中凸顯出來。目前大多數的智慧型手機採用合成淺景深(Synthetic Shallow Depth of Field)呈現照片背景模糊的效果,作法細節是利用雙鏡頭相機在相似的焦點下捕捉 2 個影像,運用立體匹配(Stereo Matching)演算法計算深度圖(Depth Map),在照片場景中選擇一個平面保持其銳利影像,並且模糊距離該平面更近或更遠的影像,如同失焦的感覺。然而僅搭載單一鏡頭的 Pixel 2 / Pixel 3...
要打造令人信服的 deepfakes 影片,神經網路模型往往需要經過大量數據訓練才能達成,但現在三星(Samsung)莫斯科 AI 研究中心的團隊已經開發出一種方法,只需要「少許」影像數據就能打造出可信度相當高的談話影片。但少許究竟是多少?根據團隊的描述,這個數字可以是 32 張或 8 張照片,又或者更少一些──1 張照片也行。據了解,這款 AI 模型是使用卷積神經網路(CNNs)所打造,團隊先是使用 VoxCeleb 公開數據庫中超過 7,000 張名人圖像對演算法進行了訓練,讓 AI 關注於辨識人們臉部的「地標」特徵,像是眼睛、嘴巴形狀、鼻樑長度和形狀,它開始能以相似的做法應用在其他照片上,使照片活過來。由於 AI 模型最少只需要 1 張照片便可以進行,這意味著歷史人物或肖像畫都能夠適用,在影片中,可以看到愛因斯坦、杜斯妥也夫斯基和夢露的著名肖像動起來,就好像他們在現代生活,被一旁友人拍下講話的畫面一樣。▲ 想看歷史人物、畫像人物動起來的可直接移動至 4:18 處。當然,使用越多照片的效果明顯越好,只使用 1 張照片製作的 deepfakes 影片很容易就能從背景、臉部表情的不自然看出造假痕跡,只是隨著使用的對象生活年代越早,也越難從影片中看出虛假──畢竟許多人在攝影技術普及前早已離世,並沒有留下實際的談話影片讓我們能夠對照真偽。要說這個 AI 模型最讓人驚豔的一點,應該還是讓畫像人物也能夠動起來的部分,以知名的「蒙娜麗莎」為例,過去即使前往羅浮宮美術館朝聖,頂多也只能感覺蒙娜麗莎像從任何角度都在看著你,可沒有辦法看到蒙娜麗莎對你眨眨眼,又或者像是在談起生活瑣事。▲ 在造假技術協助下,畫像中的人物就像被賦予了生命。隨著 deepfakes 技術越來越進步,許多人都開始擔心相關技術被應用在惡意用途,讓未來即使看到影片、聽到聲音檔仍「眼見不能為憑」。儘管潛在疑慮仍然存在,但至少以目前來說,還未有任何 deepfakes 影片造成嚴重的混亂事件──當然,這是目前啦,未來會如何發展就不好說了。 Deepfakes are getting easier than ever to make, new research paper shows arXiv 論文預印本-Few-Shot...
據 Bloomberg 報導,亞馬遜正在開發一種可辨識人類情感的穿戴式裝置,這款產品主要是做為健康和保健產品,由 Echo 智慧型音箱和亞馬遜平板電腦 Kindle Fire 的團隊開發。據亞馬遜內部文件顯示,這款可辨識人類情感的穿戴式裝置主要是搭配智慧手機應用程式使用,可透過辨識用戶的聲音來判斷用戶的情緒,主要用途是幫助用戶更有效地與其他人溝通互動。目前暫不清楚這款產品是否會推廣上市,亞馬遜內部有大量實驗性的產品開發,據知情人士透露可辨識人類情感的穿戴式裝置內部開發代號為 Dylan,目前正在進行測試,但不清楚是否是硬體測試還是辨識系統測試。亞馬遜沒有回應上述消息。亞馬遜在 2017 年申請的一份專利顯示,語音辨識軟體透過用戶聲音來分析和確認用戶的感受,可辨識快樂、憤怒、悲傷、難過、恐懼、厭惡等多種情緒狀態。在應用中這項技術可監控用戶的情緒狀態,比如用戶處於生病中疲憊的狀態,準確辨識後語音助手會向用戶提供相應的幫助,可準確區分用戶的聲音和環境背景雜音。 目前亞馬遜旗下有語音助理 Alexa、家用音箱 Echo 等產品,獲得了大量用戶的語音指令資料,應用情感辨識技術後可更準確地理解用戶想要表達的內容,完善語音助理服務。但任何辨識技術的應用都會面臨著隱私的問題,任何未經用戶許可獲取用戶資料都會涉嫌侵犯用戶隱私,之前多家公司的產品就被曝出違規取得用戶資料的行為。 Amazon Is Working on a Device That Can Read Human Emotions (首圖來源:亞馬遜)