Netflix 不久前推出了第一個互動式選擇節目,觀眾可以拿遙控器控制主角的選擇,進而決定故事發展。不過,從迪士尼的新研究看來,在未來,觀眾也許只需一個微笑,就能改變故事走向了。迪士尼研究中心(Disney Research)近日發表了一份新論文,公布了一項用於觀察分析在電影院看電影觀眾反應的技術。也就是說,當那些觀眾在看電影的時候,電影其實也在觀察你們看得開不開心。這項技術名為分解變分自編碼器(factorized variational autoencoders,下稱「FVAE」),是一項採用深度學習的神經網路,它可以在漆黑的電影院裡捕捉上百名觀眾的表情,並可以自行學習「微笑」和「大笑」等概念。▲ 你看電影時的微笑,屬於哪個區間?(Source:論文截圖)包括迪士尼在內的電影製作公司,大多都會在電影完成後,找焦點小組來對影片進行測試播映,以了解觀眾的反應是否和創作電影時的意圖相符(在該笑的地方是否有笑,該感動時有沒有感到),並且會根據回饋結果調整影片剪切。和焦點小組相比,人工智慧可分析的資料以及分析程度更高。迪士尼研究的科學家 Peter Carr 在接受 Phys.org 採訪時表示:我們能獲得的資料遠比人工可分析的要多。這就是電腦得參與的原因──它們可以在不弄丟重要細節的情況下總結分析資料。而且,除了收集分析資訊的能力了不起之外,FVAE 讓人更驚豔在於對觀眾反應的預測能力。本次研究的資料都來自同一家電影院。研究人員在 2015 年至 2016 年間的 12 個月內,在這家電影院裡記錄了 9 部電影(《蟻人》、《動物方城市》、《STAR WARS:原力覺醒》等),合計 153 個場次、3,179 名觀眾以及 1,600 萬條資訊。而這些資料中,研究人員只用了每場電影 80%的觀眾資料來訓練 FVAE,而剩下的 20%觀眾,就是給 FVAE 的測試題。對於這 20%觀眾的資料,研究人員只將每名觀眾最開始 5%的資料登錄到 FVAE,做為推測剩下 95% 時間內的觀眾表情變化。雖然 FVAE 獲得的資料還比較初步,但和其他神經網路的預測結果對比,FVAE 的錯誤率是最低的。▲ FVAE 在判斷資料和預測中的錯誤率都比其他模式低。(Source:論文截圖)這就意味著,只讓這神經網路觀察你看電影前 10 分鐘左右的表情,它就能猜到,你對剩下的這些內容會不會感興趣。再跳一步想,說不定以後就能用這類神經網路來判斷並為觀眾選擇,讓故事向他們最喜歡的情節發展方面。內容商對觀眾喜好的觀察形式,一直以來都是在科技發展過程中不斷演變。從電視時代開始,尼爾森就給樣本家庭提供有記錄功能的機上盒;而到了網路時代,影片則會記錄我們留下的觀看歷史;而現在來到人工智慧時代,在技術強大的分析能力加持下,內容商甚至想即時了解我們對內容在情緒上的喜好,最終甚至達到可預測的能力。而這個技術,對於產品跨越影視娛樂內容和主題樂園的迪士尼來講,尤其有價值。在今年 SXSW 活動中,迪士尼研發部副總裁 Jon Snoddy 表示,他們正在嘗試利用人工智慧技術和機器學習,創造極為逼真的動畫角色機器人,並負責和遊客進行互動。這個時候,懂得針對遊客情緒來反映,就顯得特別重要了。(本文由 愛范兒 授權轉載;首圖來源:Flickr/Marek Kubica CC BY 2.0)延伸閱讀: Netflix 推出全新互動影視劇,讓你參與劇情的走向
亞馬遜 Echo 的風靡,帶動了全球智慧音箱的風潮,智慧音箱創業者雨後春筍般出現,各個巨頭也各個摩拳擦掌,想在這個風頭做一下嘗試,包括蘋果、Google 都已經有成品推出。7 月 25 日,據《電子時報》網站引述行業消息人士稱,美國科技巨頭 Facebook 也正在開發一款智慧音箱。消息稱,Facebook 的智慧音箱將更加注重視覺畫面的互動,而為了保證視覺效果,Facebook 將為這款音箱配有一個 15 英吋的觸控式螢幕,據悉,螢幕將由 LG 顯示器公司提供。根據相關消息爆料,該音箱的產品設計團隊是 Facebook 內部負責新興業務的「8 號大樓」部門。而這款智慧音箱將由台灣代工巨頭和碩科技製造,預計明年第一季對外發表。目前,傳和碩在中國的工廠已經小批量生產 Facebook 智慧音箱的樣品。對於新進入智慧音箱領域的玩家來說,多數都是以亞馬遜的 Echo 為標竿,做一些微差異化的客製,但核心功能與 Echo 比較雷同,包括蘋果、Google 的智慧音箱也不外乎語音播報、生活服務、語音控制家電等功能。而 Facebook 在這個時候進入,先不說進入的時間已經稍晚,單單 Facebook 本身在硬體方面的積累,相對於其他巨頭的優勢也不是很明顯。不過這個時候布局智慧音箱市場(甚至是語音辨識、語音互動市場),Facebook 一定有自己的邏輯。Facebook 以社群網路起家,擁有近 20 億用戶,加上 WhatsApp 和 Messenger 的月活躍用戶均已突破 12 億,龐大的用戶群就是一個天然優勢,雖然其智慧音箱是否會和這些社群工具進行整合還不好說,但相信 Facebook 應該不會放過社群這個切入點。然而社群可以是切入,但不一定是全部,Facebook 近年來也在多個領域布局,而智慧家居也是一個巨大的市場,目前來看,多數人都認為音箱(語音技術)會是智慧家庭的入口,掌握這個入口對於未來相當重要。(本文由 雷鋒網 授權轉載;首圖來源:shutterstock)
為搶佔 AI 商機,科技部舉辦科技大擂台,懸賞總獎金新台幣 3,000 萬元,邀請好手角逐,主題以電腦中文聽力理解在地腔調如台灣國語為競賽主題,發掘人才技術,協助國內廠商開發相關應用。科技部部長陳良基表示,為加速台灣人工智慧(AI)科技發展,一改以往計畫補助模式,以挑戰賽模式,舉辦「科技大擂台 與 AI 對話(Formosa Speech Grand Challenge)」,用總獎金 3,000 萬元、首獎 2,000 萬元,激勵頂尖團隊挑戰技術瓶頸。陳良基解釋,語音對話是最直覺且人性的人機互動介面,未來各電子產品要結合 AI 智慧化時,語音介面是非要不可的技術。像在嘈雜的環境,要讓電腦聽懂人的講話,相當困難。陳良基說,AI 語音涵蓋「語音辨識」、「語音理解」兩項核心技術,兩者皆須與在地契合,包括慣用語、在地腔調、文化風俗、使用情境及背景雜音的掌握與判斷,才能實現人機無礙的對話。他強調,台灣若開發出在地語料庫及知識建構,都能夠共行,在全世界很多的地方,都會擁有優勢。科技部次長許有進說明,「科技大擂台 與 AI 對話」競賽分為熱身及正式賽兩項進行,熱身賽 8 月開始展開賽程,10 月中決賽,同步提供教育訓練課程。他指出,正式賽則在 107 年 3 月開賽,108 年 3 月決賽,挑戰在複雜環境下 AI 中文語音辨識與語意理解的能力。同時,科技部也將建置各類情境的中文語音大數據,協助國內技術團隊與業界開發 AI 中文語音對話與應用服務。(作者:陳政偉;首圖來源:shutterstock)
南韓努力研發生物製藥,將結合人工智慧(AI)運算工具,開發全新藥品。韓國先驅報(Korea Herald)報導,南韓藥品暨生物製藥商協會(Korea Pharmaceutical and Bio-pharma Manufacturers Association,KPBMA)24 日宣布,2017 年擬創立一座 AI 藥物研發支援中心,希望能幫助國內製藥廠,加快新療法的研發進度。新藥研發是一項冗長、風險高又資本密集的過程,根據 KPBMA 統計,藥廠平均要花 10 年、投注 24 億美元的資金,才能開發出一款全新藥物。在開發新藥時,藥廠一開始得檢驗約 5,000~10,000 種新藥原料,慢慢刪減到只剩一項,然後繼續研發。KPBMA 認為,AI 和大數據可在這個過程中助研發人員一臂之力,找出最具潛力的候選藥物,並擬定最有機會成功的研發流程。KPBMAi 研發委員會董事成員 Pae Young-wook 說,AI 能夠分析醫療大數據,藉此預測藥物的成效和副作用,可作為臨床實驗規劃的指引、讓結果最佳化,大幅降低時間成本。世界級的大藥廠,早就在用 AI 協助新藥研發。舉例來說,輝瑞(Pfizer)就採用了 IBM 的 AI 軟體「華生(Watson)」進行新藥開發的工作,加快腫瘤免疫學的研究。(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)
107 年度科技預算審議結果今天出爐,科技部表示,加計前瞻特別預算後的整體規模達新台幣 1,178 億元,創歷年新高,較1 06 年度行政院核定數成長約 9.2%。其中,前瞻特別預算佔 177 億元,扣除特別預算後的整體科技預算為 1,001 億元。科技部指出,根據經費分配顯示,基礎研究預算總計核列共 364.9 億元,包括有科技部的 262.4 億元及中央研究院的 102.5 億元,兩者合計約佔 107 年度不含特別預算的整體科技預算 36.5%,顯見政府對基礎學術研究的重視。除匡列鉅額預算外,科技部表示,在不含特別預算的 1,001 億元科技預算中,還透過三大創新措施方式支持基礎學術研究,分別為「強化貴重儀器中心服務量能」、「整合國家實驗室資源」和「維持長期研究經費」等,以做為國內基礎研究科學家們的後盾。舉例來說,像是科技部主管預算總數為 423 億元,其中就匡列 262.4 億元支持各學術司的基礎研究,約佔整個科技部預算的 62%,整體佔比仍維持和 106 年度相當比例。科技部長陳良基表示,基礎研究是科技發展的基礎,有紮實基礎研究才有廣泛的科技應用,政府十分重視也力保基礎研究經費。在「強化貴重儀器中心服務量能」方面,科技部將建置貴重儀器共用服務網路,提供全國科學研究及產業界共用;「整合國家實驗室資源」部分,將所屬法人的 13 個國家級實驗室建置共用研發網路,積極提供國內基礎研究實驗平台。科技部表示,在「維持長期研究經費」方面,未來將逐步提高多年期計畫比例,使其成為常態,以鼓勵研究人員能長期投入新知識、新技術的基礎科學研究工作。
Google 最近在 AI 上的動作有點多。月初時宣布成立新基金 Gradient Ventures,專門投資 AI 公司;而 27 日,Google 又宣布成立一個新的工作室 Launchpad Studio,為 AI 公司提供發展所需的資源。人人生而平等,但創業公司卻生來不平等。AI 創業公司尤其喜歡數據,並想努力獲得足夠的數據,但這往往是他們缺乏的。新工作室就希望透過專門的數據集、仿真工具和幫助開發原型產品,來滿足這些需求。Launchpad Studio 的另一個賣點,是被選中的公司可得到 Google 員工的幫助,比如工程師、智慧財產權專家和產品專家。Launchpad Studio 是 Google Developer Launchpad 的一部分,後者一直在全球範圍內開展加速器業務。據稱,目前 Launchpad 網路在全球 40 個國家有業務,與一萬多家初創公司合作,在全球培訓了超過 2,000 名導師。AI 工作室的想法並不新鮮,有「Android 之父」之稱的 Andy Rubin 就成立了 Playground Global,能為初創公司提供一系列服務,幫助獲得頂尖人才,打磨產品,並與大型科技公司競爭。在 AI 方面,雷鋒網報導過機器學習的專家 Yoshua Bengio 聯合創立的孵化器 Element AI,已經有了 1.02 億美元的 A 輪融資。Bengio 是最著名的 AI 研究者之一,本身就能幫助吸引頂級機器學習人才,效果不會比 Google、Facebook 差。當然,Launchpad...
總是找不到你要買的特定物品嗎?eBay 26 日宣布,將在秋季啟用行動裝置上兩項新功能,運用人工智慧(AI)和機器學習,未來消費者將能透過拍攝鞋子、包包等特定物品照片,來找到 eBay 上販售的類似物品。CNBC 報導,這項功能被稱為「Image Search」,消費者除了能夠透過拍照搜索外,也能運用手機裡既有的物品照片來尋找。另一項功能「Find it On eBay」則讓消費者透過「分享」社群媒體、網站上的照片給 eBay,來尋找到類似的商品列表。這兩項行動裝置上的圖像辨識功能預計將在秋季登場,電腦版本還需要再等一段時間。較可惜的是,目前功能僅提供美國地區用戶使用,海外地區尚未透露何時開放。(Source:eBay 官網)負責採購體驗的副總裁 Mohan Patt 表示,eBay 相信透過與機器學習結合,將能運用全球最大的商業數據庫,來提供消費者快速又可靠的購物體驗。通過結合機器學習,這兩項功能的圖像辨識將隨著時間推移改善,並讓搜尋結果更符合消費者的需求。Patt 表示,eBay 一直都專注於創造相關技術,來幫助數百萬購物者能輕鬆找到自己喜愛的產品,「無論是走在街上或瀏覽社群媒體時,消費者都可隨時隨地掌握購物靈感」。eBay 確實投入圖像辨識一段時間了。TechCrunch 的報導就指出,eBay 前執行長 John Donahoe 在 2011 年底時就曾透露,公司計劃推出行動裝置的圖像辨識軟體。而在去年,eBay 更收購了圖像辨識公司 Corrigon,進一步強化視覺搜索技術。收購了 Corrigon 之後,eBay 負責結構式資料的副總裁暨總經理 Amit Menipaz 就曾表示,Corrigon 對圖像辨識的專業知識和技術,將幫助消費者在 eBay 購物時能獲得最好的結果,這是過去 eBay 無法做到的。不僅是 Corrigon,做為結構式資料(structured data)計畫的一部分,eBay 還收購了瑞典 Expertmaker 和以色列 SalesPredict,希望透過 AI、機器學習來加強數據分析能力。 You will soon be able to search eBay using...
人工智慧,中國有自己的那一套,阿里巴巴推出的語音揚聲器 Tmall Genie 類似亞馬遜的 Echo,搭載語音助理 AliGenie,可以線上購物、查看天氣、放音樂、控制家中的智慧裝置。百度也有對話平台叫做 DuerOS,可以添加在家用機器人、電視機上盒、HTC 智慧手機上,中國科技巨擘期待自家語音助理可以吸引投資者,與亞馬遜互別苗頭。事實上這個市場潛力無窮,IDC 預期 2020 年 51% 的中國智慧駕駛產業,68% 的電話與穿戴產業會搭載語音人工智慧系統。麻省理工科技評論(MIT Technology Review)報導認為,中國發展語音系統有跡可循,因為中文輸入相對麻煩,這也是為何中國消費者早就習慣語音留言取代文字輸入使用 WeChat。但是現在中國的語音助理技術可以執行命令,無法對話,因為對話運算沒那麼簡單,必須先解決中文的複雜性。報導舉例,在中文世界當中,同樣的單字安排在不同的順序上意義就會不同,即使順序相同,意思也會隨上下文出現差異。此外,中國沒有像英文的空格,所以中國自然語言處理研究人員必須教育演算法在哪裡插入空格,以建立句子適當的意義。且中文沒有時態,所以機器很難辨識句子的時間意義。更別說中國有許多方言,對機器學習而言也是一大挑戰。研究自然語言處理的清華大學副教授指出,為了真正了解人類話中的意圖並進行適當溝通,電腦不得不採用語調和壓力等細微的線索。 他們也必須了解情緒,因為人類的決策不是完全依賴邏輯。為了使系統更智慧,百度在平台上引入培訓師模式,讓軟體開發人員透過內建的註釋機器人即時提供語言數據,機器人接收到開發者反饋從中學習,然後更正系統。報導認為,中國研究人員解決這些問題的一個優勢是大量數據,由於支持當今電腦語言理解的神經網路需要大量數據訓練,因此擁有的數據愈多,其神經網路將更智慧化。截至 2016 年底,百度每月活躍行動用戶達 6.65 億戶,截至今年 3 月,阿里巴巴每月有 5.07 億行動用戶。但是阿里巴巴的人工智慧科學家王剛表示,研究人員必須設計不需要大量數據的神經網路,才能讓機器語言學習更有效率。他說,畢竟在現實世界中,人們用不同方式表達同樣意義,電腦不可能學會所有解釋。王剛與研究團隊開發一種不需龐大數據,只要相關主題的數據就可訓練電腦理解主題的方法,例如為了訓練神經網路了解運動醫學文本,只需使用運動與醫學數據,就特定主題訓練神經網路。雖然使用特定主題資料的效果不如大量數據,但是在數據量有限的情況下,這種方法特別有用。由於對話介面的互動更自然,將可吸引更多人進入網路世界,而最終語音助理成功的關鍵就是內容和服務。如在中國推出小魚聲控家庭助理機器人的 Ainemo,計劃透過百度的 DuerOS 對話平台在家庭語音助理中建立教育和醫療保健項目,目標是為不太會使用電腦與智慧手機上網,特別是老人與幼兒提供基於語音的服務。 For Computers, Too, It’s Hard to Learn to Speak Chinese (首圖來源:Flickr/Jonathan Kos-Read CC BY 2.0)
「他」是個混血兒、「他」含著金湯匙出生、「他」曾集萬千矚目於一身、「他」經歷了無數讚譽和質疑,很多人認為「他」會被寫進歷史,如今「他」卻稍顯頹靡……「他」是 Pepper。從 2014 年誕生開始,Pepper 就成了引領「情感機器人」的標誌性產物,並且不斷引發銷售狂潮。但短短 3 年,機器人產業變化巨大,Pepper 風光不再。就在上週,日經新聞報導了一則關於 Pepper 的消息:軟銀集團向財務省關東財務局提交的 2016 財年(截至 2017 年 3 月)有價證券報告書顯示,軟銀旗下開發和銷售 Pepper 的軟銀機器人控股公司(Soft Bank Robotics Holdings Corp,下稱 SBRH)負債已經超出資產 314 億日圓。根據過去媒體一系列數據顯示,SBRH 至今已經連續 3 年虧損,2014 財年虧損 23 億日圓,2015 年淨虧損則高達 117 億日圓。據悉,Pepper 機器人的低利潤和巨大的研發投入是造成高額虧損的主因。那到底是什麼原因造成 Pepper 今日的境遇呢?Pepper 的未來在哪?「先行者」造就了 Pepper 的光環2012 年,軟銀收購了法國機器人公司 Aldebaran,也就是研發了知名雙足機器人 Nao 的公司,並將其改名為軟銀機器人控股公司,SBRH 的第一個作品就是 Pepper。2014 年 6 月 5 日,軟銀首席執行長孫正義帶著 Pepper 出現在了全世界的面前,在那場足以寫入「機器人史」的發表會上,孫正義激動地向全世界宣布,世界第一個可以讀懂人類感情的機器人誕生了。發表會過後,Pepper 就成了各大科技媒體的座上賓,聚光燈下傲視群機。時至今日,提起 Pepper,雖然沒有往日風光,但也是一個不小的話題。Pepper...
AI 浪潮席捲全球,科技部長陳良基 31 日表示,為爭取發展先機,在國內 AI 軟、硬體相關發展計畫共編列新台幣 100 億元預算,且 8 月將舉辦「科技大擂台」暖身賽,廣邀各界好手。陳良基中午接受網路媒體科技報橘專訪,暢談「科技部 AI(人工智慧)大戰略」。他表示,今年是 AI 元年,但運算量是 AI 能否到位的最重要依據,所以他今年 3 月便提出希望爭取新台幣 50 億元預算,建置 AI 主機基礎設施進行雲端運算,這部分硬體計畫現已納入前瞻基礎建設的特別預算內。其次,軟體部分,科技部每年也將投入預算 10 億元、為期 5 年,首期計畫總預算 50 億元,協助各校規劃成立跨領域的 3 至 4 個「AI 創新研究中心」,在國內各校推動、儲備更多 AI 人才和技術,預定今年底前底定學校名單。陳良基說明,AI 創新研究中心研究範疇,包括基礎設施(雲)、技術層面(管)和應用領域(端),透過跨領域和應用方式形成群聚效果,3、4 個中心互相合作或競爭,可造就一個國際矚目的平台。「這兩項軟、硬體計畫會同步推展」,陳良基表示,當各校在進行深度演算時,只要遠端連線到科技部主機即可,不需自行另外建置相關硬體設備。除了訂定計畫之外,科技部 8 月也將首度舉辦「科技大擂台」暖身賽,陳良基說,希望廣邀各界人士挑戰設計中文與台語的 AI 語音,並正確分析語意,且由公視提供語音資料來源,活動首獎獎金高達 2,000 萬元、總獎金共計 3,000 萬元。陳良基表示,藉此活動也將趁機建置語音大數據,希望明年 3 月前可建置 5,000 到 1 萬小時的台灣語音資料庫,此數量已達國際水準,若台灣電子產業未來需要推展 AI 科技產品,即可掌握台灣語言核心發展技術。(作者:黃麗芸;首圖來源:shutterstock)延伸閱讀: 科技部 3 千萬辦擂台,助機器人聽台灣國語...

