據彭博 7 月 13 日報導,微軟正在籌建 Microsoft Research AI 研究院,未來將專注人工智慧領域,開發更多通用學習系統。該研究院將設立在華盛頓州雷德蒙德,近百位人工智慧領域的科學家集中在此,分為 13 個研究小組,以下一一介紹各組。自適應互動組:致力於追求智慧和互動原理的進步及相關應用的進步,提高計算系統和介面。包括傳感、學習和決策、搜尋和檢索以及人機互動基礎等研究。空中資訊與機器人組:主要做機器智慧的尖端研究,機器人和人類為中心的計算,飛行機器人艦隊,微型無人機,民用客機。研究彙集了機器學習和思想感知,不確定決策在機器人平台上產生各種挑戰。合成演算法和系統將應用在飛行器如:滑翔機、小飛機和商用飛機。應用場域包括精確農業監控、病原體監測、氣象探測、啟用數位連線等。團隊有 3 篇論文被 ICRA 2017 接受。對話系統組:重點推進人機對話。研究涵蓋對話方塊管理、對話狀態追蹤、用戶建模、語言理解和語言生成。團隊對探索對話系統在對話過程中學習的方法特別感興趣。團隊正在面對挑戰,例如如何從非常有限的互動中學習特定工作的對話控制器;如何建立架構化知識與機器學習相結合的對話控制模型,以及對話控制器如何透過互動進行自主改進。團隊與微軟研究其他團體密切合作,包括自然語言處理、機器教學、自適應系統和互動。深度學習組:主要開發演算法、模型,有監督和無監督學習系統,深入強化學習,神經象徵式推理,然後尋求在電腦視覺、自然語言處理、多智慧、網際網路資訊處理、以及其他相關領域的突破。該小組的研究人員對學術界產生重大影響的許多專案都有貢獻,最近的例子是電腦視覺的 API 在微軟認知服務,它提供了世界上第一個影像字幕的雲端服務。資訊和資料科學組:跨學科的資訊和資料科學團隊彙集了來自資訊檢索技術、人機互動(HCI)、人工智慧、社會科學共同挑戰相關的問題:1. 人們如何組織資訊和資訊系統的相互作用,2. 如何用挖掘出來的資料說明人的行為。身為一個團隊,他們直接與產品組合作,從根本上理解產品應用程式中的問題。團隊開發的技術,提高了 Cortana 應用體驗。知識技術組:知識技術組專注微軟產品和為市場帶來新的企業智慧應用和服務。和微軟的研究和產品團隊密切合作。他們關注先進技術研究專案的進展,自然語言處理、字檔挖掘、機器學習、知識抓取等人工智慧技術領域。他們結合機器學習和人工智慧與最廣泛使用的線上服務,開發出新奇有趣的產品體驗。語言和資訊技術組:利用人工智慧了解人們如何與資訊系統互動,並開發新功能以提高生產力。他們的研究興趣是資訊檢索、自然語言理解和應用機器學習的交叉點。工作包括分析大規模文本和用戶行為資料,以了解用戶如何與資訊互動,建立從非架構化資訊中擷取知識模型,幫助用戶完成工作並有效尋找資訊。他們的工作應用於內容理解、智慧助理、搜尋、個性化和用戶滿意度建模。機器學習與最佳化組:重點是設計新演算法,使下世代人工智慧系統和應用程式能應用,並回答在學習、最佳化、演算法和數學的基本問題。主要研究領域包括統計和線上學習、凸和非凸最佳化、組合最佳化及其在 AI、統計學和概率的應用。此外,他們的工程機構建立了世界級的機器學習和最佳化系統。機器教學組:一大部分專注於建立新演算法以提高給定資料集上的「學習者」(ML 演算法)準確性。機器教學(MT)組與機器學習相比,側重於教師的效能。如建立一個模型理解控制電視的語音指令。對機器學習模型的需求遠大於建立這些模型的機器教學。所以解決日益增長需求的辦法,是使教學機器簡單、快速、普及。自然語言處理組:自然語言處理組重點是開發處理文本的有效演算法,使資訊能在電腦應用程式存取。感知和互動組:感知和互動小組研究虛擬世界與我們居住的物理世界間的介面。目標是透過感測技術、智慧訊號處理、新的互動型態和理解用戶來豐富介面。他們的工作是建立在感知和互動的基礎上實現這想法,他們也喜歡透過構建工作原型來實現想法。生產力組:微軟是職場生產力的領導者。隨著工作環境的發展,為了保持領導地位,團隊將重點放在人工智慧的最新進展、日益普及的資料以及為人們提供低摩擦方式的新興平台。他們力求使工作更容易更吸引人,使人們更易集中注意力在一個特定環境中,做重要的事。強化學習組:強化學習組致力於自主決策的理論基礎、演算法和系統。主要研究領域包括馬爾可夫決策過程和內文決策過程的泛化。他們的技術已成功應用於許多領域,如線上廣告、建議、網路搜尋、階段作業系統、遊戲和程式合成。由於名單人數較多,以下截圖為部分名單。 Microsoft Research AI (本文由 雷鋒網 授權轉載;首圖來源:微軟)延伸閱讀: 追趕 Google、Facebook,微軟建立人工智慧實驗室 微軟證實將裁員約 3,000 人,未來將專注於雲端業務
被人工智慧支配的恐懼,終於要蔓延到媒體業了。一直以來,有關人工智慧是否會取代人類的討論都在激烈進行。尤其當 AlphaGo 完勝人類棋士後,人類逐漸認識人工智慧的威力,並開始擔憂,仍不斷升級進化的人工智慧可能會讓自己未來失去工作。近日,Google 宣布要拿出 62.2 萬英鎊,投資一個「新聞機器人」專案。據悉,這筆投資將用於英國新聞聯合社(The Press Association)旗下一個名為「記者、資料與機器人」(RADAR)的專案,計劃打造一個由人類和人工智慧協作的新聞網站。之前新聞聯合社已跟英國當地一家新創媒體 Urbs Media 合作,由後者開發一款人工智慧寫稿的軟體。在使用時,新聞機器人會利用網上的開源資料來「編輯」新聞。有人工智慧技術的加持後,它們可以根據特定的撰寫風格和用詞來「模仿」記者的報導,讓文章更個性化。此外,透過機器學習和大數據分析,新聞機器人不僅大大提升寫稿效率,還能有效過濾潛在的假新聞。先前《洛杉磯時報》曾報導過一篇加州將發生 6.8 級地震的訊息,後來還被新聞機器人檢查出來是假消息。每個月能「寫」3 萬篇稿件的新聞機器人,更讓人類記者體會到被人工智慧支配的恐懼。不過在英國新聞聯合社總編輯 Pete Clifton 看來,雖然人工智慧記者有很多優點,但還是無法完全取代人類記者。比如說,雖然在類似公司財報、政府統計資料、民意調查等偏向資料的報導題材中,新聞機器人擁有比人類更快的處理速度和更高的準確率,但在人文類等具感性色彩的內容以及需要深入調查分析的題材方面,新聞機器人就有些鞭長莫及了。專門從事新聞自動化生產研究的 Neil Thurman 教授曾在一項研究中指出,新聞機器人產出的報導品質往往不如想像中高。因此,在 RADAR 計畫中,新聞機器人並不會完全取代人類,而是讓雙方協作來共同完成報導。這麼看來,同為媒體人的我們似乎可以暫時鬆一口氣了。不過就像前面提到的那樣,在資料導向、更追求效率的領域,人工智慧有人類無法比擬的優勢,如果不好好精進自己的撰寫和思考能力,仍停留在一些初級報導,早晚會被機器人記者取代。在 Google 的數位新聞倡議(DNI)網站上,RADAR 放在非常重要的位置。Clifton 表示,這專案能造福傳統的新聞機構、獨立出版商以及部落客。在媒體越來越感到商業化壓力的當下,RADAR 能為新聞工業開啟高效率的新大門。除了英國新聞聯合社,Google 的 DNI 專案還曾資助很多其他研究數位新聞、數位出版的機構,這其中包括半島電視台的 AJ 實驗室應用、虛擬新聞 WikiTripune 等。目前,Google DNI 的投資已進展到第三輪,總投資額達 2,196 萬歐元。(本文由 愛范兒 授權轉載;首圖來源:The DNI Innovation Fund)
水能載舟,亦能覆舟,蚊子一向被視為令人避之唯恐不及的病媒,但微軟研究院的專家突發奇想,將蚊子當作蒐集血液樣本的良好載具,希望可藉此在新興傳染病開始流行前預做防範。微軟內部專家分析包括伊波拉、H5N1 及 SARS 等案例,發現近年新興發展的傳染疾病,不僅威脅人類的健康,也造成經濟上相當大的損失,因此開始發想能預先發現新型疾病及解決方案的方法。根據微軟研究,新型傳染疾病在人類之間開始流行之前,約有 6~7 成早已經在動物間相互傳染,但人類鮮少注意到這類情況;此外,新型疾病的大型傳染,平均在發生兩個禮拜後,才會被疾管單位或衛生單位注意。微軟專家突發奇想,想到能利用蚊子吸食的動物血液為樣本,透過基因比對找出潛在的新型傳染疾病。台灣微軟首席技術與策略長丁維揚表示,產業界這幾年逐漸走向雲端、大數據及人工智慧,這也是微軟未來的方向,微軟從兩年前開始將這些技術應用在疾病防治相關計畫。微軟先前曾公開智慧型捕蚊器,可辨別傳遞茲卡病毒的病媒蚊,並加以捕捉。微軟持續精進捕蚊器功能,利用偵測蚊子振翅頻率的方式鎖住蚊子,並延長蚊子在捕蚊器內的存活時間,確保在平均 12~18 個小時的部署時間後,能取得新鮮的血液樣本。丁維揚表示,微軟與大學及研究單位合作,透過大量快速運算的雲端科技,將血液樣本中的基因資料與現有的細菌、病毒及蛋白質等資料庫做比對,判別其中是否帶有可能引發傳染病的新型病毒。他也說,以傳統方式做基因比對,每批血液樣本約需花費 30 天時間,但利用微軟這項專案中的技術,只要 12 個小時就能快速計算出結果,省去大量時間與人力。微軟過去一兩年也同時在加勒比地區的格瑞那達(Grenada)利用空拍機進行捕蚊熱點環境資料的蒐集工作,讓機器透過濕度、溫度等資料學習,讓部署捕蚊器的工作更智慧化。 Project Premonition (作者:廖禹揚;圖片來源:微軟)
馬斯克(Elon Musk)一直都十分關注人工智慧(AI)的發展,也從不吝於表達對未來的擔憂,近期在一場聚會中,他再度呼籲美國政府應正視 AI 興起的潛在危險,並建議建立監管機構,來指導這項強大技術的發展。華爾街日報報導,馬斯克 15 日受邀在羅德島上舉辨的全美州長會議上演講,他談到 AI 發展可能會出現的幾個最糟的情況,除了可能將威脅到所有人的工作權利,甚至可能引發戰爭。「身處一個文明社會,這是我們會面臨到的最大風險。」除了是特斯拉(Tesla)、SpaceX 等多家科技公司執行長,馬斯克同時也協助創建了 OpenAI,一個宗旨為「安全開發技術」的非營利組織,他認為各州應該儘快深入了解現今 AI 發展的情況,建立監管機構並制定相關規定。馬斯克表示,現在的政府對此渾然不覺,「一旦他們查覺到情況,人們就會開始非常擔憂,他們也應該如此。」一些支持 AI 的人士則認為,有鑑於目前的技術發展狀況,馬斯克的擔憂是為時過早。亞利桑那州州長 Doug Ducey 就表示,他一直致力於推動政府放寬相關規定,而馬斯克卻反而還建議政府制定新規則,他對此抱持質疑。Ducey 指出,他不確定除了拖緩經濟發展的速度,政策制定者還能做出什麼規範,「在我們正面對這些規定時,很驚訝於你還提出增加規範的建議。」對於 Ducey 的疑問,馬斯克表示,他認為多數在發展 AI 的公司──除了他旗下的,都不會贊成新增規範的想法,強調這將「阻止創新」,但說實在的,他非常懷疑新增規範的舉動,真的會讓這些公司決定出走美國。 Elon Musk Lays Out Worst-Case Scenario for AI Threat (首圖來源:Flickr/Web Summit CC BY 2.0)延伸閱讀: 微軟新成立 AI 研究院,13 個研究組都在做什麼? DeepMind 想透過認知心理學,來弄清楚人工智慧的思考模式 《人類大歷史》作者:因為 AI,人類將失去很多力量
手機與虛擬實境設備大廠宏達電(HTC)於 17 日宣布,日前新推出的 HTC U11 智慧型手機將搭配 Amazon Alexa 個人智慧數位助理。透過已在美國上線,且支援功能強大、直覺操作的 Amazon Alexa,無論是在辦公室、在公園、或是在海灘上,只要有 HTC Alexa 即可免觸控以語音喚醒 Amazon Alexa,隨時隨地享受智慧型手機帶來的便利性。宏達電表示,HTC U11 是全球首支結合個人智慧數位助理 Amazon Alexa 的智慧手機,透過 HTC Alexa 應用程式即可在手機未上鎖的情況下,免觸控喚醒隨時待命的 Alexa。藉由簡單的發問,Alexa 就能夠隨時隨地滿足需求。也可透過 HTC Edge Sense 側框擠壓感應技術來喚醒 Alexa,輕鬆任意選擇最適合的操作方式。此外,透過 HTC Alexa 應用程式,使用者也可以聆聽 Amazon 的音樂與有聲書、接收天氣訊息與即時新聞、在家購物及整理工作清單。而隨著愈來愈多智慧居家產品的推出,甚至可以控制各種家電用品。除此之外,還有多達 15,000 種以上的功能可於 Alexa Skills Store 取得。Amazon Alexa 副總 Steve Rabuchin 表示:「透過 HTC U11,使用者現在能隨時隨地使用 Amazon Alexa。使用者能夠隨時透過 Alexa 開啟音樂與新聞資訊、在下班回家的路上先將智慧居家環境中的空調先打開、檢查家中前門是否上鎖等上千種功能。我們相信使用者將會喜歡隨時隨地皆能免觸控喚醒 Alexa 的便利性。」HTC...
眼睛看到的不一定可靠!過去,我們用 Photoshop 修出各種「照騙」,但最新 AI 技術,連影片中談話者的嘴形和聲音都可以修改,甚至逼真到難以從影片中察覺異狀。該研究可將聲音檔轉換為說話嘴形,並套用在其他影片中,改變影片主角原本的說話內容;也就是,雖然影片片段是真的,但說話的內容是假的。僅分析 17 小時歐巴馬演講影片,所需資料量較過去小華盛頓大學研究團隊發表一篇名為「同步歐巴馬:學習如何用聲音同步嘴形」的研究,而研究成果就是一系列美國前總統歐巴馬的「造假」影片。該研究透過深度學習演算法,讓軟體從歐巴馬過去的演講影片中,學習如何將聲音檔轉換為嘴形變化,因此,當替影片配上新配音時,這套軟體可將新配音轉換為嘴形變化,再將嘴形移植到既有影片中。▲ 該研究透過神經網路技術,從歐巴馬過去的演講影片中學習如何將聲音檔轉換為嘴形變化,再將嘴形移植到既有影片中。(Source:UW News)雖然影片中的音檔確實來自歐巴馬過去說過的話,但說話場景卻完全不同。就像示範影片中,左邊是音檔來源,右邊是另一場完全不同的演講,但研究者透過演算法,將兩者結合成全新的影片。研究者表示,之所以選擇歐巴馬為實驗對象,原因在於網路上可輕易取得大量歐巴馬公開談話的高畫質影音檔,適合用來訓練人工智慧。和過去研究不同的是,該軟體不需要掃描大量的演講影音資料,也不需要分析不同人說出相同句子的嘴形,才能學會轉換聲音;其僅需要既有的影音素材即可,所需成本和規模更小。研究者指出,該研究僅分析 17 小時的歐巴馬演講影片就達到此成果,希望未來可以將分析所需影片長度壓縮到 1 小時。希望用於優化歷史影音檔案和視訊工具研究者表示,希望這款軟體可幫助優化歷史紀錄的影音檔案,或是用於改善 Skype 這類的視訊工具品質。例如,用戶可以收集他們自己說話的影片,並用以訓練軟體,之後當他們使用視訊工具時,影像便能自動符合說話內容,因此就算網路連線品質不佳,也能讓視訊畫面保持順暢。不過,外界也擔心,這套軟體若遭惡意人士利用,後果不堪設想。例如,可先利用聲音合成技術模仿出歐巴馬的聲音,再加上這套已經訓練好、可將歐巴馬聲音轉換為嘴形的模型,即可讓歐巴馬說出從未說過的話。事實上,人工智慧新創 Lyrebird 已經透過機器學習開發出聲音模擬技術。該公司號稱,只要 1 分鐘的聲音樣本,即可模仿任何人說話。 New AI research makes it easier to create fake footage of someone speaking AI Lip-Syncing Could Make Fake News Look Real UW’s lip-syncing Obama demonstrates new technique to turn audio clips into...
三星電子(Samsung Electronics)18 日宣布增產 8 GB 第 2 代高頻寬記憶體(HBM2),以滿足包括人工智慧(AI)、HPC(高效能運算)、先進繪圖、網路系統、企業伺服器在內等多項應用迅速成長的市場需求。三星 8GB HBM2 提供業界最高等級的 HBM2 效能、可靠性以及能源效率。HBM2 是在 2016 年 6 月首度對外發表,數據傳輸速度達到每秒 256GB,較 GDDR5 DRAM(數據傳輸速度達到每秒 32GB)高出 8 倍。三星預估 2018 年上半年 8GB HBM2 將佔旗下 HBM2 產量超過 50% 的比重。根據 6 月 19 日公布的 Green500 名單,全球前 500 名節能效率最高超級電腦當中,前 13 名全部都是採用 NVIDIA Tesla AI 超級電腦平台。這 13 台皆採用 NVIDIA Tesla P100 數據中心 GPU 加速器、當中有 4...
DoNotPay 是一個很實用的法律機器人,它以幫助倫敦和紐約司機處理停車罰單而出名。不過最近它的服務範圍擴大了,除了可以對停車罰單提出上訴,還能為美國和英國居民提供一千項法律服務。DoNotPay 用起來其實更像搜尋引擎,只需輸入問題,它就能提供一系列建議。它被稱為律師機器人,普通人遇到技術或法律相關的問題,都可以問它要怎麼辦,比如有建商要在我家旁邊蓋房子怎麼辦?怎麼從房東那取回押金?自 2015 年開始處理停車罰單以來,機器人已發展到包括為愛滋病患提供法律服務、為難民申請庇護、為無家可歸的青少年申請住房、幫航空公司乘客申請賠償等服務。在金融領域,DoNotPay 能幫忙處理詐欺指控,或提升信用報告分數。它還能幫你申請產假和陪產假,保護你免受工作職場的歧視。DoNotPay 的開發者 Joshua Browder 稱,「兩年前我開始開發 DoNotPay,是為了處理停車罰單,當時看到一些律師總會趁人之危。在一些悲劇中,似乎唯一受益於不公正的人是少數律師。我希望 DoNotPay 能透過幫助解決問題,最終賦予每個人平等的法定權力。」DoNotPay 能在地理上擴張,是因為大約 6 個月前,公司聘了 4 名律師,以支援美國 50 個州和英國各地區的機器人。DoNotPay 現在可以根據地理位置提供建議。如果 DoNotPay 滿足不了某人的具體法律問題,Browder 及小組律師仍可將某人轉介給願意幫助他的機構,比如律師事務所或慈善機構。他說:「這對用戶非常好,因為這意味著每個來我們網站的人都能獲得一些幫助,這對我們來說非常有用,因為可以弄清楚將來應在哪些方面開展工作。」DoNotPay 是一個具利他主義目標的機器人,不過它的持續經營能力一直是個問題。但 Browder 表示,公司也考慮營利。「一種方式是透過贊助獲利,我也在和大型公司討論。比如,如果你是洛杉磯最大的汽車經銷商,為什麼不贊助洛杉磯的停車罰單機器人來幫助建立品牌?我認為有很多品牌合作機會,但我永遠不想收用戶的錢。」(本文由 雷鋒網 授權轉載;首圖來源:DoNotPay)延伸閱讀: 不只幫忙申訴違停罰單,英國機器人律師再為街友爭取住處 又被亂開單?英國大學生開發聊天機器人成功替市民申訴數十萬罰單
看到一張張令人驚歎的風景照,都很佩服攝影師捕捉到這些大自然美景,不過 Google 快要讓這些大自然攝影師失業了。Google 正在研發一種全新人工智慧系統,利用 Google 街景的龐大資料庫,自動生成壯大的大自然風景照。這次 Google 就發表了一些成品。Google 正在研發的大自然相片生成系統,將使用 Deep Learning 人工智慧技術,學習哪些風景相片人類認為是漂亮的,進而在 Google 街景龐大的相片資料庫中,生成專業攝影師等級的風景相片。▲ Google 發表利用人工智慧系統「拍攝」的一些作品,圖片上半是完成品,下半是 Google 街景的原圖。這個人工智慧系統最核心的問題,是要分辨哪些畫面以人類的審美觀來說是漂亮的。AI 可以在 Google 街景的相片中,將最佳構圖的相片抽選出來。它更可為斷斷續續的風景照合成、後製修色,製成一張完美的風景照。Google 把這個 AI 系統稱為「Google Photographer」。這次發表的作品,是從加拿大賈斯珀國家公園、美國黃石國家公園的 4 萬張全景相片中抽取而成。AI 可將斷片式的相片合而為一,而且從構圖、彩度、HDR 等級等要素進行詳細分析、修圖,製作出最終成品。▲ 利用人工智慧裁剪、合成與後製風景相片(a)→(b)→(c)→(d)。 Using Deep Learning to Create Professional-Level Photographs (本文由 Unwire HK 授權轉載;首圖來源:pixabay)
各方預期人工智慧(AI)將成未來科技主流,晶片廠 Nvidia 沾光,股價一路暴衝。不過近來新對手逐漸浮現,日廠富士通(Fujitsu)準備參戰,替該公司 AI 微處理器設下超高目標,預期效能為競爭對手的 10 倍。MarketWatch、Top500 報導,富士通在發展晶片方面經驗豐富,該公司是超級電腦「京」的共同開發者,替超級電腦和 SPARC 伺服器生產處理器。富士通自 2015 年開始研發 AI 專用的微處理器「Deep Learning Unit」(DLU),但一直未曾多談發展情況,上個月該公司 AI 平台資深主管 Takumi Maruyama 才透露更多內情。Maruyama 表示,該款晶片包含 16 個「深度學習執行單位」(Deep Learning Processing Element,DPEs),每個內含 8 個執行單位(見下圖),預定 2018 年上市。DLU 目標效能為對手的 10 倍。(Source:富士通)當前 AI 晶片以 Nvidia 為市場龍頭,不過對手日益增加。英特爾(Intel)將推出「Lake Crest」處理器,專為深度學習節點設計。超微(AMD)也準備以「Radeon Instinct」GPU 搶攻相同市場,預料兩款晶片會在未來 6~12 個月內問世。(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)

