早前,米蘭理工大學的 Elena De Momi 博士帶領了一支國際研究團隊訓練機器人,讓它們能夠模仿人類自然的動作。這支研究團隊最新發表在 Frontiers in Robotics and AI(Artificial Intelligence)上的研究成果顯示,人類和機器人可以在一些高風險的活動中展開高效合作(比如手術等),也就是說,或許你下次去醫院就診的時候,迎接你的就不是美麗溫柔的護士小姐了,取而代之的,是機器人。將機器人引入手術的各種環節後,手術的整體安全性會得到極大的提高。因為機器人與人類不同,它們永遠都不會感到疲倦,所以可以完成一系列精準度極高的操作。但值得注意的是,De Momi 博士和她的研究團隊並不是想讓機器人取代頂尖的醫學專家和主治醫師,而是讓機器人參與到手術的過程中,用它們特殊的性質和技能提高手術的成功率,進而造福廣大病患。「做為一個機器人學家,我認為在不久的將來,機器人與人類的溝通協作一定會改變整個工作環境。這裡不單單指醫療健康方面的應用,還包括在其他行業中的應用。更重要的是,機器人的參與並不會使人們失業,相反地,它們會以專業的技術水準完成各種任務,降低人類的工作負擔。」De Momi 博士解釋。那麼,機器人到底是怎樣以高度的專業素養完成一系列任務的呢?De Momi 博士和她的研究團隊設計的實驗過程是這樣的:首先,她們會讓一個人做出與手術操作相關的動作,在這個過程中,研究者會拍攝各種照片。接下來,這些照片資料會輸入到一個機械臂的神經網路中,這對控制手部運動是非常關鍵的。最後,操刀醫生可以就可以指引著機械手臂,讓它模仿人類操刀時的動作。目前,De Momi 博士的實驗結果顯示,儘管機械手臂和人類得動作還不能完全重合,但是相似度還是非常高的。當機械手臂已經能夠完成很多動作的時候,人類觀察員就會對機械手臂的動作進行評估,看這些動作是否符合生物學原理,也就是說,他們會關注機械手臂的動作是否反映他們建立的神經網路能夠高效模仿人類行為。隨著研究的不斷深入,De Momi 的結論可能會得到驗證,也可能會被推翻,但研究團隊依然相信,道路是曲折的,前途是光明的。在不遠的將來,如果機械手臂真的能夠模仿人類動作的話,人們就可以和機器人在各種壓力山大的環境中進行高度合作了(比如手術室中),也就是說,人們接受醫學治療的方式遲早會發生翻天覆地的變化,仔細想想還真是有點興奮呢。 Robots can successfully imitate human motions in the operating room (本文由 雷鋒網 授權轉載)
人工智慧(Artificial Intelligence)的研究和應用在近年爆發,不過因為研究所需成本和知識含量相當高,成了科技巨頭的戰場。不過在競爭的同時,28 日,5 家科技巨頭 Amazon、Google、Facebook、IBM、Microsoft 合夥成立共同研究 AI 的非營利組織,但主要是研究 AI 與人類與社會的關係,像是道德、隱私、可信度等問題,確保 AI 的應用是能夠造福人類和社會。5 家科技巨頭共同成立的 AI 組織就叫做「The Partnership on Artificial Intelligence to Benefit People and Society 」(The Partnership on AI ),在新架設的官方網站中寫到,該組織的目標是找出研究 AI 科技的最佳行為準則,針對特定領域如健康照顧或運輸設立工作小組開發 AI 應用、增進社會大眾對於 AI 的理解、同時作為開放平台討論 AI。而在研究 AI 科技的最佳發展準則部分,該組織也特別提出幾點如:倫理道德、公平性與包容性;透明、隱私、共通性;AI與人類間的合作;科技的可信賴、可靠、強健程度。The Partnership on AI 總共有 10 席董事會,5 家創始會員都有派人出任,而 Google 指派的董事是 DeepMind 團隊成員,該團隊位於倫敦,其開發的「AlphaGo」人工智慧系統曾打敗南韓棋王李世乭 ;另外有學術界的專家、非營利組織人士、政策和道德專家參與,未來也會廣納其他企業參加,甚至促成跨產業的合作。而 5 個創始會員也會貢獻財源以及研究用的資源。會有 The Partnership on...
許多人工作時早已離不開 Gmail、Google Docs、日曆等應用了吧?Google Apps for Work 上線至今約 10 年,Google 在 29 日宣布,將所有工作應用集合在一起,重新取名為「G Suite」,一個更能夠看出它的功能的名字,同時也宣布將機器學習加入這些應用,讓他們能更有效協助人們工作與協作。「G Suite」包括人們熟悉的 Gmail、Docs(文件)Sheets(試算表)、Slides(簡報)、Drive(雲端硬碟)、Calendar(日曆)、Hangouts 等,還有最新發佈的「Team Drives」公用硬碟,Google 也宣示還會有更多。G Suite 產品經理負責人 Ryan Tabone 表示,Google 也希望以此告訴潛在的企業使用者:Google 有這樣一個完整的應用套件,而不只是獨立的應用而已。而 Google 近年來大力發展機器學習,在照片辨識、翻譯等多項應用上都可以看到機器學習的身影,Google 現在也將機器學習放入 G Suite 的部分應用中。像是在雲端硬碟裡,新增「Quick Access」功能,號稱可以省下平均搜尋時間的 50%,就能找到你想要的檔案,他是藉由機器學習,依據你早先輸入過的資訊,預測你現在想要開啟的檔案可能是哪些,這項功能目前只限於 Android 上可使用。 在日曆應用,原本 Android 就有的「Smart Scheduling 」功能也開放至 iOS 應用,同樣是藉由機器學習,依據使用者過去的偏好等,主動建議某個會議的時間,甚至建議可以使用的會議室。 在試算表的「Explore」功能,則可以幫使用者解決困難的公式、函數問題,使用者只要用自然語言輸入問題,Google 就會用自然語言處理功能翻譯你的問題並翻譯為公式,並給你答案,Tabone 說,有 1/3 的試算表使用者不懂得用公式,要讓他們能跳過公式,用自然語言就能發揮試算表的價值。在文件和簡報中,同樣也有「Explore」功能,在文件裡,可以依使用者的內容推薦相關文章、圖片,甚至告訴你在雲端硬碟中有相關的檔案;在簡報裡,可以依據使用者插入的圖片,推薦可以使用者簡報樣式。 G Suite 還有一項新產品「Team...
IBM 超級電腦人工智慧「華生」(Watson)可說多才多藝,上美國益智問答節目奪冠只是輕而易舉,還能為電影剪接預告片、設計服裝、整理食譜、開電動巴士、協助無人機視察行動基地台,甚至挑戰醫學診斷,不過,它的最新任務,卻是回到小學,教 3 年級學生數學。過去兩年來 IBM 基金會與美國教師聯合會(American Federation of Teachers)合作,打造「教師顧問」(Teacher Advisor)人工智慧軟體,這款人工智慧會詢問老師教學問題,以幫助老師們設計個人化的課程計畫。至 2016 年底,華生支援的教師顧問,就能免費協助全美國的 3 年級數學老師。而隨著時間累積學習,教師顧問可增加更多學科,更多年級的課程。3 年級老師為何需要顧問?其實老師的工作可不簡單,在常態分班下,尤其美國學生學力上下落差又更大,在紐約市,一班 3 年級的學生中,可能有 60% 學生的數學能力只有 2 年級程度,而每班的學力差距分布又都有所不同,要如何兼顧優秀學生,又不會讓落後學生跟不上,讓老師們傷透腦筋。在這種狀況下,固定統一的教學指引根本毫無作用,老師們得根據自己班上的情況設計客製化的教學方式。同時,老師們又得為此蒐集許多資料,尋求其他老師或研究者實踐過證明已經有效的教學方法等等。此時華生就能幫上大忙,華生蒐集全美所有教學資訊,供老師詢問,協助老師們打造客製化的教學指引。目前全美有 200 位老師,其中約有 20 人在紐約市,參與華生教師顧問的前期計畫,參與的老師表示教師顧問節省了許多時間,因為所提供的指引來自於數學專業老師,並且教學方法也已經驗證過有效。教師顧問將在 2016 年稍晚正式發表,不過,屆時教師顧問還不會是完成狀態,IBM 還希望持續增加更多內容領域與新功能,更重要的是:增加更多老師與華生互動,如此一來華生就能學到更多。華生先前主要的類似應用是在醫學方面,紐約市史隆·凱特琳紀念癌症研究中心的腫瘤科醫師們,訓練華生研究病人的病史後,提供醫師可行的治療選項,如今在亞洲有 20 家醫學中心使用華生來協助治療癌症。比起治療癌症,小學數學似乎是一項不起眼的任務,不過,有時小朋友可比癌細胞還難搞。華生到底能不能當個好老師,就讓我們拭目以待教師顧問計畫會進行得如何。 Next Target for IBM’s Watson? Third-Grade Math (首圖來源:msn)
根據英國 《金融時報》 的報導,目前總部位於美國華盛頓特區的金融諮詢公司 Promontory Financial Group 於 3 日宣布,該公司已經接受了來自藍色巨人 IBM 的收購要約。收購完成後 Promontory Financial Group 將成為 IBM 的全資子公司,協助 IBM 訓練 Watson 人工智慧系統,以便為客戶提供更好的解決方案,進而應對時刻變化的金融監管內容。不過,兩家公司並未公布正式的收購金額。根據報導指出,IBM 目前正準備成立一個名為華生金融服務 ( Watson Financial Services ) 的新部門,該部門會試圖利用其人工智慧電腦系統華生 ( Watson ) 的強大運算能力,為客戶提供風險評估,以及規範內的諮詢意見。過去 4 年,隨著其核心電腦業務的下滑,IBM 飽受營收下滑之苦。該公司執行長 Ginni Rometty 曾試圖透過專注於分析數據和雲端運算服務等新的商業領域,用以對抗這樣的發展趨勢。在這些領域中,IBM一直在以大量且快速的方式展開投資。其中,在 2016 年上半年就完成了價值 50 億美元(約新台幣 1,570 億元)的收購交易。Promontory Financial Group 則是由 Eugene Ludwig 創辦領導的一家金融諮詢公司。Eugene Ludwig 曾經在前美國總統克林頓執政期間擔任管理美國銀行業的官員。目前,該公司在全球擁有超過 600 名員工,其中許多人都曾在政府金融監管機構任職,現在則是為他們曾監管過的銀行客戶提供諮詢服務。IBM 收購...
2014 年,數次敗戰於智慧硬體的 Amazon 終於發布了 Echo 智慧音箱,這款在 Lab 126 研發權重排名靠後的產品,剛開始面對市場戰戰兢兢,僅採用了邀請購買來試水市場。當時估計沒人想到這款產品竟然出奇地贏下了口碑!於是 Amazon Echo 開始在美國市場大肆推廣,連廣告都做進了超級杯!最近 Echo 開始在歐洲全面發售。Echo 得益於 Amazon 的線上和線下通路,其銷量往上竄,成為了智慧硬體迄今為止在口碑和銷量上都比較成功的產品。Google 顯然坐不住了,2016 年 5 月份的 I/O 開發者大會上,Google 的產品副總裁 Mario Queiroz 以黑色 T 恤和牛仔褲的經典 IT 造型,向大家介紹了 Google Home 智慧音箱。台灣時間 2016 年 10 月 5 日,Google 秋季發表會正式推出了 Google Home 智慧音箱。從 10 月 5 日開始,Google 要與 Amazon Echo 一較高下的 Google Home,可以從 Google...
從人類的視角出發,一張圖片是由物件和背景構成,不過對電腦而言,圖片是由不同顏色的像素構成,很難判斷出哪些是背景、哪些是物體,以及這些物體是什麼。不過,Facebook 人工智慧研究團隊(FAIR)克服這些挑戰,於本月 26 日開源 3 款人工智慧影像辨識工具,成功教電腦如何用人類視角辨識圖像。辨識三步驟:確認是否有物體、描繪物體輪廓、辨識物體Facebook 利用機器學習,讓演算法學習人類的神經網路如何認知物體和環境。例如,讓演算法接收多張綿羊圖片,並且告訴演算法這是綿羊,之後電腦便可以自行辨識出圖片中的綿羊。▲ 右圖為電腦辨識圖片的視角,一張圖片由不同顏色的像素組成。(Source:Facebook)這 3 款人工智慧工具分別為 DeepMask、SharpMask 和 MultiPathNet: DeepMask:辨識圖片裡是否有物體存在 SharpMask:更細緻地描繪出這些物體的輪廓 MultiPathNet:辨識這些物體是什麼 例如,DeepMask 雖然可以找出圖片中有狗和綿羊,卻無法區分兩者,需要仰賴 MultiPathNet 辨識物體;結合這 3 款工具後即為一套影像辨識系統,可以讓電腦在「像素」階段如人類般理解圖像。 ▲ 這套系統已可成功辨識影像,紅線部分為機器未判斷出來的物體。(Source:Facebook)未來目標為影音圖像自動辨識Facebook 在部落格指出,透過影像辨識系統,未來不用特地在圖片上標記物體,也可以用文字搜尋到特定圖片。這項技術對視障者也相當實用,例如,只要用手指輕觸圖片,該系統便可告知圖片中包含哪些物體,讓視障者「看」見影像。此外,這項技術也可加強擴增實境(AR)的應用,例如,偵測出圖片中的三明治含有多少卡路里,或是運動員是否處於良好的健康狀態,以及讓使用者模擬家具放在房間的樣子、試穿虛擬衣服等商業應用。▲ 影像自動辨識技術可加強擴增實境的應用。(Source:Facebook)下一步,Facebook 希望能讓這套工具辨識影片中的物體,不過物體在影片中不斷移動,辨識難度更高。可想見,這項技術將有助於Live直播影片的推廣,可更容易向使用者推薦符合興趣的影片。 Google 也開源人工智慧工具 TensorFlow根據《The Verge》報導,除了 Facebook,Google 也已將類似的人工智慧工具用於圖片搜尋、email 的自動回覆功能、以及搜尋字詞「自動完成」功能,並開源這套人工智慧演算法 TensorFlow。 Segmenting and refining images with SharpMask Facebook is giving away the software it uses to understand objects in photos Facebook opens...
Facebook於 26 日宣布「趨勢話題(Trending Topic)」撤掉人工編輯,不過還不到 3 天,完全依靠演算法篩選熱門新聞的趨勢話題,讓一則關於美國福斯新聞主播梅根‧凱利(Megyn Kelly)的假新聞登上版面。篩選機制仰賴討論數量該則假新聞出自外媒《End The Fed》,內文引述不知名消息來源「Conservative101」,稱梅根‧凱利其實是美國民主黨總統候選人希拉蕊‧柯林頓的秘密支持者,因此遭保守派的福斯新聞解聘。 Megyn Kelly is trending on Facebook for an article that has no basis in reality. pic.twitter.com/31f4ERnzHI — Kyle Blaine (@kyletblaine) 2016年8月29日《TechCrunch》指出,對人工編輯而言,避免這項錯誤非常容易,但 Facebook 篩選趨勢話題的演算法,仰賴該話題相關文章和貼文數量,相對來說較容易讓假消息、騙點擊標題的新聞登上版面。Facebook 在新聞登上趨勢話題幾小時後便下架該則新聞,並對此解釋,由於該則新聞達到演算法顯示新聞的條件,即相關文章和貼文達到一定數量,才被判斷為真實新聞。他們目前正努力讓審查機制更準確,可篩選出假新聞和有疑慮的消息來源。 日前剛裁撤人工編輯團隊今年 5 月,Facebook 前員工向《Quartz》披露,負責篩選趨勢話題的編輯帶有偏見,刻意打壓特定政治立場。在負責主管、Facebook執行長馬克·祖克柏(Mark Zuckergerg)紛紛跳出來滅火後,Facebook 於本月 26 日宣布裁撤趨勢話題的人工編輯團隊,《Quartz》估計約有 15 至 18 人遭資遣。裁撤人工編輯前,Facebook 先以演算法蒐集熱門話題,編輯再負責審查新聞並寫摘要。裁撤編輯團隊後,剩演算法自行運作,根據使用者個人喜好、地點和話題熱門度推薦新聞,唯一人力只剩下調整演算法的工程師。為了讓趨勢話題可以涵蓋更多新聞、觸及到更多人,以及減少外界對人工編輯帶有偏見的疑慮,Facebook 讓熱門趨勢審核機制完全自動化,卻在短短 3 天內出包。《TechCrunch》報導指出,大多數 Facebook 使用者並非新聞工作者,僅有少數人會檢視新聞正確性,也因此,雖然演算法可以找出社群網站中的熱門話題,但多數人推薦的新聞、並不一定是品質高的新聞。Facebook 要讓「趨勢話題」成為有幫助的新聞管道,或許還有一段距離。 After replacing human editors...
中國入口搜尋網站巨擘百度(Baidu Inc.)決心要在人工智慧(AI)佔有一席之地,剛剛在北京舉行的百度世界大會(Baidu World)上,宣布要跟繪圖晶片巨擘 Nvidia Corp. 聯手開發無人駕駛汽車平台,另外還將發表跟亞馬遜(Amazon.com Inc.)聲控揚聲器「Echo」極為類似的家用電子裝置。華爾街日報、VentureBeat、TechCrunch 等多家外電報導,百度執行長李彥宏(Robin Li)1 日在大會上表示,AI 是下一個網路產業大事件,過去覺得不可能的事,現在都能透過 AI 達成,他希望大家能對 AI 和整個中國經濟重新去思考。AI 已成為蘋果(Apple Inc.)、Google 等科技巨擘競相開發的焦點,大廠們相信,只要研究出能讓消費者高度黏著的個人助理和應用程式,就能掌控人們和數位分身的互動介面,這麼一來定能從中獲取巨大利潤。為了進一步拓展 AI,百度 1 日宣布跟揚聲器製造商 Harman International Industries Inc. 合組同盟,共同開發智慧裝置,把 AI 整合到 Harman 的聲控揚聲器內,用戶只要說說話,Harman 揚聲器就能代為執行任務、上網購物並進行網路搜尋。一名發言人指出,百度整合至 Harman Kardon 的 AI 技術包括英文、中文的自動語音辨識系統(ASR)、喚醒裝置詞句(on-device wake word)、自然語言處理(natural language understanding,NLU)、文字轉語音(text-to-speech,TSS)、聲紋解鎖(voiceprint)、推薦系統和對話系統。百度 1 日還宣布跟 Nvidia 合作開發具備 AI 的無人駕駛汽車平台,其作業系統將以演算法為基礎,整合高解析度的雲端地圖,還能偵測不同路況並做出適當反應。Nvidia 執行長黃仁勳在大會上表示,目前全世界還沒有一家公司有能力整合這項系統,將之部署至數百萬輛自駕車,Nvidia、百度計劃把雙方的 AI 專長相互結合,實現這個願景。百度才剛在本周稍早獲得美國主管機關許可,將在加州測試旗下自駕車。百度自駕車早已開始在中國測試,公司宣稱要在 5 年內大量生產。(本文由 MoneyDJ新聞 授權轉載;首圖來源:達志影像)
美國影集《矽谷》(Silicon Valley)中虛構的公司 Pied Piper 開發了一款利用人工智慧的壓縮技術,Google 似乎在其中找到了靈感。根據 Quartz 報導,Google 的研究者開發出了一款利用人工智慧進行圖片壓縮的技術,讓其在大小與品質之間找到最佳平衡點。壓縮是現在社群媒體內容分享的基礎,不管是影片還是圖像,只有讓文件盡可能小才有可能讓內容分享更加順暢,但在這個過程中的品質損失顯然是我們不想看到的,更何況現在的螢幕解析度還在不斷提升。Google 這項技術的原理是什麼?根據論文,Google 首先需要讓人工智慧系統進行有效學習。為此,他們使用了 600 萬張隨機壓縮的 1,280×720 圖片,並分別把每張圖分成若干 32×32 像素的小塊。之後,人工智慧會在其中挑選出 100 個壓縮率最不理想的小塊進行學習。(Source:Digital Trends)經過對這最難壓縮的 100 個小塊進行學習,Google 希望可以提升人工智慧壓縮最複雜數據的能力,進而讓人工智慧在壓縮普通圖片時更加游刃有餘。經過大量學習之後,類神經網路透過複雜的運算可以將圖像解構,將圖像分成若干小塊,並且針對每塊的實際情況「對症下藥」,採取量身定制的壓縮方案,而不是使用統一方法壓縮整個圖像。由此,人工智慧可以在壓縮前預先估計採用不同方案後的壓縮效果,經過一系列複雜的計算選出最佳方法。(Source:Digital Trends)由此一來,它既有效縮減了文件大小,也沒有讓質量打折過多,而且論文顯示,這項技術目前已經在標準測試上優於 JPEG 格式。但是這項技術也有它不完美的地方。首先,圖像品質是個很主觀的方面,機器顯然不會用人類那樣的審美去判定何種壓縮方法最優,而Google 的研究者也坦言,技術上的度量方法與人類審美完全是兩回事。圖像壓縮技術對 Google 來說尤其重要。Google 的照片雲端儲存服務已經提供了不限量的儲存空間,因此 Google 需要盡可能將圖片大小降低,並且不損傷用戶的實際體驗,這項技術剛好可以應用到其中。 Google Photos Is Your New Essential Picture App (本文由 愛范兒 授權轉載;首圖來源:Wired)