星期日, 19 1 月, 2025

科技新知 人工智慧

本文作者為 Andrey Nikishaev,既是軟體開發者,也是創業者。如何成為一名機器學習工程師?經常有人這麼問,這篇文章就嘗試回答這個問題,其中會談到關於機器學習各方面,從簡單的線性回歸到最新的神經網路。你不僅將學習如何使用這些技術,還將學習如何從頭開始建構。這個指南主要針對電腦視覺(CV),這也是掌握一般知識的最快方式,從 CV 中抓取的經驗可簡單應用到機器學習的其他領域。我們將使用 TensorFlow 為框架。這些課程需要你會 Python,雖然不要求你是大師,但至少要懂基本知識(另外,都是英語授課)。溫馨提示,學習知識與動手實踐結合,效果更佳。一、課程1.1 約翰霍普金斯大學的實用機器學習課程總共 4 週,用戶評分:4.4(5 分制,下同)網址:https://www.coursera.org/learn/practical-machine-learning#syllabus1.2 史丹佛大學的機器學習課程總共 11 週,用戶評分:4.9。授課教師是大名鼎鼎的吳恩達。網址:https://www.coursera.org/learn/machine-learning上面兩節課,會教你資料科學和機器學習的基本知識,並為下面的學習做好準備。1.3 CS231n:面向視覺辨識的卷積神經網路總共 16 堂課,目前已更新為 2017 春季最新版本。李飛飛是這節課的導師。網址:http://cs231n.stanford.edu/現在才算步入正軌。這是網路上最好的機器學習與電腦視覺課程。1.4 Google 講深度學習整個課程大約耗時 3 個月,導師為 Google 首席科學家 Vincent Vanhoucke,以及 Google Brain 的技術負責人 Arpan Chakraborty。在這個課程中,將教授深度學習的原理、設計可從複雜的大型資料集學習的智慧系統、訓練和最佳化基本的神經網路、CNN、LSTM 等。網址:https://www.udacity.com/course/deep-learning–ud730選修課。你可以只看其中練習的部分。1.5 CS224d:面向自然語言處理的深度學習總共 17 堂課。網址:http://cs224d.stanford.edu/選修課。建議給那些需要用到 NLP 的同學。課程內容也很棒。1.6 深度學習電子書Leonardo Araujo dos Santos 整理的深度學習電子書。網址:https://leonardoaraujosantos.gitbooks.io/artificial-inteligence/content/選看。這是一本涉及諸多機器學習領域的好書。二、練習這部分給了一堆教程和專案清單,你應該逐一嘗試並了解它們的工作原理,以及考慮如何改進提升。這個清單的存在,只是為了增加你對機器學習的興趣,所以遇到一些困難也別氣餒,當你準備好就可以隨時上手練習。2.1 TensorFlow 上的簡單練習Kadenze 學院出品,總共 5 堂課。網址:https://www.kadenze.com/courses/creative-applications-of-deep-learning-with-tensorflow-iv/info2.2 Tensorflow 食譜這部分內容來自 Nick McClure 的電子書《TensorFlow Machine...
微軟 22 日發表 Project Brainwave,一個基於 FPGA 的低延遲深度學習雲端平台。微軟官方評測顯示,當使用英特爾 Stratix 10 FPGA,Brainwave 不需要任何 batching 就能在大型 GRU(gated recurrent unit)達 39.5 Teraflops 的效能。微軟表示,該系統為即時 AI 設計──這意味著,它能以極低的延遲在接收資料後立刻處理要求。由於雲端基礎設施需要處理即時資料流,不管是搜尋要求、影片、感測器資料流還是用戶互動,即時 AI 正在變得越來越重要。Project Brainwave 的系統可分為三層面: 高效能分散式系統架構。 整合到 FPGA 硬體上的深度神經網路(DNN)引擎。 能 low-friction 部署已訓練模型的編譯器和 runtime。 第一點,Project Brainwave 利用微軟數年建立起來的 FPGA 基礎設施。透過把高效能 FPGA 連線到資料中心網路,微軟可為 DNN 提供硬體微服務支援──把一個 DNN 加載到遠端 FPGA,再由一個 loop 中沒有軟體的伺服器呼叫。這套系統架構既降低延遲,因為 CPU 不需要處理傳來的要求;也能達到非常高的吞吐率,FPGA 處理要求的速度能達到網路接受要求的速度。第二點,Project Brainwave 使用一個非常強大的「軟」DNN 處理單元(即 DPU),並整合到可購買的 FPGA...
IT 大廠正激烈展開「智慧音箱」研發競賽,除亞馬遜(Amazon)、Google 已推出「Echo」、「Google Home」之外,蘋果(Apple)、LINE 也已分別宣布將推出智慧音箱產品「HomePod」、「WAVE」。▲ Amazon Echo 。(Source:Amazon)而日前一度傳出南韓三星電子採用自家人工智慧(AI)語音助理「Bixby」的智慧音箱「Vega」可能已胎死腹中的消息。不過,三星最新出面證實 Vega 還「健在」,且有望在近期內亮相。日本媒體 CNET Japan 24 日報導,三星行動部門主管高東真(Koh Dong-jin)在發表 Galaxy Note 8 之前接受 CNBC 採訪時表示,三星的智慧音箱產品正在準備中。高東真向 CNBC 指出,「(智慧音箱產品)或許有望會在近期發表。已在著手進行相關準備。」另外,高東真還向 CNBC 透露,三星預計會在下週舉行的活動上發表智慧手錶「Gear S」系列的次代新產品。CNET Japan 指出,現在大多數 IT 企業都預估,未來智慧家庭的中心將是智慧音箱而不是智慧手機,今後智慧音箱人氣有望急速狂飆,Strategy Analytics 預估,2020 年智慧音箱全球銷售量有望自 2016 年的 180 萬台暴增至 1,500 萬台的水準。(本文由 MoneyDJ新聞 授權轉載;首圖來源:Flickr/TechStage CC BY 2.0)延伸閱讀: 定價 299 人民幣,小米推出首款智慧音響「小米 AI 音箱」 Facebook 被爆正在研發智慧音箱,2018 年發表 LINE 智慧音箱 WAVE 今夏開賣;找上豐田、FamilyMart 攻...
科技部預計 5 年投入新台幣 160 億元,推動人工智慧(AI)發展。行政院發言人徐國勇轉述,行政院院長林全今天在行政院會中表示,AI 對未來 30 年的國家競爭力是關鍵,對台灣未來發展非常重要。科技部今天在行政院會報告「我國 AI 的科研戰略」,5 年將投入 160 億元執行 5 大策略,預計今年底可先誕生幾處 AI 創新研究中心,以及在中科、南科設機器人製造基地。科技部報告指出,第一項策略是研發服務,將建構 AI 主機,以 4 年 50 億元,整合國內資源,提供大規模共用、共享的高速運算環境,孕育 AI 技術服務公司;第二是創新加值,將設立 AI 創新研究中心,以 5 年為期,每年投入 10 億元,形成世界級 AI 研發聚落,培養充足的 AI 人才。科技部表示,第三是創意實踐,將打造智慧機器人創新基地,4 年預計投入 20 億元,落實機器人軟硬整合與創新應用;第四項產業領航策略,提出半導體射月計畫,4 年將投入 40 億元經費,全力協助半導體業進入 AI,培育頂尖半導體製程與晶片設計人才。最後一項則是社會參與,推出科技大擂台,以擂台賽方式設定重大挑戰課題,廣徵好手參與投入,首波推出「與 AI 對話」競賽,懸賞總獎金 3,000 萬元,首獎 2,000 萬元,以未來 AI 必須的電腦中文聽力理解為競賽主題。林全表示,台灣要擁有完整的 AI 產業,除了需有現有的 ICT 產業群聚及優質的軟硬體人才,如何運用 AI...
LegalTech 是 Legal Technology 的縮寫,就和 FinTech(金融科技)代表利用科技讓金融服務更有效率一樣,LegalTech 指的是透過科技來協助法律服務,雖然這裡的科技泛指任何科技,但實際上對法律服務造成巨大衝擊的,主要是還是「資訊科技」。FinTech 從 2008 年開始受到重視,隨著應用面的推展,也有越來越廣泛的討論。包含第三方支付、虛擬貨幣、P2P 借貸平台以及區塊鏈等的發展,以及越來越多新創公司投入,台灣近幾年對於 FinTech 這個名詞並不陌生。但 LegalTech 並沒有受到它應有的重視,從 2011 年開始逐年備受重視的法律科技,在台灣則乏人問津,除了偶爾「人工智慧是否會取代律師」的零星討論外,鮮少有人認真看待科技可能對法律產業帶來的各種衝擊。沉默的 LegalTech 其實正在造成巨大的影響但衝擊其實已經發生,而且有越演越烈的情勢。就如 FinTech 是由創業公司開始,逐漸影響到金融圈、銀行和保險業紛紛開始導入越來越多科技應用一般。在英美,由創業公司挑起戰火的 LegalTech 也已經延燒到法律圈,包含 Legal Monthly Awards、British Legal Awards 和 Asian Lawyers Awards 等律師獎項,都已經增設了科技類或是創新類的獎項,來表彰律師在科技法律應用的重大成就。Simon Kilgour,世界十大法律事務所 CMS 的合夥人,在 2015 年就以他的保險契約審閱系統「Contract Quality」獲得當年的 British Legal Innovation Awards。而這還只是由法律事務所主導的開發,在新創公司有更多已經獲得初步成功的應用。根據史丹佛大學所成立的法律資訊中心 CodeX 的資料,目前世界各地至少有 700 家法律科技的新創公司,其中 600 家成立在 2012 年後。而這還只是以歐美為中心的統計資訊,若加上中國以及其他亞洲國家,LegalTech 新創公司的數量會超過 1,000 家。不只是新創公司看到了 LegalTech...
還記得 Google 與暴雪娛樂(Blizzard Entertainment)打算讓《星海爭霸 II》成為 AI 研究環境嗎?馬斯克(Elon Musk)的人工智慧 Open AI 最近也將腦筋動到遊戲產業上,不但讓 AI 與《Dota 2》的職業選手對戰,還擊敗了對手。《戰慄時空》開發商 Valve 旗下,目前全球總獎金最高的電競比賽項目《Dota 2》,在日前的比賽中,加入了一段令人驚訝的「表演賽」,由馬斯克的人工智慧 OpenAI 出戰職業選手 Dendi,以 1V1 的方式進行對決,在接連兩場敗北後,Dendi 宣佈棄權不再挑戰與 OpenAI 對打。《Dota 2》是一款 MOBA(Multiplayer Online Battle Arena,多人線上競技)遊戲,每場遊戲由十人分成兩隊,以 5V5 的方式進行,MOBA 遊戲強調各種資源獲取、戰術應用、團隊合作以及玩家對遊戲概念與操作的掌握度,瞬息萬變的遊戲過程讓全世界玩家愛不釋手,包括《英雄聯盟 League of Legends》、《傳說對決》等都是 MOBA 類型遊戲。而這也是 AI 繼挑戰高難度的圍棋後,第二次在高難度的比賽項目中擊敗人類。馬斯克本人也隨即在 Twitter 上發文表示,這是 OpenAI 首次在比西洋棋和圍棋更為複雜的電競項目中擊敗了人類,言下之意似乎在暗指 AlphaGo 打敗世界棋王不過爾爾。 OpenAI first ever to defeat world’s best players in...
Google 研究團隊產品經理、醫學博士彭浩怡(Lily Peng)近日分享深度學習應用於醫療領域的進展,看好影像辨識精準度不斷提升與發展潛力。Google 台灣董事總經理簡立峰認為,台灣具有資通訊和醫療領域優勢,兩者在 AI 人工智慧時代會有更好的交集,值得跨領域結合投入 AI 醫療應用,而長照智慧型輔具也是發展方向之一。簡立峰提到,過去一直強調要有大數據才能投入 AI 應用,實際上在單一領域應用裡不見得需要非常大量的數據資料。他以彭浩怡所研究的視網膜病變診斷應用為例,說明研究團隊以近 13 萬張視網膜眼底影像,經由專業眼科醫生判讀分級並建立模型,這樣的資料量對台灣來說應不至於蒐集不到,尤其台灣擁有健保制度也建立許多醫學中心,所具備的醫療資料相當可觀,加上台灣在資通訊領域優勢,若要運用 AI 進一步投入影像辨識和醫療研究,以基礎來說台灣不僅擁有資料,也具有深度學習平台與環境。「如果說有很多法規限制不能走太快,有個辦法是醫學中心內部先行,」簡立峰認為台灣各大醫院都有各自體系,可以從內部體系先行,這是其他國家難以比擬的優點。他指出,醫生與 AI 之間的最大差別,就是醫生準確率很高但涵蓋率不夠高,無法全面性判讀影像;AI 相對全面但也可能判讀錯誤,所以看好醫生結合 AI 輔助,「這不是 AI 跟醫生的競爭,而是病人能從中受益,」他說。儘管台灣在醫療和資通訊領域具有優勢,教育問題卻是眼前一大瓶頸,特別是跨領域發展。簡立峰表示,台灣科系在大學甚至在高中時期就已分流,想發展新領域又不一定有教授願意投入,從事既有領域的教授也不會在沒有誘因之下轉換領域,學生想學習新領域自然困難,這是台灣必須重視的問題。另外,發展 AI 醫療領域也要思考長照問題,在高齡少子化問題日趨嚴重、長照人力明顯短缺的情況下,未來 AI 對長照的重要性會更顯重要。簡立峰建議台灣科技部推動 AI 發展,可為長照研發智慧型輔具,不見得一定要發展機器人,但自動輪椅、無電梯公寓上下樓輔具等都是發展方向,「台灣要發展 AI 值得從現在開始投入長照,大概 10 年、20 年就可以收割,」他相信為長照發展的智慧型輔具擁有內需市場。簡立峰強調,醫學對全人類來說都是好事,現在在資訊科技和醫學領域投入更多,將能加速未來科技進展。透過 Google 研究團隊所分享的 AI 醫療輔助診斷應用實例,可見目前實驗平均結果達到與醫生相同甚至更高水準,未來人們在醫學影像判讀上或許會愈來愈依賴機器,但有個最終重點,「醫生是做決定的那個人,」簡立峰一語表達醫生無可替代的重要性。(首圖來源:《科技新報》攝)延伸閱讀: 以深度學習判讀腫瘤定位、糖尿病視網膜病變,Google:AI 與醫生合作可達理想成效 Google 台灣董事總經理簡立峰:服務思惟決定台灣硬體未來 Google 台灣董事總經理簡立峰:從未看過硬體如此重要
在 AlphaGo 打敗世界頂級的圍棋選手之後,人工智慧(AI)的發展已經讓世界感到驚奇,但 DeepMind 並沒有停下腳步,根據了解,他們最近又讓 AI 具備了一項人性化的技巧──打個瞌睡,休息一下。AI 在近代之所以能持續發展,主要得歸功於新的統計方法和電腦處理能力的進步,但 DeepMind 指出,事實上在神經網路開發的關鍵工作,多半不是由數學或物理實驗室,而是由心理學和神經科學協助開發,這兩項科學的貢獻經常被人忽視。DeepMind 相信,神經科學能幫助驗證已存在的 AI 技術,確定技術發展是否處在正確軌道上,也能為新型演算法和架構提供豐富靈感來源,讓工程師透過了解對認知功能至關重要的生物運算資訊,來建構人工智慧的「大腦」。近期在神經科學上,就發現了一個在「離線」狀態下重複體驗經歷的狀況:當生物處在睡眠或休息期間,大腦會重播在先前活躍期間的神經元活動序列,就好像是精神上重播過去的活動,並藉此改進未來的行為。因此儘管乍聽之下,建造一個會「睡覺」的 AI 似乎違反直覺──畢竟 AI 理想中應該是要不眠不休的工作,但這個原則其實是 Deep Q Network(DQN)演算法中一個非常關鍵的部分。DeepMind 表示,運用 DQN 演算法,研究人員只需要輸入原始像素和數據,就可以讓 AI 掌握雅達利(Atari)2600 上各種類型的遊戲,並且發揮如超人的水平。之所以能做到這件事,就是因為 DQN 演算法運用經驗回放(experience replay)功能,在「離線」狀態下回顧存儲數據的訓練模擬經驗,藉以從過去發生的成功、失敗經驗中重新學習。無論神經網路、AI 還是機器學習,研究人員正試圖做到的,就是教導電腦如何自己計算、歸究出一些結論。畢竟考量到實際應用,自駕車得對交通狀況進行決策,分析數據的演算法必須決定如何歸類資訊,AI 則得學會和人一樣思考,這些發展才真正有意義。Google 最新提出的這個方法,意味著系統不再需要保持連線才能解決問題,它能先全力運轉弄清楚問題的重點,並在斷線後的「夢境」中整理這些資訊,然後再次連線後完成任務。 Google’s DeepMind AI has a new trick: taking a nap AI and Neuroscience: A virtuous circle (首圖來源:shutterstock)延伸閱讀: DeepMind 創辦人:AI 要展現出真正潛力,得從人類智慧中獲得更多靈感 DeepMind 想透過認知心理學,來弄清楚人工智慧的思考模式
由於 AMD 新發表的 RX Vega 顯示卡功能強大,被熱於比特幣挖礦者用來挖礦之用,也讓市場為之瘋狂,造成一度供不應求。在 RX Vega 顯示卡亮相後,大家的焦點又放在 AMD 下一代顯示卡。根據 AMD 日前釋出的發展路線圖,可確認的是下一代顯示卡代號為 Navi,將採用 7 奈米製程生產,屆時無論在性能、核心面積、功耗上都會有重大提升。更令人驚豔的是,AMD 下一代顯示卡將會具備 AI 運算功能,全力搶攻 AI 運算市場。根據 AMD 提出的發展路線圖顯示,雖然 Navi 顯示卡載明將會是 2018 年亮相的產品,但是,實際上這一代 Vega 顯示卡的推出已延遲了許多。再加上 Navi 將會搭配 「可拓展的下一代顯示記憶體 」(Scalability Nexgen Memory),這部分猜測將會是 GDDR6 顯示型記憶體,其最早量產時間為 2018 年上半年。還有就是 7 奈米製程真正量產時間目前依然未確認的情況下,以此推測,在最佳的情況下,2018年下半年就或許可以見到 Navi 的身影。考量 Navi 將會搭配 GDDR6 顯示型記憶體,而不是高端的 HBM 2,有可能將會是與 Polaris 定位相仿的中低階產品。不過,在競爭對手 NVIDIA 全力擁抱 AI、深度運算、機器學習領域多年後,發展出屬於自己的計算架構平台。並且,在新的 Volta...
剛過去的週末,OpenAI 的人工智慧只花 10 分鐘就打敗了人類 Dota 世界冠軍。正如許多讀者所知,遊戲是許多研發人員用來訓練人工智慧的工具。在 OpenAI 位於舊金山的辦公室裡,研究人員 Dario Amodei 正在透過《賽艇大亨》(Coast Runners)來訓練人工智慧。不過,這個人工智慧好像有點失控了。《賽艇大亨》的遊戲規則很簡單,如果想贏,選手必須得到最高分,然後跨過終點線。但 Amodei 的人工智慧玩著玩著有點過火了,不斷追求高分,非但毫無跨過終點線的意思,反倒為了要多轉幾個圈拿高分,開始和其他賽船碰撞,或是過程中自己撞牆爆炸了。為了應對,Amodei 和 OpenAI 的同事 Paul Christiano 正在研發一套不僅可以自我學習,同時也願意接受人工監控的算法。在賽船遊戲的訓練中,Amodei 和同事不時透過按鍵指出人工智慧的不當之處,告知人工智慧,不僅分數要贏,同時也要跨過終點線。他們認為,這種包含人工干預成分的算法可確保系統的安全性。Google 旗下 DeepMind 的研究人員也同意 Amodei 和同事的想法。兩個團隊,分別代表 OpenAI 和 DeepMind,最近罕見地合作發表了部分人工智慧安全方面的研究論文。除此之外,Google 旗下的 Google Brain,以及來自柏克萊大學和史丹佛大學的研究團隊,都設有該方向研究課題,從不同方面考慮人工智慧的安全問題。除了這種在自我學習過程中「搞錯重點」的潛在危險,另一個可預想的人工智慧危險在於「為了完成工作,拒絕開發者關機」。一般在設計人工智慧時,研發人員都會給它設定「目標」,就像賽艇遊戲的「得分」。一旦人工智慧將獲得「分數」視為終極目標,它可能會產生一個方法論──想要獲得更多分數,其中一個方法就是不關閉自己,這樣就能無止境地獲得分數了。柏克萊大學的研究人員 Dylan Hadfield-Menell 和團隊最近發表了討論這個問題的論文。他們認為,如果在設計演算法時,讓人工智慧對目標保持一定的不確定性,它才有可能願意保留自己的「關機鍵」。他們採用數位方式來嘗試達成此設定,目前還處於理論階段。除了人工智慧自我「失控」,研究人員還在考慮駭客對人工智慧的影響。現代電腦視覺基於深度神經網路(deep neural networks),它透過學習分析大量資料來形成對型態的了解。也就是說,如果要讓電腦學會什麼是「狗」,那就讓它分析大量狗的圖片,並從中搜尋規律。但 Google 的 Ian Goodfellow 認為,這種型態可能會為駭客提供「矇騙」人工智慧的機會。Goodfellow 和其他研究人員曾展示,只要修改圖片的幾個特定畫素,他們就能讓神經網路相信圖片中的大象是一輛汽車。如果這個神經網路應用在監視鏡頭,問題就大了。即便你用了數百萬張標記為「人」的照片來訓練一個對象辨識系統,你還是可以輕易拿出系統和人工辨識 100% 不同意的圖片。我們需要認清這種現象。Goodfellow 說。雖然這些研究大多仍處於理論階段,但這群致力將意外止於搖籃裡的研究人員堅信,越早開始考慮這個問題越好。DeepMind 人工智慧安全的負責人 Shane Legg 說:雖然我們還無法確定,人工智慧將以多快速度發展,但我們的責任是試著理解並猜測,這種技術有可能以哪種方式誤用,並嘗試找出不同的應付方式。 Teaching A.I. Systems to Behave...