據富比士雜誌報導,我們每天能產生 2.5EB(約 10 億 GB)數據,這相當於 25 萬個美國國會圖書館或 500 萬台筆記型電腦記錄的內容。我們有 32 億個全球網際網路用戶,他們每分鐘在 Pinterest 上發表 9,722 個 Pin,在 Twitter 發表 347,222 條推文,在 Facebook 上留下 420 萬個「讚」,我們還透過拍照和影片、保存文件、打開帳戶等行為產生其他大量數據。我們正處於傳統電腦數據處理能力的極限,但數據還在不斷增長。雖然摩爾定律(Moore’s Law)預測集成電路上的晶體管數量每隔兩年就會翻一倍,但自 1965 年這個術語出現以來,事實證明它有很強的彈性。隨著技術進步,晶體管現在的體積越來越小。正因為如此,業界領導者展開激烈競爭,看誰能首先推出一款比現有電腦更強大的量子電腦,處理我們每天產生的所有數據,並解決日益複雜的問題。量子電腦能快速解決複雜問題當這些行業領袖成功製造出商業上可行的量子電腦時,這些電腦就有可能在幾秒內完成龐大的計算量,這些任務可能需要傳統電腦花費數千年時間才能完成。今天,Google 宣稱已擁有這種量子電腦,據說它的速度比當今任何一種計算系統都快 1 億倍。如果我們能用它處理生成的大量數據並解決非常複雜的問題,那將至關重要。成功的關鍵是把現實世界的問題轉化為量子語言。我們生成的數據集之複雜性和增長規模,遠比計算技術進步快得多,因此對計算結構造成相當大的壓力。雖然今天的電腦難以解決或無法解決某些問題,但這些問題預計將被量子電腦在幾秒鐘內破解。據預測,人工智慧(AI),尤其是機器學習,可從量子計算技術的進步中獲益,且還會持續下去,即使在完整的量子計算解決方案出現之前。量子計算法使我們能增強機器學習的能力。量子電腦將優化解決方案量子計算促進數位革命的另一種方式是,我們能採樣數據,並最佳化遇到的各種問題(從組合分析到最佳遞送路線等),甚至能幫助確定每個人的最佳治療方式和醫療方案。我們正處在大數據增長的關鍵點,我們已經改變了電腦架構,這就需要用不同的計算方法來處理大數據。它不僅規模更大,且要解決的問題也不同。量子電腦更能有效解決連續性問題,給予企業甚至消費者做更好決策的能力,這正是說服企業投資新技術方面所需要的。量子電腦可辨識大數據集中的模式預計量子計算能搜尋非常大、未排序的數據集,以非常快的速度發現模式或異常。量子電腦可同時訪問數據庫所有條目,在幾秒鐘內辨識出相似點。雖然這在理論上可行,但它只發生在並行的電腦上,且只能以一個接一個的方式查看每條紀錄,所以它花費大量的時間;取決於數據集的大小,它可能永遠不會成為現實。量子電腦以幫助整合不同數據集的數據此外,由於可用於整合不同的數據集,量子電腦有望獲得巨大突破。雖然這在沒有人類介入的情況下可能很困難,但人類的參與將幫助電腦學會未來如何整合數據。因此,如果有不同獨特模式的原始數據源,並有研究團隊想要比較它們,那麼在數據比較值錢,電腦就必須理解模式之間的關係。為了實現這個目標,需要在分析自然語言的語義方面取得突破,而這正是 AI 面臨的最大挑戰之一。然而,人類可以提供輸入,然後訓練未來系統。最終,量子電腦將允許快速分析和整合龐大的數據集,這些數據集將改進和改變機器學習和 AI 能力。(本文由 36kr 授權轉載;首圖來源:pixabay)
麻省理工科技評論(MIT Technology Review)7 日報導,奇異創投(GE Ventures)子公司 Avitas Systems 現在透過無人機或機器人,讓油管、電力線以及交通系統的檢查工作得以自動化。Avitas 利用現成的 Nvidia 機器學習技術(DGX-1系統)來引導檢查流程、自動地從收集的影像數據中找出可能的異常之處。Avitas 創辦人 Alex Tepper 表示,客戶過去得花數億美元,派人去偏遠地區手動檢查設備。無人機或機器人可重複多次地自動收集相同地點的影像],因此能夠輕鬆地察覺異狀。Avitas 預估這樣的自動化檢查方式每年可為一家煉油廠省下 100 萬美元的檢修費用。Nvidia 部落格 7 日報導,Avitas Systems 透過 NVIDIA 人工智慧(AI)超級運算平台「DGX-1」所提供的 AI 服務可讓機器人自行穿越工業場所,探索人類無法踏上的地方。Avitas 利用電腦視覺技術學習檢測故障並創建目標區域、組件需要維修或汰換更新的熱圖,並根據風險機率排定維修的先後順序。NVIDIA 連續 3 年名列麻省理工科技評論年度「50 家最聰明企業(50 Smartest Companies)」名單,2017 年更是高居第一名。(本文由 MoneyDJ新聞 授權轉載;首圖來源:NVIDIA )
若你是一個喜歡按讚的人,每當朋友在網路上發表照片或影片,你總是習慣性去「捧場」,或你更喜歡默默欣賞;又或許對自己的網路動態,你很想知道別人的真實想法是什麼……單純按讚,似乎無法滿足人們的網路社交生活了。一款名叫 Polygram 的社群應用軟體應運而生。Polygram 是一款集發表照片、影片和訊息為一體的社群軟體,目前僅支援蘋果手機免費下載。它利用人工智慧技術捕捉人的臉部表情,並即時轉化為 emoji 表情。Marcin Kmiec 是 Polygram 的聯合創始人之一,他稱 Polygram 的人工智慧系統並非只簡單抓取臉部特定部位,如瞳孔或鼻子,而是透過神經網路技術捕捉用戶的臉部表情,並快速分析一系列圖像。Marcin Kmiec 說,Polygram 會利用 iPhone 的前置鏡頭和圖像處理器,這樣,用戶就能在手機上完成整個臉部辨識過程。雖然 Facebook 平台除了有按讚的圖標,還提供一些其他設定好的表情,但 Polygram 有自己的獨特之處:它能即時執行手機本地程式,運用神經網路技術,辨識出你微笑、皺眉、無聊、尷尬、驚訝及更多表情。當你瀏覽該 App 貼文時,你會發現有一張小黃臉出現在底部,它會隨著你的表情變化而即時改變。當然這個「即時」還是有誤差,大概有約 20 毫秒的輕微延遲。Polygram 會記錄你的反應表情,並保存在表情框中。另外,在同一篇貼文的表情框,你還可以看到其他人瀏覽完的反應表情。對於熱愛滑動態又在意別人看法的人來說,Polygram 為他們帶來福音:用戶在社群平台發表照片、影片等內容後,就能看到所有瀏覽者的表情回覆紀錄,還包括其他細節,比如誰看了這些貼文、看了多長時間,以及瀏覽者所處的地理位置。(Source:iTunes)但是有的用戶比較注重隱私,即使可以匿名,他們還是擔心自己的一舉一動被追蹤。App 研發者很清楚,開發出一款成功的社群軟體並不容易。並不是所有 App 都能像 Instagram 或 Snapchat 一樣,最終在市場上站穩腳步(還記得 Secret、Path、Yik Yak 和 Google+嗎?)Polygram 開發者說,目前這項臉部辨識技術僅運用於自己這款 App。不過,將來也有可能拓展到其他應用,比如 Telemedicine App,這樣醫生或護士就能看到患者的真實表情反應,進而判斷他們的心理反應。「或許未來我們會發表該軟體的工具包,允許其他開發者在自己的軟體運用這項技術。」 Polygram 開發者補充。 The Next Generation of Emoji Will Be Based...
鑑於數據、計算力、演算法等諸多門檻,自神經機器翻譯(NMT)產品化以來,很大程度上便是網際網路巨頭的競技場。如今,又一個新的挑戰者高調加入,直接把矛頭指向堪稱行業技術標竿的 Google、微軟及 Facebook。上週,來自德國的 DeepL 翻譯上線,號稱實現了 NMT 技術的新突破,打造出「世界上最精確、語言組織最自然的機器翻譯系統」;並宣布在自家組織的盲測中,打敗了 Google 翻譯、微軟與 Facebook 的 NMT 系統,挑釁意味十足。目前,DeepL 翻譯已支援英德法西等 42 門歐洲語言,正在訓練漢、日、俄等語言,並計劃將來發表一款 API,讓開發者能將 DeepL 翻譯整合入其應用。公司前身首先要說,這家公司的來歷並不簡單。公司前身是營運近十年的線上外語詞典 Linguee,DeepL 翻譯也完全由 Linguee 團隊打造。Linguee 在中國沒什麽存在感,至於在海外……有 Google 翻譯專美於前,存在感也不是很高,但還是有一批認可它的用戶。▲ Linguee 的英漢、漢英詞典介面。(Source:Linguee)不過,Linguee 的成敗現在已不重要了,它在今年正式更名 DeepL,以「Deep」提醒 VC 自己是一家正經的深度學習公司。真正重要的是 Linguee 的技術積累。Linguee 由 Google 翻譯前研究員 Gereon Frahling 在 2007 年離職開發,2009 年正式上線。Linguee 的核心優勢是它的爬蟲和機器學習系統,前者抓取網路上的雙語對照翻譯,後者評估這些翻譯的品質。兩者結合,使 Linguee 成為當時「世界上首個翻譯搜索引擎」。十年積累,Linguee 無論數據或演算法的研究都不可小覷。▲ 去年在倫敦 Noah 演講的 Gereon Frahling。(Source:YouTube )一年前,研究團隊著手欲實現一個新目標:利用在機器翻譯領域的多年專業積累,打造一套業內最先進的 NMT 系統。這便是...
林全內閣在「亞洲矽谷」計畫備受批評之後,發回國發會重新寫成「亞洲‧矽谷方案」,其中再度強調「工業 4.0」(也就是相當於舊政府的所謂「生產力 4.0」)還列出「一大生態體系、兩大主軸、三大連結、四大推動策略」洋洋灑灑大塊文章,讓人對國發會的作文能力十分刮目相看,竟然隨時都可以湊出個一二三四來。產業界過去對政府推出的許多遠大口號,若不說是餘悸猶存,至少也是如人飲水、冷暖自知,歷經政黨輪替下來,不管哪黨執政,政府都好大喜功,總是編造一些定義不清、前景不明,連自己都搞不清楚的名詞,甚至同一名詞不斷改名重複炮製,編造誇大的預期成效數據,行銷成執政者很有方向感的樣子大肆推動,產業界雖然心存懷疑,但是在政府投注巨量資源之下也不得不低頭,被迫跟著一唱一和,不敢當那個戳破國王沒穿新衣的孩子,在這樣盲人騎瞎馬的情況下,不論是「亞洲營運中心」還是「兩兆雙星」都成了泡影。當然,類似現象也不只台灣才有,各國政府都有要提出遠大願景的壓力,也不是只有政府才會胡亂炒作名詞,產業界與媒體界也會重複炮製名詞炒作議題,最明顯的例子莫過於所謂「大數據」,在兩岸炒作大數據議題火熱的關頭,許多資深資訊業界人士,一聽到往往反射式的回應:不就是所謂「機器學習」或「資料探勘」嗎?其實正是,1959 年起定義的機器學習,即發展演算法,讓電腦人工智慧能在並未事先指定特別方向或任務的情況下,從大量資料中找出資料中的關鍵之處或是異常之處,可逐步學習,並有預測能力。把時間往後推到如今的 2016 年,產業界的運算能力使得機器學習可發揮驚人的水準,其成就表現於 AlphaGo 以「深度學習」擊敗人類圍棋棋士,於是「深度學習」又一時成為當紅的新名詞,其實不過就是過去被遺忘的機器學習。如今深度學習已經開始應用於許多領域卓然有成,但 1959 年時,人類掌握的運算能力還不足以讓機器學習產生太大的有意義成果,結果到 1960 年代開始出現「資料釣魚」或「資料挖泥」的貶稱,因為統計學家嘲笑這種不設定預設假說、只是丟進一堆數據就想分析出成果的想法是異想天開,說是跟挖爛泥巴沒兩樣,機器學習這個名詞蒙塵,遭扔進爛泥堆,但是電腦科學家的理想不變,到了 1990 年,又發明了新名詞,這次叫「資料探勘」,強調從大量資料中找出關鍵或異常資訊的能力。資料探勘這個名詞風行了好幾年,也的確有許多應用,但從 1990 年開始喊,到 2000 年已經成了 10 年前的老名詞,又感覺不大新潮了,於是全球的產業顧問界為了創造新流行,在 2001 年又新發明出「大數據」,強調巨量、即時、多樣化的資訊經由機器學習處理的應用,其實本質上與過去的機器學習、資料探勘並無二致。同樣一件事,進入馬政府於 2015 年對德國「工業 4.0」有樣學樣提出的「生產力 4.0」計畫中,又提到生產力 4.0 將運用的技術之一是「巨量資料」,也就是大數據、也就是資料探勘、也就是機器學習,這是一路追溯到 1959 年的舊觀念,如今應用早已經相對成熟,譬如在台灣,健保局於健保 IC 卡化後,利用資料探勘,察覺出診所申報的看診情況異常,再針對這些異常資料的診所進行實地檢查,果然發現其中有部分診所有詐騙健保的行逕,這就是一個相當成功的資料探勘應用。早有實際應用,卻寫入了生產力 4.0 之中,成為「專家們普遍預期到 2030 前才有機會實現」的最新未來技術。 德國對工業革命歷史的詮釋有謬誤學者與市場人士都曾揶揄,所謂生產力 4.0 很快就會消失,因為政黨輪替又會包裝出一個新口號,就像機器學習被不斷改名重複炮製成新口號、重新炒作議題的歷史一樣,不過,目前新政府並未打算這麼做,只是把生產力 4.0 還原回原本德國的工業 4.0,對業界來說,一則以喜、一則以憂,喜的是至少新政府不打算浪費大量心力胡亂創造新口號,產業界可以省下很多無謂的應付心力,憂的是所謂生產力 4.0 本來就定義不明,前景模糊,蕭規曹隨下去也不知會走到哪去。整個工業 4.0 風潮,始作俑者是德國,2011 年時,德國提出了工業 4.0 的想法,其主要概念認為一般我們所稱的 18、19 世紀工業革命,只是「第一次工業革命」,代表的是蒸汽動力的技術革命,19 世紀末到 20 世紀初則因為普遍引進了電力、電動馬達,視為「第二次工業革命」,代表的是電力相關的技術革命,而 20 世紀末到...
美國人工智慧業界,今天起風了。三大領軍企業 Facebook、微軟和 Google 之間的關係發生了重大的變化:Facebook 和微軟結盟,推出一套開放神經網路交換格式(Open Neural Network Exchange,ONNX),提升兩家公司主導的神經網路框架格式間的互通性。 ▲ 已確認支援 ONNX 的 3 種深度學習框架:Caffe2、CNTK 和 PyTorch。給非神經網路專業人士簡單解釋一下怎麼回事:人工智慧的實現技術主要是深度學習神經網路,而神經網路訓練和使用(推理)通常採用一種主流的深度學習框架或程式庫,主流的框架或程式庫和主導者、主要支援者有以下這些:TensorFlow(Google)、Caffe / Caffe2(Facebook)、CNTK(微軟)、MXNet(亞馬遜為主)、PyTorch 等。不同框架有不同優勢。比如 PyTorch 出現很早,學術界擁護者很多,用它訓練神經網路取得的效能更好,用專業術語來說叫做 state-of-the-art(目前水準最高的)。PyTorch 是 Facebook 主導,FAIR(Facebook 人工智慧研究院)都用它。但 Facebook 還有一個學術大神、在知乎上活躍度很高的賈揚清帶隊開發的 Caffe2 框架,這個框架的極限效能並不一定最出眾,但優勢是非常適合在終端機裝置(比如手機甚至內嵌式裝置)執行。Facebook 的產品很多都依賴 Caffe2。這些框架之間的互通性過去並不好,大部分沒有。為什麼需要框架間有互通性?情況一:有時候另一個框架或程式庫某個模型效能更好,但和你的整體專案不相容;情況二:因為框架 A 表現很好,你用它訓練了一個神經網路,結果你公司的生產環境用的是框架 B,這意味著你的研究成果沒法投產。想想,Facebook 一家公司內就有兩種主流框架,工作起來不累嗎?如果你還不太理解這種尷尬,就想像你寫一個程式:大部分程式碼都用 A 語言來寫,但某個很重要的組成部分已有現成的開源,用的是 B 語言,但這兩種語言之間沒有很好的互通機制,無法共同工作,所以你只能繼續用 A 寫,結果就是不僅累且效率低。Facebook 和微軟今天合作就是為了解決這個問題。根據雙方透露的情況,9 月內,CNTK、Caffe2 和 PyTorch 都會發表更新,支援新的互通格式 ONNX。Facebook 和微軟說,他們期待人工智慧的學術研究和工業生產的世界是一個開放的生態,而 ONNX 是他們走向開放生態的第一步。如果你相信了,那你可能太年輕了:這次合作並沒有 Google 的事。Google 是...
本文為整理作者阿薩姆在知乎「未來 3~5 年內,哪個方向的機器學習人才最緊缺?」問題下的回答,對機器學習有興趣的朋友不妨參考看看。既然身在業界,那麼我就談談業界未來幾年需要什麼樣的機器學習人才。不談學界主要還是因為大部分人最終不會從事研究,而會在應用領域奮鬥。相較而言,業界對人才的需求更保守,這和學界不同。這受限於很多客觀因素,如硬體運算能力、資料安全、演算法穩定性、人力成本開支等。這個答案可能更適合兩類人:1. 在校學生。2. 工作不久想轉行的朋友。特別厲害的技術大腕建議探索適合自己的路線,而我只能談一談適合大部分人的路線。在回答前,我還是忍不住吐槽那種簡單回答 「深度學習」、「大數據」、「NLP」、「機器視覺」的人。以上領域的小方向多如牛毛,以自然語言處理(NLP)為例,細分有自然語言生成、自然語言理解,還有不同語言的語言模型。任一個方向花幾十年研究也不為過,只給幾個字答案和買彩券有什麼差別……因此大部分機器學習實踐者還是腳踏實地吧。盲目追逐熱點很容易跌進陷阱,而鞏固基礎、尋找自己擅長的領域和機器學習交叉點,可幫助你在就業市場保持炙手可熱,成為業界最想要的人才。0. 背景工業界未來需要什麼樣的機器學習人才?老生常談──能將模型用於專業領域的人,也就是跨領域讓機器學習落地的人。有人會問現在不就需要這樣的人嗎?答案是肯定的,我們需要並也長期需要這樣的人才,現階段機器學習落地還有各種各樣的困難。這種需求不是曇花一現,這就跟 web 開發是同樣道理,從火熱到降溫也過了十年。一個領域的發展有特定週期,機器學習的門檻比 web 開發高且正在日出期,所以大家致力於成為「專精特定領域」的機器學習專家不會過時。什麼是特定領域的機器學習專家?舉個例子,我以前曾回答 「人工智慧會否取代財務工作者」 時提到,我曾在某個公司研究如何用機器學習自動化一部分稽核工作,但遇到的最大困難是我自己對稽核的了解有限,而其他稽核師對我的工作不是非常支援,導致進展緩慢。所以如果你有足夠的機器學習知識,並對特定領域理解良好,職場供需中你肯定站在優勢方。以一個問題「阿薩姆:反欺詐(Fraud Detection)用到的機器學習模型有哪些?」回答為例,特定領域的知識幫助我們更能解釋機器學習模型的結果,得到老闆和用戶的認可,這才可說是演算法落了地。能寫程式碼、構建模型的人千千萬萬個,但理解自己在做什麼,並結合自己的領域知識,提供商業價值的人少之又少。調侃一句,哪個方向的機器學習人才最缺?答:每個領域都需要專精的機器學習人才,你對特定領域的理解就是你的武器。當然,給雞湯不給湯匙很不厚道,所以我會再給一些具體建議。再次申明,這裡我僅建議以就業為主的朋友,走研究路線有不同建議,本文不再贅述。1. 基本功說到底機器學習還是需要一定的專業知識,這可以透過學校學習或自學完成。但有沒有必要通曉數學,擅長最佳化呢?我的看法是不需要,大前提是要了解基本的數學統計知識即可,更多討論可看我在「阿薩姆:如何看待『機器學習不需要數學,很多算法封裝好了,調個包就行』這種說法?」的答案。最低程度我建議掌握五個小方向,對於現在和未來幾年內的業界夠用了。再次重申,我對演算法的看法是大部分人不要造輪子、不要造輪子、不要造輪子!只要理解自己在做什麼,知道選什麼模型,直接呼叫 API 和現成的工具包就好了。 回歸模型(Regression)。學校課程其實講更多分類,但事實上回歸才是業界最常見的模型。比如產品定價或預測產品的銷量都需要回歸模型。現階段比較流行的回歸方法是以數為模型的 xgboost,預測效果很好,還可以自動排序變數重要性。傳統的線性回歸(一元和多元)也還會繼續流行下去,因為良好的可解釋性和低運算成本。如何掌握回歸模型?建議閱讀《Introduction to Statistical Learning》的 2-7 章,並看一下 R 裡 xgboost 的 package 介紹。 分類模型(Classification)。老生常談,但應該對現在流行並繼續流行下去的模型有深刻了解。舉例,隨機森林(Random Forests)和支援向量機(SVM)都屬於現在業界常用的演算法。可能很多人想不到的是,邏輯回歸(Logistic Regression)這個常見於大街小巷每本教科書的經典老演算法,依然占據業界半壁江山。這個部分建議看李航《統計學習算法》,挑著看相對應的那幾章即可。 神經網路(Neural Networks)。我沒有把神經網路歸結到分類算法還是因為現在太紅了,有必要學習了解一下。隨著硬體能力的持續增長和資料集愈豐富,神經網路在中小企業的發揮之處肯定有。三、五年內,這個可能會發生。但有人會問,神經網路內容那麼多,比如架構,比如正則化,比如權重起始化技巧和觸發函數選擇,我們該學到什麼程度呢?我的建議還是抓住經典,掌握基本的三套網路:a. 普通的 ANN。b. 處理影像的 CNN。c. 處理文字和語音的 RNN(LSTM)。對每個基本網路只要了解經典的處理方式即可,具體可參照《深度學習》的 6~10 章和吳恩達的 Deep Learning 網路課程。 資料壓縮/可視化(Data Compression & Visualization)。業界常見的就是先可視化資料,比如這兩年很紅的流形學習(manifold learning)就和可視化有很大的關係。業界認為做可視化是磨刀不誤砍柴工,把高維資料壓縮到 2 維或 3 維,可很快看到一些有意思的事,能節省大量時間。學習可視化可以使用現成的工具,如...
即將發表的蘋果新一代 iPhone 智慧型手機,傳出可能捨去 Touch ID,改用 3D 臉部辨識的消息,臉部辨識功能一時成為辨識科技的當紅炸子雞。只是,臉部辨識真如業者所說那樣神奇精準嗎?以近期英國倫敦警察局開始臉部辨識的治安維護測試來說,出現一天抓錯 35 個人的情況,目前臉部辨識功能恐怕還有待努力。根據外電報導,8 月底,英國倫敦大都會警察局上線即時人臉辨識系統,員警在倫敦街頭偽裝後,以警用車輛監控人群,並使用系統尋找混雜在人群裡的通緝嫌疑犯。不過系統上線的第 2 天,倫敦警察局發現一個很嚴重的問題,就是系統說要抓的一個嫌疑犯,連性別都搞錯,甚至一天出現 35 次問題。其中 5 次的錯誤落差太大,工作人員及時發現,立刻阻止了後續逮捕行動。此外,倫敦警察局還指出,這套系統問題在於不僅「識人不明」,甚至連資料庫都對不上。員警還表示,他們抓到一個「辨識正確」的嫌疑犯時,發現該嫌疑犯的案子已和解,且洗脫了罪名,但系統依然辨識他是嫌疑犯,導致警察抓錯人,可見該系統與資料庫的連結也有問題。英國警察局這次試驗突顯臉部辨識技術和人工智慧發展仍有不足。雖然臉部辨識和人工智慧是未來發展潮流之一,但應用前這些技術還需要強化,才能確保不會對一般人的生活產生負面影響。(首圖來源:shutterstock)
隨著氣象衛星技術的進步帶來巨量的氣候資料,使氣象科學家現在也要仰賴人工智慧(AI)梳理所有資訊,希望能發現新的氣候模型,改善預測準確度。《自然》(Nature)期刊網站刊登一篇文章指出,氣象現在已經是一個數據問題,而透過機器學習技術,人工智慧系統可隨著數據量的增加提高性能。這種方法非常適合氣候科學,光是單獨執行的高分辨率氣候模式就能產生數百億筆數據,英國國家氣象局維護的氣候數據存檔現在擁有約 45PB(PB=1,024TB)的資料量,每天增加 0.085PB。這方面的工作正在迅速發展,過去幾年研究人員利用人工智慧系統幫助科學家在真實與模擬的氣候資料中,排序氣候模式,定位氣旋與其他極端天氣事件,並確定新的氣候模式。常規的電腦演算法依賴工程師輸入規則和事實,指導系統產生結果。常規電腦很難辨識人們認為理所當然的事情,譬如了解語言、閱讀手寫筆記或在雜亂數據庫中辨識某類別,如在 YouTube 影片發現貓。而機器學習系統以及模擬人腦複雜神經網路的深度學習系統,透過大量數據進行梳理後,可以自行產生規則。科學家認為,氣候是另外一個複雜的主題,很適合使用深度學習方法來分析。2016 年研究人員報告首次使用深度學習系統來確定熱帶氣旋、大氣河流(atmospheric river)和鋒面,這些鬆散的特徵,通常取決專家判斷,而深度學習技術證實可以複製人類的專長。現在位於加州勞倫斯伯克利國家實驗室(Lawrence Berkeley National Laboratory)團隊希望使用類似的技術研究各種極端氣候事件,包括尚未被定義的氣候模式。研究人員的最終目標是能更精準評估和預測氣候事件在面對氣候變化時的轉變方式,科學家認為這工作雖然不簡單,但不像深度學習的商業應用程式,如語言翻譯和圖像辨識那麼難。美國明尼蘇達大學電腦科學家 Vipin Kumar 利用機器學習打造監測森林火災和評估去森林化的演算法,研究團隊使用一台已能辨識空氣壓力模式如聖嬰現象氣候模式的電腦,這套演算法在南太平洋塔斯曼海發現先前沒有被辨識的氣候案例。喬治華盛頓大學電腦科學家 Claire Monteleoni 開發機器學習演算法,將氣候變化專門委員會使用的大約 30 個氣候模型建立一個加權平均數,科學家認為這種演算法產生比傳統方法更好的結果,且這些方法可以平等對待所有模型。由於深度學習系統會制定自己的規則,所以研究人員通常無法解釋結果產生的原因,故有些科學家不敢仰賴黑盒子預測如洪水等緊急災難,因此不願意使用人工智慧代替自己的工作。但即使如此,科學家認為人工智慧演算法最適合幫助測試下一代氣候模型,這些模型目的在融合複雜的氣候現象,如雲、大氣河流和海洋渦流的精細結構。然而,一些人工智慧演算法證明對天氣預報有用,2016 年來自美國國家氣象局(National Weather Service)9 位氣象學家在預測暴風持續時間時選擇人工智慧執行大約 75% 的工作。現在研究人員計畫將人工智慧演算法納入冰雹預報。雖然大部分氣象專家仍使用傳統方法分析資料,但是科學家相信機器學習的參與程度會愈來愈高,氣象資訊學將成為一種顯學。 How machine learning could help to improve climate forecasts (首圖來源:Flickr/Tom Brandt CC BY 2.0)
自從比爾蓋茲喊出機器人稅的概念之後,因科技造成貧富差距愈來愈大的舊金山開始認真研擬可行性方案,發起人之一就是舊金山市監事 Jane Kim,她於今年 4 月公開這項計畫,而最新進度是成立了一個名叫未來工作基金(Jobs of the Future Fund)的組織,開始著手進行實務面的討論,當中遇到許多困難,首先就是定義問題。機器人稅將用來促進人類技能,補償因機器人造成的工作損失,包括職業培訓、免費社區大學、普世基本收入等等,Jane Kim 認為,善加利用機器人稅,或許能提高人類對機器人的容忍度。但在研擬機器人稅的過程中,首先遇到的問題就是什麼是機器人?這個問題連機器人專家都難以達成共識。減少人類工作量的人工智慧算機器人嗎?Jane Kim 表示關於機器人定義,以及定義什麼樣的工作算是被機器人取代等都還需要釐清,未來工作基金的任務就是要以公共論壇的形式,與利益關係者及加州公民展開對話。且討論到最後,有可能不會是所謂的機器人稅形式,而是確定國家將會經歷一個經濟轉型的過程,進而想出一個資助轉型過程的方式,或許是透過不同的稅收,或是其他種收入來源。Wired 分析指出,人類害怕機器人取代工作,不只是怕沒了收入,而是失去自己在社會中的定位,畢竟人類透過工作來定義自己,所以工作本質不只是錢。當然不管以什麼樣的形式徵收機器人稅,企業老闆都不會願意,就連學者專家也不見得同意,因為機器人與人工智慧只是一種新技術,現在還不清楚到底會造成什麼影響。且以汽車業為例,雖然幾十年來打造一台汽車需要的勞工人數變少,但整體來看並沒有造成大量失業現象。人工智慧專家吳恩達樂觀看待人工智慧對人類社會的影響,但他強調過程中並非沒有風險,有些人的工作的確會被取代,有些工作薪水會變低,但他認為問題在於人類如何精進自己的技能,而不是人類工作從此消失。他預期存在自動化風險的工作比例約 3~5 成。若人類工作技能提升,人工智慧帶來的軟體與硬體應用,將可與人類一同協作,提高生產力,甚至可減少工時。Jane Kim 也深知這一點,她說機器人對人類工作的影響不能想得太簡單,因為大部分自動化是取代任務,而不是工作。她組織研究的動機不是要逼迫老闆拿錢出來,而是讓社會注意到,無論自動化將人類帶往何方,未來勞動力都將產生巨變。 TAX THE RICH AND THE ROBOTS? CALIFORNIA’S THINKING ABOUT IT ‘AI Is the New Electricity’, Says Coursera Co-Founder, and Former Google and Baidu AI Researcher, Andrew Ng (首圖來源:Flickr/Michael Coghlan CC BY 2.0)延伸閱讀: 盼能緩下自動化步伐,南韓推全球首創「機器人稅」 比爾蓋茲:若勞工繳稅,政府也必須對機器人課稅