自動駕駛汽車原本只是科幻小說或電影中的概念,但一些機器人領域的工程師卻不信邪,他們將這概念變成許多古怪的研究專案。如今,這些被潑了無數冷水的專案成了現實,自動駕駛汽車即將改變人類的交通形態。縱觀整個業界,未來誰能先到達終點,誰就能在價值 770 億美元(2035 年)的巨大市場中佔盡先機,而後來者會被世界遺忘。「為了在未來能分到一塊蛋糕,投入自動駕駛技術研發的資金正在層層加碼,更重要的是,這些投資不是空頭支票,它們可是實打實的真金白銀。」精通自動駕駛汽車法律的史丹佛法學院學者 Bryant Walker Smith 說。據了解,自動駕駛工業的主要玩家 Google Waymo、特斯拉和 Uber 等都在爭奪建立產業標準的發言權。無論哪家公司都冒著極大風險。就拿 Uber 來說,自動駕駛是他們提升利潤率的殺手鐧,如果無法先佔一步,Uber 的商業型態就會被複製,等待他們的就會是萬劫不復。因此,即使前路漫漫充滿風險,Uber 也必須義無反顧。▲ Waymo、特斯拉和 Uber 無人車團隊的競合。自動駕駛工業激烈的競爭已催生了至少兩場劍拔弩張的訴訟。訴訟的起因也很簡單:一是由於員工跳槽帶走技術,二是由於新公司崛起威脅老公司地位。除了科技公司,傳統的汽車廠商也不甘寂寞,通用、福特、飛雅特和戴姆勒等公司都打開「錢包」對自動駕駛技術投入巨資。雖然現在看不清這些錢是否打水漂,但從很多團隊的動向來看,他們都盯上了 Uber 和 Lyft 的飯碗。一陣明爭暗鬥後,戰況最為激烈的要數 Waymo 與 Uber 的訴訟了。Waymo 聲稱,自家前工程師 Anthony Levandowski 在離開公司前下載了 1.4 萬份機密檔案,並藉 Waymo 的核心技術成立了新創公司 Otto,而 Otto 成立沒幾個月,就被 Uber 收入麾下。在法庭上,Waymo 要求法官禁止 Uber 使用 Levandowski「偷竊」的雷射雷達技術,如果判決成立,Uber 的自動駕駛汽車專案將遭遇滅頂之災。在矽谷,有關商業機密的爭鬥是家常便飯,但一旦 Google 加入戰事就不同了,搜尋巨頭可是將自動駕駛專案看得很重。「以前都是別人告 Google,他們當原告的次數可不多。」Santa Clara 律師事務所專攻高科技訴訟的 Eric Goldman 說。曾幾何時,自動駕駛產業是個緊密社群,但 Waymo 的一紙訴狀把人們從美夢中叫醒,原來這個產業競爭的火苗已燒得很旺了。「大量工程師同時做同樣的事,他們要麼在大學研究,要嘛為公司提供諮詢,要嘛就建立自己的公司。」Smith...
你可能已經知道了,Google 旗下的人工智慧 AlphaGo 要和中國頂級圍棋選手柯潔決戰了。4 月 10 日下午,中國圍棋協會、Google 和浙江省體育局於北京中國棋院舉辦的發表會上宣布了這個訊息。對戰的地點在中國浙江烏鎮,對戰時間是 5 月 23 日至 27 日,比賽採用中國規則,三番棋,無論輸贏,每方 3 小時,5 次 1 分鐘讀秒。除了與柯潔對戰,此次還將組織一場配對賽和一場團隊賽,配對賽是連笑、古力分別與 AlphaGo 組隊進行比賽,團隊賽則是柯潔、周睿羊、時越、唐韋星和陳耀燁五名人類棋手組隊與 AlphaGo 對戰。這可能是 AlphaGo 自去年戰勝李世乭之後最高規格的一次比賽。今年 1 月,AlphaGo 的 2.0 版本曾化身 Master 在網路圍棋網站下贏許多高手。其中已包括柯潔,但隨後柯潔爆出住院消息,疑似帶病與 AlphaGo 對弈。且線上對弈也非正式比賽,所以從嚴格意義上來說,AlphaGo 還沒有正式成為地球上最強的圍棋選手。這一次,烏鎮舉辦的對弈似乎是為了徹底讓人類死心。但對大多數人來說,可能已有對比賽結果的預期。畢竟,Master 在年初 60 場大戰的不敗戰績,已充分說明。既然 AlphaGo 這麼厲害,那麼還讓它和柯潔比賽有意義嗎?答:當然有意義。標題的問題,其實並不來自媒體,而是來自馬雲。剛過去的清明節假期裡,馬化騰、馬雲和李彥宏同時站在 2017 中國(深圳)IT 領袖峰會的台上,探討關於人工智慧的話題。馬雲對 AlphaGo 式的人工智慧提出十分尖銳的質疑:大家把 AlphaGo 說得天花亂墜很恐怖的樣子,我個人覺得,So What?在發表會上,Google 大中華區總裁石博盟對這個問題似乎有備而來。現場回答的 3 個問題中,都在解釋為什麼 AlphaGo 與人類棋手對弈如此重要。第一個問題就是:AlphaGo 和柯潔對弈是否有意義?這個問題的答案是肯定的,但並不是外界理解的「這對 Google...
AT&T 公司是一家美國電信公司,美國第二大行動營運商,創建於 1877 年。目前是美國最大的本地和長途電話公司。公司擁有超過 12,500 項專利、8 項諾貝爾獎以及 140 年的實地測試經驗,目前 AT&T 是人工智慧的重要參與者。AT&T Connected Health Foundry 主管 Nadia Morris 認為,AT&T 是網路的中堅力量。公司管理連接個人和組織的無線電、固定電話甚至私人安全網路,所有這些網路都產生了大量的數據,這些數據剛好可以用來機器學習。AT&T 早在幾十年前就已經建立了人工智慧和機器學習系統,使用演算法來自動執行諸如通用呼叫中心程式和網路中斷的分析和校正等操作。在娛樂方面,AT&T 的 DirecTV 部門利用用戶的評分歷史、觀看行為和其他因素來預測他們將要觀看的下一部電影。AT&T 大數據研究主管表示,AT&T 需要數十億的數據點可視化,以前沒有工具來整理 AT&T 產生的數據,公司為此構建了可視化工具 Nanocubes。這種工具可將數百萬個單獨的手機和基地台連在一起,這款工具已在公司外使用用以區別體育迷,並分析犯罪率。演算法和工具不是解決問題的瓶頸。Volinsky 明確指出數據和數據集成才是瓶頸。現代人工智慧需要一個集中的數據源,但是目前數據來自於不同標準的網路接口,有些追蹤 4G 數據、有些追蹤 3G 數據。數據來源不同,最終結果也會產生偏差,所以現在要做的就是,如何將來自不同方面的數據集合在一起。AI 是 AT&T 研究部門開發下一代面向企業和消費者解決方案中最強大的工具,但是深度學習並不是解決所有問題的唯一方法,團隊目前應該做的還有優先考慮實體數據基礎設施,以及數據集成的方法。AT&T 已經在全球各地開設了 6 個創新實驗室,每個實驗室專門從事不同行業。透過已建立的各種聯繫,AT&T 可以幫助醫療保健 IoT 加速其硬體原型和生產。此外,實驗室還利用類似 Flow Designer 開源工具,軟體可幫助軟體工程師簡化硬體設計。對於生產可穿戴裝置公司,AT&T 的人工智慧系統調節可幫助其調節網路流量,公司可以智慧地檢測網路上的可穿戴裝置,並動態分配更大的頻寬以支持即時影片流。AT&T 對網路的控制也適用於積累大量患者資料的醫院。現在很多醫院都擔心資安問題,為防止患者個資洩露,醫院工作人員將資料上傳至雲端,但是資料管理通常不是醫院的核心競爭力,常常導致的後果是技術過時和效率低下。AT&T 在這裡做的就是,不管醫院使用哪一個雲端提供商,AT&T 都能夠讓所有伺服器執行專有的網路連接。將更多的醫療資料遷移到雲端,不僅可以降低人力成本,還可以促進人工智慧的研究。醫院本身蘊藏了大量的資料,這些資料對於獲得進一步的醫學成果至關重要。將醫療數據匯總到雲端,使得醫學研究人員能夠訪問不同數據集,生命體徵等監測的演算法可以對聚合數據集進行培訓,以獲得更準確的健康結論。AI 和資料可視化有助於 5G 的推出。現代人工智慧演算法使電信公司能夠處理更複雜的任務,例如優化 5G 網路。為什麼這麼說呢?傳統的電池塔通常放置在城市中心,網路覆蓋率比較低,對於房地產商而言,建立和維護網路也是非常昂貴的。而小型電池更便宜、更緊湊,並且可以安裝在內部城市建築上,網路覆蓋更密實,它們的作用是複製來自主電池塔的訊號,使其更接近終端用戶。透過調整行動用戶數據,人工智慧可以幫助創建空間模型,進而構建小型單元,確保客戶得到最強的 5G 訊號。用於 5G 網路的基礎設施是一項巨大的工程,而準確地模擬趨勢和增長是成功的關鍵。人口趨勢可能導致以前利用不足的地區,突然變成熱點生成器。雖然統計模型對於辨識客戶運動的趨勢很有用,但人工智慧和機器學習技術在整個過程中,都可以為當前數據提供未來的預測。除了人工智慧促進 5G 網路的布局,當地時間 4 月...
根據《華爾街日報》,三星 Galaxy S8 的重點功能「Bixby」,在上市之初將不會先推出英文版語音服務,但 Bixby 的其他功能,像是 Bixby recommends 仍然會如期上線。「Bixby」是三星由收購來的 Viv 為基礎開發的智慧助理。後者的創辦人在成立 Viv 之前,曾經推出一款語音助理 Siri,後來被蘋果收購,成為蘋果生態系眾所皆知的聲控服務。在聲明中,三星表示希望讓 Bixby 成為三星手機、家電、穿戴式裝置的核心界面,而不是現在以多點觸控為基礎設計的 UI。與 Siri、Google Assistant 或是 Alexa 相較,Bixby 複雜了不少,結合了各種小功能或頁面。除了基本的語音服務,Bixby 還有一個稱作 Bixby recommends、上頭掛有 Hello Bixby 的頁面,類似首頁,另外還有智慧提醒、景物辨識、自動翻譯、QR code 辨識等小功能。《華爾街日報》指出,由於英文版的辨識度表現不佳,不如韓文,因此 S8 上市後,英文版語音服務會推遲大約 1 個月,不過這個時程目前僅為暫估。其實在發表會上試用時,也可以感受到英文單字的辨識能力、反應速率都有些不足,但當時以為是現場聲源太雜,加上網路頻寬限制所導致。Galaxy S8 / S8+ 將是 Bixby 首款支援的三星產品。儘管還不能啟用聲控,但用戶可以透過專屬的側邊鈕來開啟它,進入 Bixby recommends 首頁。在三星的規劃中,目前 Bixby 仍會以內建 App、手機產品為主,然後再慢慢擴散到其他新品,甚至推出 Bixby 第三方 SDK。三星表示,Bixby 的特點在於能理解任務進程,可以讓用戶在觸控與聲控間交錯。App 如果有支援,也可以直接聲控操作每一項 App 上的功能。未來 Bixby 的英文語音服務將會透過軟體更新來提供。Bixby 目前也還不支援中文。 Samsung’s Bixby...
台灣著名的電腦科學家及前 Google 全球副總裁李開復受騰訊專訪時表示,人工智慧在金融業將會先迎來變革,且新創公司還是有機會去挑戰科技巨頭。作為電腦科學專家,李開復早在 30 多年前,就進入了人工智慧領域。他從 1980 年開始研究自然語言處理,1982 年做電腦視覺,1983 年從事語音識別,1985 年進行人機對弈研發,在1988 年其奧賽羅對弈系統就擊敗了世界國際象棋冠軍,並幫助 IBM 組織了深藍研究團隊。AI 革命新創仍有機會李開復認為,AI 的發展更勝於網際網路革命,它能將人類的大腦從無謂繁瑣的事件中解放出來,未來人類能夠更重視家庭,並且進行更多哲學性思考,雖然 AI 將帶來許多很難理解的社會現象,但不去理解就可能會帶來更多麻煩甚至是災難,所以他近期一直在呼籲,希望用最簡單的方式來讓大家了解未來世界的機會及挑戰,讓更多人適應AI時代的到來。數據是人工智慧的核心,但目前中國大量網際網路數據,被三大科技巨頭百度(Baidu)、阿里巴巴(Alibaba)、騰訊(Tencent)所壟斷是個很大的難關,不過李開復卻強調,創業公司仍然還是有機會的,因為 AI 革命影響幾乎所有產業,科技巨頭們不可能在所有垂直領域都佔有優勢,所以應該要去尋找各產業及場景的關鍵痛點進行突破。封閉將成科技巨頭弱點李開復指出,這些科技巨頭還有一個弱點就是共享性不夠,就像是黑洞一樣,數據進去之後,裡面做了什麼演算法也看不出來,而根據過往的歷史,當某些公司共享性不夠的時候,就會受到後來者的挑戰。所以在年初,李開復旗下的創新工場成立了人工智慧工程院,計劃將工程技術從孵化器中剝離出來,與非 BAT 的各產業龍頭一起打造公開的數據庫平台,以吸引更多科學家及創業者。從行業趨勢來看,李開復認為小額分散、高頻率及標準化程度較高的產業將比較容易迎來 AI 時代的變革,而符合這些條件的金融產業對 AI 而言就有著先天上的優勢,機器可以處理大量數據,提高服務效率,且學習速度極快,可以實現高頻率的優化及更新,在投資、保險、小額貸款、風險控制等工作,都需要大量數據進行判斷,非常適合人工智慧的發揮,並快速取代人類。李開復解釋,因為在金融領域,只要能做出正確的選擇,很快就能賺錢,所以這將會是一個快速爆發的過程。然而 AI 帶給社會的問題其實不在於失業,政府能透過課稅來解決問題,然而這些失去工作的人將會失去人生追求,不再有自我實現的機會。所以未來的年輕人總想著捧金飯碗是沒有用的,必須去從事一些更有深度、更有創造力的事業,才能在 AI 的浪潮中創造自我價值。 怕機器人搶孩子們的飯碗?這幾件事一定要做! (首圖來源:工研院)延伸閱讀: 貝萊德為節省成本,將裁員改用機器人選股 首位機器人警察 5 月值勤,杜拜警方:2030 年後不會再有懸案發生 【5 分鐘 Fintech】第一次投資就上手,AI 教你如何輕鬆入門 李開復:AI 創業的十個真相
前不久 Google 釋出關於 TPU 細節的論文,稱「TPU 處理速度比目前 GPU 和 CPU 要快 15~30 倍」。當時就有人對此「比較」表示質疑,因其拿來的比較對象並非市場中效能最好的。而美國時間 4 月 10 日,輝達(Nvidia) CEO 黃仁勳親自撰文回應,文章第一段就以 Google TPU 開頭,炮擊意圖十分明顯,隨後更扔出 Tesla P40 GPU 與 TPU 的效能對比圖,可謂針鋒相對。不過 P40 和 TPU 的售價差距很大(P40 24GB 版本售價 5 千多美元,TPU 成本估計在幾百美元),大小和製程也不一樣,也有人覺得這樣的比較未免也不恰當。但黃仁勳不惜親自撰寫長文,擺事實擺資料,意在表明輝達在 AI 晶片領域的強勢姿態和技術領先的驕傲。當時 TPU 論文一發布,雷鋒網就論文中的比較問題諮詢 AI 人士意見,感興趣的讀者可看《Google 公布 TPU 細節後,AI 界怎麼看?》。以下則為黃仁勳全文,原文標題為《AI 驅動資料中心加速計算的崛起》(AI Drives the Rise of Accelerated Computing in Data...
4 月 13 日,百度宣布全資收購美國科技公司 xPerception。這是一家專注於機器視覺軟硬體解決方案的科技公司,面向機器人、AR / VR、智慧導盲等行業客戶,提供以立體慣性相機為核心的機器視覺軟硬體產品。據悉,此次收購行為被看做是百度進一步加強在視覺感知領域的軟硬體能力,賦能 AR、自動駕駛等核心業務,加速人工智慧技術產品化的一個重要步伐。xPerception 聯合創始人包英澤博士和陳明裕博士曾是全球頂級 AR 公司 Magic Leap 的早期核心工程師。百度方面表示,十分看重該公司在機器視覺領域開創性的研究和國際一流的軟硬體成果,此次收購後,xPerception 核心團隊都將加入百度研究院,繼續致力於其核心技術慣性視覺定位與構圖(Visual Inertial SLAM)的研發,加速包括 AR、自動駕駛、機器人在內的百度人工智慧業務矩陣的產業化。準確穩定的空間定位與地圖重構技術(Simultaneous Localization And Mapping,簡稱 SLAM) ,是人工智慧視覺領域的基礎技術,其在 AR / VR、手機 3D 應用、室內地圖、機器人、無人機、自動駕駛等場景中均發揮核心作用。基於這方面的核心技術優勢,xPerception 開發了可以應用於 x86 / x64、ARM 或手機平台的立體慣性相機產品。產品具有 6 自由度姿態追蹤、低延遲感測器融合、立體障礙物檢測及物體辨識等功能,相當於為各種智慧硬體和行動裝置裝上「眼睛」。產品可實現智慧硬體在陌生環境中對自身的的定位、對空間三維結構的計算和路徑規劃。其軟硬體解決方案目前已在中美兩地有多個計畫落地,簽約服務客戶包括多家上市公司及 VR 行業標竿企業等。(本文由 雷鋒網 授權轉載;首圖來源:xPerception)
電視廣告分秒必爭,廠商無不想盡方法讓廣告每秒價值最大化,而漢堡王想出一個「好」方法。在漢堡王的最新 15 秒廣告中,一名店員表示,時間不夠讓他向大家介紹新漢堡中的食材,但他想到,可以讓家中的智慧語音裝置代替他回答。於是,他在廣告結束前說:「OK Google,華堡(Whopper burger)是什麼?」若觀眾家中的 Google Home 剛好放在電視旁,廣告中的關鍵字會觸發 Google Home 的回答機制,讓這台智慧助手開始念出華堡在維基百科上的介紹。甚至,只要有安裝語音助手 Google Assistant 的智慧型手機,也會有相同反應。你能想像家中各處的智慧裝置,突然同時朗誦華堡介紹的情景嗎?語音裝置是下一個廣告平台對廣告商而言,智慧語音助手或許是繼電視和網站後,下一個可觸及大量群眾的廣告平台。美國投資銀行 Evercore ISI 分析師便估計,Google Home 最新一季出貨量約 50 萬台。不過,從過去的經驗可以知道,用戶並不歡迎智慧助手推播廣告,例如,Google Home 曾推播電影《美女與野獸》的介紹,引起用戶反彈。 New Beauty & the Beast promo is one way Google could monetize Home. cc: @gsterling @dannysullivan pic.twitter.com/9UlukSocrO — brysonmeunier (@brysonmeunier) 2017年3月16日「這是很酷、很勇敢的方法來帶給客人驚喜。」漢堡王總裁 Jose Cil 說,他並表示這樣的互動「相當正面」。Google 並未和漢堡王合作推出這則廣告,而是漢堡王利用 Google Home...
如果說,一年前人類還在為李世乭輸給 AlphaGo 搥胸頓足;今天,當 AlphaGo 的升級版要挑戰柯潔時,已經沒多少人相信柯潔能贏了。人們已經開始相信,甚至習慣,在一些垂直領域,人工智慧比人類做得更好,是一件無比正常的事。可是如今,人工智慧要挑戰的可能是福爾摩斯了。在入侵圍棋、德州撲克、人臉辨識、醫療、金融等領域之後,人工智慧現在要來幫警方破案了。在《新世紀福爾摩斯》中,福爾摩斯為了撫平失去瑪麗的傷痛,沒日沒夜地工作,很多時候,只需要藉助委託人傳過來的影片、圖像等資料,就可以輕鬆破案,甚至不需要去現場。這樣的事,好像 AI 也能做到了。人工智慧版的福爾摩斯據《科技日報》報導,智器雲公司有一款機器人福爾摩斯,就幫廣西警方破獲了一起 15 年前的懸疑命案。雖然不能透露具體案情,但創始人王海波解釋了人工智慧的基本思路:沒有血跡說明是第二現場,屍體在一個胡同裡代表汽車進不來,可能是三輪車、自行車、電動車帶進來的,而且表示罪犯熟悉這個地方;第一現場附近用水的數據會有重大變化,因為罪犯要用大量水去沖淡血跡。他解釋,由於兇殺案地點是鬧區,經過的人太多了,所以沒有辦法統計。「透過我們的工具分析關聯關係、時間關係、空間關係,再利用地理資訊系統的分析,就可能破案。」王海波說,「我們想找這樣一個人,他不經常出現在此處,但他也不是出差的人。在人工智慧平台上,就可以把這個規律找出來,一天之內,我們就幫警方確定一些嫌疑人。警方有方向後再去調查,就破案了。」正如人工智慧在醫療領域和行銷領域的應用一樣,其擅長處理龐大的資料,並從大量行為數據中找出規律或異常,這跟金融領域中透過帳戶行為反欺騙也略相似。王海波說,AI 曾經破了一件涉案金額巨大的逃稅案。因為涉案的資料十幾萬條、幾千個帳戶,處理起來很龐雜,所以經過一年還沒破案,但在 AI 幫助下,一天就把主要線索找了出來,並將涉案金額從開始認為的 20 多億深挖到 60 多億元。一件讓海關頭疼、證據複雜的成品油走私案,也幾個小時內就被 AI 整理清楚。他說,AI 還用來分析找到小偷,因為行竊者的交通軌跡跟上班族不同;還可以透過閱讀《紅樓夢》,將人物關係圖譜畫出來。此外,神州泰岳的公安案情分析系統,做的事情也有點類似。據中國網報導,這個系統利用人工智慧領域的自然語言語義分析技術,對公安案件資訊系統中「簡要案情」、「回訪紀錄」、「現勘紀錄」、「訊問筆錄」、「詢問筆錄」等特徵資訊分析進行提取,為情報部門、偵查部門提供案件偵破支援,降低警力支出。人工智慧反欺騙的鼻祖:神祕的 Palantir上面說的,聽起來似乎有點高大上,但其實很早之前,美國就已有公司應用類似的技術來做反欺騙,只是在人工智慧這個概念紅起來之前,其不被稱為人工智慧,而更常被稱為大數據。36Kr 曾經報導過的 Palantir,就是這個領域的鼻祖。我們經常可以看到某諜報大片裡,CIA 或 FBI 的工作人員對著電腦劈哩啪啦打進一堆東西,就能發現犯案者。再藉用一位知乎作者何明科舉的例子:911 之後,史丹佛大學的幾位教授利用大量公開數據,利用電腦建立人物關係的網路,最後鎖定了一堆疑似人物,然後公開發表,結果 CIA 等部門大為震驚,因為教授們的結果與 CIA 花大量人力偵查和審訊的結果很類似。Palantir 做的就是上面說的那些高階的事。籠統來說,就是透過大數據分析回答問題:透過收集大量數據,幫助非科技用戶發現關鍵卻又不太明顯的聯繫,進而先發現端倪,或者找到複雜問題的答案。這家數據公司主要面向政府和金融機構等客戶,主要提供的是利用大數據挖掘的反欺騙(甚至反恐)服務。它最早期的投資人是美國中情局旗下的 In-Q-Tel 基金,因此,據公開資料顯示,其初期的政府業務佔比高達 70%。據華創證券研報,其客戶包括美國國防部、CIA、FBI、陸海空三軍、紐約和洛杉磯警察局。因為服務的敏感性,Palantir 一直很低調,幾乎所有媒體提到 Palantir Technologies 的時候,都無一例外地用上「神祕」這個詞。利用 AI 定位逃犯,這不是好萊塢大片嗎在《神鬼認證:傑森包恩》中,麥特戴蒙飾演的男主角,無論逃亡到世界哪個角落,都會被美國中情局的人監測到。這種好萊塢大片中的酷炫技術,已經有中國公司開始努力。格靈深瞳公司創始人趙勇,就曾經分享過,他認為,甘肅省白銀市的連環殺人案,犯罪嫌疑人從 1988 年到 2002 年期間作案多次,卻一直沒有落網,跟整個社會沒有監視器有關。如此一來留下的線索太少。到了後來,城市的監控攝影機的網路逐步建立,有了大量數據,據說北京用於安全監控的攝影機數量超過 200 萬個,每一個攝影機都在 24 小時不停錄製圖像,這就意味著每天都會錄製兩百多萬天的圖像,折算一下,總時長超過 5 千年。但問題是,捕獲的數據量太大了,憑藉人眼搜尋成本太高、效率卻很低。如果用機器視覺直接分析錄影資料,從幾千萬人中找出目標臉孔,這樣就可大大節省成本提高效率,透過人眼需要很長時間才能找出來,電腦可以在 1 秒鐘內做到。今天,中國大約有 50 萬名嫌犯在逃,人眼沒有辦法時刻監測這些人在哪,但電腦視覺技術可以投入這個領域。曠視科技的人臉辨識技術,就已經在 20...
雲端文件同步和共享服務商 Dropbox 13 日披露了更多支持光學文字辨識(OCR)功能的技術細節,已經為 Dropbox Business 付費的企業員工可以在 Android 和 iOS 應用程式中使用該功能。具體操作是這樣的,使用行動裝置上的相機掃描文檔後,光學文字辨識功能將會啟動。然後,應用程式會根據需要裁剪或旋轉文檔,然後將其保存為 Dropbox 中的 PDF。 8 月,該公司表示正在使用電腦視覺來檢測應用程序掃描文件檔。與人工智慧深度學習結合的 OCR 技術已經不是新鮮事了。GitHub 上的開源軟體可以用於兩者結合,Google 在 Google 街景圖像中也運用了機器學習和 OCR 技術。OCR 系統的初始版本採用市售軟體開發工具包(SDK)。Dropbox 選擇執行自己的數據包以節省資金並提高準確性,因為市售系統主要是為實際的硬體掃描儀構建的,而不是為行動裝置上使用相機的掃描儀。Dropbox 利用用戶數據訓練系統。Dropbox 的軟體工程師 Brad NeubergNeuberg 表示,Dropbox 需要收集用戶上傳一部分圖像或文件,例如收據、發票、信件等。為了收集這些,公司事先徵得了用戶的同意。如果用戶同意,那麼這些文件資訊一定會被保密。Dropbox 對用戶捐贈的數據採取各種安全措施,比如絕不會將數據保留在本地部署的伺服器上,保持持續並廣泛的審計、部署強大的身分驗證訪問數據措施等。為了預測文檔中特定單詞的剪切文本,Dropbox 透過卷積神經網絡,然後是雙向長時間短期記憶(LSTM)網路發送圖像,最後連接時間分類(CTC)系統。該系統部分依賴於 Google 的 TensorFlow 開源深入學習框架。為了加強這個系統,Dropbox 借鑒了虛構的數據 ,然後以簡單的方式進行了轉換。Dropbox 已經脫離了亞馬遜網路服務(AWS)的公共雲端,並運行自己的資料中心基礎架構。此外,Dropbox 已經開始使用圖形處理單元(GPU)加速的 G2 虛擬機(VM)實例對其模型進行了培訓 ,並儲存了一些數據在 AWS S3 服務中。為了進一步改進模型,Dropbox 訓練了小數量的圖像單詞。然後,從預測單個詞跳轉到處理整個文件檔。 Dropbox uses AI to to recognize...