星期六, 17 1 月, 2026

旅 TRIVEL

前不久 Google 釋出關於 TPU 細節的論文,稱「TPU 處理速度比目前 GPU 和 CPU 要快 15~30 倍」。當時就有人對此「比較」表示質疑,因其拿來的比較對象並非市場中效能最好的。而美國時間 4 月 10 日,輝達(Nvidia) CEO 黃仁勳親自撰文回應,文章第一段就以 Google TPU 開頭,炮擊意圖十分明顯,隨後更扔出 Tesla P40 GPU 與 TPU 的效能對比圖,可謂針鋒相對。不過 P40 和 TPU 的售價差距很大(P40 24GB 版本售價 5 千多美元,TPU 成本估計在幾百美元),大小和製程也不一樣,也有人覺得這樣的比較未免也不恰當。但黃仁勳不惜親自撰寫長文,擺事實擺資料,意在表明輝達在 AI 晶片領域的強勢姿態和技術領先的驕傲。當時 TPU 論文一發布,雷鋒網就論文中的比較問題諮詢 AI 人士意見,感興趣的讀者可看《Google 公布 TPU 細節後,AI 界怎麼看?》。以下則為黃仁勳全文,原文標題為《AI 驅動資料中心加速計算的崛起》(AI Drives the Rise of Accelerated Computing in Data...
4 月 13 日,百度宣布全資收購美國科技公司 xPerception。這是一家專注於機器視覺軟硬體解決方案的科技公司,面向機器人、AR / VR、智慧導盲等行業客戶,提供以立體慣性相機為核心的機器視覺軟硬體產品。據悉,此次收購行為被看做是百度進一步加強在視覺感知領域的軟硬體能力,賦能 AR、自動駕駛等核心業務,加速人工智慧技術產品化的一個重要步伐。xPerception 聯合創始人包英澤博士和陳明裕博士曾是全球頂級 AR 公司 Magic Leap 的早期核心工程師。百度方面表示,十分看重該公司在機器視覺領域開創性的研究和國際一流的軟硬體成果,此次收購後,xPerception 核心團隊都將加入百度研究院,繼續致力於其核心技術慣性視覺定位與構圖(Visual Inertial SLAM)的研發,加速包括 AR、自動駕駛、機器人在內的百度人工智慧業務矩陣的產業化。準確穩定的空間定位與地圖重構技術(Simultaneous Localization And Mapping,簡稱 SLAM) ,是人工智慧視覺領域的基礎技術,其在 AR / VR、手機 3D 應用、室內地圖、機器人、無人機、自動駕駛等場景中均發揮核心作用。基於這方面的核心技術優勢,xPerception 開發了可以應用於 x86 / x64、ARM 或手機平台的立體慣性相機產品。產品具有 6 自由度姿態追蹤、低延遲感測器融合、立體障礙物檢測及物體辨識等功能,相當於為各種智慧硬體和行動裝置裝上「眼睛」。產品可實現智慧硬體在陌生環境中對自身的的定位、對空間三維結構的計算和路徑規劃。其軟硬體解決方案目前已在中美兩地有多個計畫落地,簽約服務客戶包括多家上市公司及 VR 行業標竿企業等。(本文由 雷鋒網 授權轉載;首圖來源:xPerception)
電視廣告分秒必爭,廠商無不想盡方法讓廣告每秒價值最大化,而漢堡王想出一個「好」方法。在漢堡王的最新 15 秒廣告中,一名店員表示,時間不夠讓他向大家介紹新漢堡中的食材,但他想到,可以讓家中的智慧語音裝置代替他回答。於是,他在廣告結束前說:「OK Google,華堡(Whopper burger)是什麼?」若觀眾家中的 Google Home 剛好放在電視旁,廣告中的關鍵字會觸發 Google Home 的回答機制,讓這台智慧助手開始念出華堡在維基百科上的介紹。甚至,只要有安裝語音助手 Google Assistant 的智慧型手機,也會有相同反應。你能想像家中各處的智慧裝置,突然同時朗誦華堡介紹的情景嗎?語音裝置是下一個廣告平台對廣告商而言,智慧語音助手或許是繼電視和網站後,下一個可觸及大量群眾的廣告平台。美國投資銀行 Evercore ISI 分析師便估計,Google Home 最新一季出貨量約 50 萬台。不過,從過去的經驗可以知道,用戶並不歡迎智慧助手推播廣告,例如,Google Home 曾推播電影《美女與野獸》的介紹,引起用戶反彈。 New Beauty & the Beast promo is one way Google could monetize Home. cc: @gsterling @dannysullivan pic.twitter.com/9UlukSocrO — brysonmeunier (@brysonmeunier) 2017年3月16日「這是很酷、很勇敢的方法來帶給客人驚喜。」漢堡王總裁 Jose Cil 說,他並表示這樣的互動「相當正面」。Google 並未和漢堡王合作推出這則廣告,而是漢堡王利用 Google Home...
如果說,一年前人類還在為李世乭輸給 AlphaGo 搥胸頓足;今天,當 AlphaGo 的升級版要挑戰柯潔時,已經沒多少人相信柯潔能贏了。人們已經開始相信,甚至習慣,在一些垂直領域,人工智慧比人類做得更好,是一件無比正常的事。可是如今,人工智慧要挑戰的可能是福爾摩斯了。在入侵圍棋、德州撲克、人臉辨識、醫療、金融等領域之後,人工智慧現在要來幫警方破案了。在《新世紀福爾摩斯》中,福爾摩斯為了撫平失去瑪麗的傷痛,沒日沒夜地工作,很多時候,只需要藉助委託人傳過來的影片、圖像等資料,就可以輕鬆破案,甚至不需要去現場。這樣的事,好像 AI 也能做到了。人工智慧版的福爾摩斯據《科技日報》報導,智器雲公司有一款機器人福爾摩斯,就幫廣西警方破獲了一起 15 年前的懸疑命案。雖然不能透露具體案情,但創始人王海波解釋了人工智慧的基本思路:沒有血跡說明是第二現場,屍體在一個胡同裡代表汽車進不來,可能是三輪車、自行車、電動車帶進來的,而且表示罪犯熟悉這個地方;第一現場附近用水的數據會有重大變化,因為罪犯要用大量水去沖淡血跡。他解釋,由於兇殺案地點是鬧區,經過的人太多了,所以沒有辦法統計。「透過我們的工具分析關聯關係、時間關係、空間關係,再利用地理資訊系統的分析,就可能破案。」王海波說,「我們想找這樣一個人,他不經常出現在此處,但他也不是出差的人。在人工智慧平台上,就可以把這個規律找出來,一天之內,我們就幫警方確定一些嫌疑人。警方有方向後再去調查,就破案了。」正如人工智慧在醫療領域和行銷領域的應用一樣,其擅長處理龐大的資料,並從大量行為數據中找出規律或異常,這跟金融領域中透過帳戶行為反欺騙也略相似。王海波說,AI 曾經破了一件涉案金額巨大的逃稅案。因為涉案的資料十幾萬條、幾千個帳戶,處理起來很龐雜,所以經過一年還沒破案,但在 AI 幫助下,一天就把主要線索找了出來,並將涉案金額從開始認為的 20 多億深挖到 60 多億元。一件讓海關頭疼、證據複雜的成品油走私案,也幾個小時內就被 AI 整理清楚。他說,AI 還用來分析找到小偷,因為行竊者的交通軌跡跟上班族不同;還可以透過閱讀《紅樓夢》,將人物關係圖譜畫出來。此外,神州泰岳的公安案情分析系統,做的事情也有點類似。據中國網報導,這個系統利用人工智慧領域的自然語言語義分析技術,對公安案件資訊系統中「簡要案情」、「回訪紀錄」、「現勘紀錄」、「訊問筆錄」、「詢問筆錄」等特徵資訊分析進行提取,為情報部門、偵查部門提供案件偵破支援,降低警力支出。人工智慧反欺騙的鼻祖:神祕的 Palantir上面說的,聽起來似乎有點高大上,但其實很早之前,美國就已有公司應用類似的技術來做反欺騙,只是在人工智慧這個概念紅起來之前,其不被稱為人工智慧,而更常被稱為大數據。36Kr 曾經報導過的 Palantir,就是這個領域的鼻祖。我們經常可以看到某諜報大片裡,CIA 或 FBI 的工作人員對著電腦劈哩啪啦打進一堆東西,就能發現犯案者。再藉用一位知乎作者何明科舉的例子:911 之後,史丹佛大學的幾位教授利用大量公開數據,利用電腦建立人物關係的網路,最後鎖定了一堆疑似人物,然後公開發表,結果 CIA 等部門大為震驚,因為教授們的結果與 CIA 花大量人力偵查和審訊的結果很類似。Palantir 做的就是上面說的那些高階的事。籠統來說,就是透過大數據分析回答問題:透過收集大量數據,幫助非科技用戶發現關鍵卻又不太明顯的聯繫,進而先發現端倪,或者找到複雜問題的答案。這家數據公司主要面向政府和金融機構等客戶,主要提供的是利用大數據挖掘的反欺騙(甚至反恐)服務。它最早期的投資人是美國中情局旗下的 In-Q-Tel 基金,因此,據公開資料顯示,其初期的政府業務佔比高達 70%。據華創證券研報,其客戶包括美國國防部、CIA、FBI、陸海空三軍、紐約和洛杉磯警察局。因為服務的敏感性,Palantir 一直很低調,幾乎所有媒體提到 Palantir Technologies 的時候,都無一例外地用上「神祕」這個詞。利用 AI 定位逃犯,這不是好萊塢大片嗎在《神鬼認證:傑森包恩》中,麥特戴蒙飾演的男主角,無論逃亡到世界哪個角落,都會被美國中情局的人監測到。這種好萊塢大片中的酷炫技術,已經有中國公司開始努力。格靈深瞳公司創始人趙勇,就曾經分享過,他認為,甘肅省白銀市的連環殺人案,犯罪嫌疑人從 1988 年到 2002 年期間作案多次,卻一直沒有落網,跟整個社會沒有監視器有關。如此一來留下的線索太少。到了後來,城市的監控攝影機的網路逐步建立,有了大量數據,據說北京用於安全監控的攝影機數量超過 200 萬個,每一個攝影機都在 24 小時不停錄製圖像,這就意味著每天都會錄製兩百多萬天的圖像,折算一下,總時長超過 5 千年。但問題是,捕獲的數據量太大了,憑藉人眼搜尋成本太高、效率卻很低。如果用機器視覺直接分析錄影資料,從幾千萬人中找出目標臉孔,這樣就可大大節省成本提高效率,透過人眼需要很長時間才能找出來,電腦可以在 1 秒鐘內做到。今天,中國大約有 50 萬名嫌犯在逃,人眼沒有辦法時刻監測這些人在哪,但電腦視覺技術可以投入這個領域。曠視科技的人臉辨識技術,就已經在 20...
雲端文件同步和共享服務商 Dropbox 13 日披露了更多支持光學文字辨識(OCR)功能的技術細節,已經為 Dropbox Business 付費的企業員工可以在 Android 和 iOS 應用程式中使用該功能。具體操作是這樣的,使用行動裝置上的相機掃描文檔後,光學文字辨識功能將會啟動。然後,應用程式會根據需要裁剪或旋轉文檔,然後將其保存為 Dropbox 中的 PDF。 8 月,該公司表示正在使用電腦視覺來檢測應用程序掃描文件檔。與人工智慧深度學習結合的 OCR 技術已經不是新鮮事了。GitHub 上的開源軟體可以用於兩者結合,Google 在 Google 街景圖像中也運用了機器學習和 OCR 技術。OCR 系統的初始版本採用市售軟體開發工具包(SDK)。Dropbox 選擇執行自己的數據包以節省資金並提高準確性,因為市售系統主要是為實際的硬體掃描儀構建的,而不是為行動裝置上使用相機的掃描儀。Dropbox 利用用戶數據訓練系統。Dropbox 的軟體工程師 Brad NeubergNeuberg 表示,Dropbox 需要收集用戶上傳一部分圖像或文件,例如收據、發票、信件等。為了收集這些,公司事先徵得了用戶的同意。如果用戶同意,那麼這些文件資訊一定會被保密。Dropbox 對用戶捐贈的數據採取各種安全措施,比如絕不會將數據保留在本地部署的伺服器上,保持持續並廣泛的審計、部署強大的身分驗證訪問數據措施等。為了預測文檔中特定單詞的剪切文本,Dropbox 透過卷積神經網絡,然後是雙向長時間短期記憶(LSTM)網路發送圖像,最後連接時間分類(CTC)系統。該系統部分依賴於 Google 的 TensorFlow 開源深入學習框架。為了加強這個系統,Dropbox 借鑒了虛構的數據 ,然後以簡單的方式進行了轉換。Dropbox 已經脫離了亞馬遜網路服務(AWS)的公共雲端,並運行自己的資料中心基礎架構。此外,Dropbox 已經開始使用圖形處理單元(GPU)加速的 G2 虛擬機(VM)實例對其模型進行了培訓 ,並儲存了一些數據在 AWS S3 服務中。為了進一步改進模型,Dropbox 訓練了小數量的圖像單詞。然後,從預測單個詞跳轉到處理整個文件檔。 Dropbox uses AI to to recognize...
Google 要用 AI 來做創造類工作不是新聞,前陣子才推出 AutoDraw 讓畫圖苦手能憑幾筆畫弄出藝術家等級線條畫。如今 Google 談背後的技術部分。儘管成果就真的像小孩子塗鴉,身為「父母」的 Goolge 研究員仍高調在網路曬成果。Google 的研究人員依靠 App Quick, Draw! 取得的畫筆資料,研發畫圖 AI sketch-rnn,能夠直接模仿人類畫畫的方式,一筆一筆學會畫畫。訓練資料則包括 75 種物品,像是貓頭鷹、蚊子、花園或是斧頭,每種資料含有至少 7 萬筆個別範例。 ▲ Google 研究者調教 AI,AI 在調教過程中畫畫的狀況。而為了加強 AI 的辨識度,研究員加入雜訊,希望 AI 能學會辨識重點。而範例圖案訓練 AI,至少不會畫出三隻眼睛的狗或是貓。另外研究者還混入混合圖片,像是畫出八隻腳的豬,AI 成功畫出四隻腳的豬。 ▲ AI 有時候會畫出合理但不存在現實裡的物體,而 sketch-rnn 被訓練如何合理畫出東西。藝術創作目前仍是人類的天下,但有無數次用機器征服的企圖。去年 5 月 Google 曾發表 Magenta 計畫,嘗試用 AI 來創造樂曲,儘管不怎麼好聽,但至少 AI 的確創作一首曲子出來。或許那一天,Google Doodles 有機會出現 sketch-rnn 畫的線條畫,或是至少代班畫幾次吧? Google’s...
21 世紀經濟報導,中國工信部信軟司副司長朱皖昨(28)日於「2017 年人工智慧電腦視覺產業創新大會」表示,中國在資料保有量、應用場景、計算資源和軟體發展等方面具有很強的比較優勢,人工智慧發展面臨良好契機,未來將大有可為;工信部也將會同相關部門共同策劃部署人工智慧重大國家戰略,加強標準化工作,研擬編制人工智慧發展的白皮書和產業生態地圖,引導社會圍繞重點領域加大投入。朱皖指出,中國工信部將從四個方面推動人工智慧發展。第一,加強頂層設計,統籌部署產業發展;第二,將人工智慧產業發展與一系列重大應用工程相結合;第三,重點突破關鍵技術和重點產品;第四,引導加強國際合作。其中,將加強人工智慧相關軟硬體產業供給和智慧製造的協同發展,在智慧製造綠色製造等重大專案中實施支援人工智慧技術的突破和應用,引導人工智慧在各行業,各領域展開合作。此外,中國工信部將支援面向人工智慧的基礎軟硬體技術的突破,進一步推動人工智慧相關各方面的技術轉化為各類產品和各種應用,鼓勵成立人工智慧行業組織,聚合產學研用各方力量,共同建設人工智慧公共大數據,為業界提供高品質的訓練資源,培育技術和應用互為支援的產業生態。朱皖指出,從全球來看,美國、歐盟等主要先進國家和地區正積極佈局支援相關技術和產業的發展,全球著名 IT 企業也已陸續將發展人工智慧做為投入的重要領域。就中國而言,結合新的發展態勢,將籌畫部署人工智慧重大的頂層設計和發展戰略;此外,工信部正在實施的《中國製造 2025》已將人工智慧納入智慧製造的重點任務和主攻方向,以資訊技術與製造技術深度融合為主線,引導智慧製造重大需求和人工智慧技術成果結合,加快人工智慧技術的研發和轉化。首圖來源:Pixaboy
根據諮詢公司普華永道的一份報告,由於人工智慧的突破,英國超過 30% 的工作都面臨威脅。在某些行業,大約半數人會失業。報告預測,自動化會帶來效率提升,創造新的工作機會,但是,自動化也可能導致不平等現象擴大,因為越來越多的低技能工作將由機器人完成。各個行業都要應對機器人帶來的衝擊,比如批發和零售行業(英國就業人數最多的行業)有 225 萬個工作面臨威脅,製造業是 120 萬個、管理和客服業是 110 萬、交通和倉儲業是 95 萬個。「毫無疑問,AI 和機器人將會改變未來的工作形態,有些工作更加容易被取代。重要的是,我們應該確保自動化的潛在益處惠及整個社會,沒有人被拋棄。有責任的雇主要鼓勵員工提升適應力,這樣的話,我們都能準備好迎接改變。」PwC 技術和投資主管 Jon Andrews 接受衛報採訪時說,「未來,知識將是一種商品。因此,如何培養和提升下一代的技能,我們需要改變自己的思維方式。創造性思維和批判性思維將會受到高度重視,同時受重視的還有情感智力。」PwC 的首席經濟學家 John Hawksworth 表示體力勞動或程序化的工作被自動化的可能性大,而社交技能相對來說較難自動化。不過,隨著機器人和 AI 的發展,沒有什麼行業是完全保險的。「把更多體力勞動和重複性工作自動化後,一些現有工作會消失,但與此同時,工人可專注於更高價值、更有回報、更有創造性的工作,讓每日工作不再單調。」(Source:zerohedge)不過,即使機器人替代工人有技術上的可行性,從經濟上看也未必合算。這取決於機器人的成本和效率究竟如何。PwC 預測,情況會變得更有利於機器人,因為今後機器人的製造成本會越來越低。「同時,即使 AI 和機器人已具備技術和經濟上的可行性,法律和法規方面的阻礙、結構性的惰性和陳舊系統也會拖慢轉變的步伐。這未必是一件壞事,因為現有的工人和商業機構將有更多時間適應這個美麗新世界。」(本文由 愛范兒 授權轉載;首圖來源:Flickr/Esther Vargas CC BY 2.0)
我們都知道量子電腦有強大的計算能力,但似乎很少有人提及它的缺陷:由於量子電腦的本質原因,你不可以在上面保存或複製資訊。這是由量子電腦的本質所決定的,思考一下,量子態永遠處於概率中,一旦有觀測就會發生坍塌,所以,複製當然是不可能的了。如今,科學家們正致力於解決這個問題,其中一種方案就是使用 DNA 來儲存資訊,讓我們一起來了解一下。你肯定聽過這種炒作:量子電腦的革命時代正在到來。物理學家說,這些電腦的速度快到可以破解銀行現在使用的每一種加密模式。它們的人工智慧如此先進,你可以載入元素週期表還有量子力學的法則,它們能夠設計出目前為止最高效的太陽能電池。它們很快就會到來了:Google 的研究人員 3 月早些時候在《自然》雜誌上發表稱,他們預計最早在 5 年內推出商業化的量子電腦。而且 Google 想要在今年末構建並測試一台 49 量比──也就是「量子位元」──的量子電腦。一些專家稱,一台 50 量比的電腦性能要超過任何一台傳統電腦。但是存在一個大問題:由於量子電腦的本質原因,你不可以在上面保存或複製資訊。如果不能備份工作成果,那麼再強大的計算能力也沒用武之地。你可以轉變一下量子數據,然後把它放在一個傳統儲存裝置裡,但這些轉化過的資料會佔用很大的空間。所以,物理學家們在搜尋一種由新的材料(包括 DNA)製作的可靠、超級壓縮的硬碟驅動器。量子電腦之所以如此強大,正是因為資料密度。一台傳統的電腦閱讀、儲存、控制位元:1 和 0。但量子電腦使用的是量子位元:一種在你觀察時,可以同時存在兩種狀態的小小量子物質──0 和 1。而如果你可以在兩種狀態疊加的情況下控制量子微粒,那麼你就可以平行處理多項任務。這能提高與計算有關的特定任務處理速度。這種速度不會讓 Netflix 觀看體驗更好,也不能讓微軟 Excel 承受能力更強。但是它在執行搜尋演算法或是和有機物質或人腦相似的類比複雜系統時,速度將會非常快。量子力學擁有不可思議能力的同時,也存在一定的缺點。它的法則允許疊加,但是也禁止任何人複製量子微粒。「這叫做『不可複製原理』」,加拿大西蒙弗雷澤大學的物理學家 Stephanie Simmons 說。她說量子電腦會把原子程式設計為特定的原子狀態,代表一連串數字。想讓電腦給另一個原子編出完全一樣的原子狀態在物理上幾乎不可能。所以 Simmons 提出一個比較婉轉的儲存量子數據方式:首先,你要把它轉化為二進位資料──把描述出原子疊加的數字翻譯成簡單的 0 和 1;然後,再用傳統儲存形式把這些轉化來的資料存起來。換句話說:硬碟驅動器。一個超級壓縮的硬碟驅動器,因為一台 49 量比電腦的每個量子數據檔案大小可達到 4 萬支影片的規模。為了儲存如此巨大的資料,量子電腦的開發者們需要新的資料儲存科技,Simmons 說。現在商業化的驅動器壓縮程度還不夠。一個單一量子檔案會佔到一個固態硬碟驅動器上一張郵票大小的地方。所以 DNA 是可供選擇的儲存方案。《科學》雜誌 3 月早些時候發表稱,科學家已經證明 1 克 DNA 可以儲存 215 兆百萬位元組,或者說 2.15 億千百萬位元組的資料。在這種密度下,兩輛貨卡就可以裝下人類所有的資料。和傳統的硬碟驅動器只在二維表面上儲存資料不同,DNA 是在三維分子上儲存資料的,多出來的那個垂直維度使 DNA 每單位儲存的資訊多得多。而且,它可以持續很長時間。「想一想你 1990 年代買的 CD,」哥倫比亞大學的電腦科學家 Yaniv...
對於 Facebook 來說,AI 技術是提升用戶體驗、創造新體驗的一大法門。該公司表示,每天處理數十億的發文、評論和照片,需要開發出「地球上最高效」的 AI 系統。但 AI 領域的人才和專業知識十分缺乏,尤其是深度學習。即便是 Facebook 這樣的巨頭,也一直感受到招募壓力。順便說一句,李開復前段時間把 Google、Facebook、Microsoft、Amazon 以及中國 BAT 比喻為 AI 人才的「七大黑洞」,把行業人才吞噬一空。即便如此,無論人、技術還是資料,離滿足巨頭們的胃口仍然差得遠。就業市場的 AI 工程師已經被瓜分一空,但企業還需要更多。在全世界範圍內,高校紛紛上馬 AI、機器學習、資料科學的專業以及課程。但這只是問題的某一方面:現在非常多工程師,缺乏在實際業務環境做 AI 開發的第一手經驗和履歷。為填平這一道技能鴻溝,Facebook 在 29 日晚上宣布創建 Facebook AI Academy,對公司內部員工進行免費 AI 技能培訓。Facebook 表示:「我們堅信創新以教育為基礎。透過向公司工程師提供最前線的 AI 技術培訓,Facebook 能夠向全公司業務線部署更多的深度學習專家。當下,Facebook 有超過 40 個技術團隊、超過 25% 的工程師在產品服務中要用到 AI 。我們想要進一步提升這個數字。」據了解,Facebook AI Academy 的培訓分為兩部分。第一部分是要求學習者親身實踐的深度學習課程。課程由身為 Facebook AI 研究實驗室(FAIR)首腦人物之一的 Larry Zitnick,與其他頂級專家共同設計,讓 Facebook 全公司的工程師能夠直接向 FAIR 專家學習。學院課程的主題包括深度學習基礎、CNN / RNN 以及增強學習等相關話題。一套課程包含...