英特爾對 Mobileye 的收購被業界定義為一次龐大的資料爭奪戰,這不無道理。然而,在自動駕駛的資料積累以及市場佈局中,英特爾不算布局排場最大的,也絕不算幹得最漂亮的。誠然,他們完成了一次跳躍式前進,但仍不可避免面對勁敵。雷鋒網編譯整理了來自雅虎財經的深度分析文章,展現了目前的產業格局。近期,英特爾披露了收購 Mobileye 的計畫,該計畫極大提高了英特爾在自動駕駛領域的市佔率與競爭力。英特爾擬以每股 63.54 美元現金溢價 34% 收購以色列駕駛輔助系統開發公司 Mobileye,對應股權價值高達 153 億美元,該交易預期在未來 9 個月內完成。驚人的收購價格顯示出英特爾對未來戰略的決心,在行動智慧裝置市場失利之後,英特爾顯然不想在下一個高速增長的市場繼續被動。根據波士頓諮詢公司(BCG)的分析,2025 年自動駕駛汽車市場總規模將會超過 420 億美元,而 2035 年則將超過 770 億美元。據 HIS(美國汽車專業調查公司)預測,自動駕駛汽車銷售量將在 2035 年達 2,100 萬輛。預計在 2025~2035 年,保持年複合增長率 43% 的水平,也就是說在美國,2035 年將有約 450 萬輛自動駕駛汽車在路上跑。自動駕駛市場巨大的增長潛力,吸引整個科技界矚目,並不僅晶片業巨頭英特爾和輝達,還包括 Google 與蘋果、百度、微軟等科技巨頭及 Uber、Lyft 等行業新貴。傳統汽車廠商也頻頻有大動作,如通用推自動駕駛量產計畫、福特大型收購案、福斯首發全自動駕駛概念車。自動駕駛市場的增長,必然帶動整個科技產業的增長,不僅晶片領域,還包括軟體演算法領域等各個方面。而 ADAS 做為現階段真正商用的系統,將在最近幾年高速增長,進而為半導體行業的企業提供極大的增長動力。據 JP 摩根公司預測,車用半導體晶片市場將會在 2025 年前達到 730 億美元規模,將在未來幾年保持約 62.5% 的年複合增長率。更重要的是,每輛自動駕駛汽車都是內容豐富且價值極高的資料源。掌握未來自動駕駛領導地位的公司,將同時掌握相關的海量資料;而在這個時代,擁有海量資料就等於擁有寶庫,為獲取市場主導地位顯然值得豪賭。Mobileye 將如何使英特爾受益自動駕駛市場對英特爾來說至關重要,因為傳統 PC 市場逐步萎縮,英特爾又沒有搭上行動晶片市場的特快車,這次規模巨大的收購將幫助英特爾快速滲入自動駕駛市場,取得先機。透過 Zacks Rank 對整個半導體市場的測算,我們得到如下表格,清楚顯示最近一年英特爾的趨勢,在業界增長達 44.5% 的情況下,英特爾增長僅...
NVIDIA 近來積極佈局人工智慧自動駕駛技術,16 日再宣布與全球最大汽車零件商博世(Bosch)合作推出 AI 自動駕駛電腦,另外還與美國最大卡車製造商 PACCAR 合作開發自動駕駛卡車。NVIDIA 與 Bosch 合作推出 AI 車用電腦系統,採用 NVIDIA 新一代 Drive PX2 技術,搭載 NVIDIA 即將推出的 AI 車用超級晶片 Xavier ,可以在一秒內處理 30 兆深度學習的運算,足以應付自動駕駛車執行任務時所需的大量運算,包括運行深層神經網路以感測周遭環境、瞭解 3D 立體環境、在 HD 高解析地圖中定位、預測其他物體的行為與位置以及運算安全行車路線和汽車動態,而且只耗 30 瓦的電力。基本上 Bosch 的 AI 車用電腦系統的硬體和軟體都由 NVIDIA 提供,Bosch 負責開發汽車感測器,由於 Bosch 是一級汽車供應商,將有助於把 NVIDIA 的自動駕駛系統賣到大眾市場。在今年 1 月,NVIDIA 也與另一間汽車零件大廠 ZF 合作推出 ZF ProAI 自動駕駛系統,藉著由汽車供應鏈、製造商上到下的推行自家產品, NVIDIA 在自動駕駛的佈局可說是相當積極。佈局小型汽車之外,NVIDIA 同時也將目光投向大型汽車如卡車,13 日 NVIDIA 同時也宣布與美國最大卡車製造商 PACCAR 合作開發完全自動駕駛的卡車,目前已經開發出證實可行的概念車款,採用的同樣是 NVIDIA...
以電商起家的 Amazon,透過旗下虛擬助理 Alexa 以智慧喇叭 Echo 獲得消費市場注目,而現在 Amazon 宣布,要把 Alexa 帶到自家 ios App 上,直接與蘋果的智慧助理 Siri 打對台。(Source:Amazon)從下週開始,擁有 Amazon App 的 iPhone 用戶,就能直接透過此 App 使用 Alexa。Alexa 目前已經累積超過一萬種技能,它需要與用戶的 Amazon 帳號整合,除了能夠在 Amazon 上購物、追蹤包裹之外,還能與它對話,詢問天氣、運動球賽資訊,或者要求它講個笑話,另外,還能播放音樂、點外送 Pizza、Uber 叫車,以及控制家中智慧家電產品等。但是如果要更改 Alexa 的相關設定,用戶得另外安裝獨立的 Alexa App 才行。Alexa 在應用程式開發上,採開放平台,Amazon 提供 API 以相關工具廣邀開發者來此開發應用,促進 Alexa 技能快速增加,至今已超過一萬種能力;硬體方面,Amazon 也開放給硬體產品製造商,歡迎他們在裝置內建 Alexa 作為虛擬助理,包含 Motorola、聯想、GE 等廠商,都確定推出內建 Alexa 的產品。而現在 Amazon 這個將 Alexa 帶到 iPhone 上的策略,等於直接與 Siri...
這是一輛藍色的林肯,車頂有一塊 LED 螢幕,幾個黑色圓柱體圍繞在 LED 螢幕周圍,不停轉動。車頭前方也有一個黑色凸起。駕駛座旁是一個螢幕,上面顯示密密麻麻的藍色點和藍色框,隨著汽車行駛,點和線不斷消失。副駕座位旁還配備一個小型滅火器。我坐在這輛車上,在山景城兜了一圈。在這段 7.5 公里、20 分鐘左右的車程,經過了 16 個紅綠燈、有 stop sign(停止號誌) 的十字路口、紅色箭號的左轉路口等。大部分時間的體驗都很舒服,只有偶爾突然加速減速,和司機旁顯示幕上科幻感極強的畫面,在提醒我這是一輛無人駕駛車。沒錯,我身旁的司機手並沒有放在方向盤上,腳也離開油門和煞車。車頂的相機、雷射雷達和雷達是汽車的眼睛,車廂後的電腦是汽車的大腦,一套基於深度學習的演算法把我從路邊接上車,又把我送回停車場。這就是之前報導過的創業公司 Drive.ai 研發的自動駕駛汽車。這家神祕的自動駕駛汽車公司成立不到兩年,但這已經是第四代自駕車,我也有幸成為它第一個外部乘客。機器人司機表現得非常自然,比我以往坐過的自駕車更像「人類」,比如當我們駛到一個路口,恰好遇上紅燈轉綠燈,車子並沒有先停下來再啟動,而是無比自然地減速加速切換,過了這個路口。「雖然看起來很簡單,但其中有一些很難的地方。」陪我一起體驗的工程師說。比如某個左轉路口是左轉箭號綠燈亮起才能走,要讓汽車明白在這個特定的路口,前行綠燈和左轉箭號綠燈的差別,並不容易。「剛開始汽車不明白,我們就收集一些這樣的路口資料來訓練,它才學會。」當然,這輛車還有很多可以做更好的地方,比如加減速的處理如何更平穩、怎麼做到紅燈合理右轉及無保護左轉等。但是整體來說,已經是很不錯的駕駛體驗。聯合創始人兼 CEO Sameep Tandon 告訴我們,目前他們的車隊已具備 L4 級(部分狀況下完全自動駕駛)的自動駕駛水準,接下來他們希望和更多夥伴合作,把他們的軟硬體解決方案帶到商務車隊去。經典機器人 vs. 深度學習,自動駕駛哪家強?自動駕駛汽車公司這麼多,Drive.ai 有什麼不同?在採訪中,幾位聯合創始人一再強調,Drive.ai 是一個「深度學習技術為先」的公司。這也就意味著他們採用的技術和 Waymo(Google 無人駕駛車部門)、特斯拉等都不太一樣,他們用的是深度學習技術來打造自動駕駛系統。這意味著什麼?在自動駕駛領域,基本可以分成兩個流派:一是經典機器人方向,基於規則的(rule-base)。工程師會為每個場域都寫好固定的程式碼,來告訴機器人該怎麼做。這樣的結果是,如果新場域出現、又沒有對應程式碼,那麼機器可能不知道怎麼應對,這限制了自駕車的可拓展性。舉一個例子,Waymo 的自動駕駛汽車,從總部山景城延伸到奧斯汀的時候,僅因為山景城的紅綠燈是直向,奧斯汀則是橫向,就沒有辦法順利辨識紅綠燈,不得不讓式設計師重新寫程式「教」它。另外一個現在更受歡迎、包括 Drive.ai 也選擇的方向,是基於深度學習技術。深度學習可模擬大腦辨識機制,對於非結構化資料(如影像語音等)更能辨識、判斷和分類,讓演算法可從資料和訓練中學習。這就像人腦,只需要工程師透過類似的場域不斷訓練機器,它就能自己判斷,這樣即使在全新場域裡,車子也知道如何處理,更有利於適應和延伸。比如同樣辨識紅綠燈,rule-base 的自動駕駛汽車會需要在高精確度地圖上特別標注出所有紅綠燈,讓機器固定看到那個方向;但深度學習算法可直接從相機裡辨識紅綠燈的色彩,所以車輛就可以自己看懂紅綠燈,以及整個路口的行車情況,以此決定是否前行。Sameep Tandon 說,隨著大家都意識到深度學習的優勢,越來越多公司都號稱自己的技術是基於深度學習基礎,但事實上很少有人真正做到這點。「我們所有的技術,比如地圖、行動規劃、決策全都基於深度學習。我們是用深度學習來設計整個系統,這和其他公司走經典機器人方向,只把深度學習當做補充部分,有很大不同。」他說。從資料處理到演算法訓練再到計算資源,利用深度學習打造一個自動駕駛公司Drive.ai 的另一個創始人 Tao Wang 說,自動駕駛的困難之一是自動駕駛產生的資料量極大,在收集到資料後,怎麼使用成了關鍵。第一步要做的事情就是標記它們,才能訓練演算法引擎。1 小時自動駕駛產生的資料,即使是大型網際網路公司,也需要 800 個小時人工標記。Drive.ai 自己打造了一個自訂的資料標記工具,可不斷最佳化整個資料工作流程,進行高品質的資料分類。他們使用深度學習讓同一個工作可同時進行多個分類,把匯出結果整合後,就可以產生高品質的標記。他們現在資料標寄的速度已是大公司的 20 倍,這也就意味著有更多資料可以「餵」給演算法引擎學習,進而讓汽車快速處理新道路、學習新使用場域,隨著訓練資料的增加而持續提高效能。Tao Wang 說,Drive.ai 的深度學習系統甚至比專門的人類標注者更準確。有一次演算法顯示某個號誌燈是紅燈,但是專門的標注員回憶說是綠燈,結果他們檢視資料後,發現真的是紅燈。「這也表明演算法可訓練得比人類更聰明。無論是決策、路線規劃還是定位都可以做得很好。」有一次,自駕車看到路上有一隻狗在滑滑板,標注員很震驚地和工程師說:「請問這個要怎麼分類?」然而汽車還能正常行駛。深度學習關鍵就在不需要辨識每樣東西,而是知道怎樣是安全駕駛,然後自己做決策。另外一個重要部分是,Drive.ai 打造了一個模擬器,可以模擬各種場域,比如自行車搶道等,檢查學習引擎怎麼處理這些情況。這個模擬器是 7×24 小時運轉,所以相當於車一直在虛擬世界的道路上進行各種測試。在真實世界裡,身為最早拿到加州自動駕駛汽車上路測試許可證的創業公司之一,Drive.ai 也已讓自家無人車在山景城城區上路測試 9 個月了,沒有發生任何事故。另一個關鍵點是,利用於深度學習的自動駕駛系統可以擺脫昂貴硬體。和特斯拉與 Waymo 的「天價」自訂感測器不同, Drive.ai...
三星近期發出新聞稿,趕在旗艦 Galaxy S8 上市前,先發表去年已經預覽過的智慧助理「Bixby」。三星也提前劇透,表示「Bixby」將會是 S8 的重點功能。根據三星的描述,第一版的「Bixby」大概就是類似 Siri、Alexa 那樣,可以透過聲控來操作裝置、使用 App 的智慧助理。不過三星也指出了三項與現行 AI 助理的差異:首先,「Bixby」可以完整使用支援 App 的所有功能。以 iOS 的 Siri 來說,聲控的可控範圍、與直接拿起手機來觸控其實差異極大,比如說用戶目前可以用 Siri 操作 LINE 傳送訊息,但無法傳送貼圖,然而 Bixby 卻幾乎可以取代 App 的觸控操作。Bixby 也可以理解 App 目前的使用狀態與進程,因此,用戶可以觸控操作一段時間後,再轉而透過 Bixby 收尾。與目前的語音助理一旦開啟、都必須重啟一個新的工作流程或任務相較,Bixby 的特點在於能了解任務的現有背景,強化便利性。它同時也能理解用戶的語境。最後一項差異則是 Bixby 不需要一套固定而僵化的指令,能聽懂不完整的要求。如果不理解,AI 也會跳出提醒,希望提供更完整的指令。三星指出,Bixby 與 AI 將是三星未來的發展核心。而在目前,公司將特別著重在 UX,希望 Bixby 可以讓用戶從已經發展 10 年、同時手邊裝置也愈來愈多元的觸控時代解放,成為新的人機界面,而不是再依靠 UX 設計師的才能,在各種不同的裝置、不同大小的螢幕設計一套新 UI。至於目前,Bixby 將會從 Galaxy S8 開始,先搭載在三星手機,再慢慢擴大到旗下每一款裝置與家電。包括 S8,未來支援 Bixby 的裝置都會有一個專屬的側邊鍵來開啟它。而第一代支援的軟體,將會是 S8 裡的一組內建...
初次想要投資的人一開始碰上的問題莫過於不知從何下手,就算買了股票也是每天戰戰兢兢的看盤不放?現代的金融科技可以讓你直接從線上透過與人工智慧的對話,就能告訴你如何進行投資。機器人理財(Robo Advisors)除了便利特點,更能夠實現自動化管理資產,不會有人為的道德風險問題。這項服務剛推出時,從各個層面帶給了市場相當大的震撼,值得一探究竟。假如民眾不僅是要短期投機,而是想盡量降低風險並獲得較為穩健的報酬,那麼理解投資組合理論就是一件必要的事情。俗話說雞蛋不要放在同一個籃子裡,就是投資組合的寫照,然而實務上如何去選擇,是一門很大的學問,不同的資產有不同的風險及報酬,甚至同一種資產也會隨著時間及環境改變,所以掌握足夠的資訊就非常的重要。例如 Wealthfront 公司的機器人理財服務就是結合市場資訊演算並基於現代投資組合理論而誕生。人工智慧設計投資組合在主打機器人理財服務的新創公司當中以美國的 Wealthfront 及 Betterment 公司最為有名,其所用到的技術包括機器學習、大數據分析、資料回測、人工智慧等,就是用來找出個別資產之間的相關性及配置比例,以達到符合投資者風險偏好的資產組合。例如最基本的,想要更穩健退休的民眾就分配更多比例的資金在債券上,而追求報酬的投資人其資產配置,股票就可能佔更多。再透過理論模型的演算就可以設計出符合不同風險偏好及理財目標的投資組合推薦給客戶。 再拿 Betterment 公司為例,只要在線上回答年齡、年收、投資目標等並填寫銀行帳戶、地址等基本個人資料後,就可以取得客製化的投資組合建議,還可以隨時利用手機 APP 等軟體來查看獲利情形,並調整偏好的資產配置,如股票與債券的投資比例。其實就這些步驟而言,與傳統金融業者並無不同,畢竟原本這些演算大部分就是透過電腦完成的,只是在某些判斷上可能依靠更多人力。 (Source:Betterment.com) 降低入門門檻 事實上,單純利用網路科技理財已不算是創新,自從智慧裝置興起之後,能即時監控投資的軟體層出不窮,但在財富管理上的應用卻不普遍,所以才造就了機器人理財這項服務。理財機器人具備協助客戶設定目標、針對目標提供理財規劃等附加功能,可解決許多初學者及缺少專業知識的民眾在投資時所遇到的問題。機器人相較於傳統理專還有一項優勢就在於道德問題,有些從業人員為了賺取更多傭金會去鼓吹客戶購買不必要的商品,甚至導致客戶虧損。不過以目前的技術而言,大部分的機器人理財服務,仍然侷限在被動投資管理,而主要標的通常是 ETF。 也因如此,雖然機器人理財有諸多優勢,不過仍不能說改變了整個市場,近年來,美國兩大機器人理財領導公司 Betterment 與 Wealthfront 所受託管理的資產成長速度已經趨緩。其中原因除了其他傳統資產管理公司也在發展相關業務如,貝萊德(BlackRock)收購了 FutureAdvisor 以及高盛(Goldman Sachs)及嘉信集團(Charles Schwab)等皆推出了自己的智慧理財服務外,事實上大多數客戶僅滿足於免費服務。 (Source:Kitces.com) 關鍵還是在信任 所以有觀點認為,機器人理財還是沒有辦法完全取代人力作投資研究及決策,付費的機器人服務並不受青睞。但這可能還不是主要原因,因為還有一點很難用技術克服,那就是信任。真正能影響市場的高資產人士,是否真的願意將財富交由機器人代為管理,才是金融科技能否顛覆傳統市場的真正關鍵。據華爾街日報的調查,目前只有 1/3 的受訪者表示他們會願意用完全數位化的服務作為主要的投資顧問。而且光靠線上的風險容忍問卷,原本也很難達到理解投資者真正的財務需求和目標。 但這並不表示,機器人理財就沒有前景。事實上,許多傳統資產管理公司正開始以機器人來強化原有服務,但不是取代。就如同前圖所示,自從老牌資產管理公司 Vanguard 及 Charles Schwab 加入了機器人理財服務後,那些新創公司便開始遇到成長壓力。可以說此項金融科技,並不利於讓新創公司直接挑戰傳統金融巨頭,如台灣政府本身也擔心沒有投顧執照的公司跨足這項服務而暫不開放。 Can Robo Advisers Replace Human Financial Advisers? 4 Reasons Why the End is Near for Wealthfront Wealthfront Review 2016:...
顯示晶片生產廠輝達商 (NVIDIA) 在 9 日宣布,將攜手軟體大廠微軟 (Microsoft),發展全新專為驅動人工智慧 (AI) 雲端運算的超大規模 (hyperscale) GPU 加速器藍圖「HGX-1 」。全新 HGX-1 架構的設計是為滿足 AI 雲端運算的需求需求而來。其範圍包含自動駕駛、個人醫療照護、超越人類的語音辨識、數據與影像分析以及分子模擬等應用。輝達表示,全新 HGX-1 是一款結合微軟 Project Olympus 開源設計的超大規模 GPU 加速器,提供超大規模資料中心於人工智慧快速且具彈性的途徑。而且,HGX-1 適用於建構在雲端運算上的人工智慧作業,如同二十多年前為 PC 主機板所推出 ATX (Advanced Technology eXtended) 時的角色一般,HGX-1 建立了一項業界標準,能快速且有效的被採用以協助達到急速增長的市場需求。輝達共同創辦人暨執行長黃仁勳表示,AI 為全新的運算模型,因此需要全新的架構支援。HGX-1 超大規模 GPU 加速器在 AI 雲端運算所扮演的角色,如同過去 ATX 標準使現在 PC 能夠普及一樣。HGX-1 將使雲端服務供應商能更輕易的透過 NVIDIA GPU 滿足激增的 AI 運算需求。微軟公司總經理,暨 Azure 硬體基礎架構部門工程師 Kushagra Vaid 也指出,HGX-1 AI 加速器將提供極至的效能擴充,以達成快速成長的機器學習作業負載需求,同時,其特殊的設計使現今全球各地的資料中心皆能輕易採用。對於全球數千家已投資 AI 與採納基於...
在 9 日凌晨的 Google Cloud Next ’17 大會上,Google 雲端服務 AI 與機器學習部門的首席科學家李飛飛,公布了新的機器學習 API:Video Intelligence API。它可以自動辨識影片中的物體,讓影片搜尋成真。李飛飛稱,影片一直被視為電腦視覺裡面的「暗物質」,無法像圖片一樣便捷的搜尋,但新的 API 可以幫助開發者開發出從影片中讀取實體的應用。在展示中,影像 API 可搜尋棒球、狗這樣的實體,並標出其在影片中出現的位置,進而得到物體在影片中出現的頻率。除了提取資料,API 還允許標籤變換的場景。在 Google 的官網已經有了展示的影片,可以點這裡試玩。除了影像 API,李飛飛還表示,Google 的機器學習引擎 ML Engine 會提供給更廣泛的用戶。該引擎可以使用 TensoFlow 框架開發機器學習模型。她還在演講中提到,希望能讓 AI 民主化,讓更多人享受到 AI 的便利。(本文由 雷鋒網 授權轉載;首圖來源:Google)
3 月 8 日的 Google Cloud Next Google 雲端計算開發者大會上,華人 AI 學界的驕傲、Google 雲端首席科學家李飛飛宣布一則重大訊息:Google 收購 Kaggle。其實,這事近兩天已陸續有風聲傳出。但 Google 和 Kaggle 對媒體總是「無可奉告」的態度,導致大家各自猜測,但無從證實。即便李飛飛在 Next 大會上對全世界宣布,也僅停留在「沒錯,我們是收購了 Kaggle,這對雙方都有好處」層面;對收購細節、未來計畫等一概沒提,更別說收購協定和價格。但是 Google+Kaggle,即便不進行任何探究,也是震動資料科學、AI、機器學習三界(在很多方面「三界」本是一體)的大事件。其衍生出來的潛藏資訊:對開發者社群的意義、產業走向,以及Google的機器學習布局等──雖然當事者惜字如金,卻為嗅覺敏銳的觀察者帶來巨大的想像空間。這隱約使人聯想到 2014 年 Google 收購 DeepMind:雖後者與 Kaggle 不管在業務還是營運方式都完全不同,但 Kaggle 所掌握的產業資源,只會在 DeepMind 之上;兩次收購對 Google 的意義,同樣位於極高的戰略層面。▲ 李飛飛宣布 Google 雲收購 Kaggle。下面我們來整理一下,關於此次收購至今披露的所有資訊。Kaggle 簡介凡是玩資料科學和機器學習的老手,有兩個網站一定不會錯過:GitHub 和 Kaggle。前者用來分享,後者進行實戰練習。對不熟悉 Kaggle 的人,先來一段簡介。簡而言之,Kaggle 是玩資料、ML 的開發者展示功力、揚名立萬的江湖。它在 2010 創立,專注於舉辦資料科學相關的線上競賽。它吸引大量資料科學家、機器學習開發者參與,為各類現實中的商業難題開發基於資料算法的解決方案。競賽的獲勝者、領先者,在得到對方公司提供的優厚報酬之外,還可引起業內科技巨頭的注意,或許獲得各路 HR 青睞,為自己的職業道路鋪上紅地毯。因此與 GitHub 不同的地方,Kaggle 為其社群提供一整套服務。其中最有名的是它的招聘服務以及名為 Kaggle Kernels...
根據藍色巨人 IBM在官網上的公布,該公司已經開發出針對語音辨識,錯誤率達到 5.5% 的系統。根據這樣結果,顯示當前電腦語音辨識的能力已經與人類達到差不多的水準。IBM 指出,人們在說話時,對方每聽 20 個單字或詞,就有可能會漏掉或聽錯 1 到 2 個。以此比例計算,人類在 5 分鐘的對話中,有可能會聽錯 80 個單字或詞。只是就人類來說,多數人在理解說話的意思上沒有問題。然而這樣的情況對電腦可就不一樣。2016 年,IBM 宣布在自然對話環境中的語音辨識上獲得重大進展,也就是開發出單字或詞錯誤率為 6.9% 的系統,之後還在不斷進步。現在 IBM 宣布,已經達到新的業界紀錄,創下 5.5% 錯誤率。而 IBM 研究人員在達成這個突破時,是專注於應用深度學習技術,將 LSTM 和 WaveNet 語言模型與其他 3 個強大的聲學模型結合起來的結果。使用的 3 個聲學模型中,前 2 個為雙向 6 層 LSTM。包括一個為多特徵輸入,另一個則是有對話多任務學習能力。最後一個模型不僅能從積極的例子中學習,也能利用消極的例子,這將使系統變得越來越聰明,在之後重複出現類似的說話風格時,便能表現更好。IBM 表示,達成與人類同等水準,也就是錯誤率與一般 2 個人類說話時相當,長期以來都是在開發語音辨識時的目標,目前其他公司也正在努力追趕 IBM 的紀錄。在這樣的成就上,IBM 與合作夥伴 Appen 正合作呈現與人類相同水準的語音辨識系統。不過,雖然 IBM 達成 5.5% 的錯誤率是一次大突破,但有其他廠商的研究發現,真正的電腦語音辨識要達到人類同等水準,其錯誤率應該下降到 5.1%。雖然只有 0.4% 錯誤率的差別,但就目前的科技技術來說,要達到與人類相同水準的錯誤率,還有很大一段需要努力的距離。(首圖來源:shutterstock)