這是一輛藍色的林肯,車頂有一塊 LED 螢幕,幾個黑色圓柱體圍繞在 LED 螢幕周圍,不停轉動。車頭前方也有一個黑色凸起。駕駛座旁是一個螢幕,上面顯示密密麻麻的藍色點和藍色框,隨著汽車行駛,點和線不斷消失。副駕座位旁還配備一個小型滅火器。
我坐在這輛車上,在山景城兜了一圈。在這段 7.5 公里、20 分鐘左右的車程,經過了 16 個紅綠燈、有 stop sign(停止號誌) 的十字路口、紅色箭號的左轉路口等。大部分時間的體驗都很舒服,只有偶爾突然加速減速,和司機旁顯示幕上科幻感極強的畫面,在提醒我這是一輛無人駕駛車。
沒錯,我身旁的司機手並沒有放在方向盤上,腳也離開油門和煞車。車頂的相機、雷射雷達和雷達是汽車的眼睛,車廂後的電腦是汽車的大腦,一套基於深度學習的演算法把我從路邊接上車,又把我送回停車場。
這就是之前報導過的創業公司 Drive.ai 研發的自動駕駛汽車。這家神祕的自動駕駛汽車公司成立不到兩年,但這已經是第四代自駕車,我也有幸成為它第一個外部乘客。機器人司機表現得非常自然,比我以往坐過的自駕車更像「人類」,比如當我們駛到一個路口,恰好遇上紅燈轉綠燈,車子並沒有先停下來再啟動,而是無比自然地減速加速切換,過了這個路口。
「雖然看起來很簡單,但其中有一些很難的地方。」陪我一起體驗的工程師說。比如某個左轉路口是左轉箭號綠燈亮起才能走,要讓汽車明白在這個特定的路口,前行綠燈和左轉箭號綠燈的差別,並不容易。「剛開始汽車不明白,我們就收集一些這樣的路口資料來訓練,它才學會。」
當然,這輛車還有很多可以做更好的地方,比如加減速的處理如何更平穩、怎麼做到紅燈合理右轉及無保護左轉等。但是整體來說,已經是很不錯的駕駛體驗。
聯合創始人兼 CEO Sameep Tandon 告訴我們,目前他們的車隊已具備 L4 級(部分狀況下完全自動駕駛)的自動駕駛水準,接下來他們希望和更多夥伴合作,把他們的軟硬體解決方案帶到商務車隊去。
經典機器人 vs. 深度學習,自動駕駛哪家強?
自動駕駛汽車公司這麼多,Drive.ai 有什麼不同?
在採訪中,幾位聯合創始人一再強調,Drive.ai 是一個「深度學習技術為先」的公司。這也就意味著他們採用的技術和 Waymo(Google 無人駕駛車部門)、特斯拉等都不太一樣,他們用的是深度學習技術來打造自動駕駛系統。
這意味著什麼?
在自動駕駛領域,基本可以分成兩個流派:一是經典機器人方向,基於規則的(rule-base)。工程師會為每個場域都寫好固定的程式碼,來告訴機器人該怎麼做。這樣的結果是,如果新場域出現、又沒有對應程式碼,那麼機器可能不知道怎麼應對,這限制了自駕車的可拓展性。
舉一個例子,Waymo 的自動駕駛汽車,從總部山景城延伸到奧斯汀的時候,僅因為山景城的紅綠燈是直向,奧斯汀則是橫向,就沒有辦法順利辨識紅綠燈,不得不讓式設計師重新寫程式「教」它。
另外一個現在更受歡迎、包括 Drive.ai 也選擇的方向,是基於深度學習技術。深度學習可模擬大腦辨識機制,對於非結構化資料(如影像語音等)更能辨識、判斷和分類,讓演算法可從資料和訓練中學習。這就像人腦,只需要工程師透過類似的場域不斷訓練機器,它就能自己判斷,這樣即使在全新場域裡,車子也知道如何處理,更有利於適應和延伸。
比如同樣辨識紅綠燈,rule-base 的自動駕駛汽車會需要在高精確度地圖上特別標注出所有紅綠燈,讓機器固定看到那個方向;但深度學習算法可直接從相機裡辨識紅綠燈的色彩,所以車輛就可以自己看懂紅綠燈,以及整個路口的行車情況,以此決定是否前行。
Sameep Tandon 說,隨著大家都意識到深度學習的優勢,越來越多公司都號稱自己的技術是基於深度學習基礎,但事實上很少有人真正做到這點。「我們所有的技術,比如地圖、行動規劃、決策全都基於深度學習。我們是用深度學習來設計整個系統,這和其他公司走經典機器人方向,只把深度學習當做補充部分,有很大不同。」他說。
從資料處理到演算法訓練再到計算資源,利用深度學習打造一個自動駕駛公司
Drive.ai 的另一個創始人 Tao Wang 說,自動駕駛的困難之一是自動駕駛產生的資料量極大,在收集到資料後,怎麼使用成了關鍵。第一步要做的事情就是標記它們,才能訓練演算法引擎。1 小時自動駕駛產生的資料,即使是大型網際網路公司,也需要 800 個小時人工標記。
Drive.ai 自己打造了一個自訂的資料標記工具,可不斷最佳化整個資料工作流程,進行高品質的資料分類。他們使用深度學習讓同一個工作可同時進行多個分類,把匯出結果整合後,就可以產生高品質的標記。他們現在資料標寄的速度已是大公司的 20 倍,這也就意味著有更多資料可以「餵」給演算法引擎學習,進而讓汽車快速處理新道路、學習新使用場域,隨著訓練資料的增加而持續提高效能。
Tao Wang 說,Drive.ai 的深度學習系統甚至比專門的人類標注者更準確。有一次演算法顯示某個號誌燈是紅燈,但是專門的標注員回憶說是綠燈,結果他們檢視資料後,發現真的是紅燈。「這也表明演算法可訓練得比人類更聰明。無論是決策、路線規劃還是定位都可以做得很好。」
有一次,自駕車看到路上有一隻狗在滑滑板,標注員很震驚地和工程師說:「請問這個要怎麼分類?」然而汽車還能正常行駛。深度學習關鍵就在不需要辨識每樣東西,而是知道怎樣是安全駕駛,然後自己做決策。
另外一個重要部分是,Drive.ai 打造了一個模擬器,可以模擬各種場域,比如自行車搶道等,檢查學習引擎怎麼處理這些情況。這個模擬器是 7×24 小時運轉,所以相當於車一直在虛擬世界的道路上進行各種測試。在真實世界裡,身為最早拿到加州自動駕駛汽車上路測試許可證的創業公司之一,Drive.ai 也已讓自家無人車在山景城城區上路測試 9 個月了,沒有發生任何事故。
另一個關鍵點是,利用於深度學習的自動駕駛系統可以擺脫昂貴硬體。和特斯拉與 Waymo 的「天價」自訂感測器不同, Drive.ai 使用商業化的低成本硬體,包括雷射雷達、雷達和相機,深度學習系統會同步所有感測器資料,基於這些資訊做最明智的決策,避免單點導致的誤判。這樣即使其中一個失靈,別的感測器也可以正常工作。
正是感測器的多餘設計,才讓他們完成了雨夜開車的成就──即使雨水擋住相機,但其他感測器讓汽車仍然安全地自動駕駛。
由於感測器會將資訊傳給軟體系統的人工智慧神經網路,這些神經網路系統可在普通計算硬體上執行,所以這讓他們的解決方案成本大大降低。
「我們的改裝方案並不貴,且可以適應各類汽車,無論汽車、貨車、卡車或高爾夫車都行。我們可以在一週內就登陸一個新的汽車平台。而且由於我們在為機器應用打造規模化神經網路的專長,只需要其他自動駕駛汽車計算資源的一部分,就能讓自駕車執行。每台車需要的處理器資源差不多是一台家用電腦的 30% 而已。」Sameep Tandon 說。
大部分自駕車都需要精確到公分的高精確度地圖,進行感知、搞清楚汽車開向哪裡,這樣做的結果就是需要持續更新地圖,這非常昂貴且危險。深度學習讓 Drive.ai 的自駕車比對地圖上的物體和真實環境,像車道、人行道這類東西,所以即使環境改變了,汽車也能適應。
史丹佛整個人工智慧實驗室成員跑來創業
為什麼 Drive.ai 可以做到這一點?這要從團隊的成員背景開始說。雖然Drive.ai 才成立不到兩年,但早在 4、5 年前,團隊創始人就已在史丹佛的人工智慧實驗室,開始怎麼把深度學習系統規模化的研究。
沒錯,團隊核心成員都來自深度學習界鼎鼎大名的吳恩達實驗室。兩年前,由於發現深度學習在無人駕駛上的機會,實驗室 6 個人全都暫停博士學業,一起成立這家公司。所以,在一些公司有一兩位深度學習專才就很稀有時,這個團隊已把史丹佛人工智慧實驗室都搬空了……
「自動駕駛非常難,如果只是一個人很難做好,所以我們決定大家一起做好了。」聯合創始人兼 CEO Sameep Tandon 說。「我們那時和很多汽車公司聊過,發現自己有這麼棒的技術,所以等不及畢業了。」
Tandon說,團隊很早就開始做非常基礎的研究,比如資料標記等,是最棒的深度學習團隊之一。當他們還在史丹佛,就打造過世界最大的神經網路。當時 Google 用1,000 台機器在 Google Brain 專案裡做了一個實驗,結果他們只用 16 GPU 機器就重現了這個效果,只花十分之一的成本。所以 Tandon 很有底氣的說,他不知道其他號稱深度學習的公司有些什麼核心技術,但他們絕對是世界最好的深度學習團隊之一。
在低調研發兩年後,Drive.ai 現在認為自家在 L4 級無人駕駛的研究上已到一定階段,希望進一步搜尋合作夥伴,把技術帶到更多汽車上。聯合創始人 Carol Reiley 告訴我們,Drive.ai 和 OEM 商關係很親密,也希望獲得汽車製造商的支援。「我們不生產車和感測器,我們只提供解決方案。現在希望先從商務車隊開始合作,包括包裹運送、食物運送、零售等。我們希望和夥伴一起先做到 L4 程度,提高定位準確性,一起收集資料,然後不斷向外拓展,最終向消費者層級的 L5 級前進。」
「深度學習做為人工智慧的一種領先方法,可以教機器如何像人類思考,這就是無人駕駛的關鍵。在這個基礎上,打造一個可延伸、適用廣泛、安全的平台,就是我們做的事。我們相信,無論安全性還是效率方面,自動駕駛會整個顛覆交通系統。」Sameep Tandon 說。
(本文由 PingWest 授權轉載,首圖來源:Drive.ai)