與 Amazon Echo 相比,Google Home 為何只用了 2 個麥克風?

213

2014 年,數次敗戰於智慧硬體的 Amazon 終於發布了 Echo 智慧音箱,這款在 Lab 126 研發權重排名靠後的產品,剛開始面對市場戰戰兢兢,僅採用了邀請購買來試水市場。當時估計沒人想到這款產品竟然出奇地贏下了口碑!於是 Amazon Echo 開始在美國市場大肆推廣,連廣告都做進了超級杯!最近 Echo 開始在歐洲全面發售。Echo 得益於 Amazon 的線上和線下通路,其銷量往上竄,成為了智慧硬體迄今為止在口碑和銷量上都比較成功的產品。

Google 顯然坐不住了,2016 年 5 月份的 I/O 開發者大會上,Google 的產品副總裁 Mario Queiroz 以黑色 T 恤和牛仔褲的經典 IT 造型,向大家介紹了 Google Home 智慧音箱。

與 Amazon Echo 相比,Google Home 為何只用了 2 個麥克風?

台灣時間 2016 年 10 月 5 日,Google 秋季發表會正式推出了 Google Home 智慧音箱。從 10 月 5 日開始,Google 要與 Amazon Echo 一較高下的 Google Home,可以從 Google 網上商店、沃爾瑪等通路開放預訂,並於 11 月 4 日陸續發貨。

當然坐不住的還有 Apple, Siri 智慧音箱也是未來可期的產品,Apple 不會錯過如此有趣的臥室爭奪大戰。不過,這裡不得不吐槽一下,Google 和 Apple 相繼召開發表會,其保密工作的步調真是極其一致,一塌糊塗。不過也好,說明現階段各家巨頭的技術路線都非常清晰,即便對於智慧音箱這片蠻荒之地,確實也很難再爆出令人興奮的技術。既然驚豔不再,在這個被譽為未來千億美元的市場競爭之中,巨頭之間的技術到底又有多大差別呢?

與 Amazon Echo 相比,Google Home 為何只用了 2 個麥克風?

價格

Google Home 售價定為 129 美元,而 Amazon Echo 售價為 179.99 美元,但是 Amazon 還有更便宜的 Amazon Tap 和 Echo Dot,兩者分別定價為 99.99 美元和 49.99 美元。顯然 Home 要走性價比路線,但是 Echo 在低階市場的布局更加完善。

硬體

Amazon Echo 規格 是 TI DM3725 / 256MB 記憶體 / 4GB 快閃記憶體,而 Google Home 應該是沿用 Chromecast 的硬體規格,與 Marvell Armada 1500 / 512MB 記憶體 / 2GB 快閃記憶體的規格接近。毫無疑問,這兩款產品不約而同地選擇了 ARM 晶片架構。

智慧音箱的核心屬性仍然是音箱,其音質需求應該是第一位的,遺憾的是兩款產品的音質體驗都是一般。兩款產品都是選用了 D 類標準功放晶片,Amazon Echo 選用的是 1 個 2 吋揚聲器 + 1 個 2.5 吋低音揚聲器組合,而 Google Home 選用的是 1 個 2 吋揚聲器 + 2 個被動振膜組合。注意 Echo 也有被動振膜,被動振膜主要就是為了擴展低音效果,這對於小型音箱來說非常重要。

被動振膜為什麼會改善低音體驗呢?通俗來講,可以近似理解為低頻體驗與揚聲器推動的空氣體積有關,這在物理上主要有兩種實現方法:

一種方法是增加振膜面積,還有一種方法就是增加振膜的運動衝程。

大型揚聲器顯然推動的空氣體積更多,其低頻效果要遠遠好於小型揚聲器。被動振膜就是藉助揚聲器在音腔內的空氣振動受迫振動,進而推動更多的空氣,改善低頻效果。但是受限於智慧音箱的體積和功耗,音質的改善還不是當前智慧音箱的重點。

Home 和 Echo 這兩款產品在硬體方面最大的差異,應該就是 Amazon Echo 選用的是 6+1 麥克風組成的麥克風陣列,而 Google Home 選用的是 2 麥克風組合。因此 Amazon Echo 可以使用環形燈帶提示不同聲源的喚醒方向,而 Google Home 只用 4 個 LED 燈顯示是否正在語音辨識偵聽,Home 採用 2 個麥克風的配置目前來說還無法進行聲音定向。

與 Amazon Echo 相比,Google Home 為何只用了 2 個麥克風?

這裡可能會有個疑問,為何 2 個麥克風就不能準確測出聲音位置呢?人類也是兩隻耳朵呀?確實,很多科學的進步都是在仿生中得到啟發,但是這有兩個前提:首先要搞明白基本原理,其次要有模擬的方法。這兩項至少目前還無法做到,迄今為止科學家還沒真正搞明白人類耳朵的複雜工作方式,當然也就沒有辦法造成如同複雜耳朵一般的仿生零件。僅僅憑藉 2 個麥克風,還無法做到人耳這種定位的能力。

為解決這個問題,通常就是增加陣元數量,就是採用多個麥克風,例如 Echo 的 6+1 麥克風陣列,用來定向聲源資訊,抑制無關噪聲,保證真實環境的語音識別率。2 個麥克風也具有較好的降噪性能,手機和藍牙耳機上的降噪功能大多也都採用雙麥結構,但是這在複雜環境特別是距離較遠噪聲較多的時候效果不好。綜合各家人工智慧公司的語音識別率測試來看,多麥克風的性能是普遍認可的。從這點來看,Home 的遠場識別能力,特別是在複雜環境下的語音交互能力,肯定明顯弱於 Echo。

為何 Google Home 僅採用了 2 個麥克風呢?

筆者估計應該是兩個原因,一是成本方面的考慮,Echo 的 6+1 陣列成本大概要在 45 美元左右,Home 恰恰就比 Echo 便宜了 50 美元;另外一個應該就是時間問題,麥克風陣列不僅成本昂貴,技術上目前還是比較複雜,Home 也考察了很多家供貨商,最終可能沒有趕上產品發表時間。Google Home 的二代版本相信就會採用麥克風陣列技術。

麥克風陣列的技術複雜和成本昂貴是阻礙這種技術普及的重要原因,但是在真實環境的表現確是毋庸置疑的。不僅智慧音箱,智慧汽車和機器人都在廣泛使用這項技術。中國也有科大訊飛、思必馳和聲智科技致力於推進這種語音交互前端技術的普及應用。

另外,Amazon Echo 僅有黑色和白色兩款型號,而 Google Home 可以更換外殼,擁有 6 種不同的顏色。至於兩款產品的功能按鍵,基本相差不大,對於用戶來說足夠了。

軟體

由於兩款產品均是基於 ARM 架構,採用 Linux + App 的可能性更大,Home 估計也不會用 Android,畢竟 Android 太過龐大,啟動還是太慢。Amazon Echo 的 App 就是 Alexa 語音助手,喚醒詞默認是 Alexa,而 Google Home 直接使用 Google Assistant,喚醒詞默認是 OK Google 或者 Hey Google。

這兩家產品的喚醒詞感覺都挺傻,也不符合用戶自然互動的習慣,很多時候我們都習慣採用更簡單的名字來開始對話,但是這在當前的語音喚醒中還是有些問題,多個音節的喚醒詞至少可以保證虛警率比較低,相比多個音節來說,用戶其實更討厭智慧音箱莫名其妙的自己啟動,突然的聲音往往會嚇人一跳。

Google Home 和 Amazon Echo 集成的功能比較類似,包括了天氣、音樂、出行、購物、搜尋、日曆等,而且都可以與其他智慧設備進行連接操控。Google 由於收購了 Nest,也有自己的 ChromeCast,因此一開始就顯得咄咄逼人。

平台

智慧音箱另一個重要方面就是平台聚合,也就是做為一個平台如何相容於第三方公司的內容、服務和設備。亞馬遜的 Alexa 平台是一個開放平台,目前已經聚合了超過 3,000 項功能,這些都是由第三方公司開發的。Amazon Echo 逐漸成為國外用來控制智慧家居設備越來越重要的平台,透過這個平台的 API,甚至可以控制燈光、門鎖、調溫器、風扇、空調等一切家居設備。Amazon 也啟動了 100 億美元的 Alexa 開發基金,以便扶持第三方公司在生態鏈上的開發。

Google 則是另外一個思路,目前來看還是比較封閉,之所以如此,也是因為 Google Assistant 能夠利用過去 Google 在手機領域積累的優勢。雖然 Google 也創建了開發工具包,為企業直接集成 Google Assistant,但是相比 Alexa 來說還是顯得有些複雜。Google 最大的優勢還是自身資源的無比豐富,包括收購的 Nest 和自己的 ChromeCast,至於第三方合作,目前也僅集成了飛利浦的智慧燈泡。

前景

「亞馬遜點燃了戰火,並證明了語音服務的價值。」Sonos 總裁 Patrick Spence 接受採訪時曾經這樣說。但是 Sonos 這家 Wi-Fi 音箱的早期廠商,確實起了個大早,趕了個晚集,競爭的舞台讓給了幾家巨頭。

雖然 Amazon 的 Alexa 平台幾乎被定義成了下一代的語音搜尋引擎,但是 Google 的 Home 不僅只是語音搜尋,而且是與 Google 搜尋整合,了解用戶搜尋習慣和搜尋歷史,相比 Alexa 來說能使搜尋結果更加智慧,這是非常重要的。

Google 同時也擁有更為龐大的內容資源,Amazon 的 Alexa 可以從維基百科提取資訊,但這和 Google 的知識圖譜相差甚遠,Home 將來不僅可以理解人物、地點和事物,還可以知道它們之間的關聯,這甚至能夠幫助 Google 達到情景情感的理解。當然,Amazon 也有 Google 無法重建或模仿的功能,Alexa 知道用戶在網上的購買習慣和購買歷史,能夠理解甚至預測用戶的購買趨勢並給用戶做出推薦和建議。

值得欣慰的是,人工智慧雖然還在模糊中探索,但是競爭已經開始,創新並不局限於任何一個款具體設備。人工智慧領域出現更多的產品,引入更多的公司,意味著人工智慧,至少是語音助手會變得更加聰明,設計也會更加新穎,而這一切都將加速人工智慧產品在全世界的普及。

(本文由 雷鋒網 授權轉載;首圖來源:達志影像)

延伸閱讀: