星期六, 24 1 月, 2026

旅 TRIVEL

2017 下半年,全球加密貨幣挖礦熱替台積電帶來一筆意外之財,光是第三季就貢獻近 4 億美元營收,台積電更預估,包含加密貨幣挖礦專用 ASIC(特殊應用積體電路)在內的高速運算晶片,將是今年主要成長動能。而這背後的神祕大戶,便是以比特幣礦機起家、成立僅 4 年的中國晶片商「比特大陸」(Bitmain)。(Source:比特大陸)談到比特大陸的兩名創辦人,多數聚焦在吳忌寒中國比特幣首富的身分,較少人注意擔綱比特大陸技術大腦的詹克團(見首圖)。如今,比特大陸靠著自己設計挖礦專用 ASIC 晶片,打造出「算力」領先市場的螞蟻礦機,也是全球最大礦池經營者。從中國科學院微電子研究所後,詹克團 2010 年創辦機上盒公司 DivaIP(天津迪未數視科技),2013 年就被投資分析師出身的吳忌寒找上,神奇的是,詹克團只花了兩小時看完維基百科有關比特幣的介紹,便決定答應吳忌寒的邀請,共同創立比特大陸。我一直在思考,人為什麼要不斷被驅趕往前走、不管賺多少錢也不敢退休?詹克團認為,原因之一是貨幣不斷在變質,以中國來說,人民幣在過去 30 年變質近千倍,而或許比特幣就是解方。只花半年,詹克團就設計出比特大陸第一代螞蟻礦機(Antminer S1),由於效率遠勝競爭產品,投入的資金很快就回收。去年,比特大陸更隨著比特幣價格大漲、訂單暴增,躋身中國前五大 IC 設計公司,「和今年比,過去賺的都是小錢。」詹克團說。不過,詹克團的野心並未止步。早在 2014 年,他們就注意到挖礦整體來說是相對收縮的業務,拓展新市場成為當務之急。「好的時候,客戶天天追著你,不好的時候你送他們也不一定要。」回想 2015 年,比特幣價格來到低點,比特大陸礦機嚴重滯銷,「低於成本價都賣不出去。」詹克團說。這段低迷期長達一年,賣不出去的礦機只能自己加減挖,直到開發出效能更好、替比特大陸奠定市場龍頭地位的螞蟻礦機第五代,現金流才轉正。這時,詹克團也才有精力認真思考下一步。他觀察,深度學習和挖礦同樣屬於「高性能計算」(HPC),耗計算量、又無法用 GPU 和 CPU 等晶片解決,是 ASIC 再適合不過的應用場景。「需求明確、市場上又沒有現成的產品,就是很好的商業機會。」他說。比特大陸在 2015 年投入人工智慧(AI)開發、2016 年寫完第一代程式碼,去年 11 月正式發表首款 AI 專用 ASIC 晶片「算豐」(SOPHON),目前已開始出貨。在產品策略上,比特大陸也不同於 NVIDIA 這類技術領先的大廠,不只比晶片算力、更從「應用」角度突圍,推出專做影像辨識的伺服器,初期將鎖定技術要求相對簡單、應用也成熟的安防產業。詹克團透露,儘管現在 AI 營收還很小,但已經有幾十名客戶進行測試評估階段,未來 3 到 5 年的目標,就是把 AI 業務做起來,甚至超越比特幣。瞄準 AI 市場,一方面也和詹克團的「私心」有關。「我年紀還不到 40 歲,想做一些更有挑戰性的事。」詹克團認為,AI 將替人類帶來巨大改變,而現在有很好的機遇參與這樣的變革和市場領域,「這已經超越企業的範疇了,是更有意義的一件事。」當然,比特幣這顆現成的果子還是得摘了。詹克團說,他們會讓比特幣業務繼續保持在第一位置,加快產品更新。「以前做每一代產品,都必須是成功的,一旦出問題公司就扛不住了,」詹克團說,「現在我們可以嘗試更有挑戰性的東西。」至於去年 12 月比特大陸收購的機器人公司蘿蔔科技,這個看似理所當然的市場布局,也意外讓詹克團露出柔軟的一面。他笑說,現在市面上的機器人還不夠聰明,連他 8...
百度董事長李彥宏 26 日在中國高度發展論壇以「中國經濟的新動能」為主題進行談話,並提到近日無人車事故及個資外洩問題,引發討論。 近日舉行的中國高度發展論壇討論議題多聚焦在數位經濟及新興科技的應用,與對中國的展望。百度作為中國最大的網路搜尋引擎業者,但近年來屢傳出濫用用戶資料、收受利益屏蔽負面新聞及競價排名服務等爭議,導致品牌形象日漸受損。而如今李彥宏在論壇中的一句話更引發輿論反彈。他在談及大數據及用戶隱私時表示,儘管百度很重視保護隱私,但中國人對此問題比較沒有那麼敏感,更願意用隱私換便利。此言一出,引起許多民眾的反彈。有意見表示,中國人的確在用隱私換便利,但這並不是自願的,因為不同意的話根本就什麼事也做不了。 (Source:財新網微博)社論強調,中國很多軟體業者都要求過度的隱私權利,而且這些企業也往往不告訴用戶,這些資料將會作什麼用途,及採取怎樣的方式保護個資。與外國相比差距甚大。例如 Google 同樣是搜尋引擎也會蒐集個資,但是有詳細的隱私權說明,甚至包括技術手段的描述及各細項隱私權的控制開關,這是中國業者所不及的。李彥宏談話節錄在此談話中,其實李彥宏首先談到的是自駕車,他相當肯定自駕系統的發展,未來將會達到中國 GDP 的六分之一規模。不過他表示,目前自駕車還是相當仰賴人類駕駛,要真的能在開放道路運行,恐怕還需要 3~5 年。但之前 Uber 自駕車事故,輿論就過度反應了,就像「狗咬人不是新聞,人咬狗才是新聞」。李彥宏強調,隨著時間過去,輿論終會醒覺到自駕車才是更安全的選項。而且透過中國政府對推動人工智慧技術的發展不遺餘力,再加上中國人口紅利所產生的大數據,未來自駕技術的進展將會非常快。尤其政府及企業的數據開放,將會使 AI 發展呈現指數上升,中國製造正邁向智慧製造,而百度投入的相關研發經費已累積上百億人民幣了。但當主持人問及百度對隱私問題的看法時,李彥宏表示,「當你把不同領域的數據匯集到一起時,力量將會更強大,但我們也非常了解隱私問題及如何保護數據。在過去幾年中,中國正加強執法力度,但同時我也認為,中國人對隱私問題比較開放,或者說沒有那麼敏感,如果通過交換隱私,獲得便利、效率及安全。在很多情況下,他們是願意這麼做的。」(原音) 李彥宏:百度研發投入累積超 100 億元  AI 上將繼續投入 李彦宏:很多时候中国人愿意用隐私交换便利性  中国人不得不用隐私交换便利性 (首圖來源:百度官網)延伸閱讀: Facebook 個資問題又一樁,通話紀錄和簡訊都淪陷 連是不是談遠距戀愛 Facebook 都追蹤,科技巨頭用隱私煉金 口袋裡的間諜:App 追蹤位置數據轉賣,用戶隱私不保 蘋果將用戶資料加密金鑰轉移到中國境內,引發隱私擔憂
人工智慧(AI)不是只有美國、中國雙雄爭霸,日本、以色列、英國等也全力投入,期盼在這場科技大戰中勝出。南華早報報導,安永(EY)訪調 2 千家上市公司的 126 名資深 AI 人員,其中 40% 相信美國的 AI 接納度傲視全球,另外 32% 認為中國才是霸主。IDC 全球研究主管 Chwee Kan Chua 表示,以研究數量而言,美國在 AI 領域領先全球,在醫療和金融服務方面尤為明顯。中國則在影像分析、人臉辨識上,握有絕對優勢。中國 AI 論文數量居冠,約為美國兩倍,不過品質仍不及美國。安永全球創新長(Chief Innovation Officer)Jeff Wong 表示,儘管美國和中國持續領導 AI 科技,其他國家也大有進展,最終能脫穎而出的國家,將是能解譯數據、並能充分利用此一優勢的國家。不少國家砸錢追趕,日本 2018 年財年,計劃斥資 393 億日圓(約 3.7 億美元)發展機器人和次世代電腦的 AI 晶片,日本民間企業每年也投資 6,000 億日圓研發 AI。以色列有「新創之國」的美名,該國 AI 新創業者極多,2017 年共募得 11 億美元,占該國新創企業總募資額的五分之一。IDC 的 Chua 說,現在這些國家還在追趕中美,不過差距很快就會縮小。(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)
以降噪耳機出名的耳機商 Bose,最近別出心裁,在奧斯汀舉辦的 SXSW 推出一款 AR 眼鏡──Bose AR。與 Google 的 Google Glass、微軟 HoloLens 及英特爾 Vaunt 等 AR 眼鏡不同,Bose 並不是透過光學鏡片,在人眼看到的世界疊加一層虛擬視覺資訊。Bose 的 AR 眼鏡既沒有光學鏡片,也沒有鏡頭。他們要做的是提供音響擴增實境體驗。Bose 在 SXSW 展示 3D 列印的眼鏡原型。據外媒報導,這款眼鏡看起來就像一般墨鏡,在公開場合配戴也不會引起注意。Mashable 記者稱,其戴起來很輕便,沒有壓力感,即使眼鏡的電池、電子套件都放在鏡腳上。雖然看起來還是比英特爾 Vaunt 更厚重。鏡腳上有兩個小型定向喇叭,用戶不需戴耳機就可以聽到聲音,其他人是聽不到的,除非把耳朵靠在喇叭上。你可以買一副很酷的眼鏡來聽音樂,當然你還可以做更多。Mashable 記者說明,Bose 在現場示範了戶外應用。當你看著一個地標性建築物時,按兩下觸控區域,Bose 就會為你播放建築的導覽。Bose AR 眼鏡沒有鏡頭,因此並不像一般 AR 眼鏡是以影像辨識來判斷位置。據 Bose 介紹,眼鏡搭載運動感測器,可精確偵測你的方向,配合搭載 GPS 的手機,Bose AR 眼鏡就可清楚知道你在看什麼。▲ 英特爾 Vaunt。這個技術聽起來跟英特爾前段時間推出的智慧眼鏡 Vaunt 如出一轍,兩者的應用場景也近乎一致,只是一個是播放語音,一個是顯示文字或影像。與合適的內容提供商合作,例如當你看著一家餐廳時,Bose 就能提供餐廳介紹、評分等資訊。此外,Bose 還可用於接電話、簡訊。Bose 可辨識人的頭部運動,當有電話打進來時,你可以點頭接電話,也可以搖頭掛斷。左右晃動頭部還能操作功能表。Bose 眼鏡可說具備了智慧眼鏡(不是嚴格意義上的 AR 眼鏡)的基本功能,和英特爾 Vaunt 一樣簡潔,內容和應用場景將決定這款眼鏡的未來。Bose 目前與...
據 BBC 報導,著名物理學家史蒂芬·霍金去世,享年 76 歲。 霍金 1942 年 1 月 8 日出生於英國牛津,出生當天正好是伽利略逝世 300 年忌日。冥冥中預示著某種物理學上偉大的傳承。果不其然,霍金憑藉日後在物理學和宇宙學上的輝煌成就,普遍被認為是愛因斯坦之後最偉大的物理學家。他最重要的學術貢獻是宇宙大爆炸和黑洞理論,並在 1988 年發表了廣為人知的《時間簡史》。可是天妒英才,21 歲時,霍金患上肌肉萎縮性側索硬化症,全身癱瘓,不能言語,手部只有 3 根手指可以活動。從此他就被禁錮在輪椅上長達半個多世紀。不過,霍金依然堅持不懈地進行科學研究。他在 1979 至 2009 年任盧卡斯數學教授,這是英國劍橋大學的一個極負盛名的榮譽職位,牛頓、保羅‧狄拉克都曾擔任。近年來,霍金十分關注人工智慧和人類未來等話題。他對人工智慧以及人類文明的未來,抱持一種非常審慎的態度。2017 年在北京舉辦的 GMIC 大會上,他透過視訊演講稱:我認為強大的人工智慧的崛起,要麼是人類歷史上最好的事,要麼是最糟的。我不得不說,是好是壞我們仍不確定。他對人工智慧的威力始終保持著一種擔心,並表示:我們無法知道我們將無限地得到人工智慧的幫助,還是被藐視並被邊緣化,或者很可能被它毀滅。的確,我們擔心聰明的機器將能夠代替人類正在從事的工作,並迅速地消滅數以百萬計的工作崗位。最終,他總結,「人工智慧的成功有可能是人類文明史上最大的事件。但是人工智慧也有可能是人類文明史的終結,除非我們學會如何避免危險。」而在 2017 年年底在騰訊 WE 大會上,霍金更是直言,人類需要探索太空殖民,才能避免世界末日。因為,到 2600 年,世界將擁擠得「摩肩擦踵」,電力消耗將讓地球變成熾熱的火球。不過,他對太空探險的價值和前景倒是非常看好。霍金把探索太空移民比為哥倫布的偉大探險。「今天的情況就如同 1492 年前的歐洲。當時的人們很可能堅信,哥倫布的探險注定是徒勞無功。 然而,新世界的發現,對舊世界帶來了深遠的影響。」相比之下,「人類向太空的拓展,甚至將會產生更深遠的影響,這將徹底改變人類的未來,甚至會決定我們是否還有未來。」霍金還極力稱讚了探索太空的偉大意義:人類做為獨立的物種,已經存在了大約 200 萬年。我們的文明始於約一萬年前,其發展一直在穩步加速。如果人類想要延續下一個 100 萬年,我們就必須大膽前行,涉足無前人所及之處。如今,斯人已逝,他對人類未來的期許和警告卻依然振聾發聵,值得每一個有理想、關心人類未來的人深思而奮進。這個在過去半個世紀裡曾震撼世界的靈魂,未來也依然活在我們的心中。(本文由 36Kr 授權轉載;首圖來源:達志影像)延伸閱讀: 當代著名物理學家霍金逝世劍橋,終年 76 歲
去年 12 月在與 Google 的合作之下,美國太空總署(NASA)成功發現了兩顆過去被忽略的行星,但在浩瀚無垠的宇宙中仍有太多行星等待著被發現,為了讓探索太空的速度加快,Google 宣布開源搜尋系外行星的代碼,讓所有對太空探索有興趣的人都可以幫上忙。2009 年時,NASA 發射克卜勒太空望遠鏡來搜索太陽系外的行星,但由於相隔距離太遠,天文學家並無法直接觀測、而是只能夠透過「凌日」現象(Transit photometry)來推論其存在:當一顆系外行星通過恆星前方時,恆星的亮度會暫時性的下降。▲系外行星的「凌日」現象。(Source:Google Blog)當然,其他天文和儀器現象也可能導致恆星亮度降低,像是聯星系統、星斑、克卜勒太空望遠鏡上的宇宙射線或儀器上的雜訊,學者必須透過觀測顯示的亮度差異、時間間隔等相關信號進行評估。▲其他現象造成的恆星亮度下降情況。(Source:Google Blog)經過 4 年觀測 15 萬顆恆星後,克卜勒為天文學家收集了大量數據──遠遠超過人力可以有效搜尋的數據。為了讓搜尋行動能夠更有效率,天文學家只得專注在那些最有希望的目標,期望在 3 萬個強列訊號中發現 2,500 顆系外行星。但這也意味著還有 12 萬個較弱信號未經過分析,而其中任何一個都可能代表一顆系外行星。為了不浪費這個寶貴的天文數據,Google 的研究人員先是用 NASA 研究員已標記的 1.5 萬筆系外行星的數據訓練了演算法,教會了演算法該如何在數據中透過一些「特徵」來確認系外行星的存在。而在那之後,Google 的研究人員用它分析了 700 個弱信號,Shallue 和他的同事便發現了兩個過去被忽略、全新的系外行星:克卜勒 80g 和克卜勒 90i。Google負責行星搜尋項目的 AI 高級工程師 Christopher Shallue 表示,他們已經在 Github 上將系外行星搜尋的代碼開源,其中還包含了如何使用它的說明。簡單來說,只要你有興趣,任何人都可以下載並協助在克卜勒數據中尋找系外行星。儘管代碼和相關克卜勒數據對任何人都開放,但它並不是簡單的「隨插即用」──如果你有 Google 機器學習軟體 TensorFlow 和 Python 的編碼經驗,對於想成為發現那顆全新系外行星的「行星獵人」將會很有幫助。Shallue 表示,公布代碼除了要讓大眾了解到神經網路如何發現行星,也希望能鼓勵找出對克卜勒數據進一步的分析方式,替未來更複雜的搜尋工具鋪平道路。 Google’s Open Source AI Lets Anyone Hunt for...
IC 設計大廠聯發科 14 日在北京舉行曦力 Helio P60 手機晶片的發表會,並邀請多家 AI 合作夥伴參與,展示手機 AI 創新應用。由於 Helio P60 是聯發科首款內建多核心人工智慧處理器及 NeuroPilot AI 技術的新一代智慧型手機晶片,而且也是目前市場上首款內建 AI 技術的手機晶片,領先競爭對手,使得市場消費者對 Helio P60 有所期待之外,也使得生態系合作夥伴也加入共襄盛舉。聯發科技無線通訊事業部總經理李宗霖表示,AI 技術正在快速進入消費者的日常生活。做為終端 AI 的推動者,聯發科技非常自豪能為 AI 在各種終端設備的應用和普及提供開放性平台和優異的硬體架構。目前,Helio P60 整合了來自中國的騰訊、商湯、虹軟、曠視等多家 AI 廠商的方案,在手機安全、拍照、人臉辨識等方面均達到業界領先水準。聯發科技將繼續與合作夥伴一起打造 AI 生態系統,共創 AI 未來。與聯發科攜手共同打造 AI 生態系的中國企業或團隊,有騰訊安全團隊、製作影像軟體的騰訊天天 P 圖、人工智慧平台公司商湯科技、人工視覺發展公司曠視科技、以及人工視覺解決方案處理商虹軟等。聯發科指出,未來公司將堅持開放性 AI 平台策略,與眾多 AI 合作夥伴一起提供軟、硬體整體解決方案,打造 AI 生態系統。而目前 Helio P60 是聯發科技 AI 策略在智慧型手機領域的首款落地產品,以合理的價格將高階旗艦手機才有的功能帶給更多消費者,將徹底改變消費者對於智慧型手機的期待。(首圖來源:聯發科官網)
豐田汽車的大數據新創公司 Toyota Connected 14 日宣布將為 Avis 提供 1 萬輛聯網汽車。同時,Avis 計劃在 2020 年前建立一個完全互聯的車隊,簡化租賃過程。據外媒報導,兩家公司的合作關係將從今年延長至 2021 年。這筆交易是 Avis 汽車租賃公司總體目標中的一部分,該協定的目標是到 2020 年在全球建立全面互聯的租賃車隊。Toyota Connected 北美分公司首席執行長柴克‧希克斯(Zack Hicks)聲明表示:「豐田公司的行動服務平台將增強 Avis 租賃車隊的互聯性和可視性,並為用戶提供更多的控制權和便利性,以提升他們的租賃體驗。」根據兩家簽署的協定,Avis 將使用豐田的行動服務平台改善車隊管理,並幫助加快或自動化車輛註冊及結帳處理時間。豐田汽車公司發言人說:「該平台的應用程式介面(API)將即時向 Avis 公司及用戶提供行駛里程、油箱油量和車輛位置等資訊。」Avis 聲明表示:「聯網的豐田汽車預計將於今年 9 月上市,屆時將會有相當數量的車輛進入公司車隊。」(本文由 雷鋒網 授權轉載;首圖來源:Flickr/Mike Mozart CC BY 2.0)
繼在語音辨識和機器閱讀領域取得優秀成績,由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊 15 日宣佈,研發的機器翻譯系統在通用新聞報導測試集 newstest2017 的中翻英測試集,達到可與人工翻譯媲美的水準。這是第一個在新聞報導的翻譯品質和準確率上可以比肩人工翻譯的翻譯系統。newstest2017 新聞報導測試集由產業界和學術界的合作夥伴共同開發,並於去年秋天在 WMT17 大會發表。為了確保翻譯結果準確且達到人類的翻譯水準,微軟研究團隊邀請了雙語語言顧問將微軟的翻譯結果與兩個獨立的人工翻譯結果進行了比較評估。微軟技術院士,負責微軟語音、自然語言和機器翻譯工作的黃學東稱,這是對自然語言處理領域最具挑戰性任務的一項重大突破。「在機器翻譯方面達到與人類相同的水準是所有人的夢想,我們沒有想到這麼快就能實現。」他表示,「消除語言障礙,代表人們的溝通進步,這非常有意義,值得我們多年來為此付出的努力。」▲ 黃學東。機器翻譯是科研人員攻堅了數十年的研究領域,曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水準。雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。微軟亞洲研究院副院長、自然語言計算組負責人周明表示,WMT17 測試集的翻譯結果達到人類水準很鼓舞人心,但仍有很多挑戰需要我們解決,比如在即時的新聞報導測試系統等。微軟機器翻譯團隊研究經理 Arul Menezes 表示,團隊想要證明的是:當一種語言對(比如中─英)擁有較多的訓練資料,且測試集中包含的是常見的大眾類新聞詞彙時,那麼在人工智慧技術的加持下機器翻譯系統的表現可以與人類媲美。跨時區跨領域合作,四大技術為創新加持雖然學術界和產業界的科研人員致力於機器翻譯研究很多年,但近兩年深度神經網路的使用讓機器翻譯的表現取得了很多實質性突破,翻譯結果相較於以往的統計機器翻譯結果更加自然流暢。為了能夠取得中─英翻譯的里程碑式突破,來自微軟亞洲研究院和雷德蒙研究院的三個研究組,進行了跨越中美時區、跨越研究領域的聯合創新。▲ 劉鐵岩。其中,微軟亞洲研究院機器學習組將他們的最新研究成果──對偶學習(Dual Learning)和推敲網路(Deliberation Networks)應用在此次取得突破的機器翻譯系統。微軟亞洲研究院副院長、機器學習組負責人劉鐵岩介紹,「這兩個技術的研究靈感其實都來自於我們人類的做事方式。」對偶學習利用的是人工智慧任務的天然對稱性。當我們將其應用在機器翻譯時,效果就好像是通過自動校對來進行學習──當我們把訓練集中的一個中文句子翻譯成英文之後,系統會將相應的英文結果再翻譯回中文,並與原始的中文句子進行比對,進而從這個比對結果中學習有用的回饋資訊,對機器翻譯模型進行修正。而推敲網路則類似於人們寫文章時不斷推敲、修改的過程。透過多輪翻譯,不斷地檢查、改善翻譯結果,從而使翻譯的品質大幅提升。對偶學習和推敲網路的工作發表在 NIPS、ICML、AAAI、IJCAI 等人工智慧的全球頂級會議,並且已被其他學者推廣到機器翻譯以外的研究領域。▲ 周明。周明帶領的自然語言計算組多年來一直致力於攻克機器翻譯,這一自然語言處理領域最具挑戰性的研究任務。周明表示:「由於翻譯沒有唯一的標準答案,它更像是一種藝術,因此需要更加複雜的演算法和系統去應對。」自然語言計算組基於之前的研究積累,在此次的系統模型中增加了另外兩項新技術:聯合訓練(Joint Training)和一致性規範(Agreement Regularization),以提高翻譯的準確性。聯合訓練可以理解為用反覆運算的方式去改進翻譯系統,用中英翻譯的句子對去補充反向翻譯系統的訓練資料集,同樣的過程也可以反向進行。一致性規範則讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結果。可以說,兩個研究組分別將各自所在領域的累積與最新發現應用在此次的機器翻譯系統中,從不同角度切入,讓翻譯品質大幅提升。在專案合作過程中,他們每週都會與雷德蒙總部的團隊開會討論,確保技術可以無縫融合,系統可以快速反覆運算。沒有「正確的」翻譯結果newstest2017 新聞報導測試集包括約 2 千個句子,由專業人員從線上報紙樣本翻譯而來。微軟團隊對測試集進行了多輪評估,每次評估會隨機挑選數百個句子翻譯。為了驗證微軟的機器翻譯是否與人類的翻譯同樣出色,微軟沒有停留在測試集本身的要求,而是從外部聘請了一群雙語語言顧問,將微軟的翻譯結果與人工翻譯比較。驗證過程之複雜也從另一個側面展現了機器翻譯要做到準確所面臨的複雜性。對於語音辨識等其它人工智慧任務來說,判斷系統的表現是否可與人類媲美相當簡單,因為理想結果對人和機器來說完全相同,研究人員也將這種任務稱為模式識別任務。然而,機器翻譯卻是另一種類型的人工智慧任務,即使是兩位專業的翻譯人員對於完全相同的句子也會有略微不同的翻譯,而且兩個人的翻譯都不是錯的。那是因為表達同一個句子的「正確的」方法不止一種。 周明表示:「這也是為什麼機器翻譯比純粹的模式識別任務複雜得多,人們可能用不同的詞語來表達完全相同的意思,但未必能準確判斷哪一個比較好。」複雜性讓機器翻譯成為一個極有挑戰性的問題,但也是一個極有意義的問題。劉鐵岩認為,我們不知道哪一天機器翻譯系統才能在翻譯任何語言、任何類型的文本時,都能在「信、達、雅」等多個維度上達到專業翻譯人員的水準。不過,他對技術的進展表示樂觀,因為每年微軟的研究團隊以及整個學術界都會發明大量的新技術、新模型和新演算法,「我們可以預測的是,新技術的應用一定會讓機器翻譯的結果日臻完善。」研究團隊還表示,此次技術突破將被應用到微軟的商用多語言翻譯系統產品中,從而説明其它語言或詞彙更複雜、更專業的文本實現更準確、更地道的翻譯。此外,這些新技術還可以被應用在機器翻譯之外的其他領域,催生更多人工智慧技術和應用的突破。對偶學習(Dual Learning):對偶學習的發現是由於現實中有意義、有實用價值的人工智慧任務往往會成對出現,兩個任務可以互相回饋,從而訓練出更好的深度學習模型。例如,在翻譯領域,我們關心從英文翻譯到中文,也同樣關心從中文翻譯回英文;在語音領域,我們既關心語音辨識的問題,也關心語音合成的問題;在圖像領域,圖像識別與圖像生成也是成對出現。此外,在對話引擎、搜尋引擎等場景中都有對偶任務。一方面,由於存在特殊的對偶結構,兩個任務可以互相提供回饋資訊,而這些回饋資訊可以用來訓練深度學習模型。也就是說,即便沒有人為標注的資料,有了對偶結構也可以做深度學習。另一方面,兩個對偶任務可以互相充當對方的環境,這樣就不必與真實的環境做交互,兩個對偶任務之間的交互就可以產生有效的回饋信號。因此,充分地利用對偶結構,就有望解決深度學習和增強學習的瓶頸──訓練資料從哪裡來、與環境的交互怎麼持續進行等問題。論文網址:https://papers.nips.cc/paper/6469-dual-learning-for-machine-translation.pdf▲ 對偶無監督學習框架。推敲網路(Deliberation Networks):「推敲」二字可以認為是來源於人類閱讀、寫文章以及做其他任務時候的一種行為方式,即任務完成之後,並不當即終止,而是會反復推敲。微軟亞洲研究院機器學習組將這個過程沿用到了機器學習中。推敲網路具有兩段解碼器,其中第一階段解碼器用於解碼生成原始序列,第二階段解碼器通過推敲的過程打磨和潤色原始語句。後者瞭解全域資訊,在機器翻譯中看,它可以基於第一階段生成的語句,產生更好的翻譯結果。論文網址:https://www.microsoft.com/en-us/research/publication/deliberation-networks-sequence-generation-beyond-one-pass-decoding/▲ 推敲網路的解碼過程。聯合訓練(Joint Training):這個方法可以認為是從來源語言到目的語言翻譯(Source to Target)的學習與從目的語言到來源語言翻譯(Target to Source)的學習的結合。中英翻譯和英中翻譯都使用初始並行資料來訓練,在每次訓練的反覆運算過程中,中英翻譯系統將中文句子翻譯成英文句子,從而獲得新的句對,而該句對又可以反過來補充到英中翻譯系統的資料集中。同理,這個過程也可以反向進行。這樣雙向融合不僅使得兩個系統的訓練資料集大大增加,而且準確率也大幅提高。論文網址:https://arxiv.org/pdf/1803.00353.pdf▲ 聯合訓練:從源語言到目標語言翻譯(Source to Target)P(y|x) 與從目標語言到源語言翻譯(Target to Source)P(x|y)。一致性規範(Agreement Regularization):翻譯結果可以從左到右按順序產生,也可以從右到左進行生成。該規範對從左到右和從右到左的翻譯結果進行約束。如果這兩個過程生成的翻譯結果一樣,一般而言比結果不一樣的翻譯更加可信。這個約束,應用於神經機器翻譯訓練過程中,以鼓勵系統基於這兩個相反的過程生成一致的翻譯結果。▲ 一致性規範:從左到右 P(y|x,theta->) 和從右到左 P(y|x,theta<-)。 機器翻譯:中英新聞翻譯方面達到與人類媲美的水準 Microsoft Translator Try & Compare Microsoft Translator 微軟推出 Presentation Translator...
蘋果(Apple)的 Siri 可說是語音助理的先行者,但如今 Amazon 旗下的 Alexa 才是語音助理界的霸主。為何 Siri 會浪費多年的優勢,甚至整整晚了 Amazon 快 4 年才推出智慧音箱 Homepod?科技媒體《The Information》訪問了十多位已離職的蘋果員工,試圖為這個問題找出答案。《The Information》的報告指出,在 Siri 跟著 iPhone 4s 推出時還不成熟,也引發了員工之間的爭論。內部對於 Siri 的理想型態有不同的認知,有些人認為 Siri 應該成為快速準確的資訊提供者,另一派則想要 Siri 變成能處理複雜任務的助手。當時負責 Siri 的團隊由創造 iOS 的 Scott Forstall 帶領,但當時他還要分神於其他計畫,包括那時候即將推出的 Apple Maps。於是 Scott Forstall 找來了 Richard Williamson 幫忙領導 Siri 團隊。好幾位蘋果前員工都表示 Williamson 做了一些 Siri 團隊不贊成的決定,像是每年只改善一次語音助理的功能。不過 Williamson 否認他當時有做出這項決定,他宣稱決定是由他的下級做的。Williamson 指出剛發表的 Siri 完全是一場災難,軟體充斥各種錯誤且龜速運轉。他認為這些問題應歸咎於原本的 Siri 團隊,與他無關。Forstall...