星期日, 12 1 月, 2025

科技新知 人工智慧

早前 Tesla CEO Elon Musk 曾指出人工智慧將會為人類帶來威脅,若干年後它們或會取代人類的工作。的確近年已有不少廠商已開始利用機器人進行生產,如今就連服裝攝影師都受到威脅!皆因最近有荷蘭公司設計出一個智慧攝影棚,只要模特兒走進去,它便會自動拍攝各種照片及影片,無需再靠人工攝影。由荷蘭公司 StyleShoots 設計的 Live 智慧攝影棚,當中包括了一切服裝攝影所需的元素,比如裡面設有 Canon 1DX Mk II 安裝在一個三軸機械臂上,主要用來拍攝 4K 影片及 2,000 萬像素照片,並會自動設定燈光及拍攝流程。至於系統方面則由一部 Mac Pro 來執行,設有專用的圖像及影片處理軟體,而更重要的是 AI 將會全面負責整個拍攝過程,比如它可以判斷模特兒的位置及身高等,並會分析相關資料再自行調整各種參數,以確保可以拍攝出質素最好的照片及影片。與此同時,工作人員更可以根據客戶的要求預先設定好各種拍攝風格,一旦有需要進行改動的拍攝參數,亦可以透過 12.9 吋 iPad Pro 控制及調整。至於拍攝好的照片及影片,甚至可即時上傳到社群媒體,無需靠人手逐張上傳,可說是方便得多。由此可見,以後模特兒只需要走入 Live 攝影棚內再擺出各種 pose,系統便會一條龍完成整個拍攝過程,屆時服裝攝影師可能需要轉型,比如專注於與模特兒溝通,又或者從後觀察 Live 拍攝的相片及影片是否符合要求。 This robotic camera system can replace an entire fashion photography studio (本文由 Unwire HK 授權轉載;圖片來源:StyleShoots)延伸閱讀: AI 壓境,人類如何求生?馬斯克:融合機械成為生化人...
當你使用數位語音助理軟體時,偏好女聲還是男聲?外媒引述研究指出,你/妳的語音偏好,或許反映出性別偏見,仍存在科技進步的數位語音虛擬助理當中。國外科技網站 9To5Mac 與中國媒體引述華爾街日報(WSJ)報導,美國印第安納大學一項調查顯示,不論是男性或女性,都偏好由女聲來呈現數位語音助理軟體的聲調。調查指出,數位語音助理軟體聲調由女聲表達,會讓男性或女性使用者感到熱忱、溫暖與滋潤療癒的感受。報導表示,微軟(Microsoft)與亞馬遜(Amazon)自家的調查研究,也呈現類似的結論。報導並引述史丹佛大學一項研究顯示,在特定情境或主題內容下,使用者對於虛擬語音助理聲音性別的偏好,也會有所不同。這項調查顯示,無論是男性或女性受訪者,若在學習電腦相關知識時,男性聲調較受青睞;當在談論愛情或人際關係的內容時,女性聲調較受歡迎。9To5Mac 指出,這意味著在人工智慧助理軟體領域,性別偏見的態度依然存在。從人類歷史看來,助理一職大部分由女性擔任,但是即便到數位人工智慧助理軟體階段,無論男性或女性,還是偏好由女性聲調表達。報導引述指出,亞馬遜的虛擬助理 Alexa、Google 的 Google Assistant 及微軟的虛擬語音助理 Cortana,語音預設值都不限於女聲;不過蘋果自家的 Siri 虛擬語音助理,在大部分國家包括美國,語音預設值多以女聲為主,但 Siri 提供選項可以切換。有趣的是,報導引述表示,Siri 在阿拉伯語、法語、荷蘭語與英式英語這 4 種語系,將語音預設成男聲。(作者:鍾榮峰;首圖來源:Flickr/Kārlis Dambrāns CC BY 2.0)延伸閱讀: 人工智慧應用大放異彩,2016~2021 年全球語音辨識產值年複合成長率達 43.64%
因應少子化趨勢,不只製造業需要全面引進自動化技術,前景看好的餐飲服務業也要未雨綢繆,引入新科技強化服務競爭力。日本微軟與東京的系統開發商 Headwaters 合作生產一個基於雲端的人工智慧系統,讓機器人為餐廳和零售商店的客戶提供服務,每月承租費用為 3 萬日圓,遠低於一般服務業勞工的最低薪資。日經報導指出,Headwaters 與微軟合作開發的人工智慧機器人不只會打招呼而已,而是結合微軟的雲端平台 Azure,將其具備的人臉辨識與自然語言處理技術,搭配 Headwaters 的雲端服務,讓機器人可以識別客戶的面孔,並在客戶到訪時使用自然語言與他們對話。據報導,微軟與 Headwaters 已經在東京的酒吧,和橫濱的健身房進行可行性研究,以了解機器人是否能夠真正提高客戶滿意度。自 2017 年 1 月以來,這款人工智慧機器人已經開始在東京的一家拉麵餐廳進行試點服務,機器人提供的服務包括向預先在手機應用程式中進行臉部註冊的客人打招呼,還會根據客人的訪問頻率發送優惠券,該餐廳已決定全面採用這套系統。Headwaters 的開發人員表示,這款人工智慧系統還可將客人的資訊發送到由人員負責的平板電腦中,以增強他們服務客戶的技能,該系統可透過人工智慧來估計客人的年齡和性別,零售商可以結合銷售數據與類似資訊來分析客戶行為,並依此開發新產品和服務。Headwaters 是該系統的主要營運商,預期在 2020 年前將人工智慧機器人引入 200 家公司,系統每月承租費用從 3 萬日圓起跳,並提供各種額外的付費選項。 Robots dish out ramen at Tokyo restaurant (首圖來源:Flickr/Arnaud DG CC By 2.0)
比爾蓋茲(Bill Gates)、馬斯克(Elon Musk)和霍金(Stephen Hawking)最近紛紛對人工智慧(artificial intelligence,簡稱 AI)提出警告,美國億萬富翁、NBA 達拉斯小牛隊老闆庫班(Mark Cuban)與之呼應,20 日透過推特發文聲稱,機器人會導致失業率攀升,人類一定要預先做好準備。CNBC 20 日報導,庫班並未額外多做評論,但他上週五(2 月 17 日)在接受專訪時曾經痛批,美國總統川普(Donald Trump)和幕僚根本不了解科技如今有多先進,企業就算在美國打造新廠房,也不會有更多人得到工作,失業率反而還將攀升,到時候川普要怎麼應付遭到機器取代的勞工?他認為,川普應該要進一步理解機器學習和 AI 的發展。庫班拿亞馬遜(Amazon)做例子,他說亞馬遜運用科技變聰明,對整個零售產業破壞革新,是全球最偉大的新創公司。人們遲早都得理解 AI 和機器學習,會對美國社會造成哪些影響。特斯拉執行長馬斯克日前才聲稱,司機恐怕會是 AI 來襲的第一個犧牲者。CNBC、Electrek 等外電報導,馬斯克 2 月 13 日在杜拜舉行的世界政府峰會(World Government Summit)上表示,AI 日益演化、司機首當其衝,10 年內幾乎所有新車估計都會具備自駕功能,而司機的職位將在 20 年內被全面取代,自此之後,全球恐有 12-15%的人類面臨失業。機器人大軍虎視眈眈,要搶人類工作。全球首富比爾蓋茲靠著科技起家,卻也對此憂心忡忡。他說或許應該刻意放慢新科技的發展,並對機器人課稅,以便開闢財源,資助失業工人受訓取得新工作。Quartz 報導,比爾蓋茲贊成對自動化課稅,他說,如果工廠的人類職員年薪 5 萬美元,必須繳納所得稅、社福稅等;換成機器人來做相同工作,也應該以相同水準課稅。各國可以藉此機會,解放人力,聘用更多員工照顧老人、縮小學校班級人數、協助有特殊需求的孩童。這些領域的工作很適合人類,也需要更多人手。(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)
隨著人工智慧的進步,可以被機器取代的工作也越來越多,而這次,輪到軟體工程師了。微軟研究院和劍橋大學研究人員開發出一套可自己寫程式的人工智慧「DeepCoder」,未來就算不會寫程式,也能也能透過 DeepCoder 打造出符合需求的程式,大幅縮短開發時間和成本。在那個機器人取代人類工作的未來,不論你是勞力型還是知識型工作,恐怕都難以全身而退。從現有程式碼找到適合的片段,組合成符合需求的程式DeepCoder 使用被稱作「程式組合」(program synthesis)的方法,只要給定系統輸入值和需要的輸出結果,DeepCoder 便可透過搜尋其他程式的程式碼,挑出適合的程式碼片段,再組合成可運作的程式,讓程式順利生成需要的結果。事實上,這個步驟就像許多工程師常做的事:在程式問答網站 Stack Overflow 上搜尋適合的程式碼,再「複製貼上」他們認為可行的程式碼片段。研究團隊指出,和人類工程師相比,DeepCoder 能更全面、廣泛地搜尋程式碼範例,因此程式碼的組合方式可能是過去人類從未想過的。此外,DeepCoder 將機器學習應用在每次的搜尋和組合程式碼,相較於舊有系統需要花費好幾分鐘才能選出正確的程式組合,DeepCoder 只需幾秒就能寫好程式,且速度還會隨著練習越來越快。麻省理工學院研究人員曾在 2015 年將這項技術用於自動修復軟體漏洞,其透過機器學習系統找出有漏洞的程式碼片段,並從其他程式找到適用的程式碼片段,用以取代錯誤的程式碼。仍是早期研究,寫不出企業等級軟體和 App看完 DeepCoder 的介紹,或許不少以寫程式為生的工程師開始擔心未來是否將被人工智慧取代。不過好消息是,該研究尚在早期階段,目前只能寫出 5 行左右的程式碼,難度相當於程式競賽網站中最簡單的問題。此外,DeepCoder 只能透過組合程式碼片段來寫程式,並不能靠自己生成一段全新的程式碼,也還沒辦法寫出企業等級的軟體,或是 App 等更複雜的程式碼。研究人員也指出,該系統的目的並非想要取代人類工程師,而是讓電腦協助完成寫程式過程中最無趣的地方,工程師可以將時間拿去做更複雜、更有創造力的工作。 AI learns to write its own code by stealing from other programs New AI shows even programmers are not safe from automation Microsoft’s new AI sucks at coding as much as the typical...
第 89 屆奧斯卡頒獎典禮剛剛過去幾個小時,除了拿下 14 個提名中 6 項大獎的《樂來越愛你》與最後最佳影片頒發時刻的烏龍(《月光下的藍色男孩 》才是「最佳影片獎」),一些真正推動電影技術事業進步的獎項也應該受到關注。不知道大家有沒有注意到,在這場電影從業者的盛會中,有一個專門頒給科學與技術成就的獎項,用以表彰那些推動電影發展的新科技。雖然頒獎典禮中出現關於這個獎項的短暫片段,但奧斯卡年度科學技術獎早在 2 月11 日時就已塵埃落定:共有 34 位個人獲獎者以及 5 個組織獲得 18 個奧斯卡年度科學技術獎。奧斯卡得獎者、美國科學技術獎委員會主席 Ray Feeney 在頒獎晚會上表示:憑藉獲獎者出色的創新工作,這些技術專家、工程師和發明家們拓寬了電影人的創作範圍。與今年其他奧斯卡獎項不同,奧斯卡年度科學技術獎的獲獎技術並沒有特定時間限制,不一定是在 2016 年期間開發或開始使用,而是需要被證明,這些技術的存在對電影製作有重要價值。這不由讓人想起了盧米埃兄弟,大多數人只清楚他們發明了第一部電影,卻鮮少能說出他們發明的那台三位一體放映機──既能攝影、放映,又能洗映。現在,讓我們一起為那些近年來對電影技術有卓越貢獻的人們喝彩。下面是今年奧斯卡年度科學技術獎的獲獎名單:奧斯卡技術成就獎1. 頒給 Thomson Grass Valley:設計 Viper FilmStream 數位相機系統。Viper 相機實現了基於幀率的對數編碼,提供適合導入現有數位化工作流程中的未經壓縮相機匯出。Viper FilmStream 是目前僅有專門設計為無壓縮匯出捕捉精彩畫面細節的數位相機,能捕捉解析度高達 1,920×1,080 的畫面。做為其工作流程的一部分,Viper FilmStream 能直接將匯出訊號傳遞到後期製作工序。▲ Viper 數位相機系統。2. 頒給 Larry Gritz:推動 Open Shading Language(OSL)的設計、達成和傳遞。Open Shading Language(OSL)是一種高度最佳化的執行架構和語言,用於程式化的著色和材質化,現在已經成為新的工業標準。它使不同技術水平的藝術家都能製造出真實的物理材料,達到高效能的製作渲染。3. 頒給 Carl Ludwig、Eugene Troubetzkoy 和 Maurice van Swaaij:在藍天工作室(Blue Sky...
在年初 CES 2017 上,Amazon 的 Alexa 語音助手出盡鋒頭,出現在聯想、LG、華為等多家硬體廠商的發表會上;競爭對手 Google Assistant 就顯得有些被動低調,僅有 Nvidia 等品牌為它站台。時隔一個多月,在 MWC 2017 召開之際,雙方戰火又燒到智慧手機上。Alexa 從智慧家居越界到智慧手機2014 年 11 月,Amazon 推出 Echo 音響,在裡面內建了一個智慧語音助手;只不過在最初,這個語音助手的名字不叫 Alexa,而是與音響同名,也叫 Echo。直到 2015 年 8 月,語音助手的名字才更名為 Alexa。之後 Alexa 做為智慧家居平台,所支援的第三方應用不斷增加;與此同時,內建 Alexa 語音助手的智慧家居裝置也開始出現。到了 2017 年的 CES,內建 Alexa 語音助手的裝置種類已超過 7,000 種。在 CES 2017 上,Alexa 不再只把戰場侷限在智慧家居領域,透過 Mate 9,它又來到智慧手機上。2017 年 1 月 5 日,華為在拉斯維加斯的 CES 大會上宣布在美國推出 Mate 9。這款擁有...
據 2 月 28 日消息,日本科技巨頭 Sony 正在和知名即時通訊應用公司 LINE 洽談合作,欲共同開發人工智慧裝置。在 2 月 27 日舉辦的 MWC 2017 大會上,Sony 旗下 Sony Mobile 表示,他們正在探索應用在 Xperia 智慧產品上的 Sony Agent 技術與 LINE 旗下全新雲端人工智慧平台合作的可能性,旨在為用戶開發(或聯合創新)一個全新的通訊體驗。目前,對於這個尚未成型的計畫,Sony 公司並未透露更多細節。不過,我們知道 Sony 公司在 2016 年 10 月發表了一款智慧耳機產品 Xperia Ear,同時也推出了利用語音和手勢的虛擬管家服務 Sony Agent,因此朝人工智慧方向發展,也符合該公司的產品策略。此外,在本屆 MWC 2017 大會上,Sony 還推出擁有「開放式概念」(Open-style Concept)的第二代 Xperia Ear 智慧耳機,這款耳機採用了 Sony 未來實驗室計畫(Future Lab Program)研發的「開耳」音頻技術,確保聲音在傳達到耳道的同時,依然允許用戶進行其他數位服務,並且能夠聽見周圍環境的其他聲音。▲ Xperia Ear「Open-style CONCEPT」:一款「開耳」立體聲無線耳機。根據《曼谷郵報》(Bangkok Post)的一篇報導,由於渴望加速推動行動業務,Sony 公司首席執行長...
很多人可能都聽說人工智慧已經可以寫文章了,但是你可能不知道編輯機器人早就已經是維基百科最重要的貢獻群體之一。2001 年,維基百科引入了機器人編輯者的概念,任何用戶可以為自己研發的機器人單獨建立一個維基百科帳號,只要根據維基百科社群官方的規定標註帳號,即可讓機器人參與維基百科的編輯。2014 年,機器人在維基百科的所有語言中完成了 15% 的編輯動作,它們辨識、撤銷破壞行為,鎖定遭到頻繁篡改的頁面、辨識錯別字和有語病的句子、創建不同語言之間的鏈接、自動導入站外內容、進行資料挖掘、辨識侵權的內容並為新手編輯者提供引導等。在研究人員近期發布的一份報告中,研究人員累計在維基百科的 13 個版本上找到 6,627 個疑似為機器人的帳號,這些機器人編輯來自不同的創建者,並遵循創建者(人類)為其獨立訂製的規則在維護維基百科。那麼,問題就來了:這些機器人之間,會吵架嗎?從結論上來說,答案是肯定的。事實上,機器人編輯之間的衝突遠高於人類間的衝突。這項研究中追蹤了 6,627 個疑似機器人帳號裡的 1,549 個,並抓取它們在 13 個維基百科語言版本中 2001 年到 2010 年期間的行為紀錄。研究顯示,機器人之間彼此撤銷或修改文章非常常見。英語維基百科上每個機器人平均撤銷 105 次別的機器人編輯,這比人類之間的數據高出 3 倍;但在德語維基百科上,互相撤銷的數量則下降到 24 次,葡萄牙語機器人則高達 185 次。這證明在不同的語言(文化)之間,機器人的衝突也不同。甚至可以說,比起「內政」,機器人在「外交」上處理得更不好。研究人員發現,在同一個語言內,機器人的衝突明顯低於跨語言的衝突。這是因為在同一個語言內,一個機器人往往只照看特定的詞條頁面,不同的機器人之間劃江而治,彼此互不侵犯。語言和環境影響機器人的行為準則但許多機器人在「佔領」自己語言的對應詞條之後,會對同一詞條在其他語言中的版本「指手畫腳」,進而導致與其他語言的機器人編輯產生衝突。這在一些有爭議的國家和人物上尤為突出(比如巴基斯坦前總統、烏茲別克、愛沙尼亞),彷彿這些機器人也有政治傾向。然而,機器人編輯衝突數量之高並不意味著機器人比人類更好戰,事實上大多數機器人之間的更改和撤銷行為,都比人類之間在篇幅上要小許多,其中很多是由於不同機器人對語法和措辭上的理解,無法像人類那樣變通造成。研究人員 Yasseri 說,(編輯)機器人不可能在抽象的介質中工作,它們像人類一樣透過語言進行「思考」並動作,因此語言和環境會顯著影響機器人的行為準則,因此以為機器人不是人類就可以沒有社會性、沒有立場的工作是不可能的。這種跨語言的衝突在 2013 年得到了緩解,因為從 2013 年開始,維基百科開始使用 Wikidata 中轉不同語言版本之間的詞條,這明顯阻隔了機器人之間互相「侵犯領土主權」的行為。但同時,隨著機器人數量和活躍度的增加,機器人之間的衝突數字變得越來越高。這有點像是網路上曾經出現過、讓兩個 Siri 對話的影片,它們會陷入無限的無厘頭對話一樣。當每個機器人固執地認為自己的修改是正確的時候,便會陷入無限反饋的深淵中──儘管它們的修改可能無關緊要且彼此都是對的。這種完全沒有意義的衝突有時會持續數年,並顯著降低機器人的工作效率,直到其中一方的主人發現並針對性調整才會結束。研究人員說,總體來說,維基百科是一個觀察機器人生態系統的絕佳例子。首先機器人數量夠大,其次這是一個善意的機器人社群──所有機器人都是為了讓文章更好;另外維基是一個由統一規則所引導的社群,並非完全開放的空間。然而在更開放的網路環境如 Twitter 或 Facebook 上,機器人之間的互動可能帶來非常嚴重的後果。曾經被網友「教育」成納粹分子的微軟聊天機器人 Tay 就是一個典型的例子。這項研究的目的是為了更理解機器人在不同社會環境中的反應,尤其是一個機器人在融入機器人群體時的行為。因為隨著機器人發展,我們陷入一個機器人承擔大多數社會工作的世界,似乎是必然趨勢,因此機器人除了和人類打交道,也必須學會怎麼和同類交流。(本文由 PingWest 授權轉載;首圖來源:shutterstock)延伸閱讀: 「如果可以的話,你會攻擊人類嗎?」兩個 AI 在 Twitch 上進行了一段哲學對話 鄉民太可怕!微軟新人工智慧機器人 Tay 竟被教成種族歧視
近日 IBM 推出了第一個認知影像產品──IBM Watson Imaging Clinical Review,並宣布將 Watson Health 醫學影像合作計畫擴大到全球 24 家組織,為處理眼部、腦部、胸部、心臟和相關病情的全球計畫增添行業專家和臨床經驗。IBM Watson Imaging Clinical Review 的主要作用有: 可檢查包括圖像在內的醫療數據,在危急情況時,發送預警給醫務工作者。 透過認知文本分析讀取心臟病科醫師病歷中的結構化和非結構化資訊,與其他來源的數據相結合,驗證其病歷中的關鍵數據(包括診斷結果)是否準確。 醫院管理人員可辨識應跟進治療的病情,確保其記錄在病歷中。 該產品的第一個應用對象是心血管疾病中的一種常見病 AS──aortic stenosis(主動脈瓣狹窄)。據了解,AS 影響 150 萬美國人,會在心臟的主動脈瓣變窄時發生,阻礙血液流向身體的其餘部位,導致呼吸急促、疲倦和胸痛。研究發現,Watson Clinical Imaging Review 能幫助醫務人員辨識潛在 AS 患者。據了解,IBM 將為這一版本補充 9 種額外的心血管疾病,比如心肌梗塞(心力衰竭)、心臟瓣膜病變、心肌病(心臟肌肉上的疾病)和深靜脈血栓。對此,Frost & Sullivan 的醫學影像和信息學分析師 Nadim Michel Daher 說:Watson Imaging Clinical Review 是一種由 AI 驅動的工具,醫療組織可透過其規範治療過程,並蒐集患者的大量重要數據,在此過程中,幫助醫務人員實施一種基於人群的個性化治療方案。與全球 24 家組織合作根據 IBM 官方消息,本次合作的組織包括:University of Michigan、Radiology Associates...