目前在高階行動處理器中,市場競爭者不外乎只有包括高通、三星、及華為海思等 3 家。已經暫時停止研發高階處理器的聯發科,也有消息傳出將在近期重返高階處理器的發展市場,而且採用的還是 7 奈米製程。不過,畢竟都還沒看到產品,因此就不計算在內。對此,近期中國知名的硬體評測軟體「魯大師」公布了高階行動處理器的效能排行榜,其結果讓市場人士也感到訝異。根據 「魯大師」日前所發布的多個和智慧型手機有關的排行榜,其資料收集時間為 2019 年第 1 季的情況。首先是在 2019 年第 1 季的行動處理器排行榜中,根據「魯大師」所公布的結果顯示,行動晶片龍頭高通的最新高階行動處理器-驍龍 (Snapdragon) 855 為綜合表現最出色的手機處理器,其 CPU+GPU 總分接近 30 萬分。而排行第二的則同樣出自高通,是驍龍 855 的上一代產品的進化版 – 驍龍 845 超頻版,其 CPU+GPU 總分超過了 26 萬分。至於,排名第三的則是華為海思的最新高階行動處理器──麒麟 (Kirin) 980,其 CPU+GPU 總分則是來到 23.7 萬分。其中無論是 CPU 性能,還是 GPU 性能方面,華為海思的麒麟 980 都要落後。尤其華為海思所採用的是 7 奈米製程,相較高通驍龍 845 所使用的 10 奈米製程提升一個世代,但是卻出現這樣的評比結果,其差距也超出市場人士的預期。而除了行動處理器的綜合評比之外,在 2019 年第 1 季的手機 AI 性能排行榜中,根據「魯大師」所提出的排行榜,高通驍龍...
現在 AI 不只會寫新聞,還會寫書了。學術出版商 Springer Nature 出版了第一本由機器學習產生的書──《鋰離子電池:機器生成的目前研究摘要》(Lithium-Ion Batteries: A Machine-Generated Summary of Current Research),簡介鋰離子電池領域的最新研究成果。AI 如何寫出一本書?這用到的技術,是一種由 Springer Nature 和法蘭克福大學共同開發的先進演算法:Beta Writer。使用基於相似性的聚類分析,將大量來源檔排列成連貫章節,然後建立文章簡單摘要,同時將文章內部加入超連結,利於讀者進一步閱讀原始文章。而 AI 這種創新的架構化摘錄成書,有利於研究人員更有效管理大量資訊,以及人們從大量內容裡快速選擇、使用和處理相關檔案。所以確切來說,其實是該學科大量研究文章的摘要合集。但摘要並不是你想的那麼簡單,這本書包含 2016~2018 年發表過的 150 多篇權威研究論文。僅過去 3 年,關於鋰電子電池的研究論文就發表超過 5.3 萬篇,這對嘗試學習這領域的科學家是巨大的挑戰,但 AI 的自動掃描和總結匯出,能讓科學家把更多時間用在重要的研究。雖然可能和我們想像的「文采飛揚」、「馳騁墨場」相差千里,但目前也為研究人員或專業人士展現取得資訊的未來方式。幾十年來,機器一直在學習人類語言的微妙之處,雖然深度學習演算法不斷更新技術,但就算世上最能寫的 AI 也無法表達出人的獨特思想。不過前幾個月 OpenAI 發表名為 GPT-2 的新演算法,給它標題就能語言建模完成接下來的情節,最特別的地方就是能靈活變動內容,甚至寫出一篇粉絲小說。(Source:OpenAI)可以預見,未來的學術出版及各類書籍,將不再只是人為創造,而有更多形式出現,包括混合人機文字生成的書籍,或完全由機器學習生成的文字。對這本書,Springer Nature 董事總經理 Niels Peter Thomas 說:圍繞自然語言處理和人工智慧的新技術,為我們提供演算法幫助下探索內容生成的新機會。身為全球出版商,我們也有責任考慮機器生成內容的影響、機遇、挑戰和風險,並為未來這類新內容提供基礎框架。(Source:medium)目前 Springer Nature 計劃透過開發其他領域內容來延伸這次試驗。而《鋰離子電池研究原型》也將成為進一步改進此類技術的基礎。如果你想讀讀這本書,SpringerLink 資料庫現在提供免費電子書。但或許我們更期待看到的是,AI 直接創造出不僅文字協助,而是基於文字本身更有價值的內容。畢竟每個人思維有限,而演算法擁有無限可能。(本文由 愛范兒 授權轉載;首圖來源:shutterstock)
Google 的機器人計畫一直不怎麼順利。從 2013 年起就耗巨資,從美國和日本收購幾家機器人新創,合併成名為「Replicant」的機器人計畫,包括知名的波士頓動力公司(Boston Dynamics)。但好景不長,原本負責機器人計畫的 Andy Rubin 於 2014 年離開 Google,加上波士頓動力的研發涉及軍事,和 Google 當初的民用構想不太符合。2017 年,Google 選擇將波士頓動力轉售給日本軟銀,機器人計畫暫時陷入沉寂。但 Google 並未止步。據《紐約時報》和 Google AI 官方部落格,Google 內部重新集結原機器人計畫工程師、研究人員,組成名為「Robotics at Google」的團隊,繼續投入機器人研發。區別在於,和波士頓動力研究的「雙足步行」、「小狗」和「輪式」等仿生機器人不同,Robotics at Google 重點放在機器學習,相當於研發機器人系統和軟體。Robotics at Google 與普林斯頓、哥倫比亞及麻省理工幾所學院研究人員合作,開發出名為「TossingBot」的物體分揀方案。具體來說,可讓機器人手臂從一堆繁雜的物體裡正確揀物,再將物體投擲到相應格子。這對電商物流和零件組裝等工業還是有實用價值。不要小看這對人類來說很簡單的動作,其實整套動作涉及物體辨識、分揀、拾取、拋投等,等於要機器人自己找到抓起每件物品的最佳方式。研究人員也強調,單純就「拋投」步驟,機器手臂就需具備多種物理知識,才可避免拋投出現失誤。以螺絲起子為例,握著柄拋投,和握著起子拋投,會出現不同拋物線,拋投距離自然不一樣。此外,拋投兵乓球所需的力度,與拋投一根香蕉顯然也不同,不僅關係到對物體品質、摩擦力等因素的掌控,也涉及對拋投距離及現場環境的理解。Robotics at Google 團隊的做法,是將深度學習和物理學混合運用,使用端到端的神經網路訓練機器手臂,做到隨機環境下的分揀處理。這意味著哪怕機器手臂碰到完全陌生的物體,比如說把木塊換成水果,也有應對方案。照 Robotics at Google 的說法,最開始 TossingBot 對一籮筐的物體還有些遲鈍,但經過約 14 小時、總計 1 萬次抓取和投擲嘗試訓練後,已達 87% 以上的分揀成功率和 85% 以上的投擲成功率。現在,它每小時可揀貨超過 500 個物體,彈性、回應速度都比最先進的分揀貨系統快 2 倍,也證明機器學習訓練確實能幫助機器人更快掌握某項技能。研究人員也表示,這套方案非常適合在物流倉儲和配送中心大量部署,像亞馬遜這類電商公司對分揀機器人的要求往往更高。不過,將自動化機器人運用到倉儲已不算新鮮事。去年 10 月,日本優衣庫就曾展示機器人倉儲,就是由機器人取代人力做分揀,達成 24 小時連續執行;亞馬遜、沃爾瑪和聯邦快遞等也嘗試將行動機器人運用在搬運工作。不過,目前大多數機器人只能解決特定場景操作,不擅長應付不同形狀的物體,這也是現在 TossingBot 希望解決的問題。理想狀態下,人們自然希望機器人靠自學就能做更多工作,而不是每次都要先來一輪預先程式設計。(本文由 愛范兒...
在宣布智慧台灣計畫後,Google 28 日接著舉辦 Google Cloud 人工智慧論壇,找來合作夥伴分享人工智慧在整理數據和物聯網上的實際應用案例,Google 台灣董事總經理簡立峰也在主題演講中暢談 AI 帶來的契機以及台灣未來在其中扮演的角色。儘管 AI 是近幾年才經常被人提起,但其實人工神經網路的概念很早就已經在進行,只是 1980 年代數據少、運算需求少,其他方式比神經網路更好.如今數據及運算需求高,相關技術運用自然比以前出彩。簡立峰表示,2011 年神經網路尚未發達的時候,機器學習技術在辨識圖片上還有著 26% 錯誤,相較人眼的 5% 錯誤率,「簡直就像人把眼鏡摘下看事物一樣」,但這幾年間技術發展快速,到了 2016 年時機器學習技術錯誤率達到了 3%,較人眼辨識率好上許多,「如果 5 年可以達到如此革命,還有什麼不行?」▲ Google Cloud Vision API 圖片分析功能展示。Google 成立之初是以搜尋引擎起家,簡立峰笑稱,當初其實是覺得現在一些應用做不出來才去做搜尋引擎,雖然人們都覺得 AI 是很深奧的東西,其實篩選垃圾郵件、翻譯文字便都有應用到 AI,只是人們並沒有把這些與 AI 聯繫在一起。回憶過去,簡立峰表示,當初光是搜尋引擎會跳出「自動建議」的搜尋便讓人感到十分驚奇,然而隨著時間過去,人們現在已經把這些看做是理所當然,而這是非常正常的,因為隨著時間過去,人們對 Google 的期望一直在持續變高。「100 年前萊特兄弟剛發明飛機時,人們都不敢坐飛機,而現在光是飛機誤點大家便會生氣,這就是一種時代轉變。」隨著 AI 應用持續成長,調研機構 IDC 預測,2021 年將有 75% 企業應用程式使用 AI,相關投資金額預估將增長至超過 500 億美元,簡立峰表示,比爾蓋茲 20 年前做的 15 項科技預言都已紛紛實現,而在最新提出對未來的 10 項預測中,便有 6 項和...
誰都想不到,紅髮艾德(Ed Sheeran)、酷玩樂團(Coldplay)和瑪丹娜的最新「同門歌手」,居然是一組演算法。近日,華納音樂集團簽下創業公司 Endel 研發的演算法,計劃今年發 20 張專輯,其中 5 張已發表並在 Apple Music 和 Spotify 上線。 ▲ Endel 團隊。(Source:Endel) 如果你覺得演算法要來搶歌手的生意,可以先不必那麼擔心,因為 Endel 演算法創作的歌曲並不是我們日常聽的流行曲,而是沒有歌詞、以情緒為線索的背景音樂。我不覺得我們是歌手或音樂家的競爭對手或替代者。華納想找我們出專輯,我們感到很榮幸,但我們大部分音樂都不需要用戶專注聆聽。它們(音樂)的真正作用在於混在背景中幫助你。Endel 聯合創始人 Oleg Stavitsky 說。事實上,獲得亞馬遜 Alexa Fund、日本企業 Avex Inc 等投資的 Endel,「本職」並不是做唱片,他們的目標其實是創作「客製化聲音」──基於用戶所處時間地點甚至個人心率等醫學徵象,用演算法為每位用戶訂做背景音樂。目前,Endel 同名應用軟體已能在 App Store 找到。既是功能類「背景音樂」應用軟體,Endel 提供「放鬆」、「專注」、「行動中」和「睡眠」4 種模式,並聲稱將根據地理位置的天氣、用戶醫學徵象等數據調整音樂內容。(Source:Endel)專門為了優化睡眠品質、提升工作專注度、協助冥想等目的創作的音樂,從實體唱片時代就已存在。筆者讀書時就買過一張「天秤座」氛圍音樂 CD(那是一套以星座為分類標準的專輯),聽過一兩次之後就扔一邊了,看來真的不是所有天秤座都喜歡一樣的音樂。現在,數據和演算法讓 Endel 這類公司可為個人訂做引導放鬆、專注等「狀態」的背景音樂,創作者無需再基於星座這種玄學的線索來寫音樂,這是技術為這種情境和情緒類音樂賦予的新可能性。另一方面,Endel 誕生前,科技早已改變了「情緒」和「情境」在音樂界的地位。新音樂歸類法:情緒和情境如果說 iPod 和 iTunes 將音樂的消費單位從「專輯」打散成了「單曲」,那以 Spotify 為首的串流媒體供應商就將無限的單曲資源重整,讓「歌單」成為了新的音樂消費單位。以歌單為單位的新框架下,「情緒」和「情境」成了新的歸類法。現在的人,很少用「嘻哈」或是「鄉村音樂」這種歸類了,他們看事情的角度都基於時間和活動……我們需要知道用戶是誰、用戶的情緒及他們正在做什麼事情來提供正確的音樂。Spotify CEO Daniel Ek 接受《Billboard》採訪時說。此外,不少人已經將「情境類」歌單當作調整情緒或是呼應情緒的工具:通常來說,我會根據自己現有心情來選歌單。不過,有時候我不開心,也會找一些開心的歌單來嘗試改變自己的心情。一直以來,針對音樂和情緒和生理狀態間關係的研究和應用一直不在少數。高級飯店和餐廳等地方會用古典音樂來嘗試觸動消費者進行更高額消費外,連托特納姆熱刺足球俱樂部在訓練時也播放專門為其運動員設計的音樂來提高大家的狀態。當數位技術將不限量的歌曲帶到每個人的手機,客製 BGM(背景音樂)歌單/音樂就不再是服務企業的專利。因做歌單很方便,Spotify 的情景類歌單越來越細化和「概念化」:「困在外太空星球」、「雪地裡的英格蘭」、「凌晨 3 點和上帝一起閒逛」、 「困在森林深處」……這些歌單都傳達一種非常抽象且不確定的感覺,聽這些歌單的人也是想用以音樂來營造一些情緒和感覺,而不是細聽裡面每一首歌曲。截至 2018 年為止,在...
又快到畢業求職季,老鳥也躍躍欲試想跳槽,不過求職過程往往會遭遇顯性和隱形的歧視,為了避免這種情況,一些公司開始使用機器人面試了。瑞典科技公司 Furhat Robotics 推出全球首個專為招聘設計的機器人 Tengai,造型是人的頭部,高約 41 公分,重約 35 公斤,如果把她放在桌上,正好與求職者視線平行。Tengai 內建顯示螢幕,可切換成不同的形象,並透過鏡頭和麥克風與求職者互動。顯示螢幕會根據說話內容同步對應嘴型,可辨識 30 多種語言。Tengai 與求職者是基於 AI 系統驅動,可讓 Tengai 模仿人類微妙的臉部表情,降低交流延遲,分析求職者的行為,適當時給予回應,不會讓求職者感到奇怪。面試時 Tengai 會微笑,跟求職者說的第一句話就是:你以前被機器人面試過嗎?Tengai 是 Furhat Robotics 與瑞典最大招聘公司之一 TNG 聯手打造的招聘機器人,旨在消除面試官於面試過程的潛意識偏見(unconscious biases),包括以求職者性別、種族和外貌來判斷一個人的能力。那麼 Tengai 和人類面試官到底有什麼區別,TNG 首席創新長艾琳舉個例子。平常面試官有時會問應徵者「你喜歡打高爾夫球嗎?」如果是肯定回答,很可能會為志趣相投的應徵者加分。但 Tengai 不會跟應聘者閒聊,會以更固定的順序提出問題,無論面對什麼對象都保持相同語調,艾琳認為這可為求職者創造更公平客觀的面試環境。不過 Tengai 暫時還沒有決定錄取誰的權力, 在面試結束後,Tengai 會把面試者的回答轉為文字,以供招聘方參考,再確定哪些人進入下一輪面試。目前 Tengai 正在瑞典進行更大範圍的測試,醫療保健領域的 HR Petra Elisson 分別以面試官和應聘者兩個角色測試這款機器人,她表示一開始還抱著懷疑,但隨著面試深入,已經不覺得是在和機器人交談了。經過更多測試後,Tengai 將會在 5 月投入實際應用。Furhat Robotics 表示最終目的是讓 Tengai 完全取代真人,可自主判斷哪些人被錄取。實際上全球有更多公司將機器人和 AI 用在招聘流程,德勤 2017 年報告顯示,33% 接受調查的招聘者都表示,已經在招聘時不同程度使用人工智慧。2017 年北美知名獵頭公司 SourceCon...
Google 母公司 Alphabet 旗下的人工智慧業者「DeepMind」,研發出能即時診斷複雜眼疾的原型裝置,朝商用化邁出一大步。金融時報報導,DeepMind 本月份實況展示了此一 AI 系統,AI 掃描患者視網膜後,交由 Google Cloud 的演算法分析,之後會依據病患的緊急程度評分,並給予詳細診斷,整個過程只要 30 秒。這款 AI 能偵測多種眼疾,包括青光眼、糖尿病視網膜病變、老年黃斑部病變等,準確程度媲美全球頂尖眼科醫生。過去 3 年,DeepMind 和英國倫敦的摩爾眼科醫院(Moorfields Eye Hospital)並肩研發 AI 系統。專案資深臨床科學家 Alan Karthikesalingam 說,這款 AI 可以了解病患需要求助專科醫生嗎?若有需要,狀況有多緊急,原因又是什麼? DeepMind 2016 年成立健康部門,至今為止尚未推出商用產品,這款眼科 AI 也還沒取得監管許可。近來美國食品藥物管理局(FDA)核准的醫療 AI 演算法大增,從 2017 年的 1 年 2 件增至 2018 年 1 個月 1~2 件。美國愛荷華州新創企業 IDx 的演算法,也即時能掃瞄並診斷糖尿病視網膜病變,目前已用於歐洲臨床患者。FDA 稱,IDx 是第一個無須臨床醫生,就能提供醫療診斷的 AI 系統,也能判讀影像或結果,對於不熟悉眼科的醫療照護人員極有幫助。Business Insider、金融時報去年報導,DeepMind 研發出 AI...
處理器龍頭英特爾(intel)旗下的英特爾全球投資公司日前宣布,將斥資 1.17 億美元(約新台幣 36.1 億元)投資 14 家新創公司。英特爾預計透過對新創公司的投資,強化本身在人工智慧(AI)平台的發展實力。根據資料顯示,英特爾投資的 14 家創新公司,多數還是美國公司,另外有兩家中國公司,加拿大、以色列及英國則各有一家公司入榜。而這 14 家新加入英特爾投資組合的公司,未來將協助英特爾構夠強大的人工智慧(AI)平台。尤其是透過創新的方式,進行研究、分析構成世界的材料和人體科學,以使用更高效、更環保的製造技術,以及採用顛覆性的晶片設計新方法。以下為 14 家公司名單:1. 人工智慧SambaNova Systems(美國加州):該公司正構建一個先進的系統平台,用於執行從資料中心到邊緣的 AI 應用程式。Cloudpick Limited(中國上海):為擁有隨時隨地購物體驗的人工智慧,提供實體商店的解決方案。Untether AI (加拿大多倫多):正在開發超高效的高性能 AI 晶片。珠海易力科技有限公司 (中國珠海):提供 AI 晶片。2. 通訊Pixeom(美國加州):提供邊緣運算軟體平台,可在本地協調雲端運算功能。Mighty Networks(美國加州):提供品牌和企業可連結的共通平台,以支援社群、內容、線上課程與訂閱商務。Polystream(英國):提供軟體定義的成像技術,使交互式圖形內容能夠以前所未有的規模進行流動式傳輸。Tibit Communications(美國加州):該公司正在開發提供家庭,辦公室或蜂窩基地台寬頻的下一代設備,並支援從雲端到用戶之間的管理。3. 衛生保健Reveal Biosciences,Inc(美國加州):該公司創建了 ImageDx,這是一種專有的數據驅動病理學深度學習平台。Medical Informatics Corp.(美國德州):一家以軟體為基礎監控和分析公司。4. 工業 4.0OnScale(美國加州):提供依需要可擴展的工程模擬軟體。Landing AI(美國加州):為製造業和農業等提供人工智慧的 SaaS 解決方案,以及 AI 轉型計畫。proteanTecs(以色列海法):開發用於電子系統的通用晶片遙測技術。Qolibri Inc(美國加州):開發突破性的專有解決方案,以解決半導體次組件中的相關問題。英特爾高級副總裁兼英特爾投資總裁 Wendell Brooks表示,「過去 50 年來,英特爾一直在推動顛覆性創新,讓計算無處不在,並以此來改變我們的生活方式。英特爾投資將透過這些投資,繼續傳承其顛覆性的創新。這些公司正在改變我們對人工智慧、通訊、製造和醫療的思維方式。這些領域在未來幾年將變得越來越重要,並成為構建以資料為中心、更加智慧互聯世界的關鍵。」Wendell Brooks 還強調,這些投資展現了英特爾投資的新戰略,也就是在被投資公司中占有更大、更具戰略意義的持股比例。而英特爾投資每年也會持續向各類新興技術創新公司投入 3 億至 5 億美元的金額,致力於推動將不可能轉變為可能的顛覆性創新。(首圖來源:Flickr/othree CC BY 2.0)
野外遇蛇不必驚慌失措,疾管署今天公布「毒蛇鼬獾咬傷救急資訊站」,結合人工智慧,民眾遇蛇拍照上傳,可協助辨識毒蛇種類,網站也顯示鄰近血清提供點,不怕找嘸醫。衛生福利部疾病管制署防疫醫師劉宇倫下午在記者會表示,台灣每年約有 1,400 人被毒蛇咬傷,若沒有血清救援,致死率達 6%。不少民眾喜歡露營、山林活動,但野外活動地點多跟毒蛇、狂犬病陽性鼬獾分布息息相關,民眾從事休閒活動前也應做好相關準備。有鑒於大多數民眾對毒蛇、鼬獾這兩類動物出沒地及遭咬傷後的就醫資訊並不清楚。疾管署與行政院農業委員會防檢局、特有生物研究保育中心、路殺社等單位合作建置「毒蛇鼬獾咬傷救急資訊站」。劉宇倫說,此網站以資訊視覺化呈現,提供民眾毒蛇、狂犬病鼬獾出沒地點,並整合就醫等醫療資訊;也可依民眾所在地點查找毒蛇出沒紀錄。若真的不幸遭蛇吻,也可第一時間查出附近提供蛇毒血清的醫療院所,就醫資訊一目了然,不必驚慌。此網站也結合人工智慧(AI)技術,當民眾發現疑似毒蛇,可拿起相機拍攝並將照片上傳,透過網站辨識毒蛇種類,也可提供給醫師判斷。疾管署是台灣目前唯一生產供應抗蛇毒血清機構,檢驗及疫苗研製中心科長鄭雅芬表示,蛇毒血清每年的產量有 5,000 至 6,000 劑,每年用量為 3,000 至 4,000 劑,足夠民眾使用。若民眾被蛇咬,第一時間不需驚慌,而是要記下毒蛇外觀。根據毒物科醫師建議,人被咬後 4 至 8 小時內接受抗蛇毒血清即可妥善治療。台灣較常見的毒蛇分別為出血性毒的龜殼花、赤尾鮐(俗稱赤尾青竹絲)與百步蛇;神經性毒的飯匙倩(俗稱眼鏡蛇)與雨傘節,以及兼具出血和神經毒的鎖鏈蛇。鄭雅芬說,龜殼花喜歡躲在灌木叢、柴堆中,被咬的人多是腳部和腳趾受傷;赤尾青竹絲則喜歡攀附在樹枝,被咬者多是上肢、手指被咬。民眾若到野外或接觸自然環境應做好防護,穿長褲、包鞋,並打草驚蛇。如果不幸被咬,鄭雅芬建議,要記得蛇的外觀,且因被蛇咬肢體會腫脹,一定要盡快脫掉首飾、手錶等,且不要冰敷,以免造成更多傷害。旁人也切莫以口吸蛇毒,以免毒透過黏膜滲入人體,反而需要被救。(作者:陳偉婷;首圖為龜殼花;來源:Evan Pickett , via Wikimedia Commons)
KKBOX 集團旗下串流影音技術公司 KKStream 與台大產學合作,共同開發智慧劇照挑選系統「Stiller」,運用 AI 人工智慧技術判斷主角、自動挑選與擷取吸睛劇照,有效提升影片點擊率,未來更有望延續研究,發展出自動剪輯影片預告、製作濃縮影片的能力。 以往影片縮圖多靠人工作業挑選影片劇照,不僅過程耗時費力,也不一定吸引得住觀眾目光。KKStream 攜手台大合作「視訊理解」(Video Understanding)研究專題,聚焦挑選劇照的實務應用,從演員臉部表情到動作場景,透過不同面向強化 AI 對視訊理解的能力。雙方所共同開發的 Stiller 智慧劇照挑選系統,藉由串流影音服務 KKTV 支援豐富的劇庫資料,並整合影像辨識與視覺感知技術,訓練 AI「看劇」、學習判斷與挑選吸睛劇照。現階段已經能夠判讀重要影片情景挑選照片,平均每集影片只需 60 秒就能完成劇照擷取作業,大幅降低原本由美術人員逐格截圖的作業時間,而且所挑選出的劇照效果吸睛,能提高觀眾點擊觀看的意願。▲ 智慧劇照挑選系統開發示意圖,劇照愈吸睛愈有助於提高觀看意願參與系統設計與發表的曹峻寧同學表示,Stiller 結合關鍵影格擷取(Key-Frame Extraction)與影像美感評估(Image Aesthetic Assessment)兩大技術,可從影片中挑選兼具代表性與吸引力的劇照。透過 AI 技術,Stiller 系統經三集訓練就能以演算法判斷男女主角、自動擷取精彩劇照,期望未來能有機會延續研究,進一步開發自動剪輯預告或濃縮影片的能力,讓 AI 不只看見畫面,還能看懂影片。台大多媒體處理及通信實驗室教授陳宏銘指出,多媒體科技在影音串流時代的重要性有目共睹,學術研發促進產業發展,正是產學交流的初衷。KKStream 總裁蔡怡仁也感謝台大積極響應,並表示雙方透過產學合作,為學術研究和產業應用創造更多可能性。如今雙方合作的研究成果大放異彩,已獲國際電機電子工程師學會(IEEE)邀請,近日於美國加州聖荷西 MIPR 國際會議發表。未來 Stiller 系統除了運用在偶像劇,也將持續延伸至不同類型的影片、拓展應用層面,可望在串流影音急速發展的時代當中,發展為不可或缺的關鍵技術。(首圖、圖片來源:KKStream。圖片右起:台大多媒體處理及通信實驗室教授陳宏銘、曹峻寧同學。)延伸閱讀: 面對數位轉型浪潮,KKStream 攜手領域專家探討串流影音技術發展 KKStream 攜手 17 Media、Umbo CV 舉辦第二屆 Streaming Meetup 串流聚會 結合 KKBOX、KKTV 與 KKLIVE 服務!頂級版「KKBOX Prime」每月 199 元全包

