轉載從: Tech News 科技新報
為了讓視障人士能夠「閱讀」世界及參與數位經濟發展,阿里巴巴旗下的達摩研究院研發出「讀光」技術,也就是所謂的光學字符識別(Optical Character Recognitio,OCR),將光學與運算技術結合,對文本資料的圖像文件進行分析識別處理,獲取文字及版面資訊,讓視障者也能藉此享受科技便利。
簡而言之,讀光是將圖片資訊化為語音,讓視障者用耳朵「讀取」資訊。OCR 技術最初用於印刷體文字辨識,例如郵政系統的郵編數字識別,以實現郵件自動分揀功能。但隨著光學設備(如掃描儀器、數位相機及手機等)的飛速發展, OCR 應用領域日益廣泛,包含車牌識別、證件識別、票據識別等眾多場景。
阿里巴巴指出,雖然目前新款智慧型手機一般具備朗讀功能,不過,圖片資訊目前並不能被識別出來,而達摩院的 OCR 技術則改善了此一情況。像是讓淘寶具備了自動識別圖片的能力;在 2018 年,淘寶天貓正式推出「聽圖購物」的程序,將「讀光」應用至購物體驗之中,能夠精準地把圖片中的資訊轉為語音,讓視障用戶能夠靠聽力購物。
達摩院資深算法專家、阿里巴巴 OCR 技術負責人王永攀表示,阿里巴巴的技術團隊從 2010 年就開始致力於解決圖像中的文字問題,只要使用者打開(手機)旁白功能,OCR 就會在這些應用程式裡面,自動啟動讀光 OCR 功能;且讀光的閱讀速度非常的快,對視障人士而言非常流暢。
除了打造讀光技術外,阿里巴巴集團在今年也成立「訊息無障礙委員會」,包含 10 個阿里巴巴業務及 14 個不同的產品部門,除了不斷完善阿里巴巴各款產品的無障礙化外,該委員會也於技術探索、行業發展、標準制定、倡導宣傳等方面有所建樹,相關成果也多次入選訊息無障礙產業白皮書及案例彙編等。
(首圖來源:阿里巴巴)