Facebook 推人工智慧新功能:讓盲人也能「看見」照片內容

31

在 Facebook、Instagram、Facebook Messenger 與 WhatsApp 等平台上,用戶們上傳的照片每天超過 20 億張,但對盲人或視障人士來說,Facebook 等平台上所出現的照片,只能是螢幕閱讀器讀出的「照片」二字,影像內容從來不得而知。而現在,Facebook 透過人工智慧技術,要將圖像內容以語音敘述方式,「說」給盲人或視障人士聽。

Facebook 所推出的這項新功能名為「自動文字替代(automatic alternative text)」,利用機器學習技術,建立演算法來幫助人工智慧學習識別圖像內容,餵養數百萬個範例,在正確度達 80% 的情況下,才會對圖像進行標示,讓人工智慧系統能辨識平台上圖像中的內容,並透過語音詮釋圖片。自動文字替代功能辨識圖像內容後,接著利用 iPhone 的 VoiceOver 功能,以語音敘述方式,向用戶讀出照片內容。

雖然目前這項功能還在發展初期,但已能辨識包括交通工具(車、船、飛機)、自然現象(日落、下雪、海洋)、運動(籃球場)、食物等類型的圖像,也能針對人臉特徵進行敘述。就如 Facebook 所舉例,假如影像中出現「一對情侶戴著太陽眼鏡站在海邊微笑著」(首圖左),那麼,Facebook 的自動替代文本功能所讀出的會是「兩個人、微笑、太陽眼鏡、戶外、水」,至於首圖右,所讀出的則會是「披薩、食物」。

對於如種族等較為敏感、可能引起爭議的內容,Facebook 表示,將會特別小心處理,若不具高度把握的話,並不會對這類圖像進行標示,避免引起紛爭。

目前自動文字替代功能僅在 iOS 平台上推出,且語言的部分僅支援英文語音,但 Facebook 表示將會盡快在其他平台上推出並提供更多語言。雖然這項功能還在發展初期,但對盲人或視障人士來說,無疑為他們使用社群平台又多開啟了一扇窗。

延伸閱讀: