Facebook 推人工智慧新功能：讓盲人也能「看見」照片內容

由

2019-06-13

在 Facebook、Instagram、Facebook Messenger 與 WhatsApp 等平台上，用戶們上傳的照片每天超過 20 億張，但對盲人或視障人士來說，Facebook 等平台上所出現的照片，只能是螢幕閱讀器讀出的「照片」二字，影像內容從來不得而知。而現在，Facebook 透過人工智慧技術，要將圖像內容以語音敘述方式，「說」給盲人或視障人士聽。

Facebook 所推出的這項新功能名為「自動文字替代（automatic alternative text）」，利用機器學習技術，建立演算法來幫助人工智慧學習識別圖像內容，餵養數百萬個範例，在正確度達 80% 的情況下，才會對圖像進行標示，讓人工智慧系統能辨識平台上圖像中的內容，並透過語音詮釋圖片。自動文字替代功能辨識圖像內容後，接著利用 iPhone 的 VoiceOver 功能，以語音敘述方式，向用戶讀出照片內容。

Perspective Box 透視箱

雖然目前這項功能還在發展初期，但已能辨識包括交通工具（車、船、飛機）、自然現象（日落、下雪、海洋）、運動（籃球場）、食物等類型的圖像，也能針對人臉特徵進行敘述。就如 Facebook 所舉例，假如影像中出現「一對情侶戴著太陽眼鏡站在海邊微笑著」（首圖左），那麼，Facebook 的自動替代文本功能所讀出的會是「兩個人、微笑、太陽眼鏡、戶外、水」，至於首圖右，所讀出的則會是「披薩、食物」。

對於如種族等較為敏感、可能引起爭議的內容，Facebook 表示，將會特別小心處理，若不具高度把握的話，並不會對這類圖像進行標示，避免引起紛爭。

目前自動文字替代功能僅在 iOS 平台上推出，且語言的部分僅支援英文語音，但 Facebook 表示將會盡快在其他平台上推出並提供更多語言。雖然這項功能還在發展初期，但對盲人或視障人士來說，無疑為他們使用社群平台又多開啟了一扇窗。