小心有雷！人工智慧幫你未看先防爆雷

由

2019-07-13

還記得《復仇者聯盟：終局之戰》上映時，全球掀起的反爆雷活動嗎？聖地牙哥大學研究出一套演算法，可以讓你在被雷到之前，就提前避開這些危險的文章與留言。

「雷」是近年來常見的網路用語，意指「提前洩漏劇情」，為了避免不小心雷到別人，許多網友在討論漫畫、電影、電視劇的時候，都會在貼文和留言加上「防雷分隔線」或是長串空白，以免意外炸傷。但也有些可惡的網友以此為樂，特別喜歡在知名影評人的文章下留言爆雷，讓許多人氣得牙癢癢。

聖地牙哥大學（UC San Diego）的研究團隊，發現《終局之戰》和《冰與火之歌》引發的這個現象後，開發出這套 SpoilerNet，解決這個討人厭的麻煩。

他們利用亞馬遜旗下的閱讀社群網站 Goodreads，收集超過百萬篇評論，這個網站的評論有個特點，每一篇評論都有標註防雷警語的習慣，對讀者來說非常友善，對開發者來說更是一個寶藏。這就像一個完美的資料庫，充滿大量已經下好標記的數據，也是「深度學習」模型最好的學習材料。開發團隊將 130 萬篇評論餵給這個深度學習模型，並讓機器分析「一般字句」跟「爆雷字句」的不同。

以人類直覺來說，很難想像這兩種字句有什麼不同，但機器還真的分辨出來了。SpoilerNet 完成訓練後，開發團隊使用 Google 與 TV tropes（一個大型文化資料維基網站）測試，獲得 92% 正確率。也就是說，它已能幫你避開九成以上的爆雷文，剩下 8% 還有待更多數據幫忙。

開發團隊表示，類似的防雷預警系統，以前也曾出現，但資料庫太小，只有幾千筆，因此不夠精準。深度學習模型加上巨量資料，讓機器更貼近人類用語，並找出人類也無法說明白的差異點。然而深度學習依然有侷限，在文字分析，一些雙關用語常常讓機器混淆，比如說：

（以下有雷，若你還沒看過終局之戰，且預計要看，請快速跳過）

「鋼鐵人死定了」大概不是爆雷，「鋼鐵人死了」就是爆雷。像這樣的判斷力還有待提升，但站在防雷的立場，寧可誤殺不可錯放，未來或許可以加入這樣的敏感度判斷，將可疑字句先當成雷，以免誤傷。

下一個問題就是，一般大眾要怎麼使用這套系統呢？開發團隊表示，這個系統完全可在個人電腦運作，但要貼近使用者習慣的話，他們認為瀏覽器擴充套件比較有機會。儘管他們還沒有想商業化，但他們還是很希望幫助更多人「防雷」，因為團隊成員都是吃過爆雷之苦的過來人。

這套工具未來很可能會落入亞馬遜手裡，並成為旗下網站的好幫手。試想，當下一部神片上映時，有個網站能跟你保證絕不爆雷，讓你不用再關機 3 天直到走出電影院，是不是好棒棒呢？

TechCrunch:Spoiler warning! This neural network spots dangerous reviews before you read them

（首圖來源：pixabay）

Perspective Box 透視箱