Site icon About 24/7

西北大學新系統在智力測試中超越 75% 美國人,人類的推理能力也不及 AI 了?

你聽過瑞文氏標準推理測驗(Raven’s Progressive MatriCES)嗎?上面這張圖就是一道標準的瑞文氏測驗題目,是不是很眼熟?在公務員考試、一般的智力測試中我們經常看到它。

那麼問題來了,你知道圖中這道題的答案嗎?如果不知道,也用不著沮喪,因為有 75% 的美國人大概也不知道。但壞消息是:電腦可能知道。

近日,美國西北大學的科研團隊研發了一個全新的計算模型,在瑞文氏標準推理測驗中達到或超越了 75% 美國普通大眾的表現,被媒體譽為人工智慧史上的又一里程碑。

根據 2016 年的數據顯示,一般 18 歲成年人的平均智商為 97,6 歲兒童的平均智商為 55.5,相比之下 Google 人工智慧系統的智商則為 47.3,微軟小冰是 24.5,人工智慧的智商還不及 6 歲兒童的平均水平。

團隊負責人,來自西北大學 McCormick 工程學院的 Ken Forbus 教授對此表示:「模型在智力測試中的表現優於 75% 的美國大眾,這意味著人工智慧的邏輯推理能力已經高於人類的平均水平,起碼在測試題中如此。另外,由於對人來說很難的題目對模型來說通常也很難,這表示該模型已經可以表現出一些人類認知系統中特有的重要屬性。」

▲ Ken Forbus 教授

實力這麼強,這個模型到底是如何工作的呢?

據悉,該模型建立在一個名為 CogSketch 的「草圖」(sketch)理解系統之上,該系統同樣是 Ken Forbus 團隊的研究成果。這裡「草圖」是指人們在思考問題或表達觀點時,自然而然在紙上畫下來的說明性圖樣,特別是面對有關空間理解和地理學的相關問題時,尤其必要。CogSketch 系統可以利用草圖進行空間建模和邏輯推理,再配合此次最新研發的計算模型,因而能夠在瑞文氏標準推理測驗中脫穎而出。

Ken Forbus 教授認為類比推理是解決視覺問題的核心,團隊正是在這一核心思想的指導下研發了最新的計算模型。所謂類比推理即結構映射的過程,是在不同對象之間透過逐個匹配,尋找它們在結構上的相似點,進而透過圖式歸納(即關係結構表徵)把源問題中元素之間的關係要素提取出來,用於靶問題的解決。也就是說,先要形成基於源問題的圖式歸納,再基於源問題和靶問題之間的結構映射將圖式歸納應用到靶問題的解決。在新的計算模型中,團隊成員利用了結構映射理論來對比不同的圖像,通過標記兩張圖像中發現的相同結構,辨識出其中的相同點和不同點。值得一提的是,結構映射是由心理學家 Dedre Gentner 於 1983 年提出的一個理論,他也是西北大學的教授。

針對西北大學的這項研究,雷鋒網隨機採訪了兩位相關專業的在讀研究生,他們表達了自己的看法。

鐘超傑是來自北京林業大學的碩士在讀生,曾參與車載鏡頭的行人檢測計畫。他認為,雖然模型的智力測試成績超過了 75% 的美國人,但這並不能說明電腦的智力真的就超過了人類。因為除了推理,智力的含義應該更複雜,比如還包括學習能力、數學計算能力等。而且他覺得如果模型建得好,經過一定資料量的訓練,電腦處理這類問題的能力一般是可以超過人類的,但超出這類問題的範疇應該就不行了。

周志敏是來自浙江大學的研二在讀生,了解機器學習領域的各種演算法,包括 svm、神經網路等。他認為這是人工智慧針對特定任務的又一項成功應用,跟人類的類比、推理能力並不一樣。西北大學的模型之所以表現出超過 75% 普通民眾的推理能力,是因為它經過了大量類似資料的訓練,如果讓它做圖形之外的工作應該就不行了。

當前,人工智慧系統對圖像和語音的辨識能力已經相當出色,但對於語義和圖像含義的理解、推理能力仍有待提高。西北大學的團隊表示,在許多場景中除了對數據源進行辨識,對其含義的推理和解釋也至關重要,這也是他們研發全新的計算模型並對其展開瑞文氏標準推理測驗的原因。他們希望這項研究成果可以為電腦視覺領域今後的發展提供一些技術參考。

(本文由 雷鋒網 授權轉載)

Exit mobile version