計算機開始像人一樣推理

類別: 新奇

正在考慮入手的新家附近有多少公園?餐館裡最佳的晚餐-酒搭配是什麼?這些日常問題都需要關係推理——一種更高階思考的重要成分,而這卻是人工智慧(AI)難以掌握的。現在,谷歌DeepMind的研究者提出了一種處理這種推理的簡單方法,並在複雜影象理解測試中擊敗了人類。

人類通常很擅長關係推理,利用邏輯連線和比較位置、順序和其他實體。但兩種主要AI——統計和符號,在發展類似的能力方面一直進展緩慢。統計AI,或者叫機器學習,善於模式識別,但不善於使用邏輯。而符號AI則能利用預定規則推理關係,但不善於學習。

計算機開始像人一樣推理
credit: 煎蛋畫師六翼

新研究提出了一種縮小差距的方式:進行關係推理的人工神經網路。類似於大腦中神經元的連線方式,神經網路利用小型程式合作發現資料中的模式,針對影象處理、語法分析或者遊戲學習有特定的架構。在這種應用中,新的“關係網路”單獨比較場景中的每一對目標。論文共同作者、在倫敦的DeepMind計算科學家Timothy Lillicrap說道:“我們明確要求網路發現目標之間存在的關聯。”

他和他的團隊利用幾個任務測試了關係網路。第一個是回答單幅影象內物體之間的關係,比如立方、球形和圓柱的圖形。例如:“在這個藍色的東西前面有個物體,它的形狀和那個灰色金屬球右邊的小型青色物體的形狀一樣嗎?”針對這個任務,關係網路與其他兩種神經網路相結合了:一個識別影象中的物體,另一個翻譯這個問題。研究者在上週發表在預覽商arXiv的論文中稱,通過進行眾多影象和問題測試,發現其他機器學習方法的正確率大概是42%到77%,人類的正確率則是可敬的92%。而新的關係網路正確率是96%,真是一個超越人類的成績。

DeepMind團隊還利用一個語言任務進行了測試。這個任務中網路將接收到一些陳述,比如“Sandra撿起了那個足球”和“Sandra去辦公室了”。隨後就會提出一些問題比如:“球在哪裡?”(辦公室)。該網路在這些問題上的表現和其他型別問題上的一樣好,但最大放異彩的是所謂的推理問題:“Lily是一隻天鵝。Lily是白色的。Greg是一隻天鵝。Greg是什麼顏色?”在這些問題上,關係網路正確率為98%,而其競爭者的正確率約為45%。最後,該方法分析了10個到處亂蹦的球體的動畫,其中某些球體之間被不可見的彈簧或者棍子連線到一起。單單使用運動模式,該網路就能鑑定出90%多的連線。然後使用相同的訓練去鑑定僅利用移動點表示的人類形態。

波士頓大學計算科學家Kate Saenko並未參與該新網路的設計,但最近也合作提出了一種回答關於影象的複雜問題的方法。他說道:“他們方法的一個優點是概念上十分簡單。” Lillicrap稱其中大部分進步都可以用一個簡單的方程來表示,這種簡單性使其容易與其他網路相結合,正如在上述物體比較任務中那樣。論文將其稱為“一個即插即用的模組”,能使系統的其他部分專注於它們擅長的方面。

加利福尼亞帕洛阿爾託的史丹佛大學電腦科學家Justin Johnson合作設計了上述物體比較任務,並且合作提出了一種在該任務上表現良好的方法,他說道:“我深深為此成果而折服。” Saenko補充道,關係網路未來可以幫助研究社交網路,分析監視視訊,或者導引交通流中的汽車。

Johnson說道,為了接近類人靈活性,該網路還需要學會回答更多挑戰性的問題。做到這一點可能需要不僅僅比較一對事物,而是三個,四個或者更大集合中的某些對。他說道:“我對研究能自己提出新策略的模型很感興趣。DeepMind正在建立特殊型別推理的模型,而不是追求更一般化的關係推理。但這仍然是正確方向上的重要一步。”

論文原文:arXiv:1706.01427

本文譯自sciencemag,由譯者CliffBao基於創作共用協議(BY-NC)釋出。Matthew Hutson

計算機開始像人一樣推理原文請看這裡