“對於AlphaGo的自我進步來講,人類太多餘了”

DeepMind創始人戴密斯·哈薩比斯

原標題:“對於AlphaGo的自我進步來講,人類太多餘了”

“元的出現為強人工智慧的出現奠定了基礎。人工智慧的發展已經從單一問題向通用問題進化,元基本上已經實現了半通用化。”

10月17日,谷歌旗下DeepMind團隊在《Nature》上發表論文,公佈了新一代AI程式AlphaGo Zero(以下簡稱“元”)。元比舊版AlphaGo(以下簡稱“狗”)更強大,它用最短的學習時間,以100:0的戰績完虐狗。

DeepMind團隊在論文中表示,他們通過一種新的“強化學習”形式,將更新後的神經網路和搜尋演算法重組,創造出了元。

圍棋是智慧的象徵,人類因為無法在圍棋上實現演算法窮舉,只能根據部分樣本分析選擇最優策略,這其中體現的是人類判斷的智慧,而人工智慧則在圍棋上體現了另一種智慧。憑藉卓越的計算能力,元能在全樣本分析的基礎上做出最優選擇。隨著人工智慧的發展,終有一天,圍棋演算法能夠窮舉。那人類在圍棋中體現的判斷智慧價值何在?

更糟糕的是,人工智慧相比人類智慧進化速度越來越快,當兩者的進化速度到了一個奇點的時候,人類還有存在的必要嗎?

2014年12月6日,人工智慧學者Jeremy Howard在TEDx Talks做演講時展示過一張人工智慧與人類智慧發展的的曲線圖。當時,代表人工智慧發展的那根曲線還處在人類智慧曲線的下方。但從2015年起,人工智慧的進化速度越來越快。隨著第一版狗戰勝歐洲圍棋冠軍樊麾,人工智慧曲線開始與人類智慧曲線出現交叉點;2016年,第二版狗戰勝了韓國棋手李世石;2017年上半年,第三版狗又戰勝了世界排名第一的中國棋手柯潔,並在“群戰”中戰勝多位前世界冠軍棋手。人工智慧曲線已經超越人類智慧曲線。

元有比狗更可怕之處:更強的學習能力和更快的進化速度。狗在學習圍棋時,還需要依靠人類知識,在掌握了人類的基本下法後,再開始自己學習。而元完全放棄了向人類學習,從零開始,通過優秀演算法,自我博弈,像《射鵰英雄傳》裡的周伯通一樣,通過自己手臂的左右互搏練成絕世武功,進化速度超越之前的狗。

在進化速度方面,狗在48個TPU(Tensor Processing Unit,谷歌張量處理器)上,花了幾個月時間,學習了3000萬棋局,才最終打敗人類第一,而元只在四個TPU上,花三天時間,自己左右互搏490萬棋局,就打敗了狗。這說明,元比狗的能耗低,能力強。

隨著元的進化,人類經驗的積累已經沒有意義,人類進化了上千年得到的經驗成果,人工智慧只要幾天時間就能得到。元突破了人類固有思維模式,它不僅發現了人類數千年來已有的許多圍棋策略,還設計了人類玩家以前未知的的策略。柯潔在微博上感慨道,“對於AlphaGo的自我進步來講,人類太多餘了。”

柯潔的話並非危言聳聽。不遠的將來,有很大一部分從事簡單、重複、不需要人類付出創意的、思考的、抽象的這樣一些工作就會被完全替代。華爾街銀行家、會計、律師、廚師、醫生、記者等職業都可能被淘汰。

目前,高盛、荷蘭ING銀行、德國商業銀行、蘇格蘭皇家銀行、美國銀行、花旗銀行都在加大對人工智慧的投入。全球金融行業大量裁員時代已經到來。未來全球金融市場將由幾十只或幾百只狗或元操控。而在國內,馬雲的“未來智慧餐廳”、德勤“小勤人”、“人工智慧醫生”沃森等人工智慧應用已經落地,廚師、會計、醫生等職業都將面臨人工智慧的衝擊。

不過人類也沒有必要灰心。更深程度、更廣範圍的替代不會在短時間內全面發生。現在的人工智慧還處在計算智慧階段,它需要走過感知智慧和認知智慧兩個階段,才能進入真智慧(RI)階段。

那時,也許我們真該想想“我們”了。

本文首發於南方人物週刊第531期

文/ 王燕青

編輯/ 孫凌宇

“對於AlphaGo的自我進步來講,人類太多餘了”原文請看這裡