會像人一樣學習新技能的機器人

類別: 新奇

會像人一樣學習新技能的機器人

機器人最出名的弱點就是不會通過反覆練習學習做一件事。你能在一個機器人的大腦裡打包許多資訊,但是卻沒辦法教它完成沒有事先程式設計好的任務。甚至連簡單的搬磚和扭飲料瓶都做不到。

不過這種情況很快就會改變了,加州大學伯克利分校的研究員們正在研究一種新演算法讓機器人可以通過練習、犯錯來學習所有新技能,就像人類一樣。切實點說,這個演算法可能最終可能產生機器人管家,能幫你完成各種不想做的無聊乏味的家務活(換燈泡、洗廁所、疊衣服)。

一般來說,機器人認識世界是全靠大量預程式設計序的,讓它們知道在什麼情況下作何反應。這種演算法可用於可控制的環境裡(如實驗室或醫療機構),如果它們要更加融入我們的日常生活,機器人必須要學會適應未知環境,這會是人工智慧技術發展的關鍵一步。

為此,伯克利分校“人與機器人倡議”活動的參與研究員正轉向稱為“深度學習”的人工智慧分支,這個技術是來源於大腦利用神經線路來感知世界並進行互動。

機器人研究者Sergey Levine介紹說:“人類並不是生來就會所有的行為模式,但我們也不需要被程式設計。我們用一生的時間從他人、實踐中學習、掌握這些技能。這個學習的過程根植於我們的神經系統,我們甚至沒辦法言傳身教到底要怎樣才能做好這件事,只能提供一些建議和指導讓他們自己領悟學習。”

如果你用過Siri、谷歌的語音助手或是谷歌街景,那你就已經從(深度學習)中獲益了。不過把深度學習應用到動作技能上卻有更多挑戰。從複雜程度來說, 肢體任務比單純地用視覺或聽覺被動感知要難得多。

在近期的實驗中,研究員一直在研究一個他們叫“伯克利清理乏味任務機器人”(Berkeley Robot for the Elimination of Tedious Tasks,BRETT)的小機器人,BRETT被訓練完成了一系列簡單的動作任務,比如把楔子釘進洞裡或堆樂高磚。這個演算法包括BRETT學習新人物的好壞,達到多熟練會有獎勵機制。這個獎勵制度很關鍵:能幫助他完成任務的會得更高的分,而沒用得動作則不會得分,這樣會讓他的神經網路傳達成千上萬的引數。

到目前為止,BRETT的訓練結果令人震驚。如果把物體在一個場所的位置告訴他,他一般能在十分鐘裡面完成一個新任務。如果位置未知,那他就要同時開動視覺和動作控制馬達,那麼這個學習過程需要幾個小時。

伯克利分校電氣工程與電腦科學系的Pieter Abbeel說:“在我們的機器人學習打掃房間或洗衣服之前,我們仍然有很長的路要走,不過我們目前出的初步結果表明這種深度學習技術可以讓機器人從零開始學習複雜的任務,這將帶來革命性的影響。在接下來的額五到十年裡,它們的學習能力或許會有明顯進步。”

想想過年時候的大掃除全都可以交給機器人,是不是很爽?

[小笨 via gizmodo]

會像人一樣學習新技能的機器人原文請看這裡