如果機器人擁有了好奇心······

時間:2017-06-15

來源:網(wǎng)絡轉載

導語:多年以來,科學家一直在開發(fā)針對好奇心的算法,但復制人類的求知欲是個難題。

在一場關于人工智能的轉折中,計算機科學家對機器進行編程,使其變得具有好奇心——能自己探索周圍環(huán)境并且為了學習而學習。這種新方法可使機器人比現(xiàn)在學習得更快。有朝一日,它們甚至可能在形成假設和推動已知科學向前發(fā)展方面超越人類科學家。

“發(fā)展好奇心是智能的核心問題?!痹诿绹祭蚀髮W掌管智能機器人實驗室的計算機科學家GeorgeKonidaris介紹說,“當你不確定你的機器人將來要做什么時,使其具有好奇心將會非常有用?!?/p>

多年以來,科學家一直在開發(fā)針對好奇心的算法,但復制人類的求知欲是個難題。比如,大多數(shù)方法不能評估智能機器人在看見某個事物前預測其是否有趣方面存在的差距。(人類有時能通過封面判斷一本書是否有趣)

目前在英國倫敦谷歌深度思維公司就職的計算機科學家ToddHester希望做得更好?!拔以趯ふ沂褂嬎銠C更加聰明地學習并且像人類一樣進行探索的方法。”Hester表示,“不是探索所有事情,也不是隨意進行探索,而是嘗試著更加聰明地做一些事情?!?/p>

為此,Hester和得克薩斯大學計算機科學家PeterStone開發(fā)了一種名為TEXPLORE-VENIR、依賴于強化學習技術的新算法。在強化學習中,程序會嘗試一些事情。如果一個舉動使其離某個最終目標(比如迷宮的盡頭)更近一步,它會收到一個小小的獎勵并且更有可能在將來再次嘗試這一操作。深度思維公司利用強化學習,使程序通過隨機試驗掌握雅達利游戲和圍棋游戲的玩法。不過,和其他具有好奇心的算法一樣,TEXPLORE-VENIR同樣設置了一個內(nèi)在目標。如果它理解了一些新事物,就會獎勵自己,即便這些知識并未使其離最終目標更近一步。

隨著TEXPLORE-VENIR不斷學習并且構建起關于世界的模型,它會因發(fā)現(xiàn)了和此前見到的事物不一樣的信息而獎勵自己。比如,在一幅地圖上發(fā)現(xiàn)遙遠的地方,或者在烹調用的程序上發(fā)現(xiàn)具有異國情調的食譜?!八鼈兪峭耆煌膶W習和探索類型。”Konidaris表示,“對它們進行平衡真的很重要。我喜歡這篇文章的地方在于它同時做到了兩點。”

Hester和Stone在兩個場景中測試了他們的方法。首先是一個含有一圈4個房間的虛擬迷宮,房間則由鎖著的門連接起來。機器人(僅是一個計算機程序)不得不找到鑰匙,將其撿起來,然后利用它打開門上的鎖。每通過一扇門,機器人會獲得10分,并且擁有3000步來獲得更高的得分。如果研究人員先讓機器人僅在TEXPLORE-VENIR的指導下摸索1000步,它在3000步的測試階段會平均獲得約55分。如果機器人利用其他開發(fā)好奇心的算法進行此類探索,它在測試階段的得分從0到35分不等,除了利用一種被稱為R-Max的算法。后者也能讓機器人獲得約55分。在另一個不同的設定中,機器人不得不同時探索和穿過門。TEXPLORE-VENIR獲得了約70分,R-Max獲得了約35分,其他算法獲得的分數(shù)則不到5分。研究人員在6月出版的《人工智能》雜志上報告了這一結果。

隨后,研究人員利用實體機器人測試了他們的算法。這是一個被稱為Nao的人形玩具。在3項單獨的任務中,半米高的機器人需要擊打鐃鈸、用手將粉色膠帶舉到眼前或者按下腳上的按鈕,從而獲得分數(shù)。在每項任務中,它有200步來獲得分數(shù),但在這之前會有400步來摸索。這要么是隨機進行的,要么利用TEXPLORE-VENIR。每種方法平均開展了13次試驗。相較于隨機摸索,在利用TEXPLORE-VENIR進行探索后,Nao在找到粉色膠帶上做得更好,并且在13次試驗中,有7次按下了按鈕。但在隨機探索后,沒有一次按下。通過自身和周圍環(huán)境開展半結構化的試驗,TEXPLORE-VENIR做好了充分準備執(zhí)行被分配的任務,就像嬰兒在學習爬之前舞動自己的四肢一樣。

在做家務、設計高效的生產(chǎn)流程或者為疾病尋求治療方案時,具有好奇心的機器人會表現(xiàn)出靈活的行為。Hester表示,下一步將利用深度神經(jīng)網(wǎng)絡,即以大腦結構為模型的算法更好地確定要探索的新領域。而這順便也能使Hester的探索更進一步:“我們能否制造像孩子一樣學習的機器人呢?”

更多資訊請關注工業(yè)機器人頻道

中傳動網(wǎng)版權與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(wǎng)(www.connectcrack.com)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0