首頁 > 新聞中心 > 智能機器人網 > 機器人方案

麻省理工提出便捷的機器人學習方案

    發布時間: 瀏覽量:
  • 0

  美國麻省理工學院(MIT)網站發布消息稱,該校已經提出了一種更便捷的機器人訓練方案。

機器人學習方案.png

  大多數機器人使用以下兩種方案中的一種進行編程:從演示中學習,觀察任務完成的過程并復制該過程,或通過運動規劃技術學習(如優化或抽樣)。后者需要由程序員明確指定任務的目標和限制。

  上述兩種方案都有缺陷。從演示中學習的機器人不能輕易地將已學到的技能用于另一種情況并保持準確。另一方面,使用采樣或優化機制的運動規劃系統可以適應這些變化,但耗時更長,因為它們通常需要由專業程序員人工進行編程。

  麻省理工學院計算機科學與人工智能實驗室(CSAIL)的研究人員最近開發了一個系統:C-LEARN,旨在將這兩種技術結合起來。它允許非編碼人員輕松地教會機器如何執行一系列任務,方式是告訴機器人一些操控物體的經驗信息,然后再給機器人做一次任務演示。

  重要的是,這使得用戶能夠教會機器人能自動轉移到具有不同移動方式的其他機器人身上的技能。對于需要各種機器人執行相似任務的公司來說,這是節約時間和成本的關鍵措施。“這個方案將演示學習的直觀性與運動規劃算法的精確性結合起來,可以幫助機器人完成以前無法學習的新型任務,例如需要使用雙臂的多步驟組合任務。”研究人員表示。

  該團隊在Optimus上對系統進行了測試。Optimus是一種新型的雙臂機器人,專為處理炸彈而設計,能夠執行開門、運輸物體和從集裝箱中提取物體等任務。在模擬中,他們展示了Optimus學會的技能可以無縫轉移到該實驗室設計的6尺高、400磅重的人形機器人Atlas。描述C-LEARN系統的論文最近已被電氣電子工程師學會(IEEE)國際機器人與自動化國際會議(ICRA)接收,該會議于5月29日至6月3日在新加坡舉行。

  在使用C-LEARN系統時,用戶首先向機器人提供一個知識庫,包含了如何接觸并獲取具有不同限制的各種對象的信息。(C-LEARN中的C代表“限制”)例如,輪胎和方向盤具有相似的形狀,但是要將它們安裝在汽車上,機器人必須以不同方式調整手臂來移動它們。這個知識庫就包含了機器人要完成這個任務所需的信息。

  然后,操作員使用三維界面向機器人提供一次針對特定任務的演示,這種演示由被稱為“關鍵幀”的相關時刻序列表示。通過將這些關鍵幀與知識庫中的不同情況相匹配,機器人可以自動給出行動計劃建議,由操作員根據需要采用或進行編輯。

  “人們看到某件事如何完成,將其與已知世界相關聯。我們的方案其實與人類的這種學習方式是非常類似的。”研究人員說,“我們不可能神奇地憑借一次演示就完成學習,因此我們會接受新信息,并將其與以前的環境知識相匹配。”

  一個挑戰是,可以從演示中學習到的現有限制不夠準確,無法幫助機器人精確地操縱對象。為了克服這個問題,研究人員開發了由計算機輔助設計(CAD)程序支持的限制。這種限制可以告訴機器人它的手臂是否應該與正在互動的對象平行或垂直。

  該團隊還展示了機器人與人類合作時表現得更好。87.5%的時間,機器人能夠順利地自行執行任務,而如果有操作員幫助糾正機器人偶爾出現的的傳感器不準確測量相關的微小錯誤,機器人能夠在100%的時間里都順利執行任務。

  “擁有知識庫的機器人非常普遍,但將其與演示學習結合在一起的情況則不常見。”美國密歇根大學(University of Michigan)研究人員表示,“這很有幫助,因為如果你一遍又一遍地處理相同的對象,你就不希望每個新任務都要從零開始訓練機器人。”

  該系統屬于更大規模的研究,后者聚焦于讓基于演示的學習方案具有更好的適應性。對于已經從演示中學會如何從管子中取出物體的機器人來說,如果途中存在一個障礙物,需要該機器人以不同方式移動手臂,它可能就做不到了。然而,用C-LEARN訓練的機器人可以做到這一點,因為它不是學習一種特定的方式來執行該動作。“我們正在從直接模仿運動的方式轉向嘗試推斷運動的原理,這對該領域是有好處的。”密歇根大學的研究人員說,“通過在運動計劃器中使用這些已經學會的限制,我們可以使得系統比僅僅模擬演示過程的系統更加靈活。”

  麻省理工學院的研究人員指出,可以證明先進的LfD方案在時間敏感的場景(如炸彈處理和災害響應)中非常重要。目前用于這些場景的機器人是在單個關節組合運動的水平上遠程操控的。另一位研究人員說:“像撿箱子這樣簡單的任務可能需要20-30分鐘才能完成,這對某些緊急情況而言是非常關鍵的。”

  C-LEARN還不能處理某些高級任務,如避免碰撞,或針對給定任務規劃出不同的步驟順序。但該團隊充滿了信心,融合了更多來自人類學習的經驗會賦予機器人更廣泛的物理能力。

  “在現實世界中,對機器人進行傳統編程困難又繁瑣,還需要大量的專業知識。”研究人員說,“如果我們能像訓練人類那樣訓練它們:給它們一些基本知識和一個演示,效率就會高得多。這是令人興奮的一步,因為它可以訓練機器人執行所需的多臂、多步驟復雜任務。”

聲明:
分享知識,勿忘初創!
電器吧內容大部分均為自己原創,歡迎轉載,請注明出處,頁面永久鏈接http://www.phwuyn.live/pro/jiqirenfangan/2082.html

猜您想看

大赢家心水主论坛13637