智東西(公衆号:zhidxcom)
編譯 | 程茜
編輯 | 李水青
智東西11月9日消息,本周一,麻省理工學院計算機科學與人工智能實驗室(MIT CSAIL)公布了一項新成果——一個能夠靈活控制機械手的程序框架。
在很長一段時間裡,機械手的操縱物體能力還不如剛滿一歲的嬰兒靈活。即使現在機械手可以做的不僅僅是撿起和放下物體,但在發力和複雜手部動作方面,它還沒有完全模仿到位。
目前,在該領域已經有多個AI實驗室緻力于機械手訓練,例如OpenAI的Dactyl機器手、DeepMind的RGB堆疊技術(RGB-Stacking)等,都在一定程度上促進了機器人行業的發展。
MIT CSAIL研究人員提出的程序框架可以讓機械手操縱超過2000個不同物體的方向,利用簡單的“師生”訓練方法,在模拟環境中訓練”教師“網絡,再應用到現實世界的“學生”中,解決機械手技術的複雜問題。
該論文将在2021年機器人學習會議(Conference on Robot Learning,CORL)上發表。
OpenAI 2019年10月15日在官網博客發布了Dactyl機械手的視頻,視頻内容是Dactyl機械手在約4分鐘的時間裡成功還原了一個三階魔方,這是在機械手控制領域,從定向任務編程邁向更通用AI技術的重要一步。
Dactyl機械手還原魔方視頻(GIF來源為YouTube)
2021年10月12日DeepMind發布RGB堆疊技術(RGB-Stacking)對機械手進行強化學習訓練,這是一個基于視覺的學習系統,評估多個研究對象的行為和動作來提高機械手能力。
RGB堆疊技術機械手訓練過程(圖片來源為VentureBeat)
MIT CSAIL的科學家們也一直緻力于讓機器提高模仿人類的能力,他們創建了一個更大的程序框架:無論機械手朝上還是朝下,都可以重置2000多個物體的方向。從杯子到金槍魚罐頭、奶酪盒子等,甚至可以延伸到生活中不常見的物體,這個程序框架都可以幫助機械手以特定的方式,在合适的位置快速拾取和放置物體。
此前機械手通常隻能完成單一任務或者隻能在垂直位置上移動,而現在機械手可以具備靈巧的“手部動作”,有助于滿足物流和制造行業一些常見的需求。例如将物品裝入插槽中進行裝配,或靈活操縱距離更遠的工具。MIT CSAIL的團隊使用了具有24個自由度的拟人機械手,證明了該程序框架可以在未來轉移到真正的機器人系統上。
MIT CSAIL研究團隊的機械手演示動畫(GIF來源為GitHub)
MIT CSAIL博士生、Improbable AI Lab研究小組首席研究員陳濤(Tao Chen)說:“在工業中,由于控制簡單,最常用的是平行爪夾持器,如下圖所示。但實際上它無法處理我們在日常生活中看到的許多工具。即使用該夾持器控制鉗子也很困難,因為它不能靈活地隻移動其中一個手柄。我們的程序框架将允許多指機械手靈巧地操縱此類工具,這為機械手應用開辟了一個新領域。”
平行爪夾持器(圖片來源為YouTube)
機械手操縱物體時需要控制大量電機,并且手指與物體之間的接觸狀态也在頻繁變化,因此,機械手重置物體方向一直是一個具有挑戰性的技術難題。該程序框架需要通過2000多個對象進行學習。
當機械手朝下時,問題就變得更加棘手。機械手不僅需要操縱物體,還需要克服重力使其不會掉落。
機械手朝下時操縱物體(GIF來源為GitHub)
該團隊發現一種簡單的方法可以解決複雜的問題。他們使用了深度學習的無模型強化學習算法,意味着該程序框架必須從與環境的交互中找出價值函數,以及所謂的“師生”訓練方法。
為此,研究人員利用物體和機械手的信息對“教師”網絡進行訓練,這些信息無法在現實世界中獲得,隻能在模拟環境中獲得,例如指尖的位置或物體移動速度。
為了确保機械手可以在模拟環境之外工作,“教師”網絡學習到的内容将被提煉為現實世界中可以獲取的觀察結果,并提供給“學生”網絡,例如攝像機捕獲的深度圖像、物體姿态和機械手的關節位置。
他們還使用了“重力課程”的學習方法,機械手首先在零重力環境中學習技能,然後慢慢地讓控制器适應正常的重力條件,以這種形式訓練機械手确實提高了其整體性能。
看似不是正常的學習過程,但被稱為機械手“大腦”的單個控制器可以通過這種訓練方法重新放置大量物體,即使這些物體它以前從未見過并且不知道形狀。
麻省理工學院教授、該研究論文作者Pulkit Agrawal說:“我們最初認為,在機械手操縱物體時推斷形狀的視覺感知算法将是主要挑戰。相反,我們的結果表明,機械手可以學習與形狀無關的強大控制策略。這表明視覺感知對于操縱的重要性可能遠不如我們習慣的思維方式重要,而更簡單的感知處理策略可能就足夠了。”
例如蘋果、網球、彈珠等小的球形物體在用機械手重新放置時,其成功率接近100%。而對于勺子、螺絲刀和剪刀等更複雜的物體放置的成功率較低,隻有約30%。
機械手操縱球形物體(GIF來源為GitHub)
由于其成功率因對象形狀而有所偏差,該團隊指出,在未來基于物體形狀訓練模型可以進一步提高機械手性能。
此次麻省理工學院研究小組推出的程序框架,可以幫助機械手重新定位不同物體,操縱機械手多指機械手使用多種複雜工具,并滿足生産過程中的多種需求,開辟機械手應用的新領域。
該研究小組表示,由于高維驅動空間和手指與物體之間接觸狀态的頻繁變化,手持物體重新放置方向一直是機器人技術中的一個具有挑戰性的問題。用簡單的“師生”方法訓練機械手,巧妙的解決了這一複雜問題。
來源:Tech Xplore
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!