手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁(yè)>科技>

Google的AI教機(jī)器人如何捕捉被遮擋的物體并適應(yīng)新情況

谷歌和加州大學(xué)伯克利分校的研究人員在本周在預(yù)印本服務(wù)器Arxiv.org上發(fā)表的兩篇論文中描述了新的AI和機(jī)器學(xué)習(xí)技術(shù),這些技術(shù)使機(jī)器人能夠適應(yīng)從未見(jiàn)過(guò)的任務(wù)并抓住被遮擋的物體。第一項(xiàng)研究詳細(xì)介紹了X射線,該算法在部署到機(jī)器人上時(shí)可以搜索對(duì)象的堆以掌握目標(biāo)對(duì)象,而第二項(xiàng)研究則提出了一種策略適應(yīng)技術(shù),可以“教”機(jī)器人技能,而無(wú)需從頭開(kāi)始進(jìn)行模型訓(xùn)練。

抓機(jī)器人是一個(gè)非常困難的挑戰(zhàn)。例如,機(jī)器人努力執(zhí)行所謂的“機(jī)械搜索”,即當(dāng)他們不得不從一堆其他對(duì)象中識(shí)別并拾取一個(gè)對(duì)象時(shí)。大多數(shù)機(jī)器人不是特別適應(yīng)性強(qiáng),并且缺乏足夠功能強(qiáng)大的AI模型來(lái)指導(dǎo)機(jī)械手進(jìn)行機(jī)械搜索。

X射線和策略調(diào)整步驟可以構(gòu)成產(chǎn)品包裝系統(tǒng)的基礎(chǔ),該產(chǎn)品包裝系統(tǒng)可以在無(wú)需人工監(jiān)督的情況下發(fā)現(xiàn),拾取和放下各種物體。

X射線

有關(guān)X射線的研究的合著者指出,由于缺乏合適的模型,機(jī)械搜索(在大量對(duì)象中找到對(duì)象)仍然具有挑戰(zhàn)性。X射線結(jié)合了遮擋推斷和假設(shè)預(yù)測(cè)來(lái)解決該問(wèn)題,它可用來(lái)估計(jì)與對(duì)象最相似的邊界框(對(duì)象周?chē)匦芜吙虻淖鴺?biāo))的占用率分布,同時(shí)考慮各種平移和旋轉(zhuǎn)。

X-Ray假定堆中至少有一個(gè)完全或部分被未知對(duì)象遮擋的目標(biāo)對(duì)象,并且每個(gè)時(shí)間步最多可以抓取一個(gè)對(duì)象。以RGB圖像和目標(biāo)對(duì)象為輸入,它可以預(yù)測(cè)場(chǎng)景的占用率分布和分割蒙版,并計(jì)算幾種潛在的抓握動(dòng)作,以最高的成功概率執(zhí)行該動(dòng)作。

為了訓(xùn)練和驗(yàn)證X射線,研究人員生成了10,000個(gè)增強(qiáng)深度圖像的語(yǔ)料庫(kù),這些圖像標(biāo)記有矩形框目標(biāo)對(duì)象的對(duì)象占用分布。他們從Thingiverse上的1296個(gè)3D CAD模型的開(kāi)放源數(shù)據(jù)集中進(jìn)行采樣,選擇了10個(gè)大小相同,體積較小但厚度較小的盒子目標(biāo),因此它們更有可能被遮擋。這使他們總共獲得了100,000張圖像。

在這10,000張圖片中,約有8,000張被保留用于培訓(xùn),其余的則留作測(cè)試。使用一千個(gè)包含模擬對(duì)象(蓋子,多米諾骨牌和長(zhǎng)笛)的其他圖像來(lái)評(píng)估X射線對(duì)看不見(jiàn)的形狀,對(duì)象,長(zhǎng)寬比和比例尺的概括。

在涉及帶有吸盤(pán)和平行顎式抓爪的真實(shí)ABB YuMi機(jī)器人的物理實(shí)驗(yàn)中,研究人員要求X射線將物體裝滿垃圾箱,然后將垃圾箱傾倒在目標(biāo)物體的頂部。在最初包含25個(gè)對(duì)象的堆中,系統(tǒng)在20次試驗(yàn)中以5個(gè)動(dòng)作的中位數(shù)提取了目標(biāo)對(duì)象,成功率為100%。

合著者將精力放在未來(lái)的工作上,以提高X射線的訓(xùn)練效率,并分析數(shù)據(jù)集大小以及用于生成訓(xùn)練分布的平移和旋轉(zhuǎn)次數(shù)的影響。他們還計(jì)劃根據(jù)目標(biāo)對(duì)象可見(jiàn)性的獎(jiǎng)勵(lì)來(lái)探索強(qiáng)化學(xué)習(xí)策略。

政策調(diào)整

在這兩篇論文的最新文章中,合著者試圖開(kāi)發(fā)一種能夠不斷適應(yīng)新的現(xiàn)實(shí)環(huán)境,物體和條件的系統(tǒng)。與大多數(shù)機(jī)器人相反,后者僅需訓(xùn)練一次即可部署,而適應(yīng)能力卻很少。

研究人員對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行了預(yù)訓(xùn)練,以在608,000次嘗試抓取的語(yǔ)料庫(kù)中抓取一系列對(duì)象,然后他們執(zhí)行的任務(wù)是使用向其起始位置右移10厘米的抓手抓取對(duì)象。系統(tǒng)練習(xí)了一段時(shí)間(經(jīng)過(guò)800次嘗試)并將這些嘗試記錄到新數(shù)據(jù)集(目標(biāo)數(shù)據(jù)集)中之后,新嘗試在50%的時(shí)間內(nèi)與原始數(shù)據(jù)集進(jìn)行了混合,調(diào)整模型。

在五個(gè)不同的場(chǎng)景中重復(fù)了這些步驟-預(yù)訓(xùn)練,嘗試新任務(wù)和微調(diào)。一方面,刺眼的光線阻礙了機(jī)器人的攝像頭。在另一種情況下,棋盤(pán)圖案的背景使模型難以識(shí)別對(duì)象。最后,實(shí)驗(yàn)人員讓機(jī)器人抓住訓(xùn)練中看不到的透明瓶子(眾所周知,透明物體很難抓住機(jī)器人,因?yàn)樗鼈冇袝r(shí)會(huì)混淆深度傳感器),并撿拾坐在高反射金屬板上的物體。

研究人員報(bào)告說(shuō),在實(shí)驗(yàn)中,該模型成功地在苛刻的燈光下63%的時(shí)間,透明瓶子的74%的時(shí)間,棋盤(pán)墊板的時(shí)間的86%的時(shí)間,抓手?jǐn)U展的88%的時(shí)間成功地捕獲了物體,和91%的時(shí)間使用偏置夾持器。而且,他們說(shuō),機(jī)器人適應(yīng)新情況只需要花費(fèi)1-4個(gè)小時(shí)的練習(xí)時(shí)間(相比之下,學(xué)習(xí)如何掌握的時(shí)間大約為6,000個(gè)小時(shí)),并且性能不會(huì)隨著所適應(yīng)的模型而降低。

將來(lái),該小組計(jì)劃調(diào)查該過(guò)程是否可以自動(dòng)化。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章