手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>教育要聞>

深度強化運動學(xué)習(xí)中的協(xié)同作用出現(xiàn)

人體運動控制一直很有效地自然,高效地執(zhí)行復(fù)雜的運動,而無需花費太多的精力。這是因為中樞神經(jīng)系統(tǒng)(CNS)中存在運動協(xié)同作用。運動協(xié)同作用使中樞神經(jīng)系統(tǒng)可以使用較小的變量集來控制一大群肌肉。從而簡化了對協(xié)調(diào)復(fù)雜運動的控制。

現(xiàn)在,東北大學(xué)的研究人員在使用深度強化學(xué)習(xí)(DRL)算法的機器人代理中觀察到了類似的概念。

DRL使機器人代理可以在其虛擬環(huán)境中學(xué)習(xí)最佳操作。它可以解決復(fù)雜的機器人任務(wù),同時最大程度地減少手動操作并達到最佳性能。另一方面,經(jīng)典算法需要人工干預(yù)才能為出現(xiàn)的每個新任務(wù)找到特定的解決方案。

然而,將人類之間的電機協(xié)同作用應(yīng)用于機器人世界并非易事。盡管許多研究支持在人類和動物運動控制中采用運動協(xié)同作用,但背景過程仍是未知之?dāng)?shù)。

在當(dāng)前的研究中,東北大學(xué)的研究人員在行走機器人代理上使用了兩種DRL算法,分別稱為HalfCheetah和FullCheetah。這兩種算法分別是TD3(經(jīng)典DRL)和SAC(高性能DRL)。

這兩個機器人代理的任務(wù)是在給定的時間內(nèi)盡可能地向前奔跑。機器人特工總共完成了300萬步。沒有針對DRL使用協(xié)同作用信息,但是機器人特工證明了運動過程中運動協(xié)同作用的出現(xiàn)。

東北大學(xué)教授和該研究的合著者林光光弘(Mitsuhiro Hayashibe)指出:“我們首先以定量的方式證實,即使在深度學(xué)習(xí)中,運動協(xié)同作用也可以像人類一樣出現(xiàn)。”Hayashibe教授補充說:“在進行深度學(xué)習(xí)之后,機器人代理通過利用電機協(xié)同作用改善了電機性能,同時限制了能耗。”

展望未來,研究人員旨在探索更多具有不同身體模型的任務(wù),以進一步證實他們的發(fā)現(xiàn)。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!