美国麻省理工学院提出了一种循环学习联合优化算法,这种方法仅需要400次模拟就能获得机器人最佳状态,远快于需30000次模拟的传统方法。

软体机器人难以计算完成复杂任务的最佳方式。研究人员提出了循环学习联合优化方法,结合模拟网格中粒子行为的材料点法和深度学习方法,降维获得机器人的最优状态。先拆分机器人在背景网格中的位置和速度场,并输入带深度可变卷积自动编码器的观察器中,将机器人状态降维成潜在状态,再确定机器人中每个模拟粒子在下一个时间步长中的运动,产生机器人下一步的整体状态。使用Adam一阶优化器记录网格快照,训练观察器直至结果收敛。当机器人达到最终模拟状态后,会更新并反馈一个与最终状态有关的“损失函数”,可用于调整所有参数,以更好地完成任务。在二维和三维软体机器人上的测试表明该模型具有良好的鲁棒性和较快的收敛速度。

打开网易新闻 查看更多图片

这项研究可用于优化软体机器人控制,提高机器人的可操作性,实现更安全、更可靠的人机交互。

(蓝海星)