增强自主机器人抓取和组装的深度强化学习方法

导读 半自主和自主机器人正在越来越多的现实环境中引入,包括工业环境。工业机器人可以帮助人类工人完成基本任务并减轻他们的工作量,从而加快各
2024-02-07 14:54:48

半自主和自主机器人正在越来越多的现实环境中引入,包括工业环境。工业机器人可以帮助人类工人完成基本任务并减轻他们的工作量,从而加快各种产品的制造速度。

制造中最关键的两项任务是物体抓取和产品组装,但使用机器人系统可靠地解决这些任务可能具有挑战性。用于自动化装配链的工业机器人的主要限制之一是它们需要进行广泛的编程来处理特定的任务(例如,抓取和装配特定的物品),并且它们的特定于产品的编程可能需要时间。

青岛理工大学的研究人员最近开始利用深度强化学习来解决工业机器人的这一关键局限性。他们的论文发表在《国际先进制造技术杂志》上,介绍了新的深度学习算法,可以加快训练工业机器人执行新的抓取和装配任务所需的时间。

“本文提出了一种基于深度强化学习的机器人自主抓取和组装技能学习框架,”陈成军、张浩和他们的同事在论文中写道。

同时,提出了基于深度Q-learning的机器人抓取技能学习算法和基于PPO的机器人装配技能学习算法,其中引入先验知识信息来优化抓取动作,减少机器人所需的训练时间和交互数据。装配策略学习算法。”

最近的论文中介绍的机器人训练新技术建立在近年来推出的计算机视觉和机器学习工具的基础上。首先,研究人员开发了一种深度学习算法,旨在快速教授机器人新的物体抓取技能,以及一种单独的算法来训练机器人组装特定物体。

同时,他们还设计了奖励函数,可用于有效评估工业机器人系统的抓取和组装技能。这些包括抓取和装配约束奖励功能。

为了评估他们提出的机器人训练工具箱的潜力,陈、张和他们的同事在模拟和物理工业机器人上对其进行了测试。在实际实验中,该团队专门使用 UR5(一种常用于工业任务的轻型机械臂)和 RealSense D435i 相机来收集物体的 RGB 图像,然后他们的算法可以对其进行分析。

“所提出的框架和算法的有效性在模拟和真实环境中都得到了验证,两种环境下的平均抓取成功率高达90%。在孔内装配公差为3毫米的情况下,装配成功在模拟环境和物理环境中,这一比率分别为 86.7% 和 73.3%。”研究人员在论文中写道。

免责声明:本文由用户上传,如有侵权请联系删除!