喵ID:bSBJ6G免责声明

Pixel-Attentive Policy Gradient for Multi-Fingered Grasping in Cluttered Scenes

基本信息

DOI:
10.1109/iros40897.2019.8968263
发表时间:
2019-03
期刊:
2019 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)
影响因子:
--
通讯作者:
Bohan Wu;Iretiayo Akinola;P. Allen
中科院分区:
其他
文献类型:
--
作者: Bohan Wu;Iretiayo Akinola;P. Allen研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

Recent advances in on-policy reinforcement learning (RL) methods enabled learning agents in virtual environments to master complex tasks with high-dimensional and continuous observation and action spaces. However, leveraging this family of algorithms in multi-fingered robotic grasping remains a challenge due to large sim-to-real fidelity gaps and the high sample complexity of on-policy RL algorithms. This work aims to bridge these gaps by first reinforcement-learning a multi-fingered robotic grasping policy in simulation that operates in the pixel space of the input: a single depth image. Using a mapping from pixel space to Cartesian space according to the depth map, this method transfers to the real world with high fidelity and introduces a novel attention mechanism that substantially improves grasp success rate in cluttered environments. Finally, the direct-generative nature of this method allows learning of multi-fingered grasps that have flexible end-effector positions, orientations and rotations, as well as all degrees of freedom of the hand.
同策略强化学习(RL)方法的最新进展使虚拟环境中的学习智能体能够掌握具有高维连续观测和动作空间的复杂任务。然而,由于模拟与现实的保真度差距较大以及同策略强化学习算法的高样本复杂性,在多指机器人抓取中应用这类算法仍然是一个挑战。这项工作旨在通过首先在模拟中强化学习一种在输入像素空间(单个深度图像)中运行的多指机器人抓取策略来弥合这些差距。利用根据深度图从像素空间到笛卡尔空间的映射,该方法能高保真地迁移到现实世界,并引入了一种新颖的注意力机制,大大提高了在杂乱环境中的抓取成功率。最后,这种方法的直接生成特性允许学习具有灵活的末端执行器位置、方向和旋转以及手部所有自由度的多指抓取。
参考文献(33)
被引文献(28)

数据更新时间:{{ references.updateTime }}

关联基金

NRI: FND: Scalable Multimodal Tactile Sensing for Robotic Manipulators in Manufacturing
批准号:
1734557
批准年份:
2017
资助金额:
75
项目类别:
Standard Grant
Bohan Wu;Iretiayo Akinola;P. Allen
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓