Graspness Discovery in Clutters for Fast and Accurate Grasp Detection 解读

news/2025/2/22 18:17:53

研究背景

  1. 研究问题 :这篇文章要解决的问题是如何在杂乱的环境中快速且准确地检测抓取姿态。传统的 6自由度抓取方法将场景中的所有点视为平等,并采用均匀采样来选择抓取候选点,但忽略了抓取位置的重要性,这极大地影响了抓取姿态检测的速度和准确性。
  2. 研究难点 :该问题的研究难点包括:如何在大量的 3D 空间点中快速识别出可抓取的区域,以及如何在不牺牲计算资源的情况下提高抓取姿态检测的效率。
  3. 相关工作 :该问题的研究相关工作包括基于平面的抓取检测和 6自由度的抓取检测。现有的方法主要集中在改进抓取参数的预测质量,但忽略了抓取位置的筛选问题。

研究方法

这篇论文提出了一种基于几何线索的“抓取性”(graspness)来解决杂乱环境中抓取姿态检测的问题。具体来说,

  1. 抓取性定义 :首先,定义了两种抓取性分数:点抓取性分数SpSp和视图抓取性分数SvSv。点抓取性分数表示每个点的抓取可能性,视图抓取性分数表示每个视图的抓取可能性。

     

  2. 抓取性测量 :通过穷举搜索未来可能的抓取姿态来评估每个点的抓取性。具体公式如下:

    s~ip= ⁣∑j=1V∑k=1L1(qki,j>c)⋅1(cki,j)∑j=1V∣Gi,j∣,i=1,...,N,s~ip​=∑j=1V​∣Gi,j​∣∑j=1V​∑k=1L​1(qki,j​>c)⋅1(cki,j​)​,i=1,...,N,

    其中,1(⋅)1(⋅)表示成功抓取的指示函数,qki,jqki,j​表示抓取质量分数,cc表示抓取质量阈值,cki,jcki,j​表示碰撞标签。

  3. 级联抓取性模型 :为了在实际中快速检测抓取性,开发了一个名为级联抓取性模型的神经网络来近似搜索过程。该模型通过多层感知器(MLP)网络生成点抓取性景观,并采用最远点采样(FPS)选择种子点,然后通过另一个 MLP 网络生成视图抓取性景观。

     

  4. 抓取操作模型 :在抓取操作模型中,通过在方向性圆柱空间内裁剪和细化点云,将点转换为夹爪坐标系,并估计抓取参数。具体步骤包括圆柱分组、抓取生成和抓取评分表示。

实验设计

  1. 数据集 :使用了 GraspNet-1Billion 数据集,该数据集包含 190 个场景,每个场景有 256 个不同视角的点云数据。测试场景根据对象类别分为已知、相似和新颖三类。
  2. 数据处理和增强 :点云数据在输入网络前进行体素下采样,体素大小为 0.005 米,仅包含相机坐标系中的 XYZ 数据。输入云通过随机翻转和旋转进行数据增强。
  3. 实现细节 :在 GraspNet-1Billion 数据集上进行实验,每个点密集地标记了 300 个不同视图的抓取质量分数和每个视图的 48 个抓取。网络的骨干网络采用 ResUNet14,输出通道数为 512 。在抓取性 FPS/PVS 中,采样 1024 个种子点和 300 个视图,阈值δPδP设置为 0.1 。圆柱分组中,采样 16 个种子点,圆柱半径为 0.05 米,高度范围为[-0.02 米,0.04 米]。损失函数中,设置α,β,λ=10,10,10α,β,λ=10,10,10。

结果与分析

  1. 级联抓取性模型的泛化性和稳定性 :在不同对象类别、视角和相机设置下的实验结果表明,级联抓取性模型在不同域中具有良好的泛化性和稳定性。点抓取性预测的排名误差在不同类别和视角下变化不大,视图抓取性预测的排名误差在所有组中几乎不变。

     

  2. 与代表性方法的比较 :在 GraspNet-1Billion 数据集上的实验结果表明,GSNet 在所有类别上的 AP 指标比现有方法提高了约 2倍,特别是在最困难的\AP0.4\AP0.4​指标上,GSNet 的相对改进超过 140%。

     

  3. 级联抓取性模型的提升效果 :将级联抓取性模型应用于现有的抓取检测方法(如 GPD 、Liang et al.和 Fang et al.)后,这些方法的性能显著提高,验证了级联抓取性模型的有效性。

     

  4. 不同采样方法的比较 :实验结果表明,使用抓取性 FPS 采样种子点比随机采样和从整个点云中采样效果更好,抓取性 PVS 在视图选择中也优于其他方法。

     

  5. 真实抓取实验 :在真实世界环境中进行的抓取实验验证了 GSNet 的有效性,成功率为 78.22/76.49 、62.88/57.64 和28.97/24.04,分别对应 RealSense 和Kinect 输入。

总体结论

这篇论文提出了一种基于几何线索的“抓取性”来解决杂乱环境中抓取姿态检测的问题。通过级联抓取性模型和抓取操作模型,实现了快速且准确的抓取姿态检测。实验结果表明,该方法在准确性和速度上均优于现有方法,并且具有良好的泛化性和稳定性。该方法已被集成到 AnyGrasp 中,以促进机器人社区的研究。


http://www.niftyadmin.cn/n/5862617.html

相关文章

oracle主库添加数据文件后备库无法按convert转换数据文件名ORA-01119,ORA-17502,ORA-15001

业务环境: 主库11g rac,备库11g单机,linux, 操作过程: 主库表空间满了,扩占了两个数据文件,dg备库无法按照convert转换数据文件 主库添加了2个数据文件 主库添加完数据文件后,备库…

go http Client net/http

框架推荐 net/http go的内置http工具,可以构建client和server。 Slf4j Controller RequestMapping("/rest") public class RestTestController {GetMapping("/get")ResponseBodypublic String get(RequestBody SSHConnectParam param) throws…

三、linux字符驱动详解

在上一节完成NFS开发环境的搭建后,本节将探讨Linux字符设备驱动的开发。字符设备驱动作为Linux内核的重要组成部分,主要负责管理与字符设备(如串口、键盘等)的交互,并为用户空间程序提供统一的读写操作接口。 驱动代码…

http代理IP怎么实现?如何解决代理IP访问不了问题?

HTTP代理是一种网络服务,它充当客户端和目标服务器之间的中介。当客户端发送请求时,请求首先发送到代理服务器,然后由代理服务器转发到目标服务器。同样,目标服务器的响应也会先发送到代理服务器,再由代理服务器返回给…

tidb实时同步到mysql

客户要求实时同步表的数据到mysql,但这个表在tidb。 测试直接通过tidb cdc写入到mysql,有些字段是null,所以中间加了一个kafka实现 客户库中创建表 CREATE TABLE tb_1 (id bigint primary key,cid bigint,gid bigint,fee DECIMAL(10,2),cre…

若依框架实现动态失效时间JWT Token的实践指南

一、功能需求背景 在前后端分离架构中,JWT(JSON Web Token)作为无状态认证方案被广泛使用。若依(RuoYi)框架的TokenService默认采用固定失效时间策略,但在实际开发中常需要根据业务场景动态调整Token有效期…

GUI编程(window系统→Linux系统)

最近有个项目需要将windows系统的程序往Linux系统上面移植,由于之前程序没有考虑过多平台兼容的问题,导致部分功能不可用以下是对近期遇到的问题的总结,以及相应的解决方案和经验分享。 1. Python 模块安装与管理 在 Linux 系统中&#xff0…

C#设计模式 学习笔记

概述 设计模式是一套被反复使用的、多数人知晓的、经过分类编目的代码设计经验的总结 本文是《C#设计模式》书籍的学习笔记 面向对象设计原则 单一职责原则 一个对象应该只包含单一的职责,并且该职责被完整地封装在一个类中 开闭原则 对扩展开放,对…