本研究提出了OPA-Pack框架,以解决机器人装箱中物体属性未被考虑的问题。通过新型识别方案和OPA-Net模型,显著提高了不兼容物体分离的准确率至95%,并减少了脆弱物体的压力29.4%,同时保持了良好的装箱紧凑性。
研究者提出了一种渐进式流水线和基准测试SPEC来评估视觉语言模型在细粒度的视觉语言概念理解方面的能力。发现四个领先的模型在SPEC上表现接近随机猜测,揭示了其局限性。研究者提出了一种优化方法,显著改善了SPEC的结果,并在其他基准测试上验证了方法的可迁移性。
完成下面两步后,将自动完成登录并继续当前操作。