本研究提出了FlexEvent框架,克服了现有事件相机在固定频率下物体检测的局限性,实现了在任意频率下的高效检测,提升了动态环境中的准确性,并设立了新的基准。
本研究提出了一种实用的全切片图像肾小球分割方法,通过拼接重叠贴片提高检测覆盖率。实验结果表明,该方法在两个大型数据集上超越了以往技术,树立了新基准。
该文章介绍了OmniNOCS数据集,它是一个新的三维大规模单目数据集,比现有的NOCS数据集的对象类别多20倍,实例多200倍。研究人员使用OmniNOCS训练了一种新颖的基于转换器的单目NOCS预测模型(NOCSformer),可以准确预测NOCS、实例掩模和姿态。该模型在3D定向边界框预测任务上表现出色,并提供了详细准确的3D对象形状和分割。研究人员还提出了基于OmniNOCS的NOCS预测任务的新基准。
RoboDrive Challenge比赛推动驾驶感知技术发展,适应现实世界变化。评估140个团队解决方案,设立新基准。
研究者们通过使用GPT-4 Vision(GPT-4V)的先进生成能力,开发了一种能够处理复杂的3D数据并实现零样本识别能力的方法。他们通过系统策略进行点云图像可视化,提高了GPT-4V的效率。实验证明了该方法在各种情景下的优越性,并设定了零样本点云分类的新基准。
本文提出了一种基于单个预训练AffectNet的EfficientNet模型的帧级情感识别算法,可在移动设备上实现实时视频人脸情感分析。该算法在第三届野外情感行为分析竞赛的Aff-Wild2数据集上,相较于VggFace基线,性能指标高0.15-0.2。该方法可作为四个子挑战的新基准。
完成下面两步后,将自动完成登录并继续当前操作。