小红花·文摘

本研究提出了一种新的粗到细自回归策略学习框架（CARP），旨在提高机器人视觉运动策略学习的效率和灵活性。该框架通过多尺度表示学习和细化预测两个阶段，显著提升了动作生成的精度和流畅性，推理速度提高了10倍，并实现了竞争性的成功率。

CARP: Visuomotor Policy Learning Based on Coarse-to-Fine Autoregressive Prediction

BriefGPT - AI 论文速递 ·

本研究提出了一种增强的深度分层视频压缩算法（DHVC 2.0），旨在提高视频压缩性能和复杂性效率。该算法利用分层自编码器将视频帧转化为多尺度表示，显著提升压缩效果并减少内存占用，适用于实时网络视频应用。

High-Efficiency Neural Video Compression via Hierarchical Predictive Learning

BriefGPT - AI 论文速递 ·

本文提出了一种多任务方法，用于人群计数和人员定位，通过学习编码人群图像的多尺度表示并将其融合，该方法在人群计数和定位任务上表现出强效果。在ShanghaiTech A和B的数据集上测试，MSE量分别为110.7和15.0，AP量分别为0.71和0.75。消融实验显示了多尺度方法和融合模块的有效性。

一种用于资源受限人群计数的轻量级特征融合架构

BriefGPT - AI 论文速递 ·

本文提出了一种多任务方法来统一框架中进行人群计数和人员定位。通过学习编码人群图像的多尺度表示并将它们融合，模型比基于密度的方法更精确地识别人群位置。在ShanghaiTech A和B的人群计数数据集上测试，展示了模型在人群计数和定位任务上的强效果。详细消融实验显示了多尺度方法的影响和融合模块的有效性。

基于红外人数统计的监督级别权衡评估

BriefGPT - AI 论文速递 ·

StairNet是一种新的目标检测模型，通过引入特征组合模块来解决基于SSD框架的小物体检测困难问题。该模型采用多尺度表示和语义分配相结合的方法，优于其他一阶段检测器。

StairNet: 用于人机移动的楼梯视觉识别

BriefGPT - AI 论文速递 ·