小红花·文摘

该研究探讨了人类在视觉场景中的注意力转移，提出结合低层显著性和物体中心偏置的模型，分析了人类注视与深度学习模型的关系。通过眼动追踪和计算机视觉，研究了视觉搜索模式的稳定性，并提出新型模型以提高显著性预测性能，展示了人类注意力对人工智能模型的支持。

BriefGPT - AI 论文速递 ·

本文提出了一种新颖的多层深度图机制，以提高人体姿态估计的精度。研究表明，通过视觉场景几何信息和视图合成，可以从单个图像推断3D结构，并在不同场景中验证其有效性。

BriefGPT - AI 论文速递 ·

本文介绍了一种名为DiffuVST的新型扩散系统，用于生成多样化的视觉场景。DiffuVST通过单个条件去噪过程生成高度多样的视觉描述，具有双向文本历史指导和多模态适配器模块，提高了句间连贯性和图像与文本的准确性。实验证明DiffuVST优于传统自回归模型，具有更好的文本质量和推理速度。

BriefGPT - AI 论文速递 ·