小红花·文摘

本研究提出了一种无训练的多提示视频生成方法DiTCtrl，解决了现有模型在数据需求和提示跟随能力上的不足。实验结果表明，该方法在无需额外训练的情况下实现了先进性能。

DiTCtrl: 在多模态扩散变换器中探索注意力控制以实现无调优的多提示长视频生成

BriefGPT - AI 论文速递 ·

本文介绍了多种基于状态空间模型（SSM）的时序预测模型，如S-Mamba和D-Mamba，强调其在节省GPU内存和训练时间的同时提升性能。Mamba模型在语言、音频和基因组等领域表现优异，尤其在处理长序列时显著快于Transformer。此外，研究还提出了SegMamba、Graph-Mamba和PointMamba等新模型，分别在医学图像分割、图网络预测和点云分析中取得了先进性能，展示了SSM在多种任务中的潜力。

将 Mamba 和 Transformer 整合用于长短程时间序列预测

BriefGPT - AI 论文速递 ·

本文提出了一种统一的CNN框架来规范化深度完成，通过模拟深度与表面法线之间的几何约束，预测稀疏LiDAR输入的置信度，以隔离噪声的影响，以实现从稀疏深度图恢复密集深度图的目标。在KITTI深度完成数据集和NYU-Depth-V2数据集上进行了实验，证明了方法的先进性能。

自动驾驶中基于图像导向的深度补全的简明有效网络

BriefGPT - AI 论文速递 ·