小红花·文摘

本研究提出了JointDiT模型，通过扩散变换器增强RGB和深度的联合建模。采用自适应调度权重和不平衡时间步采样策略，JointDiT显著提升了图像生成和深度估计的性能，展现了在多种生成任务中的应用潜力。

BriefGPT - AI 论文速递 ·

Apple Machine Learning Research ·

当前语言模型在理解复杂和长期任务时存在困难。该论文通过联合建模视频序列的时间信息和语言的静态图像，实现了更广泛的人工智能能力。

BriefGPT - AI 论文速递 ·