本研究提出了“时间搜索”框架,以解决长视频处理中的视觉幻觉问题。该框架结合聚光灯机制和反思机制,显著提高了长视频理解的准确性,LVBench准确率从41.8%提升至51.5%。
本研究提出MME-CoT基准,系统评估大规模多模态模型的链式思维推理能力。研究发现,反思机制能提升推理质量,但在感知任务中,CoT提示的表现有所下降,显示自我修正阶段效率低下。
本研究提出EvoCoder框架,通过反思机制和经验池提升大语言模型的学习能力,解决现有方法在处理独特代码错误方面的不足,改进缺陷代码再现率20%。
完成下面两步后,将自动完成登录并继续当前操作。