本文比较了DeepSeek与其他大型语言模型在短文本预测中的表现,结果显示DeepSeek在分类准确性上优于大多数模型,但不及Claude,并提供了新数据集以促进未来研究。
本研究提出了LLaVA-SpaceSGG模型,解决了现有场景图生成模型在开放词汇环境中忽视空间关系的问题。通过增强空间关系建模和利用新数据集进行训练,LLaVA-SpaceSGG在召回率上显著提高,实验结果显示召回率提升8.6%,平均召回率提升28.4%。
本研究首次创建了一个多模态的新数据集,针对分布外推理任务,解决了基础模型在异常场景下的性能不足问题。通过创新的提示工程技术,显著提升了模型的表现。
完成下面两步后,将自动完成登录并继续当前操作。