小红花·文摘 - 小红花技术领袖俱乐部

本文比较了DeepSeek与其他大型语言模型在短文本预测中的表现，结果显示DeepSeek在分类准确性上优于大多数模型，但不及Claude，并提供了新数据集以促进未来研究。

DeepSeek与其他大型语言模型的比较

BriefGPT - AI 论文速递 ·

本研究提出了LLaVA-SpaceSGG模型，解决了现有场景图生成模型在开放词汇环境中忽视空间关系的问题。通过增强空间关系建模和利用新数据集进行训练，LLaVA-SpaceSGG在召回率上显著提高，实验结果显示召回率提升8.6%，平均召回率提升28.4%。

LLaVA-SpaceSGG: Visual Instruct Tuning for Open-Vocabulary Scene Graph Generation with Enhanced Spatial Relations

BriefGPT - AI 论文速递 ·

本研究首次创建了一个多模态的新数据集，针对分布外推理任务，解决了基础模型在异常场景下的性能不足问题。通过创新的提示工程技术，显著提升了模型的表现。

Benchmarking Foundation Models on Special Cases: Dataset Creation and Validation

BriefGPT - AI 论文速递 ·