小红花·文摘

研究利用多模态数据集分析用户通过图像表达偏好，涵盖从风景到艺术的视觉表达。用户请求推荐相似感觉的书籍或音乐。实验表明，大型基础模型在任务中存在局限性，视觉-语言模型未明显优于语言模型。提出的图像链推理方法取得了改进，并公开了代码和数据集。

BriefGPT - AI 论文速递 ·

该研究介绍了一个用户通过图像表达偏好的多模态数据集，并发现大型基础模型在这些任务中的局限性。研究提出了图像链推理的方法，取得了显著改进。代码和数据集已公开发布。

BriefGPT - AI 论文速递 ·