以意象为探索:探索一种用于对话推荐的多模态数据集
原文中文,约300字,阅读约需1分钟。发表于: 。通过多模态数据集,我们介绍了一个用户通过图像表达偏好的研究。这个数据集包含了从风景到艺术表现的广泛的视觉表达,用户请求推荐具有类似感觉的书或音乐,并由社区通过点赞支持。我们的实验证明了大型基础模型在这些任务中的局限性。特别是,视觉 -...
通过多模态数据集,研究了用户通过图像表达偏好的方法。实验证明大型基础模型在这些任务中的局限性,提出了图像链推理的方法,并取得了显著改进。公开发布了代码和数据集。