ChatSearch:通用对话图像检索的数据集和生成检索模型

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本研究推出了PhotoChat数据集,专注于在线对话中的照片分享,包含12,000个对话。研究提出了照片分享意图预测和照片检索两个任务,基线模型表现良好,最佳图像检索模型的召回率为10.4%,意图预测的F1分数为58.1%。该数据集旨在推动相关研究的发展。

🎯

关键要点

  • 本研究推出了PhotoChat数据集,专注于在线对话中的照片分享,包含12,000个对话。
  • 研究提出了两个任务:照片分享意图预测和照片检索,以促进图像文本建模的研究。
  • 最佳图像检索模型的召回率为10.4%,最佳照片意图预测模型的F1分数为58.1%。
  • 该数据集旨在推动相关研究的发展。
➡️

继续阅读