OmniDataComposer:多模态数据融合与无限数据生成的统一数据结构
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
CommerceMM是一种多模态模型,具备多种理解商业主题的能力,并可应用于多种任务。它使用预训练方式,在图像-文本对上完成了5个预训练任务,并提出了名为Omni-Retrieval的方法,用于9个新的跨模态和跨配对检索任务。结果显示,在7个商业相关的下游任务中,该模型在细调后实现了最先进的性能。
🎯
关键要点
- CommerceMM是一种多模态模型,具备多种理解商业主题的能力。
- 该模型能够应用于多种任务,包括多模态分类、图像-文本检索等。
- 使用预训练方式,在图像-文本对上完成了5个预训练任务。
- 提出了名为Omni-Retrieval的方法,用于9个新的跨模态和跨配对检索任务。
- 在细调后,该模型在7个商业相关的下游任务中实现了最先进的性能。
🏷️
标签
➡️