学习品味:一个多模态葡萄酒数据集
💡
原文中文,约500字,阅读约需1分钟。
📝
内容提要
WineSensed是一个大型多模态葡萄酒数据集,包括897k张葡萄酒标签图片和824k条葡萄酒评论。数据集涵盖超过350k个唯一年份的葡萄酒,包含了年份、产区、评分、酒精含量、价格和葡萄组成等注释信息。研究通过葡萄酒品尝实验和口感排名,获得了5000多个成对的口感距离。作者提出了一种低维概念嵌入算法,证明了该算法在粗粒度口感分类方面具有改进效果,并与人类口感知觉相一致。
🎯
关键要点
- WineSensed是一个大型多模态葡萄酒数据集,包含897k张葡萄酒标签图片和824k条评论。
- 数据集涵盖超过350k个唯一年份的葡萄酒,包含年份、产区、评分、酒精含量、价格和葡萄组成等信息。
- 研究通过对256名参与者进行葡萄酒品尝实验,获得了5000多个成对的口感距离。
- 作者提出了一种低维概念嵌入算法,证明了该算法在粗粒度口感分类方面的改进效果。
- 该算法与人类口感知觉相一致,结合了人类经验和自动机器相似核。
➡️