可解释的视觉文化遗产收藏搜索与发现,基于多模态大型语言模型
💡
原文中文,约700字,阅读约需2分钟。
📝
内容提要
本研究探讨了如何在缺乏细粒度元数据的情况下改善文化机构在线数字化视觉收藏的搜索与探索界面。提出了一种基于多模态大型语言模型的方法,以实现开放式、可解释的搜索,提升用户体验和效率,同时满足隐私和伦理要求。
🎯
关键要点
- 本研究探讨了文化机构在线数字化视觉收藏搜索与探索界面的挑战。
- 缺乏细粒度元数据使得创建搜索和探索界面变得困难。
- 提出了一种基于多模态大型语言模型的方法,能够实现开放式、可解释的搜索。
- 该方法能够提供具体的文本解释,提升用户体验和效率。
- 研究表明,该方法在满足隐私和伦理要求方面具有潜力。
➡️