基于大规模视觉语言模型的考古目录收集方法

📝

内容提要

本研究解决了现有大型视觉语言模型 (VLMs) 在处理考古目录时面临的图像检测和模态匹配准确性的问题。提出了一种新的考古目录收集方法,包含文档定位、区块理解和区块匹配三个模块,通过对大巴沟和苗子沟陶器目录的实际数据收集及比较实验,证明了该方法的有效性,对考古目录的自动化收集提供了可靠的解决方案。

🏷️

标签

➡️

继续阅读