小红花·文摘

本文探讨了利用数字档案进行机器学习的新方法，包括光学字符识别、物体检测和布局分析。研究展示了图像-文本检索和洞察提取的有效性，提出了新数据集SIMAT和多模态蕴含分类器，提升了图像文本检索的准确度。通过数据预处理和模型评估，增强了视觉模型对文本信息的理解能力，并提出了新的数据过滤方法T-MARS，显著提高了图像检索性能。