小红花·文摘

冬至互动网页 – Glam Up My Markup 提交

DEV Community ·

本研究提出了一种结合软演员评论家和事后重新标签的新方法，解决大型语言模型在复杂环境中在线强化学习的局限性。在多目标强化学习环境中，该方法优于传统策略，并为自主学习代理的发展提供理论支持。

SAC-GLAM: Enhancing Online Reinforcement Learning in Large Language Models with Soft Actor-Critic and Hindsight Relabeling

BriefGPT - AI 论文速递 ·

本研究提出了多种新方法和数据集，以提升文化遗产领域的图像检索技术，包括细粒度艺术品属性识别、Zero-Shot CIR任务及其数据集CIRCO，以及使用合成标签的混合检索方法HyCIR。这些方法通过计算机视觉和多标签标注，显著提高了图像检索的准确性和效果。

EUFCC-CIR：用于GLAM收藏的组合图像检索数据集

BriefGPT - AI 论文速递 ·

文档布局分析旨在识别和分类文档中的不同内容。研究提出了基于图的布局分析模型（GLAM），在多个数据集上表现优异，准确率高达99%。此外，使用YOLOv5和DLAFormer等模型提高了文档布局识别和数据提取的效率，特别是在处理历史文档和孟加拉语文档时，展示了不同语言的挑战和解决方案。

无监督文档布局分析

BriefGPT - AI 论文速递 ·

本研究讨论了在文化遗产领域中自动元数据注释的挑战，并介绍了一种新颖的数据集 EUFCC340K。该数据集采集自 Europeana 门户网站，包含超过 340,000 张图像，并按照材料、对象类型、学科和主题等多个维度进行组织，遵循 AAT 的分层结构。研究开发了多种基线模型，基于 ConvNeXT 骨干网络在图像各个维度上进行多标签标注，并使用图像文本对对 CLIP...

EUFCC-340K：面向 GLAM 藏品元数据标注的多面向层次数据集

BriefGPT - AI 论文速递 ·

文档布局分析（DLA）通过将文档划分为文本、图像和表格等部分，提升机器理解能力。本研究采用基于图的布局分析模型（GLAM），在孟加拉语文档上取得了Dice分数0.889的良好效果。同时，研究探讨了使用Mask R-CNN模型和LoRA方法来提升模型性能，并强调了预训练权重的重要性。

RoDLA：评估文档布局分析模型的鲁棒性

BriefGPT - AI 论文速递 ·