我创建了一个互动冬至网页,使用CSS和JavaScript增强视觉效果和可用性,主要特点包括雪花动画、平滑滚动、返回顶部按钮和悬停效果。在项目中克服了性能、响应式设计和可访问性挑战,学习了高级CSS动画和优化技巧。感谢OpenAI的支持,未来计划探索更高级的动画和网站可访问性。
本研究提出了一种结合软演员评论家和事后重新标签的新方法,解决大型语言模型在复杂环境中在线强化学习的局限性。在多目标强化学习环境中,该方法优于传统策略,并为自主学习代理的发展提供理论支持。
本研究提出了多种新方法和数据集,以提升文化遗产领域的图像检索技术,包括细粒度艺术品属性识别、Zero-Shot CIR任务及其数据集CIRCO,以及使用合成标签的混合检索方法HyCIR。这些方法通过计算机视觉和多标签标注,显著提高了图像检索的准确性和效果。
文档布局分析旨在识别和分类文档中的不同内容。研究提出了基于图的布局分析模型(GLAM),在多个数据集上表现优异,准确率高达99%。此外,使用YOLOv5和DLAFormer等模型提高了文档布局识别和数据提取的效率,特别是在处理历史文档和孟加拉语文档时,展示了不同语言的挑战和解决方案。
本研究讨论了在文化遗产领域中自动元数据注释的挑战,并介绍了一种新颖的数据集 EUFCC340K。该数据集采集自 Europeana 门户网站,包含超过 340,000 张图像,并按照材料、对象类型、学科和主题等多个维度进行组织,遵循 AAT 的分层结构。研究开发了多种基线模型,基于 ConvNeXT 骨干网络在图像各个维度上进行多标签标注,并使用图像文本对对 CLIP...
完成下面两步后,将自动完成登录并继续当前操作。