标签

 数据集 

相关的文章:

这个列表页提供了一系列综合数据集,包括测量语言模型、手语、对话、导航、音乐和图像等领域的数据集。这些数据集可用于机器学习、自动语音识别、碳足迹改进、音乐分离、符号音乐处理、基于fMRI的3D重建、标点恢复和图像处理等应用。

我们如何利用AI构建最新的Open Buildings数据集

原文英文,约1100词,阅读约需4分钟。发表于:

A map of Earth against a gray and white grid. On the map, Central America, the Caribbean, South America, Africa and parts of Asia are covered in purple, yellow and pink to indicate building presence.

2021年,Google Research Africa团队推出了Open Buildings数据集,利用AI和高分辨率卫星图像,填补发展中国家人口和密度数据的空白。最新版本覆盖5800万平方公里,包含18亿建筑,支持疫苗接种和灾害响应规划。通过低分辨率图像和教师-学生模型提高精度,并推出2016至2023年的2.5D时序数据集,显示建筑高度和城市发展变化,助力城市规划。

相关推荐 去reddit讨论

Plain-Det:同时支持多数据集训练的新目标检测 | ECCV'24 - 晓飞的算法工程笔记

原文中文,约8900字,阅读约需22分钟。发表于:

近期在大规模基础模型上的进展引发了对训练高效大型视觉模型的广泛关注。一个普遍的共识是必须聚合大量高质量的带注释数据。然而,鉴于计算机视觉中密集任务(如目标检测和分割)标注的固有挑战,实际的策略是结合并利用所有可用的数据进行训练。 论文提出了Plain-Det,提供了灵活性以适应新的数据集,具有跨多样

近期,Plain-Det结合Def-DETR在COCO数据集上取得51.9的mAP,展示了出色的泛化能力。通过共享检测器和语义空间,解决多数据集训练的挑战,并引入语义空间校准、稀疏查询和动态采样策略,提高训练效率和性能。该方法在多个数据集上创造了新的最佳结果,表现出良好的鲁棒性和兼容性。

相关推荐 去reddit讨论

DefVerify: 仇恨言论模型是否反映其数据集的定义?

原文中文,约200字,阅读约需1分钟。发表于:

本研究解决了仇恨言论检测模型在构建过程中定义与实际行为之间的差距问题。提出了一种新颖的三步流程DefVerify,旨在编码用户定义、量化模型的反映程度并识别工作流程中的失效点。研究发现,当前模型与定义之间存在显著差距,强调了改进模型构建的重要性。

研究分析仇恨言论检测模型在定义与实际应用间的差距,提出DefVerify流程:编码用户定义、量化模型反映、识别失效点。结果显示模型与定义差距大,需改进模型构建。

相关推荐 去reddit讨论

直接偏好优化的数据集、理论、变体和应用的综合调查

原文中文,约300字,阅读约需1分钟。发表于:

本研究解决了现有文献中对直接偏好优化(DPO)理论、变体和应用缺乏深入审查的问题。通过对DPO的现有研究进行分类,并提出未来研究方向,本文提供了对模型与人类偏好对齐的全面理解。研究发现DPO作为一种无强化学习的方法,对提升模型对齐策略具有重要影响。

本文介绍了大规模语言模型对齐的三种方法:RLHF、DPO和新方法MPO。MPO结合了前两者的优点,采用两阶段训练:先在简单数据集上用DPO,再在困难数据集上用RLHF。实验显示,MPO在HH-RLHF和TLDR数据集上表现优异,获得GPT4和人类评估的认可。

相关推荐 去reddit讨论

Habaek:通过数据集扩展和归纳偏差优化实现高性能水体分割

原文中文,约2200字,阅读约需6分钟。发表于:

本研究解决了当前水体分割模型在实时应用中的处理需求过高的问题。通过使用ADE20K和RIWA等数据集进行数据增强,并优化SegFormer模型的归纳偏差,发现Habaek模型在分割性能上显著优于现有模型,其IoU值在0.91986至0.94397之间,显示出其在实际应用中的潜力。

本研究通过优化SegFormer模型和数据增强,提出了Habaek模型,解决了水体分割模型在实时应用中的高处理需求问题。实验结果显示,Habaek模型的分割性能优于现有模型,IoU值在0.91986至0.94397之间,具有实际应用潜力。

相关推荐 去reddit讨论

“{模板}”的价值是什么?重新思考大型语言模型的文档信息提取数据集

原文中文,约300字,阅读约需1分钟。发表于:

本研究针对视觉丰富文档理解中关键数据提取任务,提出了一个由多种定制模板生成的丰富数据集K2Q,以解决简单模板在实际应用中的不足。通过对七种基线生成模型的比较,研究发现多样化和复杂的问题能够显著提升模型的性能与鲁棒性,鼓励后续对生成模型训练数据质量的研究。

本研究提出了K2Q数据集,用于提升视觉文档理解中的关键数据提取。比较七种基线生成模型后发现,多样化和复杂的问题能显著提高模型性能和鲁棒性,建议进一步研究生成模型训练数据的质量。

相关推荐 去reddit讨论

斯瓦希里语问答基准数据集SwaQuAD-24

发表于:

本研究针对斯瓦希里语在自然语言处理中的代表性不足问题,提出建立一个斯瓦希里语问答基准数据集。该数据集提供高质量的注释问答对,关注斯瓦希里语言的多样性和复杂性,旨在促进东非的技术创新,支持机器翻译、信息检索等应用。

相关推荐 去reddit讨论

人工智能检测器够好吗?对机器生成文本数据集质量的调查

发表于:

本研究探讨当前AI文本检测工具的有效性,揭示现有评估数据集存在的质量问题。文章提出了一种系统评估AI生成内容的数据集质量的方法,并强调使用高质量生成数据来改进检测模型和数据集的潜力。该研究有助于提升人机文本动态的理解,从而支持信息的完整性。

相关推荐 去reddit讨论

MediTOD:一个全面注释的医疗病史对话数据集

发表于:

本研究解决了医疗领域缺乏高质量英语对话数据集的问题,特别是缺少全面注释的医疗条目。论文提出了一种问卷基础的标注方案,结合医生的专业知识创建了MediTOD数据集,包含高质量的医疗信息注释。研究的关键发现是MediTOD 可用于自然语言理解、策略学习和自然语言生成的基准测试,显著支持未来的医学对话系统研究。

相关推荐 去reddit讨论

MultiOrg: 多评审器类器官检测数据集

发表于:

本研究解决了生物医学领域中缺乏开放数据集的问题,特别是针对类器官自动量化的需求。通过构建一个包含超过400幅高分辨率显微镜图像和6万多个类器官注释的MultiOrg数据集,论文提出了一个独特的方法来量化标注不确定性。研究结果和提供的基准模型将显著推动类器官检测技术的进步,促进高通量图像分析的自动化进程。

相关推荐 去reddit讨论