标签

 数据集 

相关的文章:

汇总了涉及医学VQA评测、语言模型、自动驾驶、超分辨率模型等多个领域的数据集,包括超过20个人体器官和部位的ComfyUI SD3数据集、建造行业的公共微调数据集、突出、新颖、困难的语言模型数据集AutoBencher等。

OpenAI官宣新公司,谷歌前高管任CEO,打造AI健身教练;上海交大开源3D医学大模型,构建超大规模3D医学图像分割数据集...

原文约3400字,阅读约需8分钟。发表于:

AI for Science 企业动态速览——*上交大团队发布开源 3D 医学大模型 SAT,支持 497 类器官,性能超越 72 个 nnU-Nets* Sam Altman 孵化 AI 医疗新公司,打造 AI 健身教练* 英矽智能向复星医药交付第二款临床前候选化合物*哈佛 DeepMind 在世界模拟器中训练 AI 老鼠,开辟虚拟神经科学* 哥德堡大学开发 AI 模型 Candycrunc...

上海交通大学与上海人工智能实验室联合发布了开源的3D医学大模型SAT,支持497类器官,性能超越72个nnU-Nets。OpenAI首席执行官Sam Altman宣布成立AI健康公司Thrive AI Health,旨在打造定制化AI健身教练。英矽智能向复星医药交付第二款临床前候选化合物。哈佛大学与DeepMind合作在世界模拟器中训练AI老鼠,开辟虚拟神经科学。哥德堡大学开发AI模型Candycrunch,搜寻癌症线索速度远超以往。OpenAI宣布与洛斯阿拉莫斯国家实验室合作,首次在实验室环境中测试多模态AI。AI制药初创公司PolyModels Hub获得110万英镑种子轮融资。

相关推荐 去reddit讨论

DataDream: 少样本引导式数据集生成

原文约200字,阅读约需1分钟。发表于:

提出了一种名为 DataDream 的框架,用于合成分类数据集,基于少量目标类别的快速学习样本,提升 CLIP 模型对图像分类的精度,超过现有方法在 10 个数据集中的 7 个上展示出更高的分类准确度。

该论文提出了一个新的基于扩散模型的分类导向框架DreamDA,通过扰动反扩散过程生成多样样本,使用自训练范式生成伪标签和合成数据训练分类器,实验证明了DreamDA在生成高质量多样图像和准确标签方面的有效性。

相关推荐 去reddit讨论

DDFAD:音频数据的数据集蒸馏框架

原文约200字,阅读约需1分钟。发表于:

基于深度神经网络的数据集提炼框架用于音频数据,通过匹配培训轨迹提炼方法提取 FD-MFCC 作为音频数据的特征,并基于 Griffin-Lim 算法提供音频信号重构算法。DDFAD 在各种音频数据集上展示了其有效性,并在持续学习和神经架构搜索等多个应用中展示了其有前景的应用前景。

我们提出了一种结合潜在空间扩散模型和数据集精炼的潜在数据集精炼方法(LD3M),在多个 ImageNet 子集和高分辨率图像上实验表明,LD3M 在 1 个和 10 个图像每类的情况下,相比最先进的精炼技术,提高了最高 4.8 个百分点和 4.2 个百分点的性能。

相关推荐 去reddit讨论

当行人检测遇见多模态学习:通用模型和基准数据集

原文约500字,阅读约需1分钟。发表于:

MMPedestron 是一个新颖的多模态感知通用模型,它能够处理多个传感器模态及其动态组合,并通过引入 MAA 和 MAF 实现自适应多模态特征融合。此外,作者还构建了 MMPD 数据集,其中包含了 RGB、IR、Depth、LiDAR 和 Event 等多种传感器模态,通过多模态联合训练,在多个行人检测基准上取得了最先进的性能。

本研究提出了一种名为DMM的多光谱目标检测框架,通过融合RGB和IR图像的特征,减轻模态间冲突。实验证明该方法在计算效率上优于现有方法。

相关推荐 去reddit讨论

一键运行 ComfyUI SD3!大规模医学 VQA 评测数据集上线,涉及超 20 个人体器官和部位

原文约4300字,阅读约需11分钟。发表于:

它能够轻松将单色图像赋予丰富的色彩,或将简单的草图转换为逼真的图像。本文是该研究的详细解读和分享。该数据集主要覆盖木质山区,树木密度较低且地形复杂,包含总计 98,949 颗树木的 1,350 张图像训练集和 1,350 张图像测试集,每张图像的平均包含 36 棵树木,为模型在复杂地形中的性能提供了重要的测试环境。该数据集涵盖了 70 种不同的语言,为低资源语言提供了更多的训练数据,含共计...

HyperAI超神经推出了「Meet AI4S」系列直播栏目,首期邀请浙江大学博士生丁佳乐分享神经网络在房价空间异质性方面的新解释。HyperAI官网更新了10个公共数据集和3个教程精选,包括医学VQA评测数据集、角色设定和对话数据集、常识推理数据集等。教程涵盖YOLOv10目标检测、图像转换和文本转图像等内容。此外,还有社区文章精选和热门百科词条。

相关推荐 去reddit讨论
相关推荐 去reddit讨论
相关推荐 去reddit讨论

ConRebSeg:钢筋混凝土建筑的分割数据集

发表于:

通过提供一个公开可用的具有标注分割标签的 14,805 张钢筋混凝土施工 RGB 图像数据集,对建筑行业的自动化机器人系统进行实验和分析,研究了数据可用性和标签一致性对模型性能的影响,结果表明模型的预测精确度较高,但需要更多数据来提高召回率,标签一致性对模型性能影响微乎其微,建议通过众包数据集来推动建筑行业中自动化机器人系统的发展。

相关推荐 去reddit讨论
相关推荐 去reddit讨论

多模式数据集创建用于医疗联合学习的 DICOM 结构化报告

发表于:

在这项研究中,我们使用 DICOM 结构化报告扩展我们以前的工作,展示其在更多和不同数据类型上的适用性,以及在德国八所大学医院的联合会中用于简化多模态数据集的联合训练过程。我们证明了其并发过滤能力,通过创建在所有位置上用于预测经最小创伤心脏瓣膜置换术后结果的协调的多模态数据集。数据包括 DICOM...

相关推荐 去reddit讨论