标签
数据集
相关的文章:本列表汇集了最新的研究成果与应用案例,涵盖多种领域的数据集,助力人工智能与机器学习的快速发展。
首个沉浸式体积视频数据集ImViD上线,定义沉浸式媒体新形态丨CVPR‘25 Highlight
弥合差距:新数据集推动推荐系统研究迈向真实世界规模
Yandex 发布 Alchemist:用于提升文本转图像 T2I 模型质量的增强型监督微调数据集
我们如何构建了神经活动研究中最雄心勃勃的数据集之一
8个数据集全面胜出!思维链推理刷新图学习表现上限
覆盖2亿分子质谱图,捷克科学院发布DreaMS模型,构建全球最大规模质谱数据集GeMS
捷克科学院有机化学与生物化学研究所研究团队,借鉴了 GPT 系列在语言领域取得的突破性进展,从全球天然产物社交分子网络(GNPS)中挖掘出 7 亿条 MS/MS 谱图,成功构建起史上规模最大的质谱数据集 GeMS,并训练出拥有 1.16 亿参数的 Transformer 模型 DreaMS。
研究显示,当前天然小分子化学空间的探索不足10%,且90%的质谱图因缺乏注释而无法利用。捷克科学院团队开发的DreaMS模型通过自监督学习从7亿条质谱数据中提取分子特征,显著提高了质谱注释的准确性,为新药发现和疾病诊断提供了重要资源。
阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升
(SOTA)按需生成AI ML项目实时数据集的AI代理 - Perpendicular AI
This is a submission for the Bright Data AI Web Access Hackathon This is a project that I built for Bright Data MCP Hackathon. The reason I participated in this is to experiment with the MCP and...
Perpendicular AI是一个AI代理,利用先进的网络爬虫实时生成数据集,解决获取最新可信数据集的难题。它通过Bright Data工具提取和结构化来自不同网页的数据,支持多平台数据生成,提高了数据的准确性和收集效率,确保了可靠性。
