标签

 数据集 

相关的文章:

COIG-CQIA 数据集上线、在线运行 ComfyUI 文生图工作流、强化学习在数据集重置策略优化中的应用、音频对话:用于音频和音乐理解的对话数据集、OpenTrench3D: 地下工程设施语义分割的摄影测量三维点云数据集,以及 AUG:一种用于航空图像城市场景图生成的新数据集和高效模型。这些文章涵盖了多个领域的数据集应用和优化方法。

HyperAI超神经

HyperAI超神经 -

一键部署 Llama3 8B/70B!最高仅占1.07GB存储;COCONut上线,字节跳动推出的首个大规模全景图像分割数据集

基于 AI 的快速发展,谷歌团队研究了机器学习模型如何有效地将研究结果传达给放射科医生,评估了广义人工智能辅助系统在特定工作流程环境、设备和国家特定指南和评分/管理协议下对肺癌筛查工作流程的影响,并在美国和日本进行测试。厦门大学方宁教授团队基于深度学习研发了一种自动化、高速、多维的单粒子追踪系统,打破了细胞微环境中纳米颗粒旋转追踪的局限性,实现了在纳米尺度下,全方位、精准追踪活细胞内单分子/单个纳米颗粒。每个集都包含 9 个不同行星的子集:地球、水星、金星、地球、火星、木星、土星、天王星和海王星。

Meta最近发布了一个名为Llama3的大型模型,引起了AI界的关注。HyperAI在他们的网站上推出了一个关于如何部署Llama3的教程。他们还更新了他们的网站,提供了高质量的公共数据集、精选教程、社区文章和热门百科条目。数据集包括COCONut、太阳系行星、中文医学对话数据、TAL-SCQ5K、安徽电信问答数据、WikiArt、世界奇观、Google地标照片、GIS世界数据文件和SSDO。精选教程涵盖了部署Llama3-8B-Instruct和生成实时对话数字人类等主题。社区文章包括数学数据集摘要、AI辅助肺癌筛查、AI科学会议、单粒子跟踪和全球海洋溶解氧建模。HyperAI还将通过直播谷歌相关内容来准备谷歌I/O开发者大会。HyperAI是中国领先的人工智能和高性能计算社区,提供数据集、教程、论文和百科条目等资源。

相关推荐 去reddit讨论
HyperAI超神经

HyperAI超神经 -

一键部署 Llama3 8B/70B!最高仅占1.07GB存储;COCONut上线,字节跳动推出的首个大规模全景图像分割数据集...

近日,Meta 震撼发布了号称「开源 GPT-4」的大模型 Llama3,该模型惊动了整个 AI 圈,HyperAI超神经也迫不及待想要体验一下!hyper.ai 官网现已在公共教程上线「一键部署 Llama3」!有没有人和我一样激动的搓手手?赶紧来运行一下~4 月 22 日-4 月 26 日,hyper.ai 官网更新速览:* 优质公共数据集:10 个*优质教程精选:3 个* 社区文章精选:5...

Meta最近发布了一个名为Llama3的大型模型,引起了AI社区的关注。HyperAI在他们的网站上推出了一个关于如何部署Llama3的教程。他们还更新了他们的网站,提供了高质量的公共数据集、精选教程、社区文章和热门百科条目。数据集包括COCONut、太阳系行星、中文医学对话数据、TAL-SCQ5K、安徽电信问答、WikiArt、世界奇观、谷歌地标照片、GIS世界数据文件和SSDO。教程涵盖了部署Llama3-8B-Instruct和生成实时对话数字人类等主题。社区文章讨论了数学数据集、AI辅助肺癌筛查和纳米尺度粒子追踪等主题。HyperAI还将通过直播谷歌相关内容来准备谷歌I/O开发者大会。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

RadGenome-Chest CT:用于胸部 CT 分析的基于视觉和语言的数据集

通过开源医学图像数据集、基于最新的通用分割和大型语言模型,我们介绍了 RadGenome-Chest CT,这是一个全面的、大规模的、基于 CT-RATE 的区域导向的 3D 胸部 CT 解读数据集,推动了多模态医学基础模型的发展。

通过结合结构化患者数据和非结构化临床记录,研究人员提出了一种新的多模态深度神经网络框架,用于生成描述医学图像结果的胸部 X 射线检查报告。实验证明,使用附加模态可以显著改善结果。人工评估确认了该模型在识别高级结果方面的准确性,但也指出需要更多改进。

相关推荐 去reddit讨论
HyperAI超神经

HyperAI超神经 -

【数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等|持续更新中!!

Proof-Pile-2 是一个包含 550 亿个数学和科学文档的 token 数据集,融合了科学论文、数学相关的网络内容和数学代码,其知识截止于 2023 年 4 月。Orca-Math-200K 是微软创建的高质量数学问题数据集,包含约 20 万小学数学题目,此数据集中的所有答案都是使用 Azure GPT4-Turbo 生成的。Ape210K 是一个大规模且模板丰富的数学单词问题数据集,包含 210K 个中国小学水平的数学问题,每个问题都包含最佳答案和得出答案所需的方程式。

陶哲轩发布了「AI for Math Resourses」的资源清单,包括OpenWebMath、Ape210K、Proof-Pile-2等数据集,旨在帮助人工智能数学领域的人。HyperAI筛选了部分数据集供下载使用,并补充了其他数学方面的数据集。

相关推荐 去reddit讨论
HyperAI超神经

HyperAI超神经 -

【数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等...

上周,著名数学家陶哲轩在个人博客中发布了「AI for Math Resourses」的资源清单,旨在为那些有意进入人工智能数学领域的人提供帮助,这份清单由「人工智能辅助数学推理」研讨会整理。该研讨会由美国国家科学院、工程院和医学院共同组织,陶哲轩担任该研讨会的主持人。这份清单文档尚未最终定稿,陶哲轩及其他研究者仍在不断完善中。HyperAI超神经从中筛选出了部分数据集供大家下载使用,除此之外,还...

著名数学家陶哲轩发布了「AI for Math Resourses」的资源清单,包括OpenWebMath、Ape210K、Proof-Pile-2、Orca-Math-200K等数据集,旨在帮助人工智能数学领域的人。HyperAI超神经筛选了部分数据集供下载使用,并补充了其他数学方面的数据集。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

3DBench:可扩展的 3D 基准测试和指令调优数据集

评估多模态大型语言模型(MLLMs)的性能,集成点云和语言,面临重大挑战。缺乏全面评估阻碍确定这些模型是否真正代表进步,从而妨碍该领域的进一步发展。我们引入了可扩展的 3D 基准测试和大规模指令调整数据集 3DBench,提供了一个全面评估 MLLMs 的可扩展平台,以解决这些问题。该基准测试覆盖了从物体级到场景级的广泛空间和语义范围,涉及感知和规划任务,并且我们提出了一个严格的流程来自动生成可扩展的 3D 指令调整数据集,总共涵盖了 10 个多模态任务,共生成了超过 23 万个问答对。通过对热门 MLLMs 的彻底实验评估、与现有数据集的比较以及训练方案的变异,我们展示了 3DBench 的优越性,为当前的局限性和潜在研究方向提供了有价值的见解。

本文介绍了3DBench,一个可扩展的3D基准测试和大规模指令调整数据集,用于评估多模态大型语言模型(MLLMs)的性能。通过实验评估和与现有数据集的比较,展示了3DBench的优越性。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

工业过程异常检测数据集:IPAD

基于新提出的工业场景视频异常检测数据集和方法,填补了工业视频异常检测领域的空白,推动了视频理解任务和智能工厂部署的进程。

本文介绍了一种生成通用时空伪异常的方法,通过修复被屏蔽区域图像和混合光流来产生时间空间扭曲。通过学习重建质量、时间不规则性和语义不一致性等异常指标,在开放集识别任务下检测现实世界的异常。实验证明该方法在性能上与其他方法相当,并提供了有价值的见解。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

用于人脸识别中合成和真实数据评估的大规模标注数据集

通过对真实数据集和合成数据集进行性能比较,我们发现了真实数据集和合成数据集之间的差异,并发现真实样本足以解释合成分布,而相反情况则不成立。

合成数据作为真实数据的替代品,用于解决处理真实面部数据的伦理和法律挑战。研究发现,合成面部识别数据集与真实数据集的多样性相似,生成模型的训练数据分布会影响合成数据的分布。比较基于合成数据和真实数据的面部识别模型,在属性上存在具体偏差。然而,较低的内部一致性有助于减少偏差。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

EnzChemRED,一个丰富的酶化学关系提取数据集

通过 EnzChemRED 数据集,利用大型语言模型等自然语言处理方法可以显著提高识别文本中的蛋白质和化学品提及以及提取它们参与的化学转化的能力,该数据集位于 PubMed 摘要中,旨在支持酶的修饰。

介绍WebRED数据集,用于从万维网上提取关系,提供基线和强调人工注释的重要性。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

TeamTrack: 全场视频中的多项运动多目标跟踪数据集

多目标追踪是计算机视觉中的关键和困难任务之一,我们介绍了 TeamTrack,一个面向体育运动的创新基准数据集,包括足球、篮球和手球等多种运动项目,并通过综合分析和基准测试展示了其实用性和潜在影响。该工作是对多目标追踪在团队运动等复杂动态环境中精度和有效性的重要进展。

多目标跟踪在交通视频中是关键研究领域,通过机器学习算法提高交通监控准确性,促进道路安全措施。TrafficMOT数据集涵盖复杂场景的多种交通情况,实验结果突出其内在复杂性,强调在交通监控和多目标跟踪领域的价值。

相关推荐 去reddit讨论

热榜 Top10

观测云
观测云
eolink
eolink
LigaAI
LigaAI
Dify.AI
Dify.AI

推荐或自荐