小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
医疗影像中的隐性PHI问题:构建用于AI去标识化的合成数据集

本文介绍了构建合成PHI生成管道的方法,以创建隐私安全的医疗影像AI训练和验证数据。通过生成虚拟患者身份并嵌入图像和DICOM元数据,团队能够创建可用于训练和评估去标识化系统的安全数据集,从而确保数据的可重复性和准确性,支持医疗AI系统的开发。

医疗影像中的隐性PHI问题:构建用于AI去标识化的合成数据集

freeCodeCamp.org
freeCodeCamp.org · 2026-06-19T17:23:54Z
支持真人/动漫/动物驱动,美团开源多风格音频驱动视频生成框架LongCat 1.5;百万级图表理解数据集ChartNet提升VLM图表重建与表格提取能力

LongCat-Video-Avatar 1.5 是美团团队于2026年推出的开源音频驱动视频生成框架。用户只需提供静态图像和音频,即可生成口型同步的动态视频,适用于真实人像和动漫角色,具备高保真画面和长视频生成能力。

支持真人/动漫/动物驱动,美团开源多风格音频驱动视频生成框架LongCat 1.5;百万级图表理解数据集ChartNet提升VLM图表重建与表格提取能力

HyperAI超神经
HyperAI超神经 · 2026-06-16T09:38:52Z
通过新的开放数据集加速研究人员和开发者构建多语言AI

本文介绍了GitHub Copilot CLI的基本用法,包括使用斜杠命令控制终端AI代理,以及提高选择性和改进秘密扫描的可靠性,以减少误报并提升警报的可信度和可操作性。

通过新的开放数据集加速研究人员和开发者构建多语言AI

The GitHub Blog
The GitHub Blog · 2026-06-15T19:17:30Z
SmoothConv & DuplexConv:面向对话式 AI的大规模中文全双工语音数据集开源!

全双工人机交互技术受到关注,ASLP实验室与上海元音矩阵科技公司联合开源了SmoothConv和DuplexConv两个中文长音频对话数据集。这些数据集包含真实对话场景,旨在支持语音大模型研发,提供高质量对话数据,涵盖教育和闲聊领域,助力全双工系统的中断与响应决策。

SmoothConv & DuplexConv:面向对话式 AI的大规模中文全双工语音数据集开源!

实时互动网
实时互动网 · 2026-06-12T03:03:31Z
麻省理工/IBM提出迄今为止最大的合成图表数据集ChartNet,生成150万个多样化图表样本

ChartNet是由麻省理工学院等机构开发的高质量多模态数据集,包含150万个图表样本,涵盖24种图表类型,旨在提升AI对图表的理解能力。该数据集支持图表重建、数据提取和摘要生成等任务。研究表明,微调模型在ChartNet上表现优于现有大型模型,推动了视觉语言模型在图表理解领域的进步。

麻省理工/IBM提出迄今为止最大的合成图表数据集ChartNet,生成150万个多样化图表样本

HyperAI超神经
HyperAI超神经 · 2026-06-11T09:29:01Z
MiniCPM5-1B采用RL+OPD训练,多项复杂任务达SOTA;面向复杂医疗业务自动化:医疗智能体评测数据集 CHI-Bench

TACK 是 AI Laboratory for Molecular Engineering 于 2026 年发布的一个标准化知识库数据集与基准测试集,旨在解决现有 PROTAC 机器学习基准中数据稀缺、缺乏严格评估及覆盖范围有限的问题,广泛应用于 PROTAC...

MiniCPM5-1B采用RL+OPD训练,多项复杂任务达SOTA;面向复杂医疗业务自动化:医疗智能体评测数据集 CHI-Bench

HyperAI超神经
HyperAI超神经 · 2026-06-05T05:55:57Z
麻省理工学院研究人员教AI模型解读图表

MIT和IBM研究人员开发了ChartNet数据集,包含超过一百万种多样化图表,旨在提升视觉语言模型对图表的理解能力。该数据集通过合成数据生成,帮助小型企业利用AI进行商业趋势分析和科学数据解读。研究表明,使用ChartNet训练的开源模型在图表提取和总结任务上优于大型商业模型。

麻省理工学院研究人员教AI模型解读图表

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL)
MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) · 2026-06-03T04:00:00Z
字节开源 Lance,3B 模型包揽理解/生成/编辑;新加坡国立大学提出 ViMU 数据集:涵盖 588 个视频与无提示问答

Lance是字节跳动于2026年发布的多模态模型,具备图像与视频的理解、生成和编辑能力。该模型采用双流混合专家架构,提升了文本、图像和视频任务的生成质量和语义理解能力。

字节开源 Lance,3B 模型包揽理解/生成/编辑;新加坡国立大学提出 ViMU 数据集:涵盖 588 个视频与无提示问答

HyperAI超神经
HyperAI超神经 · 2026-05-29T06:13:08Z
GR00T N1.7的简介与微调——其中的VLM是“基于Qwen3-VL”的Cosmos-Reason2,且预训练数据中包含2 万小时的 EgoScale人类视频数据(含GR00T N1.6的简介)

GR00T N1.6和N1.7是NVIDIA开发的视觉语言模型(VLM),用于机器人控制。N1.6改进了模型结构,支持灵活分辨率,并引入新数据集;N1.7在此基础上增强了模型的泛化能力,并在大量人类视频数据上进行预训练,提高了机器人控制的精确性和效率。

GR00T N1.7的简介与微调——其中的VLM是“基于Qwen3-VL”的Cosmos-Reason2,且预训练数据中包含2 万小时的 EgoScale人类视频数据(含GR00T N1.6的简介)

结构之法 算法之道
结构之法 算法之道 · 2026-05-27T08:00:00Z

本文介绍了如何使用Mimesis库生成平衡的反事实数据集,以审计机器学习模型的偏见。通过创建具有相同收入但不同性别的贷款申请者,揭示模型在性别上的歧视。实验结果表明,男性申请者更容易获得贷款批准,而女性则常被拒绝。这一方法有助于识别和纠正模型中的偏见。

使用Mimesis生成平衡数据集审计模型偏见

KDnuggets
KDnuggets · 2026-05-25T14:00:46Z
全新生图模型 Anima V1 发布:专注动漫风格的图像生成;MemLens 多模态长程记忆评估数据集:涵盖跨会话图文推理与知识更新机制

Anima V1 是 CircleStone Labs 于 2026 年推出的动漫风格图像生成模型,支持通过文本描述快速生成角色立绘和插画,用户可在 Gradio 界面中调整参数以提升创作效率。

全新生图模型 Anima V1 发布:专注动漫风格的图像生成;MemLens 多模态长程记忆评估数据集:涵盖跨会话图文推理与知识更新机制

HyperAI超神经
HyperAI超神经 · 2026-05-22T08:35:01Z
5亿视频炼出全球最大 GUI 开源数据集、推理 Token 省71%小模型反超大模型——小米 AI 团队多篇论文入选 ICML 2026

小米AI团队在ICML 2026上展示了11篇研究成果,涵盖GUI Agent、推理增强和多模态理解等领域。他们从5亿条视频中提炼数据,构建了全球最大开源GUI操作数据集,显著提升了模型的准确率,并探讨了模型训练的稳定性和推理能力,推动AI技术的实际应用,展现了小米在AI研发的长期投入与成果。

5亿视频炼出全球最大 GUI 开源数据集、推理 Token 省71%小模型反超大模型——小米 AI 团队多篇论文入选 ICML 2026

小米云技术
小米云技术 · 2026-05-14T11:41:56Z
飞桨星河社区月度报告(2026年4月)

PaddleOCR 3.5和ERNIE-Image等新功能上线,支持文档转Markdown和浏览器OCR。社区活动如AICA公开课和黑客松持续推进,新增104个数据集,助力AI模型训练与应用。开发者可零门槛体验ERNIE-Image,提升文生图能力。

飞桨星河社区月度报告(2026年4月)

百度大脑
百度大脑 · 2026-05-14T11:07:43Z

本文介绍了如何使用Python和NumPy从零构建向量搜索引擎。向量搜索通过将文本表示为高维空间中的点,利用几何接近度编码语义相似性。文章详细讲解了数据集设置、索引构建、查询运行和结果可视化,展示了如何通过余弦相似度进行高效搜索。读者可以尝试用真实数据替换模拟嵌入,进一步探索向量搜索的应用。

如何在Python中从零构建向量搜索

KDnuggets
KDnuggets · 2026-05-08T12:00:32Z
本地可跑的隐私检测模型:Privacy Filter 低成本实现高质量 PII 过滤;硬核开源!涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集

Privacy Filter 是 OpenAI 开源的双向标记分类模型,专门用于检测和屏蔽文本中的个人身份信息。该模型基于小型预训练架构,采用高效的片段解码方式。

本地可跑的隐私检测模型:Privacy Filter 低成本实现高质量 PII 过滤;硬核开源!涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集

HyperAI超神经
HyperAI超神经 · 2026-04-30T05:32:10Z
10万引普林斯顿刘壮最新访谈:架构没那么重要,数据才是王道

刘壮教授在访谈中指出,AI领域的最大瓶颈是记忆,而非能力。他认为架构选择不如数据规模和计算能力重要,现有数据集的多样性低于预期。大语言模型在语言空间有世界模型,但在视觉空间尚未实现。尽管AI在低层次任务上表现良好,但在自主科研和复杂问题上仍需人类参与。

10万引普林斯顿刘壮最新访谈:架构没那么重要,数据才是王道

量子位
量子位 · 2026-04-29T04:20:49Z
麻省理工学院科学家建立全球最大的奥林匹克级数学题库,并向所有人开放

MathNet是一个包含超过30,000道数学竞赛题目的数据集,来自47个国家,旨在为AI研究者和全球学生提供训练资源。该数据集涵盖17种语言和143个竞赛,提供高质量的专家解答,帮助学生备战国际数学奥林匹克(IMO),并提升数学思维,尤其是在不同文化背景下的问题解决能力。

麻省理工学院科学家建立全球最大的奥林匹克级数学题库,并向所有人开放

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2026-04-24T17:00:00Z
背景编码代理:加速下游消费者数据集迁移(Honk,第4部分)

Spotify通过背景编码代理Honk简化了数据集迁移,节省了约10周的工程时间。团队利用Backstage和Fleet Management工具成功管理了1800个数据管道的迁移,尽管面临不同框架的挑战。项目强调了数据标准化和测试的重要性,以提高自动化迁移的成功率。未来,Honk将增强自我获取上下文的能力,进一步提升代码变更质量。

背景编码代理:加速下游消费者数据集迁移(Honk,第4部分)

Spotify Engineering
Spotify Engineering · 2026-04-22T19:39:08Z

随着AI在医疗领域的应用,高质量数据集成为提升模型性能的核心。医学影像、临床数据和生物信息学等多模态数据的快速增长,推动AI从图像识别向辅助诊疗发展。本文介绍了10个涵盖不同疾病和研究方向的医疗数据集,强调标准化数据和跨模态数据融合的重要性,为医疗AI的发展提供了基础和方向。

数据集汇总丨从医疗影像/临床数据,到细胞图谱/医学问答,10大数据集覆盖多类疾病场景

HyperAI超神经
HyperAI超神经 · 2026-04-22T06:18:42Z
戴盟机器人发布全模态物理世界数据集Daimon-Infinity

戴盟机器人发布了全球最大规模的全模态物理世界数据集Daimon-Infinity,涵盖触觉、视觉等多维信息,计划形成数百万小时的数据。该数据集将用于真实场景的物理交互,推动具身智能的发展,并已开源10000小时高质量数据,构建了外发式数据采集网络,形成完整的数据处理闭环。

戴盟机器人发布全模态物理世界数据集Daimon-Infinity

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-21T08:33:07Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码