小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI Agent 生成合成数据:从简单提示到物理准确的训练集

研究表明,AI Agent驱动的合成数据生成技术能够高效构建高质量训练数据集,降低成本并提升训练速度,解决极端场景问题,标志着合成数据进入2.0时代。

AI Agent 生成合成数据:从简单提示到物理准确的训练集

Micropaper
Micropaper · 2026-03-21T00:00:00Z

本研究提出了多任务学习框架EO-IUR,针对非完整发言重写中的冗余标记和训练数据集规模有限的问题。该方法通过编辑操作标签引导生成模型关注关键标记,并引入发言增强策略,实验证明在开放域和任务导向对话中优于现有技术。

Incomplete Utterance Rewriting with Editing Operation Guidance and Utterance Augmentation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究探讨了训练数据集对端到端驾驶系统性能的影响,并提出了一种新的数据处理方法。结果表明,专家风格对策略表现有影响,且通过判定帧变化可以减少数据集规模。改进后的模型在2024年CARLA挑战赛中表现优异,并建议修改评估指标。

Hidden Biases in End-to-End Driving Datasets

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出了一种新方法构建训练数据集,以改善说话人分离系统在真实录音环境中的表现。评估结果显示,该方法在真实混音条件下性能提升1.65 dB,验证了现实训练集对模型性能提升的潜力。

Developing an Effective Training Dataset to Enhance the Performance of AI-based Speaker Separation Systems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z
机器学习中的偏差-方差权衡:概念与教程

偏差和方差是机器学习中的两个错误来源。偏差是由于模型过于简化、做出重要假设和忽视数据关系而导致的错误。方差是由于算法对数据波动过于敏感,创建了一个过于复杂的模型,看到的数据模式实际上只是随机性。需要找到偏差和方差之间的平衡,可以通过增加模型复杂性或增加训练数据集来实现。了解偏差和方差对于开发准确的机器学习模型至关重要。

机器学习中的偏差-方差权衡:概念与教程

BMC Software | Blogs
BMC Software | Blogs · 2024-08-22T00:00:53Z

研究发现,将摄影师作品纳入人工智能(AI)训练数据集会导致摄影师离开平台并减慢上传速度,对AI训练使用的作品存量产生长期影响。文章强调了版权持有人利益与技术创新之间的权衡,并对版权和AI政策提出了影响。

战略行为与人工智能训练数据

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z
一项新法案希望揭示AI训练数据的真实内容

美国国会议员Adam Schiff提出《生成AI版权披露法案》,要求科技公司披露用于训练AI模型的受版权保护的材料。法案要求提交数据集内容摘要和URL,并适用于数据集的任何更改。公司需在发布AI模型前提交报告,得到行业团体支持。

一项新法案希望揭示AI训练数据的真实内容

The Verge
The Verge · 2024-04-10T17:35:29Z

大规模视觉语言模型(LVLMs)在艺术品解释生成任务中存在困难,需要整合语言和视觉信息。研究者提出了一个新任务,并发布了相应的评估数据集和训练数据集。LVLMs 在仅从图像中获取知识方面存在限制。

RelationVLM: 构建大型视觉 - 语言模型以理解视觉关系

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-19T00:00:00Z

介绍了一种多功能的“灵活字幕”视觉语言模型(VLM),能够生成长度各异的区域特定描述。该模型FlexCap训练用于为输入边界框生成长度条件化的字幕,控制输出信息密度。通过创建大规模训练数据集,展示了灵活字幕在密集字幕任务、视觉问答和对象检测等领域的优越性能。

FlexCap: 在图像中生成丰富、本地化和灵活的标题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-18T00:00:00Z

本文研究了在给定训练数据集中寻找预测模型的问题,并提出了一种迭代过程来改进模型和非线性特征。通过有限次迭代,非线性特征转化为原始空间上的多项式。在无限次迭代的极限情况下,导出的非线性特征形成一个联想代数。每次迭代都解决一系列凸问题,逐渐提高模型的似然性,同时将模型参数空间的维数限制为一个可控制的值。

解决非相交类别识别问题的代数方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-24T00:00:00Z

现代跟踪器在透明物体上的性能下降,因为透明物体的外观受背景影响且包含干扰因素。本文提出了透明物体跟踪训练数据集Trans2k,通过该数据集训练的标准跟踪器性能提高了最多16%。本文还提出了一种新的干扰因素感知的透明物体跟踪器DiTra,取得了最佳性能,并对不透明物体也有很好的泛化能力。

透明物体追踪的新数据集与干扰识别架构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-08T00:00:00Z

微软投资的人工智能公司OPENAI被纽约时报起诉,指控其非法使用纽约时报的版权内容进行训练。纽约时报要求删除使用其材料训练的GPT实例,销毁训练数据集,并禁止再次抓取纽约时报数据用于训练。纽约时报还要求赔偿和其他救济。OPENAI和微软尚未回应。纽约时报不是第一家起诉OPENAI的,也不会是最后一家。OPENAI已公布内容索引爬虫,允许出版商禁止其抓取内容。

纽约时报起诉OPENAI和微软侵权 要求删除版权内容并进行巨额赔偿

蓝点网
蓝点网 · 2023-12-28T03:08:22Z

本文提出了一种基于故障注入技术的输入数据故障注入测试框架(FIUL-Data),用于测试机器学习模型对多种故意引发的数据故障的弹性。实验结果表明,FIUL-Data 框架能够评估机器学习模型的弹性,较大的训练数据集上,机器学习模型表现出更高的弹性,在较小的训练集中梯度提升方法优于支持向量回归。

PyTorch 模型的大规模故障注入应用──PyTorchFI 的扩展以提高验证效率

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-30T00:00:00Z

该论文调查了谈话人工智能中常识推理的研究和评估基准,对两个开放对话模型的常识能力进行了初步观察,发现其对自然交互产生了负面影响。

推动 Transformer 在常识推理中的能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z

该文介绍了一种基于学习的框架 EMS,用于单视图 3D 眉毛重建。该框架将眉毛表示为一组纤维曲线,并通过三个模块实现重建。作者使用了包含 400 个高质量 3D 合成眉毛数据集进行训练,并证明了 EMS 在不同眉毛样式和长度上的有效性。

EMS:基于单视图图像的 3D 眉毛建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-22T00:00:00Z

本文提出了一种基于故障注入技术的输入数据故障注入测试框架(FIUL-Data),用于测试机器学习模型对多种故意引发的数据故障的弹性。实证评估结果显示,FIUL-Data 框架可以评估机器学习模型的弹性,较大的训练数据集上,机器学习模型表现出更高的弹性,在较小的训练集中梯度提升方法优于支持向量回归。

机器学习数据适用性和性能测试的故障注入测试框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-20T00:00:00Z

该研究使用可解释的潜在维度的生成音乐XAI模型在爱尔兰民间音乐的训练数据集上进行了自传体研究。结果显示,探索性的音乐创作流程突显了训练数据集的音乐特征而非生成模型本身的特征。XAI模型在迭代工作流中的应用显示出其成为比其最初设计用途更丰富和复杂工作流的潜力。

算法作曲中的自传式探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码