小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了大型语言模型(LLMs)在长上下文推理中的挑战,并提出了一种后训练合成数据生成策略,以扩展LLMs的上下文窗口。研究表明,该模型在高达100万标记的上下文长度下表现良好,同时在通用语言任务中保持稳定性能。

通过层次合成数据生成将指令调优的LLM扩展到百万标记上下文

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本文提出了一种以人为中心的多模态对比学习框架,旨在通过样本对比学习实现多视角数据的特征表示,以支持3D姿态估计任务的合成数据生成。研究表明,使用合成图像训练的CNN在3D姿态估计上表现优于使用真实图像训练。此外,提出的StylePoseGAN能够合成具有姿势控制的人类图像,适用于虚拟换装等应用。

多正同反学习与姿态一致生成图像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-04T00:00:00Z

本研究提出了一种动态数据集生成和训练模型的方法,生成约40,000项新数据,显著提升了模型的鲁棒性和性能。通过构建多语言的GOTHate数据集,开发了HEN-mBERT模型,增强了恶意言论检测效果。同时,研究探讨了在有限数据情况下的仇恨言论检测,提出合成数据生成方法,显示出良好的模型性能。

支持标注人员的提升对抗数据收集:GAHD 德语仇恨言论数据集的经验教训

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-28T00:00:00Z

该论文介绍了一个整合AutoML、XAI和合成数据生成的系统,提供了优良的用户体验设计。论文介绍了两种新型分类器,逻辑回归森林和支持向量树,提高了模型性能。通过实验,论文证明了该系统在糖尿病数据集和调查数据集上的高准确率。此外,论文还介绍了基于模型的局部解释器MEDLEY,并评估了其与其他方法的比较。研究结果表明,通过GAN增强原始数据集是生成可靠合成数据的最佳方法,特别在定量数据集上表现最好。

MultiFIX:一种从多模态数据建立模型的友好的可解释人工智能特征引导方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-19T00:00:00Z

该研究论文探讨了图神经网络在决策过程中透明度不足的问题,并提出了解决方法和数据评估。研究还探讨了合成数据生成、评估指标和解释呈现等领域的问题,并提出了缓解建议。

在保留解释的图扰动下的 PAC 可学习性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-07T00:00:00Z

本研究使用自动注释工具ERRANT的错误类型标签指导合成数据生成,并比较了多种模型以研究如何基于错误类型标签从正确的句子生成不合语法的句子。构建了一个规模较大的合成数据集,其错误标签的频率分布与给定开发集相匹配。该合成数据集可以显著提高BEA-19和CoNLL14测试集的性能,并且对于混合本地和非本地语言的英语人群,其效果优于真实训练数据。

通过多任务训练和优化训练计划实现高效的语法错误校正

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-20T00:00:00Z

该文介绍了一种针对异构表格数据集的新算法MMM,用于聚类和合成数据生成。该算法使用EM-based聚类算法确定合成数据的聚类和恢复真实数据的结构。提出了一种名为MMMsynth的合成表格数据生成算法,该算法在测试中表现优异。

MMM 和 MMMSynth:异构表格数据的聚类和合成数据生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-30T00:00:00Z

本研究介绍了一种灵活可扩展的合成数据生成流程,应用于土耳其语,生成了13万句高质量平行句子。使用神经机器翻译、序列标注和前缀调参等三种基线模型,取得了良好的结果,并对领域外数据集进行了详尽实验,获得了有关所提方法的可迁移性和鲁棒性的深入见解。通过发布数据集、基线模型和合成数据生成流程,鼓励进一步研究土耳其语错误检测和纠正。

GECTurk:用于土耳其语的语法错误校正和检测数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码