小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了文档级翻译评估的关键问题,强调了自动评估指标的重要性,并提出了未来的发展方向,包括用户友好的评估方法和机器翻译评估的训练模型。

Automated Evaluation Metrics for Document-Level Translation: Overview, Challenges, and Trends

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z
对DistilBERT进行微调以实现问答

本文介绍了如何对DistilBERT进行微调以实现自定义问答任务。首先,使用SQuAD数据集进行数据准备和预处理,然后通过Trainer接口训练模型。微调过程包括加载数据集、定义训练参数、训练模型并保存结果,最终用户可以在其他项目中加载微调后的模型。

对DistilBERT进行微调以实现问答

MachineLearningMastery.com
MachineLearningMastery.com · 2025-04-01T14:59:41Z
18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集

目前视频编辑算法主要有DDIM-Inversion和训练模型。为解决训练数据不足的问题,作者提出了Señorita-2M数据集,包含200万高质量视频编辑对,涵盖18种任务。通过专家模型和计算机视觉模型生成和标注数据,确保视频编辑效果和一致性。实验表明,该数据集能有效提升视频编辑模型性能。

18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集

机器之心
机器之心 · 2025-03-12T02:28:42Z

本研究探讨了最终训练模型在数据归因中的挑战,提出了一种测量模型对训练实例敏感性的方法,并统一了不同梯度方法的理论框架。结果表明,一阶方法的近似质量在进一步训练后下降,而影响函数方法的近似质量更稳定但整体较低。

仅基于最终模型的数据归因:梯度方法的统一视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

介绍SynShadow数据集及其合成阴影图像的方法,支持训练阴影去除模型并通过微调预训练模型改进效果。

多尺度图像阴影去除的软硬注意力 U-Net 模型与基准数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

GPT-SoVITS是一个开源项目,用极少量的声音样本快速训练模型,完成文本到语音的转换。

GPT-SoVITS —— 5s 声音样本就可以训练模型,复刻声音的 AI 应用 - SharpCJ

SharpCJ
SharpCJ · 2024-07-28T16:20:00Z

研究发现语言模型数据集存在大量冗余数据,导致训练模型时有超过1%的非提示输出直接复制自训练数据。研究团队开发了两个工具,能够定位冗余数据并通过去重训练模型,减少内存化文本的发生。这样做不仅减少了训练和测试重叠,还提高了模型的准确性。工作和代码已在指定的https网址上发布。

SoftDedup: 提高语言模型预训练速度的高效数据重新加权方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z
Picsart与Getty合作挑战Adobe的“商业安全”AI

图片和视频编辑平台Picsart与Getty Images合作推出了一个“负责任、商业安全”的AI图像生成器,该生成器仅使用授权内容进行训练。Picsart的AI实验室正在构建定制模型,允许付费订阅用户生成具有完全商业权利的图像,解决AI生成侵权问题。该生成器预计将于今年晚些时候推出,并可通过Picsart的API服务访问。这个合作项目类似于Adobe的Firefly AI模型,旨在提供商业安全的图像生成工具。Picsart的博客中包含了使用即将推出的AI模型生成的示例图像。

Picsart与Getty合作挑战Adobe的“商业安全”AI

The Verge
The Verge · 2024-06-14T10:12:17Z

该研究使用一个包含31种南亚语言的多语种共指解析翻译数据集训练了两个模型。最佳模型在印地语黄金集上的得分分别为64和68,并指出了当前共指评估指标的局限性,呼吁开发更合适的评估指标。

泰语指代消解数据集:Thai Coref

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z

这篇文章介绍了一种基于提示生成视频的方法,通过训练视频模型,利用低质量视频和合成高质量图像,成功生成了高质量的视频。评估结果显示,该方法在图片质量、动作和概念组合方面表现出优越性。

使用扩散模型的视频插值

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-01T00:00:00Z

本研究使用WikiGoldSK数据集评估了多语言预训练语言模型在斯洛伐克语上的效果,并与现有的斯洛伐克NER数据集进行了比较。结果显示使用银标准数据集进行训练可以获得更好的结果。研究公开了数据集、代码和训练模型。

巴伐利亚方言数据中的命名实体识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-19T00:00:00Z

本文介绍了一种简单的自监督方法,用于放大视频中微小的运动,并通过操作视频来实现光流的缩放。通过训练模型估计生成视频的光流并惩罚其与给定放大因子的偏差程度,避免了使用合成放大数据集的需求。通过评估视觉质量和定量度量,展示了方法的有效性。

再探基于学习的视频运动放大实时处理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-04T00:00:00Z

合作机器学习允许多个参与者共同训练模型,但现有聚合器无法准确识别恶意更新和排除操纵风险。

协作机器学习中的稳健性与学习之间的冲突

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-21T00:00:00Z
AI的电力消耗有多大?

机器学习的能源消耗是一个问题,但缺乏确切数据。训练模型需要大量电力,如GPT-3模型约需1300兆瓦时,相当于130个美国家庭一年用电量。生成图像的推断过程也能耗较高,与充电手机相当。AI公司保密能源消耗数据可能是为避免批评。研究显示,到2027年,AI行业能源消耗可能达每年85至134太瓦时。需要更多数据了解AI的能源消耗和环境影响。

AI的电力消耗有多大?

The Verge
The Verge · 2024-02-16T14:00:00Z

研究发现,预训练的抽象摘要系统性能可靠,但输出的摘要常与输入不符且存在事实错误。作者通过综合和人工标注数据训练模型,识别摘要中的事实错误,并研究了单词、依赖和句子级别的事实性。实验结果显示,人工标注的细粒度数据提供更有效的训练信号,最佳事实性检测模型能识别非事实标记,从而提高抽象摘要模型的准确性。

通过数据提炼和条件生成填空改进抽象摘要的事实错误修正

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-13T00:00:00Z

研究了面部交换的感知和反常谷效应,通过新的训练模型方法减少面部交换与源材料之间的视角误差,降低眼睛在深假检测任务中的重要性,对特效制作、数字化形象和隐私保护具有重要意义。

通过聚焦视线的损失项缓解人脸交换中的怪异感

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-05T00:00:00Z

本文研究了机器翻译的训练模型,重点关注增强多对多多语言翻译性能和零-shot翻译方向。通过在预训练的多语言大型语言模型上进行微调,并采用提示策略和跨语言一致性正则化,提高了翻译性能。实验结果表明方法有效。

提升多对多多语言机器翻译的方法与大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-11T00:00:00Z

该研究提出了弱监督标签统一流程,合并多个训练模型的伪标签,构建统一标签空间,提高泛化能力。通过微调和验证,在动态交通场景中得到出色的目标检测模型,对领域变化具有更高抵抗力。

冬季驾驶条件下使用预训练的自监督特征协助的轨迹驱动区自动标注系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-20T00:00:00Z

本文讨论了机器学习中的伪相关性问题,介绍了一种降低对伪相关性敏感度的训练模型方法和资源,并实验证明该方法在情感分析和自然语言推理任务上表现良好。

利用反事实情况测量和改善对部分输入的专注力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-16T00:00:00Z

本研究使用合成数据生成方法并对营养学领域的特定用例中生成的数据进行质量分析,通过扩展方法全面分析训练模型中抽样的效果,基本复现真实世界分析结果。

一个基于距离的原创全合成数据生成方法的统计属性和隐私保证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码