小红花·文摘

本研究探讨了文档级翻译评估的关键问题，强调了自动评估指标的重要性，并提出了未来的发展方向，包括用户友好的评估方法和机器翻译评估的训练模型。

Automated Evaluation Metrics for Document-Level Translation: Overview, Challenges, and Trends

BriefGPT - AI 论文速递 ·

对DistilBERT进行微调以实现问答

MachineLearningMastery.com ·

18项任务200万视频编辑对，云天励飞联合多高校打造出大规模编辑数据集

机器之心 ·

本研究探讨了最终训练模型在数据归因中的挑战，提出了一种测量模型对训练实例敏感性的方法，并统一了不同梯度方法的理论框架。结果表明，一阶方法的近似质量在进一步训练后下降，而影响函数方法的近似质量更稳定但整体较低。

仅基于最终模型的数据归因：梯度方法的统一视角

BriefGPT - AI 论文速递 ·

GPT-SoVITS是一个开源项目，用极少量的声音样本快速训练模型，完成文本到语音的转换。

GPT-SoVITS —— 5s 声音样本就可以训练模型，复刻声音的 AI 应用 - SharpCJ

SharpCJ ·

本文介绍了一种简单的自监督方法，用于放大视频中微小的运动，并通过操作视频来实现光流的缩放。通过训练模型估计生成视频的光流并惩罚其与给定放大因子的偏差程度，避免了使用合成放大数据集的需求。通过评估视觉质量和定量度量，展示了方法的有效性。

再探基于学习的视频运动放大实时处理

BriefGPT - AI 论文速递 ·

合作机器学习允许多个参与者共同训练模型，但现有聚合器无法准确识别恶意更新和排除操纵风险。

协作机器学习中的稳健性与学习之间的冲突

BriefGPT - AI 论文速递 ·

AI的电力消耗有多大？

The Verge ·

研究发现，预训练的抽象摘要系统性能可靠，但输出的摘要常与输入不符且存在事实错误。作者通过综合和人工标注数据训练模型，识别摘要中的事实错误，并研究了单词、依赖和句子级别的事实性。实验结果显示，人工标注的细粒度数据提供更有效的训练信号，最佳事实性检测模型能识别非事实标记，从而提高抽象摘要模型的准确性。

通过数据提炼和条件生成填空改进抽象摘要的事实错误修正

BriefGPT - AI 论文速递 ·

研究了面部交换的感知和反常谷效应，通过新的训练模型方法减少面部交换与源材料之间的视角误差，降低眼睛在深假检测任务中的重要性，对特效制作、数字化形象和隐私保护具有重要意义。

通过聚焦视线的损失项缓解人脸交换中的怪异感

BriefGPT - AI 论文速递 ·

本文研究了机器翻译的训练模型，重点关注增强多对多多语言翻译性能和零-shot翻译方向。通过在预训练的多语言大型语言模型上进行微调，并采用提示策略和跨语言一致性正则化，提高了翻译性能。实验结果表明方法有效。

提升多对多多语言机器翻译的方法与大型语言模型

BriefGPT - AI 论文速递 ·

该研究提出了弱监督标签统一流程，合并多个训练模型的伪标签，构建统一标签空间，提高泛化能力。通过微调和验证，在动态交通场景中得到出色的目标检测模型，对领域变化具有更高抵抗力。

冬季驾驶条件下使用预训练的自监督特征协助的轨迹驱动区自动标注系统

BriefGPT - AI 论文速递 ·

本文讨论了机器学习中的伪相关性问题，介绍了一种降低对伪相关性敏感度的训练模型方法和资源，并实验证明该方法在情感分析和自然语言推理任务上表现良好。

利用反事实情况测量和改善对部分输入的专注力

BriefGPT - AI 论文速递 ·

本研究使用合成数据生成方法并对营养学领域的特定用例中生成的数据进行质量分析，通过扩展方法全面分析训练模型中抽样的效果，基本复现真实世界分析结果。

一个基于距离的原创全合成数据生成方法的统计属性和隐私保证

BriefGPT - AI 论文速递 ·

该研究使用合成数据生成方法解决在线仇恨言论检测中数据不足的问题，并提供了三种方法来生成保留原有仇恨情绪但转移仇恨目标的仇恨言论数据样本。结果表明使用合成数据训练的模型表现与仅使用目标领域样本训练的模型相媲美甚至更好。

有限数据环境中使用合成数据生成进行仇恨言论检测

BriefGPT - AI 论文速递 ·

本文提出了一种新的度量方法“模型可分离性”用于评估模型分离数据的能力。研究表明，自监督方法训练的模型在分离性方面比监督方法更有效。在深度伪造数据集上，自监督模型提供了最佳结果，有助于开发更有效的深度伪造检测模型。

其他计算机视觉任务与深度伪造检测的接近程度如何？

BriefGPT - AI 论文速递 ·

该文提出了两种新方法，一是通过训练模型的短子序列来降低输入长度，提高困惑度和训练效率；二是提高了transformers的递归方法的效率，通过将绝对位置嵌入到查询和键中而不是嵌入到单词中，可以在保持结果优越的情况下提高计算效率。这些技术结合起来可以加速训练1.65倍，减少内存使用，并显著提高WikiText-103上的困惑度，而不会添加任何参数。

通过任务提示改进 Transformer 的长度泛化

BriefGPT - AI 论文速递 ·

NVIDIA DGX Cloud现已推出，加速生成式AI训练

NVIDIA Blog ·

AI绘图工具Stable Diffusion安装

迷途小书童 ·

本文介绍了使用动态嵌入表训练推荐模型的方法，TFRA和TFRS是实现动态嵌入表的工具，动态嵌入表有三种类型，训练模型的代码和自定义回调函数也在文章中提供。

使用动态嵌入训练推荐模型

The TensorFlow Blog ·