小红花·文摘

本研究提出了一种动态数据集修剪方法，解决了对比预训练中的数据效率问题。实验结果表明，该方法在多个下游数据集上优于传统静态选择方法。

BriefGPT - AI 论文速递 ·

本文比较了对比预训练和图像字幕预训练策略，发现图像字幕训练同样有效，能够产生竞争力的视觉编码器。提出的CoCa模型通过无缝训练图像和文本，提升了多种视觉任务的性能。LocTex方法利用低成本的文本标注和鼠标轨迹，减少了标注数据需求，同时在视觉任务中表现优异。

BriefGPT - AI 论文速递 ·

该研究提出了一种利用SCLDM的语音到人脸生成框架，通过对话音频和面部特征之间的对比预训练以及引入残差的方式，实现了更加逼真的人脸图像生成。在AVSpeech和Voxceleb数据集上，该方法在所有度量指标上均取得了显著提升，尤其是在余弦距离度量指标上分别提升了32.17和32.72。

BriefGPT - AI 论文速递 ·