小红花·文摘

本研究提出了一种无监督训练技术，通过Fourier谱幅值提取特征，结合空间域信息，构建多模态检测器，以提高对高保真生成图像中假冒内容的检测准确性。同时，开发了综合数据库以评估检测方法。

Towards More Accurate Fake Detection on Images Generated from Advanced Generative and Neural Rendering Models

BriefGPT - AI 论文速递 ·

该研究提出自一致偏好优化（ScPO）方法，旨在解决自对齐技术在复杂推理任务中的奖励分配问题。ScPO通过无监督训练提升一致答案的质量，显著改善传统奖励模型的表现。

Self-Consistent Preference Optimization

BriefGPT - AI 论文速递 ·

化学空间导航仪：流生成式AI引导分子属性控制

机器之心 ·

本文介绍了一系列先进的个性化图像生成技术，包括unselfie自拍转换、UPGPT统一扩散模型和FaceChain个性化肖像生成框架。这些技术通过多视角输入、无监督训练和新颖的模型设计，提升了图像生成的质量和灵活性，解决了细节缺失和身份保持的问题。

UniPortrait：一种统一的人物图像个性化框架

BriefGPT - AI 论文速递 ·

本文介绍了LeOCLR，一种新的对比学习方法，旨在提升视觉表征的实例辨识能力。实验证明，该方法在多个数据集上优于基线模型，特别是在ImageNet-1K上提高了5.1%。此外，PRCL框架通过概率表示增强了无监督训练的鲁棒性，显示出在多个基准测试中的优越性。

图像复杂度表征的对比学习

BriefGPT - AI 论文速递 ·

本文介绍了一种利用自然语言生成的合成语音来增强自动语音识别（ASR）系统的方法。通过结合合成语音与真实语音数据，实验结果表明该方法在LibriSpeech数据集上显著降低了错误率，提升了识别性能。此外，研究探讨了数据增强和无监督训练在口音识别中的应用，发现合成带有口音的语音数据能有效改善模型表现。

关于纯合成训练数据对不同自动语音识别体系结构的影响

BriefGPT - AI 论文速递 ·

本文提出了一种新型复合图像检索框架LinCIR，利用自掩蔽投影方法进行无监督训练，展示了在多个基准数据集上的优越性能。LinCIR在FashionIQ等数据集上超越了有监督方法，并引入CIRCO数据集以促进研究。通过结合视觉特征和文本描述，提出了iSEARLE方法，显著提高了检索准确性和效率。

HyCIR: 利用合成标签增强零样本组合图像检索

BriefGPT - AI 论文速递 ·

本文探讨了一种基于Swin Transformer的图像去噪和恢复新方法，提出了DS-TransUNet网络架构，显著提升了医学图像分割质量。研究还展示了深度学习在图像恢复中的加速效果，强调无监督训练和良好的泛化能力。

基于 Swin Transformer UNet 的地面图像去模糊

BriefGPT - AI 论文速递 ·

本文提出了一种基于去噪扩散生成模型的语义分割方法，利用条件DDPM生成高质量图像，并通过“attn2mask”实现无监督训练。实验结果表明，该方法在多个数据集上显著提高了分割性能，减少了对真实标注的依赖。

SatSynth: 针对航空语义分割的扩充图像 - 掩膜对的扩散模型

BriefGPT - AI 论文速递 ·

本文介绍了深度聚类中相互信息作为无监督训练神经网络的客观标准的最大化并不能得到令人满意的聚类结果，并将核心距离更改为常见的挑战导致的原因。通过引入广义相互信息 (GEMINI) 来推广相互信息，它是一组用于无监督神经网络训练的指标。GEMINI 可以自动选择相关的聚类数目，这是在深度判别聚类上很少研究的一个特性。

$f$-MICL：理解和推广基于 InfoNCE 的对比学习

BriefGPT - AI 论文速递 ·

该研究提出了一种无需文本注释的遥感图像训练方法，利用互联网图像作为中介，通过训练图像编码器对齐，实现了大规模遥感图像视觉语言模型的无监督训练。该模型在零样本分类、图像检索、分割和视觉问答任务中表现优于有监督训练的模型，分类任务提升了20%，分割任务提升了80%。

MetaSegNet: 基于元数据协同的视觉语言表示学习用于遥感图像语义分割

BriefGPT - AI 论文速递 ·

本文介绍了深度聚类中相互信息作为无监督训练神经网络的客观标准的最大化并不能得到令人满意的聚类结果，并将核心距离更改为常见的挑战导致的原因。通过引入广义相互信息 (GEMINI) 来推广相互信息，它是一组用于无监督神经网络训练的指标。最后，强调 GEMINI 可以自动选择相关的聚类数目，这是在深度判别聚类上很少研究的一个特性，因为聚类数目是先验未知的。

信息修改的 K 最近邻算法

BriefGPT - AI 论文速递 ·

该文介绍了一种基于学习的方法，用于编码和操作3D表面网格，创建可解释的可变形形状集合的嵌入空间。该方法是无监督训练的，可以处理各种各样的网格。核心是一种谱池化技术，建立了一个通用的潜空间，摆脱了传统限制。整个过程包括两个阶段，实验证明该方法实现了优秀的重建和插值。

多样化可变形形状集合的无监督表示学习

BriefGPT - AI 论文速递 ·

该文介绍了一种新的自编码器类型架构，可以无监督地进行训练，支持生成和推断，并通过对抗学习增强条件和无条件样本的质量。

使用 Wasserstein ALI 和改进的 MIPGAN 生成最坏情况变形

BriefGPT - AI 论文速递 ·

该文介绍了一种新的深度估计方法 Monitored Distillation，能够从单张图片、稀疏点云和内置集成模型中获取稠密的深度信息。在 VOID 室内场景数据集上，该方法比盲集成基线算法效果提高了 17.53%，比无监督方法效果提高了 24.25%，并且比最好的有监督方法保持可比性。

ADU-Depth: 基于注意力机制和不确定性建模的深度估计的注意力蒸馏

BriefGPT - AI 论文速递 ·

该论文提出了一种名为RINCE的新的信息噪声对比损失，可以利用相似性排名的信息来学习相应的嵌入空间，并且相比标准InfoNCE，可以自适应探索相似性信息。该损失函数也可以应用于无监督训练，针对视频的无监督学习，可展现出更优的分类精度、检索率和越界检测表现。

本文介绍了深度聚类中相互信息作为无监督训练神经网络的客观标准的最大化并不能得到令人满意的聚类结果，并将核心距离更改为常见的挑战导致的原因。通过引入广义相互信息 (GEMINI) 来推广相互信息，它是一组用于无监督神经网络训练的指标。与相互信息不同，一些 GEMINI 在训练时不需要正则化，因为它们在数据空间中具有几何意识的距离或核函数。最后，强调 GEMINI 可以自动选择相关的聚类数目，这是在深度判别聚类上很少研究的一个特性，因为聚类数目是先验未知的。