小红花·文摘

Apple Machine Learning Research ·

DEV Community ·

本研究提出了一种视觉-语义图匹配网络（VSGMN），旨在提升传统零样本学习在未见类别识别中的表现。实验结果表明，VSGMN在多种场景下优于现有方法，具备实际应用潜力。

BriefGPT - AI 论文速递 ·

研究表明，基于CLIP模型的多模态视觉语义存在种族和性别偏见，尤其在生成图像时倾向于使用刻板印象，白人和男性个体表现尤为明显。评估多个模型发现，职业和地理位置的偏见也很严重。尽管提高提示的详细程度可以缓解偏差，但无法完全解决问题。研究强调需要监督和检查AI模型中的隐性偏见。

BriefGPT - AI 论文速递 ·

同和故事匯 ·

本研究探讨了Havrylov和Titov的信令游戏设置对模型学习或捕捉视觉语义的影响。通过增强输入图像和引入附加任务，实现了在完全自监督情况下学习捕捉图像概念属性的视觉表征的通信系统。

BriefGPT - AI 论文速递 ·

该文章介绍了自监督扩散模型SODA，用于表示学习。该模型能够无监督地捕捉视觉语义，并在多个数据集上实现了重建、编辑和合成任务。研究还揭示了该模型生成图像的潜在空间的分解性质，作为控制和操纵模型生成图像的有效接口。该研究揭示了扩散模型在图像生成和表示学习方面的潜力。

BriefGPT - AI 论文速递 ·