本研究提出了一种高保真视频换脸框架(HiFiVFS),有效解决了现有技术在时间稳定性和细粒度属性保留方面的不足,显著提升了换脸效果。
本研究提出H-POPE评估基准,系统评估大型视觉语言模型中的幻觉问题,特别是对象存在性和细粒度属性的幻觉现象。结果表明,模型在这些方面易发生幻觉,揭示了其对视觉输入的依赖性。
完成下面两步后,将自动完成登录并继续当前操作。