本研究解决了一次性可控视频编辑中的内容一致性问题,提出了一种新的视觉提示方法,避免了传统的DDIM反演过程。通过内容一致性采样(CCS)和基于Stein变分梯度下降的时间内容一致性采样(TCS),确保了编辑帧与源帧之间的内容和时间一致性,显著提升了视频编辑的效果。
本文研究了在深度学习框架中引入伪谱方法以改进全波形反演(FWI)的可能性,解决了在复杂环境下传统反演方法的局限性。通过将伪谱FWI问题重新表述为深度学习算法,提出了一种新颖的递归神经网络(RNN)框架,实验证明该方法在准确性和稳定性上优于经典FWI,具有更好的故障识别能力和低频内容。
本研究解决了在复杂环境中进行全波形反演(FWI)时面临的求解器选择和数据不足等问题。通过将伪谱FWI问题重新形式化为深度学习算法,提出了一种新颖的深度神经网络框架。研究发现,这种数据驱动的伪谱反演方法在更深和滑脱区域的表现优于传统FWI,具有更好的全局逼近能力。
本研究探讨了深度学习与全波形反演结合的潜力,以解决地震成像与地下特征表征中的数据质量和模型复杂性问题。通过提出混合、生成和物理指导模型,研究显示这种协同方法能显著提高地下属性估计的准确性、效率和可靠性,对地球物理学领域产生变革性影响。
本研究解决了基于扩散模型的文本到图像生成在视频编辑过程中时间一致性不足的问题。提出了一种通用高效适配器(GE-Adapter),通过引入时间一致性块、空间一致性块和语义一致性模块,显著提高了感知质量和时间连贯性。研究结果表明,该方法在MSR-VTT数据集上实现了显著的质量提升,提供了切实可行的文本到视频编辑解决方案。
本研究提出了DispFormer,一种基于变换器的神经网络,旨在提高地表波色散曲线反演的效率和准确性。该方法能够独立处理不同长度的色散数据,并在无标记数据的情况下产生可靠的反演结果,具有广泛的应用前景。
本研究针对深度神经网络中的隐私泄露问题,系统性地调查了模型反演攻击(MIA)及其防御策略。通过总结最新的MIA方法及其贡献和局限性,提供了对网络脆弱性的深入理解,强调了在图像、文本和图形领域中的重要性,大大促进了相关领域的未来研究。
该研究解决了整流流扩散变换器在图像和视频生成中的反演精度不足问题,通过提出RF-Solver这一新方法,显著降低了整流流ODE求解过程中的误差。基于RF-Solver的RF-Edit进一步促进了图像和视频编辑,能够在进行编辑时保留源内容的结构信息,并且该方法兼容所有预训练的整流流模型,具有广泛应用潜力。
AIxiv专栏报道了微信视觉团队与浙江大学、清华大学合作提出的BELM算法,该算法解决了扩散模型反演中的不一致问题,提升了生成样本质量并确保精确反演,具有广泛应用前景,已被NeurIPS 2024接收。
本研究提出了HybridBooth框架,通过结合优化和直接回归方法,将视觉概念转化为文本嵌入,保持模型的泛化能力。该框架能从单个图像快速生成高质量个性化内容,应用潜力广泛。
研究推出了MIBench,这是首个整合16种攻击和防御方法的基准测试工具,提供9种评估协议,促进模型反演攻击的标准化比较。模型反演攻击通过模型输出重建敏感训练数据,引发隐私问题。研究还分析了跳跃连接对攻击的脆弱性,并提出随机擦除作为新防御方法,平衡隐私保护与模型效用。
LEGO方法在扩散模型中学习可分解和可逆的文本到图像表示,不仅生成匹配文本的图像,还能反转文本提示为潜在表示。研究表明,LEGO在图像质量和语义对齐方面优于标准模型,尽管训练复杂性增加。它为多模态AI系统的发展奠定了基础,可能推动更复杂的文本引导图像操作和跨模态推理。
当前的3D GAN反演方法通常只用一个正面图像重建3D头部模型,忽略多视角信息。本研究改进了这一技术,允许同时反演多个视角,处理动态视频中的不一致性,合成一致的3D表示。结果显示,在几何精度和图像质量上有显著提升,尤其在宽视角下,并展示了3D渲染的可编辑性。
本研究解决了从稀疏和噪声数据中准确识别偏微分方程的挑战,现有的稀疏回归方法容易导致不准确的方程识别。通过提出一个结合发现和嵌入的混合框架,利用递归卷积神经网络(RCNN),显著提高了从噪声和低分辨率测量中识别关键物理方程的准确性和鲁棒性。
本文提出了一个框架来评估客户隐私泄漏攻击,发现攻击者可以通过分析本地训练参数重构私有数据。研究分析了联邦学习中超参数和攻击算法对攻击效果的影响,并评估了不同梯度压缩比下的攻击有效性,最后提供了一些缓解策略来应对隐私泄漏威胁。
该研究提出了一种新的重建攻击方法,通过泄露的梯度从图像处理系统中窃取高分辨率图像。实验结果表明,该方法能够成功恢复和窃取512 x 512像素的图像,并在准确性和时间效率方面优于其他攻击方法。该方法可能会使差分隐私失效。
本研究提出了一种新颖的知识蒸馏方法,利用压缩样本提高准确率。该方法在多种数据集和模型反演方法中表现突出,尤其在少样本场景中效果显著。
本文提出了一种基于物理问题的时间谐波全波形反演方法,利用弹性散射理论和深度学习技术,增强解的准确性,并引入了一种基于物理问题的概率深度学习方法,探索解的不确定性。通过比较分析,评估了该方法的性能和准确性。
我们提出了一种逆向识别方法 (INVERT),通过学习表示与解释相连接的可扩展方法,实现了对表示与解释一致性的评估和统计显著性的度量。该方法适用于各种场景,包括受偶然相关性影响的表示和模型中决策层次结构的解释。
神经一体化无网格(NIM)方法结合了传统无网格离散化技术和深度学习,提高了训练效率。在静态和瞬态基准问题上进行了实验,结果显示NIM方法在准确性和效率方面显著提高。
完成下面两步后,将自动完成登录并继续当前操作。