本研究提出HCAF-DTA模型,利用跨注意力融合超图神经网络预测药物-靶标结合亲和力。该模型通过构建药物分子超图和加权图提取特征,并采用双向多头跨注意机制建模分子间相互作用,实验结果表明其预测性能显著优于现有技术。
本文提出了LOCATEdit,一种优化的跨注意力机制,用于文本引导的图像编辑。该方法通过图的自注意力补丁关系,显著改善了图像区域的一致性,优于现有技术,展示了其有效性。
本研究提出了MusicInfuser方法,旨在生成与指定音乐轨道同步的高质量舞蹈视频。该方法通过音乐-视频跨注意力机制,避免了对运动捕捉数据的依赖,实现灵活且高质量的音乐驱动视频生成。
本文探讨了视频问答中的挑战,现有方法在整合问题与视频帧方面存在不足。我们提出的局部-全球问知视频嵌入(LGQAVE)通过跨注意力机制和动态图转换器,显著提升了视频问答的准确性。
本研究提出了AttnMod模型,旨在帮助艺术家在生成图像中强调特定特征或风格。该模型通过修改跨注意力机制,在去噪扩散过程中创造出不依赖文本提示的新艺术风格,展现了重要的艺术创作潜力。
完成下面两步后,将自动完成登录并继续当前操作。