本研究提出HCAF-DTA模型,利用跨注意力融合超图神经网络预测药物-靶标结合亲和力。该模型通过构建药物分子超图和加权图提取特征,并采用双向多头跨注意机制建模分子间相互作用,实验结果表明其预测性能显著优于现有技术。
本文提出了LOCATEdit,一种优化的跨注意力机制,用于文本引导的图像编辑。该方法通过图的自注意力补丁关系,显著改善了图像区域的一致性,优于现有技术,展示了其有效性。
本研究提出了MusicInfuser方法,旨在生成与指定音乐轨道同步的高质量舞蹈视频。该方法通过音乐-视频跨注意力机制,避免了对运动捕捉数据的依赖,实现灵活且高质量的音乐驱动视频生成。
本文提出局部-全球问知视频嵌入(LGQAVE),通过跨注意力机制和动态图转换器整合多模态知识,显著提升视频问答的准确性。
本研究通过修改跨注意力机制,在去噪扩散过程中创造新的艺术风格。引入了AttnMod模型,使得扩散模型能够生成不依赖文本提示的新艺术风格,具有艺术创作潜力。
完成下面两步后,将自动完成登录并继续当前操作。