本研究提出了一种自注意时空校准(SASTC)方法,旨在提高脉冲神经网络(SNN)的准确性。该方法通过自注意机制实现了人工神经网络(ANN)与SNN之间的语义对齐,显著提升了SNN在CIFAR-10和CIFAR-100数据集上的表现,推动了SNN的应用潜力。
本文介绍了Transformer在自然语言处理中的应用,通过引入自注意机制,Transformer革新了NLP。文章详细解释了Transformer的架构、输入编码、编码器和解码器的工作原理。Transformer在机器翻译、文本摘要等NLP任务中表现出高效和有效的特点。
本文介绍了多种基于图卷积网络(GCN)的骨架动作识别模型,强调其在动作识别和泛化能力上的优势。研究提出了多流图卷积网络和自注意机制等新方法,显著提高了模型的鲁棒性和准确性,尤其在NTU-RGBD和Kinetics数据集上表现优异。
本文介绍了FlexEdit,一个灵活的对象编辑框架,克服了传统编辑方法的局限性。该框架支持刚性和非刚性编辑,通过文本提示和参考图像引导,结合自注意机制和双路径注入方案,提升了编辑效果和身份保留质量。研究表明,FlexEdit在多种编辑任务中表现优异,具有广泛的应用潜力。
该研究提出了一种多功能图像编辑框架,支持刚性和非刚性编辑,利用文本提示或参考图像引导。通过双路径注入方案和自注意机制,融合外观与结构信息,实验证明其在文本编辑和外观转换任务中表现优越。
本研究比较了卷积神经网络(CNN)和视觉Transformer(ViT)在服装分类中的表现。研究发现,CNN是图像分类的基石,而ViT引入了自注意机制,可以对不同输入数据组件进行加权。研究还探讨了使用这两种架构的最新方法,以确定在电子商务中对时尚MNIST数据集进行图像分类的最佳架构。研究强调了将这两种架构以不同形式结合以提高整体性能的重要性。
本研究提出了一种基于卷积结构的注意力计算近似方法,可以将注意力矩阵分解为卷积矩阵,实现几乎线性时间的计算。该方法适用于任何输入矩阵,可加速 transformer 注意力计算,实现更长上下文的应用。
本文提出了多种新型交通预测模型,包括空间-时间变换网络、流量控制机制和自适应嵌入,利用图神经网络和自注意机制动态建模交通数据,显著提高了预测准确性。实验结果显示,这些方法在实际数据集上优于现有技术,有效解决了时空数据缺失和异质性问题。
本文提出了一种名为 USTrack 的单阶段 Transformer RGB-T 跟踪网络,通过自注意机制融合多模态特征,提升目标与背景的区分度。实验结果显示,该方法在多个 RGB-T 跟踪基准上表现优异,推理速度达到 84.2FPS,尤其在 VTUAV 数据集上表现突出。
本文比较了自注意机制在医学图像分析中的应用,强调其在图像分类和目标检测中的优势。研究表明,自注意力模型能够有效捕捉全局信息,提升模型精度,并在心率预测等任务中表现优越。通过创新架构,克服了传统卷积神经网络的局限性,提供了更高效的图像处理方法。
本文介绍了基于自注意机制的图像处理模型,包括 HiT、RAM、IPS 和 PMTrans。这些模型在高清图像生成、语义分割和医学图像分析等领域表现优异,克服了传统卷积神经网络的局限性,展现出强大的建模能力和鲁棒性。实验结果显示,这些方法在处理高分辨率数据时具有显著优势。
该论文提出了图变换器结构来改进预测性能,捕捉数据集中不同场所和情景之间的差异,并设计了自注意机制和域适应模块来提高模型泛化能力。实验证明该方案的改进性能。
本研究发现自注意机制和解耦体系结构对图外分布问题有正面贡献,线性分类层会损害图的泛化能力。研究开发了一种新的图神经网络模型DGAT,实验证明其在图外分布问题下的有效性。
通过分析基于Transformer神经网络架构的模型在简单序列建模任务上的训练结果,发现Transformer内部的自注意机制呈现出与输入和输出分离机制相似的特征,暗示了关于现代AI架构与人脑模型计算相似性的研究机会。
本文介绍了一种新颖的双语端到端模型,通过共享编码器和预测网络,并通过自注意机制组合语言特定的联合网络,实现了单一神经模型对多种语言的识别和支持语言之间的动态切换。该方法在印地语、英语和混合代码测试集上分别降低了13.3%、8.23%和1.3%的词误差率。
该论文提出了图变换器结构来改进预测性能,捕捉数据集中不同场所和情景之间的差异,并设计了自注意机制和域适应模块来提高模型的泛化能力。实验结果表明该方案的改进性能。
本研究提出了一种基于变压器特征生成器的多源域适应方法(MSDA-TF),通过捕获浅层空间、时间和频谱 EEG 数据表示的卷积层,以及自注意机制提取这些特征中的全局依赖关系,解决了不同主体之间的变化对传统深度学习算法在自动情感识别中的性能问题。实验证明,MSDA-TF 在 SEED 数据集上取得了有希望的结果。
该研究提出了名为Av-CONV的多模态、多任务框架,用于预测第一人称视角下摄像机佩戴者和其他社交伙伴的对话行为。通过自注意机制建模跨时间、跨主体和跨模态的表征。实验证明了该方法在具有多说话者和多对话情景的挑战性视频数据集上的优越性能。消融研究评估了模型中每个组件的贡献。
USTrack是一个统一的单阶段Transformer RGB-T跟踪网络,通过自注意机制将三个阶段统一到一个ViT主干中,并利用模态之间的相互作用提取融合特征,改善跟踪性能。在三个RGB-T跟踪基准上进行实验,USTrack在保持最快推理速度的同时,实现了新的最先进性能,特别是在VTUAV数据集的短期和长期子集上,MPR/MSR分别增加了11.1%和11.3%。
精准医学中,药物反应预测至关重要。TransCDR是一种强大的工具,通过迁移学习和自注意机制预测细胞系对药物的敏感状态。TransCDR在预测上表现优于其他模型,基因突变和Extended Connectivity Fingerprint是关键因素。TransCDR在外部测试集上表现强大,具有重要潜力。
完成下面两步后,将自动完成登录并继续当前操作。