本研究提出了一种新型XMANet模型,解决了现有EMG手势识别方法的性能不足。实验结果表明,XMANet在多个数据集上显著优于传统模型,展示了细粒度特征在EMG分类中的潜力。
本研究提出了一种新颖的场景流估计网络MambaFlow,旨在解决时空建模不足和细粒度特征损失的问题。实验结果表明,该网络在Argoverse 2基准测试中表现优异,并具备实时推理能力。
本文提出了一种新的人物再识别方法,结合图像和自然语言描述,通过视觉和语言模型显著提升性能。研究表明,自然语言作为训练监督的有效性,并在多个基准测试中取得优异结果。新框架PLIP和方法π-VL通过细粒度特征学习和多模态学习,进一步增强了再识别效果,尤其在挑战性数据集上表现突出。
本文提出了一种视觉引导的语义组网络(VGSG),用于解决基于文本的人物搜索(TBPS)问题。该方法通过引导的视觉线索提取对齐良好的细粒度视觉和文本特征,并采用关系性知识传递方法来传播信息,实现语义组文本特征与相应的视觉特征对齐。该方法在两个基准测试中表现出优越性。
提出了一种基于注意力引导的方法,利用全幅切片图像分类模型对阴道念珠菌进行诊断分类,通过细粒度特征的自注意模块和对虚假阳性区域的注意力抑制方法,解决了WSI图像样式差异并取得了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。