本研究提出了一种新型XMANet模型,解决了现有EMG手势识别方法的性能不足。实验结果表明,XMANet在多个数据集上显著优于传统模型,展示了细粒度特征在EMG分类中的潜力。
本研究提出了一种新颖的场景流估计网络MambaFlow,旨在解决时空建模不足和细粒度特征损失的问题。实验结果表明,该网络在Argoverse 2基准测试中表现优异,并具备实时推理能力。
研究比较了多模式表示学习在医学领域的效果,发现通用领域表示在医学领域具有可转移性,多模式对比训练不足够,学习细粒度特征有益处。研究结果表明多模式医学表示学习的有效性,并公开了代码。
本文提出了一种视觉引导的语义组网络(VGSG),用于解决基于文本的人物搜索(TBPS)问题。该方法通过引导的视觉线索提取对齐良好的细粒度视觉和文本特征,并采用关系性知识传递方法来传播信息,实现语义组文本特征与相应的视觉特征对齐。该方法在两个基准测试中表现出优越性。
提出了一种基于注意力引导的方法,利用全幅切片图像分类模型对阴道念珠菌进行诊断分类,通过细粒度特征的自注意模块和对虚假阳性区域的注意力抑制方法,解决了WSI图像样式差异并取得了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。