本论文提出了一种统一的场景文本检测和布局分析方法,同时介绍了一个分层场景文本数据集。实验证明该方法在多个基线方法上表现更好,并在多个场景文本检测数据集上取得最先进的结果。
本研究提出了一种新的参数-free的空间注意力层,用于建模高层特征之间的空间关系。该层在四个基准测试中实现了最先进的结果,包括Market-1501、DukeMTMC-ReID、CUHK03-labeled和CUHK03-detected。
本文介绍了多尺度动作分割变换器(MS-AST)和多尺度动作分割因果变换器(MS-ASCT)用于手术阶段识别,准确率分别达到95.26%和96.15%。在非医学数据集上也取得了最先进的结果。
该文介绍了MotionAGFormer模型,使用AGFormer模块减少通道数,精确捕捉邻接关节之间的局部依赖关系。该模型使用四分之一的参数,计算效率提高三倍,取得了最先进的结果。
本文提出了一种无提案分割方法,可处理难以密集标注的图像,并引入了自我监督一致性损失,解决正-无标签训练中的挑战。在不同场景下实现了最先进的结果。
NEUCORE是一种用于综合图像检索的模型,通过多模态概念对齐来识别目标图像。该模型在三个数据集上获得了最先进的结果。
该研究提出了一种神经网络模型,可共同学习文本和知识库实体的分布式表示,并在三个NLP任务上取得最先进的结果。
完成下面两步后,将自动完成登录并继续当前操作。