本研究评估了标注策略、数据不平衡和先前经验对人类标注者表现的影响。结果显示,在目标检测任务中,标注者表现优于分割任务,但存在更多类型II错误。这些发现有助于改进遥感研究中的标注策略。
本文提出了3D Referring Transformer (3DRefTR)框架,结合了3D指代表达理解和分割任务,在ScanRefer数据集上表现优异。同时,研究介绍了多任务协作网络(MCN)和其他模型,显著提升了指代表达的准确性和3D视觉定位性能。
本文介绍了多种高效的模型和量化方法,如TinySAM、SmoothQuant+和HQ-SAM,旨在提升分割任务的性能并降低计算成本。SmoothQuant+实现了无损4位权重量化,显著提高了吞吐量。HQ-SAM增强了对象的精确切分能力,而PerSAM和PA-SAM通过个性化和提示驱动的方式进一步优化了分割效果。这些方法推动了计算机视觉领域的进步。
本文研究了不同视觉基础模型在分割任务中的性能,发现DINO V2在多个数据集上表现优越。强调了稳健特征提取器的重要性,并提出了一种基于自监督预训练的轻量级模块,有效生成语义分割数据集的注释。此外,提出的知识迁移方法显著提升了小型任务模型的性能。
通过分割任务、内存访问优化、并行执行和同步点,可以在GPU上并行优化矩阵乘法。矩阵分割减少内存访问延迟、提高内存带宽利用率、增加并行度和减少误差。这些优化使GPU成为执行大规模矩阵乘法的理想选择,提升性能。
本文介绍了MedGen3D,一个用于生成三维医学图像的深度生成框架。该框架利用多标签掩模序列和条件多条件扩散概率模型生成医学图像,实验结果显示其在分割任务中提供了有价值的数据。此外,还提到其他相关模型,如brainSPADE3D和GEM3D,旨在提升医学图像生成和分割的性能。
该文介绍了一种基于自监督学习的表示优化技术,可以改进细粒度分类和分割任务的性能。该技术利用部分特异变化来改进 fine-grained 分类,并在卷积和视觉变换网络中聚类像素表示。通过部分中心化学习和对比,在图像中对部分进行聚类,提高了图像分类和部分分割任务的性能。该技术在多个数据集上展示了良好的性能。
本文介绍了对nnU-Net模型进行BraTS 2020挑战的分割任务的改进方法,包括后处理、基于区域的训练、更激进的数据增强和对nnUNet管道的修改。通过重新实现BraTS排名方案,最终集成的nnU-Net在肿瘤、肿瘤核心和增强肿瘤方面的Dice分数分别为88.95、85.06和82.03,HD95值分别为8.498、17.337和17.805,获得了BraTS 2020比赛的第一名。
完成下面两步后,将自动完成登录并继续当前操作。