本研究提出了一种结合自监督训练与多列卷积神经网络的新方法,针对人群场景分析中的人群计数和异常检测,显著提升了复杂场景的处理能力,性能优于现有方法。
本研究提出了一种名为“消失深度”的自监督训练方法,旨在解决视觉编码器在广义度量深度理解方面的不足。通过新颖的位置信息深度编码技术,该方法显著提升了多个RGBD下游任务的性能,且无需微调编码器。
本文提出了一种新方法,通过第二轮自监督训练解决深度聚类中的特征随机性、漂移和扭曲问题,显著提升了六个数据集的聚类性能。
本研究提出MAGNET方法,旨在增强解码器的双向建模能力。通过自监督训练和结合双向与因果注意力,MAGNET提升了生成文本和填补缺失文本的能力。
本研究提出了一种自监督训练方法$eta$-Diffusion,旨在根据演示视频和场景图像生成自然连贯的视频。实验结果表明,该方法在用户偏好和机器评估中优于相关基线。
本研究提出了一种自监督训练策略,以提高肾细胞癌亚型分类的效率,解决因早期症状不明显导致的诊断延误问题,推动计算机辅助诊断工具的发展。
本文探讨了扩散模型在去噪数据时样本质量下降的原因,并提出了一种新的自监督训练目标,以提升远离训练分布的去噪性能。实验结果表明,该方法有效提高了并行采样器的性能和速度。
本文探讨了一种为大型语言模型(LLMs)赋予类人情节记忆的新方法,旨在提升其对长期上下文的理解与记忆。作者提出了一个新架构和自监督训练方法,利用记忆模块存储和检索信息,从而增强模型的对话和推理能力。尽管存在计算开销和可扩展性问题,该研究为提升AI对话能力奠定了基础。
本研究在无标注数据的情况下,通过将大规模GPS数据建模为停留点事件,并结合变压器等现代序列模型进行自监督训练,探讨如何检测移动行为异常。结合Aleatoric和Epistemic不确定性可提高模型的异常检测能力。
本文介绍了一种新的自监督训练方法Primal-Dual Learning(PDL),用于直接逼近受约束优化问题的最优解。PDL通过同时训练原始神经网络和对偶神经网络来模仿增广Lagrangian方法的轨迹,实验证明PDL在非线性优化基准测试中表现出极小的约束违规和微小的最优性差距,与ALM优化非常接近,并且在最优性差距、约束违规和训练时间方面表现出更好或相似的性能。
本研究提出了一种新颖的人脸交换方法,通过自监督训练和特征解耦解决姿态变化、色差和遮挡等问题,实现高保真且逼真的人脸交换。
本文提出了一种基于自监督训练的方法,通过利用所有训练数据的信息,为每个样本提取有意义且可泛化的嵌入空间,从而去除 out-of-distribution 样本,并使用迭代的 Manifold DivideMix 算法找到干净和有噪音的样本,以半监督的方式训练模型。此外,还提出了一种名为 MixEMatch 的半监督算法,通过在输入和流形空间进行插值提取更好的表示。实验证明了该框架的有效性。
该研究提出了一种名为JSSL的深度学习方法,用于提高MRI重构的质量。实验证明,JSSL方法相较于传统的自监督训练方法有了明显的改进,凸显了该联合方法的有效性。
本文介绍了一种名为md4all的解决方案,可解决单目深度估计在恶劣照明和天气条件下的不可靠性问题。该方案可在逆境和理想条件下以及不同类型的学习监督下可靠工作。实验证明该技术在nuScenes和Oxford RobotCar两个公共数据集上都显著优于先前的工作。
本文提出了三种易于实现的视觉Transformer变体,包括并行处理残差层、微调注意力层权重以适应更高分辨率和其他分类任务、添加基于MLP的补丁预处理层以提高自监督训练效果。作者使用ImageNet-1k数据集评估了这些设计选择的影响,并在ImageNet-v2测试集上确认了研究发现。同时,在六个较小的数据集上评估了转移性能。
本论文提出了一个多视图训练和测试模型MFNet,结合了多视图训练框架和面部参数模型Flame,通过自监督训练和多视图光流损失函数等约束,实现了更好的面部3D重建质量。研究使用了AFLW和facescape数据集以及模拟实际场景拍摄的面部照片,取得了良好的结果。该研究解决了面部参数模型与多视角面部3D重建相结合的问题,并对基于Flame的多视图训练和测试框架进行了探索,对面部3D重建领域有贡献。
完成下面两步后,将自动完成登录并继续当前操作。