本研究提出了一种新方法Depth-μP,旨在解决预测编码网络(PCN)在训练超过100层深度网络时的困难。尽管存在不稳定性,μPC在简单分类任务中表现出竞争性能,能够稳定训练高达128层的残差网络,并实现零-shot迁移学习。
本研究提出在深度非负矩阵分解(NMF)网络中引入局部特征交互,以提升性能。通过在局部NMF模块后增加混合NMF正向活动模块,显著提高了基于NMF的深度网络在基准数据上的表现,超越了传统深度卷积网络。这为深度网络的生物学可行性提供了新视角。
本研究提出了一种分数连接方法,解决了深度网络训练中超连接的高内存访问成本问题。通过将隐藏状态划分为多个部分,分数连接在大规模语言任务上显著优于传统的残差连接。
本研究提出了PTEENet,通过引入“捷径”优化深度网络的推理计算成本。该方法扩展了BranchyNet和EEnet架构,允许在预训练模型上附加分支,从而提高推理效率,实验结果表明显著降低了计算成本。
本文提出了一种新方法,通过利用上下文信息优化深度网络训练,以解决视觉数据标注不足的问题。研究引入上下文多样性,提出数据修复算法以减少模型偏差,并建议使用类基注释应对领域转移。优化数据策略和融入人类反馈显著提升模型在复杂环境下的表现。
PrintsGAN是一种合成指纹生成器,通过训练一个深度网络,提取了一个固定长度的嵌入,能够为给定的指纹生成独特的指纹和多个印象。
该文章介绍了一种利用相对空间和时间几何约束的新颖网络来引导定位的深度网络的训练方法,用于从单个图像中估计相机姿态。该方法通过利用相邻相机帧和场景中时空距离较远的相机帧获得的空间和时间相对姿态约束,能够在只有少量或非常稀疏的地面真实3D坐标可用的情况下进行定位。在三个视觉定位数据集上的评估结果表明,该方法优于其他直接姿态估计方法。
MGDepth是一种用于准确估计动态物体和静态背景深度的深度网络,通过引入光流和粗略单目深度来处理动态内容的挑战,并利用静态参考帧构建新的运动引导成本体积。通过引入基于注意力的深度网络架构,提高了网络结构的准确性和鲁棒性。在KITTI-2015数据集上,MGDepth在自监督单目深度估计中的均方根误差上实现了约7%的显著降低。
本研究提出了一种新的上下文感知弱监督学习方法,通过深度网络结合物体细化和实体关系建模,提高物体表述和匹配准确性。实验结果显示,该方法在Flickr30K和ReferItGame数据集上具有更好的算法性能。
研究人员正在研究深度人工网络是否能发展出共享语言来相互交互,并探讨语言在深度代理人群体中演化及紧急特性的条件。这有助于理解人类语言进化的过程,也可以让深度网络在日常生活中更加灵活和有用。
我们开发了一种工具,通过将大型预训练视觉模型映射到大脑上,揭示其隐藏信息。我们的创新提出了一种使用大脑编码的方法:预测大脑在图像刺激下的功能磁共振成像测量。我们发现大脑和深度网络特征之间的显式映射至关重要,FactorTopy方法可应用于任何深度网络。此外,训练方法对层次结构和缩放行为有重要影响,微调也会改变预训练模型。我们的方法实用,只需3000个图像就能学习网络到大脑的映射。
本研究提出了一种新的上下文感知弱监督学习方法,通过深度网络细化物体并建模实体关系,实现更准确的物体表述和匹配。实验证明该方法在Flickr30K和ReferItGame数据集上具有更好的性能。
该研究提出了一种使用多个合成子集来捕捉深度网络训练动态的方法,并改善了现有数据集提取方法的性能。同时,还实现了生成更大的合成数据集。
神经网络中的神经元代表特征,但可能表现出混合选择性。研究发现,深度网络中的特征可能通过多个神经元叠加表示。研究提出了一种自动化方法来量化视觉可解释性,并在神经数据上验证了这一方法。研究还发现大脑可能也使用了叠加表示。这对于稳健、高效和分解表示提出了基本问题。
介绍了LAUDNet框架,用于提高深度网络推理效率。该框架通过算法设计和调度优化准确衡量动态操作延迟,测试结果显示LAUDNet能够显著降低模型延迟超过50%,并在准确性和效率之间取得良好平衡。
本研究提出了一种新的上下文感知弱监督学习方法,通过两阶段深度网络结合精细化物体和实体关系建模,提高物体表述和匹配准确性。实验结果显示,该方法在Flickr30K和ReferItGame数据集上的准确度分别达到59.27%和37.68%。
PrintsGAN是一种指纹合成生成器,能够生成独特的指纹和多个印象。研究人员使用该生成器合成了525k个指纹的数据库,并训练了一个深度网络从中提取嵌入。
该研究提出了一种量化深度网络解释能力的方法,并提出了训练可解释性深度网络的方法。该方法通过提高深度网络单位的深度选择性来增强其解释能力,并提供了人们选择单元可靠性的全面分析。
临界学习期可能对行为和学习产生永久影响,深度网络中也存在临界学习期,特征学习与来源之间存在竞争关系,预训练可能损害新任务的转移性能,这是第一个解析处理临界学习期的模型。
本文提出了一种新的网络结构,用于解决低光照图像增强问题。该方法通过感知偏差照明和完整图像建模,结合伽马校正和深度网络,自适应地学习校正因子伽马。通过泰勒级数近似伽马校正,加速了训练和推理速度。层次化注意机制能够从具有信息的区域推断出暗区。实验结果表明,该方法优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。