本研究提出了一种名为ECG-Byte的分词器,用于多通道心电图生成文本任务。该方法通过自回归语言建模,将心电图信号压缩为可映射的令牌,实现端到端训练。与传统方法相比,ECG-Byte在性能上具有竞争力,训练时间减少一半,数据需求降低约48%。
本研究比较了基础模型与端到端训练在有丝分裂图形分类中的有效性。结果表明,端到端模型在不同数据量下均优于基础模型,且在领域转移方面表现更佳,推翻了之前的假设。
本研究解决了图异常检测中GNN模型在有限监督下的表现问题,提出图预训练模型在无标签异常检测中优于端到端训练模型,为未来研究提供新思路。
本文研究异构人脸识别,提出条件自适应实例调制模块(CAIM),有效适应不同源模态,缩小领域差距。通过广泛评估,证明该方法在多个基准测试中优于现有技术,成功实现端到端训练,且所需成对样本数量最少。
本文提出了一种基于对比学习和信息瓶颈的二进制哈希方法,定义了新目标函数并引入概率二进制表示层,以促进模型的端到端训练。实验结果表明,该方法在CIFAR-10、NUS-WIDE和ImageNet数据集上优于现有技术,性能显著提升。
本文研究了地面机器人的自主导航,通过仿真环境中的端到端训练,减小了模型在实际机器人平台上的差距,提升了性能和稳健性。
该研究提出了一种基于孪生网络的无监督抽取式摘要模型,通过双向预测目标进行训练。该模型可以进行端到端训练,并引入了可微分的长度控制模块。实验证明,该模型在句子编码器相同的情况下,优于基准方法,并在长度控制能力方面表现出色。人工评估结果也证明了该模型在相关性和一致性方面的优势。
本文介绍了深层分层网络HyperNet,用于处理区域提案生成和目标检测。HyperNet通过结合图像的深层、中间和浅层特征,实现了端到端的联合训练策略,并在PASCAL VOC 2007和2012检测数据集上取得了领先的召回率和目标检测准确度。
本文提出了一种基于图卷积操作的全新的可端到端训练的神经网络架构,通过轻量级的基于边缘条件的卷积来解决梯度消失和过参数化问题。实验结果表明了在合成高斯噪声和真实噪声上的最先进性能和改进的定性和定量结果。
LRM是一个大规模重建模型,可以在5秒内从单个输入图像预测对象的3D模型。该模型采用高度可扩展的transformer架构,在包含大约100万个对象的海量多视图数据上进行端到端训练。该模型具有很强的通用性,并能够从各种测试输入中生成高质量的3D重建结果。
本文提出了一种基于 Transformer 的点云感知方法,用于电路设计中的特征提取,无需预处理,可进行端到端训练,取得了高性能。该方法在拥堵预测和设计规则检查中表现最佳,并提供了源代码和预训练模型。
本文提出了基于特征嵌入的OUR方法和端到端训练策略,以改善模型的长尾现象。研究结果表明OUR方法显著改善了模型的长尾现象,为其他长尾学习方法带来了性能提升。
该文介绍了一种名为 Neural PG-RANK 的新型训练算法,通过实例化一个语言模型为 Plackett-Luce 排序策略,为检索模型的端到端训练提供了一种合理的方法,并有效地将训练目标与下游决策质量相统一。
本文介绍了一种新的3D组合表示方法,使用可区分的体积渲染计算动态人头和上半身的新视图,并在使用仅2D监督时进行端到端的训练,实现了动态人头和上半身新视图综合的最新最佳结果。
该文介绍了一种替代矢量量化的离散化表示方法——有限标量量化(FSQ),通过每信道量化构建隐式编码本,将表示投射到低维空间,实现端到端训练,无需特殊损耗或编码本优化技巧。FSQ在图像生成、分割和深度估计等任务中实现了同等性能,提供了比VQ更简单但功能更强大的替代方案。
SF-Net是一种连续手语识别模型,能够编码信息到三个层次的特征表示中,表现优于先前的方法。
本文介绍了一种新颖的方法Diffusion-EDFs,将SE(3)-等变性引入扩散生成模型中。该方法展示了卓越的数据效率,只需5至10个任务演示进行有效的端到端训练,并且相比以前的基于扩散的操作方法,具有更好的泛化能力。
本文提出了一个高效的伪立体三维检测框架,引入了Single-View Diffusion Model(SVDM),通过逐渐将正确的信息像素传递到左图像中,实现了端到端地训练。同时,探讨了SVDM在无深度立体三维检测中的应用,并与大多数立体检测器兼容。在KITTI数据集的基准测试中,取得了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。