本研究提出Fisher合并方法,以提高模型合并的效率和性能。通过对不同数据集模型的加权平均,探讨了模型合并的潜力与挑战,并提出新的正则化方法以提升合并效果。研究结果表明,强大的基础模型和较大模型显著改善合并性能,为未来研究提供重要参考。
本研究探讨了语言模型在路径星任务中的表现不足,提出了一种新正则化方法,通过相同图的结构样本改善模型表现,证明该任务是可学习的,并为编码器模型提供了解决方案。
本文提出了一种新的半定松弛方法,以提高ReLU网络的鲁棒性,效率是现有方法的三倍。研究探讨了对抗训练的极限,并提出了新的正则化方法和防御规则项,显著提升了模型在CIFAR-10和MNIST数据集上的鲁棒性和准确性。通过大量实验验证了这些方法的有效性。
本文探讨了语言模型中的情感偏见,分析了敏感属性对生成文本情感的影响。研究发现,现有模型在新闻和维基百科语料库中存在显著偏见。提出了正则化方法以提高公正性,同时保持模型性能,并介绍了新的偏差测量数据集和评估框架,以更好地识别和减少语言模型中的社会偏见。
本文提出了一种深度神经网络模型,解决音频与图像情感对应问题。研究开发了“感觉变分自编码器”(SynVAE)和“Video2Music”框架,能够生成与视频情感匹配的音乐。实验表明生成音乐的质量和匹配度较高。此外,研究探讨了音乐生成与情感表达的关系,提出了基于音乐元素的正则化方法(MusER),并设计了客观的音乐美感测量模型。
本文研究了神经机器翻译(NMT)中不同层次的向量表示,发现高层次语义学习更有效,而低层次词性标注效果更佳。探讨了多语言翻译性能,提出基于Kullback-Leibler散度的正则化方法,构建了通用NMT系统,实现103种语言的翻译,提升了低资源语言的翻译质量。此外,研究还提出了动态位置编码方法,显著提高了翻译性能。
本文研究高维机器学习中的广义线性模型,探讨贝叶斯最优估计、模型性能评估及过拟合问题。提出新正则化方法Fishr,以提升模型的鲁棒性和泛化能力。研究表明,领域泛化算法在标签噪声下表现良好,但在真实数据集上未必优于经验风险最小化算法。
本文提出了一种新的对比学习方法,通过结合开放集样本与闭集样本,提高模型在标签噪声下的准确性和鲁棒性。研究还介绍了正则化方法和新的迭代学习框架,以解决嘈杂标签问题,实验结果表明该方法在开放集和闭集分类中表现优异。
本文介绍了隐藏流形模型及其在神经网络训练中的应用,探讨了流形假设对图像数据低维结构的影响,并提出了基于流形学习的算法以提高分类和生成建模性能。同时,研究分析了深度神经网络中的过拟合问题及其正则化方法,强调了流形假设在模型训练中的重要性。
本文介绍了改进学习算法LearningLoss++,通过精确分析梯度和结合多尺度特征,提升人体姿势估计性能。同时,研究了对抗训练算法的泛化性能,提出了正则化方法DLoss和优化非可微损失函数的新方法,探索了对抗训练数据增强的影响,并提出了基于松弛损失的训练框架RelaxLoss,以增强模型的鲁棒性。
本文探讨了神经网络中的损失可塑性问题及神经坍塌现象。研究表明,层归一化和权重衰减技术能够有效维持网络的可塑性,提升学习算法的稳健性。同时,神经坍塌现象会影响模型的泛化能力和优化能力,提出的正则化方法可以缓解可塑性丧失。
本文评估了神经网络的概率校准,比较了多种校准方法。研究发现,正则化方法在概率校准和锐度之间提供了良好平衡,而修正方法则表现出更优的校准性能。分位数校准作为一种修正方法,具有有限样本覆盖的优势。此外,提出了后处理校准方法和新的评估指标,以提升模型在不同任务中的校准效果。
本文介绍了一种新颖的提示调整算法,旨在提高开放领域对话生成的效果。该算法在性能上优于传统方法,并显著减少了参数需求。同时,研究提出了基于扰动的正则化方法,以稳定训练并提升准确性,实验结果在多个基准测试中超越现有技术。此外,多任务提示调整方法在自然语言处理任务中表现出色,展现了强大的泛化能力。
深度学习中的稳健泛化是一个重大挑战,研究发现正则化方法可以提高网络的准确性,并通过机械解释来理解其效果。训练动态包含两个连续阶段。
本文研究了在有噪声标签的情况下,过度参数化的深度神经网络的正则化方法。实验结果表明,通过参数与初始化之间的距离和为每个训练示例添加一个可训练的辅助变量,可以有效提高模型的泛化性。泛化误差的上界独立于网络的大小,可达到无噪声标签情况下的水平。
本文提出了一种新颖的基于测度论的机器学习理论,提供了一种新的深度学习正则化方法,并在 CIFAR-10、CIFAR-100 和 SVHN 中表现优于之前的方法。该理论为深度学习中的一族实际成功的正则化方法提供了理论基础。与统计学习理论不同,该学习理论通过测度论分析每个问题实例,提供了不同类型的结果和见解。还讨论了该结果对一次性学习、表示学习、深度学习和课程学习的几种后果。
本文研究了语言模型中的情感偏见,并提出了一种正则化方法来减少偏见。研究发现大规模模型在不同语料库上训练时存在较高的偏见。该正则化方法提高了公正度量,同时保持了困惑度和语义相似性。
本文提出了一种混合的模仿学习方法,将行为克隆和逆向加权作为策略和奖励模型,结合无限制行为克隆技术和正则化方法,以克服使用诱导式奖励和对策略学习的困难。该方法简单灵活,学习稳定,超参数调整最小化。
该论文提出了一种正则化方法来训练健壮的 GAN 模型,提高泛化性能和稳定学习动态方面的有效性。实验证明该方法在有限的训练数据下表现更好。
该文介绍了一种可解释的深度学习模型,通过正则化方法提高网络的稳健泛化能力。研究表明,正则化方法可以强制网络忽略损坏数据,在未损坏数据集上达到 100% 的准确性。此外,该模型还可以通过逐渐抹除记忆表示来降低过拟合风险。
完成下面两步后,将自动完成登录并继续当前操作。