本研究提出了一种基于强化学习的微调框架,旨在提高数据到方程任务中的领域适应性和生成方程的准确性。该方法通过优化预训练模型的生成策略,尤其在复杂数据分布下展现出显著的潜力。
本研究提出了DeepKD框架,旨在解决知识蒸馏中目标类与非目标类知识冲突及低置信度噪声问题。通过双重解耦和自适应去噪,显著提升了知识转移效果。
本研究探讨了强化学习与蒸馏对大型语言模型推理的影响。结果显示,强化学习提高了准确性但未增强能力,而蒸馏则有效引入新知识,提升了模型能力。这有助于理解语言模型的推理机制。
本研究提出了一种结构化代理蒸馏框架,旨在将大型语言模型压缩为较小的学生模型,同时保持推理准确性和一致性。实验结果显示,该方法在多个基准测试中优于传统蒸馏和模仿学习,显著提高了模型压缩率并保持了性能。
本研究探讨了问答系统中链式推理生成的可解释追踪与最终性能之间的关系。研究表明,基于规则的问题分解方法并不总能确保模型输出正确答案,挑战了知识蒸馏的假设。
本研究提出了一种基于Koopman理论的离线蒸馏框架,旨在降低扩散生成模型的计算成本。该框架通过编码噪声输入实现单步生成,保持语义一致性,并在标准测试中将FID得分提高了40%。
本研究提出了一种基于时间序列的知识蒸馏策略,用于锂离子电池容量衰减预测。经过微调的Battery-Timer模型展现出强大的零-shot泛化能力,显著提升了专家模型的多条件泛化能力。
本研究提出双头优化(DHO)框架,旨在解决资源有限环境中视觉语言模型(VLMs)的计算复杂性和训练成本问题。DHO通过独立学习标记数据和教师预测,显著提升特征学习效率,并在多个领域和数据集上超越传统基线。
本研究提出REMEDI框架,以解决车主购车行为预测中的极端类不平衡和复杂模式问题。通过多样化模型捕捉用户行为特征,显著提升购车者识别精度,具备工业应用潜力。
本文提出了一种耦合分布随机专家蒸馏方法,旨在解决在线模仿学习中因对抗奖励或值公式引起的不稳定性问题。该方法通过在世界模型的潜在空间中联合估计专家和行为分布,实现了稳定的性能和专家级结果,优于传统对抗方法。
本研究质疑知识蒸馏的安全性,提出通过在蒸馏数据集中嵌入后门触发器的对抗样本进行后门攻击的方法。实验表明,该方法能够在不影响教师模型的情况下,成功影响学生模型,揭示了知识蒸馏中的安全漏洞。
本研究提出了一种“思维痕迹提示”方法,旨在提升小型语言模型在算术推理中的能力,减少对大型模型的依赖。研究结果表明,该方法使小型模型的性能提升可达125%,展示了开源模型的潜力。
本研究提出了群体相对知识蒸馏(GRKD)框架,解决了现有知识蒸馏方法忽视教师模型关系性归纳偏置的问题。GRKD通过关注类别之间的相对排名提炼教师知识,实验表明其在细粒度分类任务中具有更优的泛化能力。
本研究提出了一种新的知识蒸馏方法——头尾关注的KL散度(HTA-KL),旨在缩小脉冲神经网络(SNN)与人工神经网络(ANN)之间的性能差距。该方法通过动态区分高低概率区域并分配适应性权重,提升知识转移的平衡性,最终在多个数据集上表现优于现有方法。
本研究探讨了知识蒸馏方法在资源受限环境中对小型语言模型性能和可解释性的影响,提出的新方法显著提升了模型表现,为大规模语言模型的应用奠定了基础。
本研究提出了一种选择性自蒸馏方法(FedSSD),旨在解决联邦学习中因数据异质性导致的局部模型优化问题。该方法通过加权全局模型知识,显著提升了模型的泛化能力和鲁棒性,并减少了通信轮次。
本研究提出了一种“反蒸馏采样”方法,通过调整模型下一个标记的概率分布,降低推理轨迹的影响,有效防止模型蒸馏,具有重要的应用价值。
本研究提出双空间知识蒸馏(DSKD)框架,解决了白盒知识蒸馏在输出空间和词汇不兼容性的问题。通过统一模型预测头和精确标记对齐算法,DSKD显著提升了知识蒸馏效果,实验结果表明其在多个基准测试中优于现有方法。
本研究提出CleanMAP框架,旨在解决智能连接车辆对高精度地图更新的需求及众包数据不一致性的问题。通过提取关键视觉参数和动态分段评分,显著提高了地图更新的准确性和可靠性。实验结果表明,该框架在自主导航中的实用价值。
本研究提出了一种新的半监督分割框架HDC,旨在解决胎儿超声图像中颈部结构的精确分割问题。该方法通过层次蒸馏机制和一致性学习,在低对比度和模糊边界条件下有效提升特征学习。实验结果表明,HDC在超声数据集上的表现优于现有模型,且计算开销更低。
完成下面两步后,将自动完成登录并继续当前操作。