本文提出了一种风险敏感的奖励方差优化框架(RVPO),旨在解决多目标奖励聚合中的约束忽视问题。RVPO通过惩罚奖励间的方差,优化模型的一致性,从而在医疗和科学推理任务中提高表现。实验结果表明,RVPO在HealthBench上显著优于传统方法,并在保持准确性的同时,避免了多奖励方法的性能下降。
本研究提出了一种基于大型语言模型(LLM)的优化框架,能够自动重构代码以应对硬件设计的挑战。实验结果表明,该模型在成功率、效率和设计质量上优于传统LLM,为硬件设计提供了新的视角。
iDreamer旨在激发科研热情,支持教授和学生追求卓越。REVOLVE是一种新优化框架,通过历史响应相似度提升大语言模型性能,解决复杂任务中的局部最优问题,展现出显著的适应性和效率。
本研究提出了两个新的二元数据原型分析优化框架,克服了现有方法对连续数据的局限,显著提升了模型在合成和真实二元数据上的表现。
本研究提出了一种自适应熵感知优化框架(AEO),用于多模态开放集测试时的适应(MM-OSTTA)。该框架通过优化未知类别样本的自适应熵和模态预测差异,提升了在线适应性能,展现出在长时间场景中的强大适应能力,具有广泛的应用潜力。
本研究提出了一种新的零阶邻近梯度算法,旨在解决现有算法在处理非平滑问题时计算量大的问题。通过构建两个通用的优化框架,显著提高了算法在非凸和凸问题上的表现,优化了查询复杂度,提升了机器学习中的优化效率。
本文介绍了一种无需训练的图像生成优化框架,速度比传统方法快1000~10000倍,效果更佳。研究涵盖文本到图像合成、用户素描图生成及高效局部微调等技术,提出了PhotoVerse和MaxFusion等创新方法,显著提升了图像生成的质量和控制能力。
本文提出了一种结合模型强化学习和目标识别的框架,解决了目标识别中的手动设计和在线计算问题,展示了在标准和嘈杂环境中的优异性能。研究探讨了基于两层分层强化学习的任务解决方法和高效的在线目标识别技术,强调了数据驱动方法和优化框架在真实场景中的应用效果。
本研究提出多种去偏见方法,利用辅助模型、优化框架和对比学习等技术,旨在减轻机器学习中的社会偏见。实验结果表明,这些方法在准确性和去偏成本上优于现有技术,尤其在处理特定子群体和图像分类器偏见方面表现突出。
本文探讨了通过反馈机制和搜索机制提高多步推理模型的准确性,提出了一种基于奖励模型的启发式贪婪搜索算法,展示了其在数学推理和代码生成任务中的优越性。同时,研究介绍了迭代经验优化框架,强调经验消除和不同优化模式对模型性能的影响,并提出了新颖的混合代理方法以提升规划性能,探讨了奖励机制对语言模型逻辑推理能力的优化。
本研究提出了一种优化框架,用于在商业微控制器上端到端部署 Transformer 模型,以降低延迟和能耗。通过分析模型架构瓶颈、硬件设计影响及调度挑战,应用于开源 DNN 加速器,推理速度提升最高可达 88.7 倍,并探讨了多种推断技术,以支持高效的深度学习应用。
本文探讨了提高大型语言模型鲁棒性的方法,包括Jacobian正则化、预训练模型微调及其在自然语言处理任务中的应用。研究表明,使用ELECTRA编码、温度调节和Focal Loss可以有效减少校准误差。此外,提出了基于Bregman的优化框架和Frobenius规范化的后处理方法,以提升模型的稳定性和对抗攻击的表现。
本研究利用元表面技术对薄膜光学进行光学特性的灵活操控,提出了一种替代优化框架来开发适用于天文高对比度成像的两种旋涡相位面具。通过计算智能技术进行优化,有效地将所需的模拟次数减少了 75%。
本文介绍了一种新型的变分方法——变分Renyi界限(VR),通过参数化散度的Alpha值,实现了从证据下限到对数似然的平滑插值。实验证明了VR界限在贝叶斯神经网络和变分自编码器上的广泛适用性。
完成下面两步后,将自动完成登录并继续当前操作。