研究团队提出了一种选择性熵正则化方法(SIREN),有效解决了大语言模型在RLVR训练中的“熵困境”。该方法通过限制探索范围、聚焦关键决策和稳定训练过程,精准调控探索行为,显著提升了模型在数学推理等任务上的表现。
本研究针对隐式神经表示中正弦激活函数的局限性,提出将输入层激活函数改为$ ext{sin}( ext{sinh}(2x))$的方法。结果表明,H-SIREN在计算机视觉和流体流动领域的表现优于多种先进模型。
本研究提出了一种新的深度学习音频系统对抗性攻击方法SirenAttack,并探讨了三种缓解策略。同时,评估了基于人工智能的网络威胁检测,强调了在现代数字生态系统中整合AI以增强网络安全的挑战与未来研究方向。
完成下面两步后,将自动完成登录并继续当前操作。