清华系AI公司Nexusflow被英伟达收购,创始人包括焦剑涛和朱邦华。焦剑涛曾获清华特等奖学金,后在伯克利任教授。Nexusflow专注于生成式AI,推出多款模型,技术实力显著。收购后,团队将继续推动开源研究。
华人学者Tianhao Wu提出的思考偏好优化(TPO)方法,通过生成和评估内部思考过程,提升大模型的回答质量。该方法无需额外标注数据,研究表明TPO在多项基准测试中显著提高了模型性能,适用于推理和非推理任务。
完成下面两步后,将自动完成登录并继续当前操作。