小红花·文摘 - 小红花技术领袖俱乐部

Llama-Nemotron：2.5倍速度提升的AI推理，保持准确性

Llama-Nemotron：2.5倍速度提升的AI推理，保持准确性

DEV Community ·

DeepThought-8B利用LLaMA-3.1 8B创建紧凑型推理模型

DeepThought-8B利用LLaMA-3.1 8B创建紧凑型推理模型

InfoQ ·

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

机器之心 ·

昆仑万维「天工大模型4.0」o1版（Skywork o1）正式启动邀请测试

昆仑万维「天工大模型4.0」o1版（Skywork o1）正式启动邀请测试

机器之心 ·

本研究提出了一种改进的H-DPO方法，解决了大型语言模型训练中直接偏好优化（DPO）无法有效捕捉参考分布模式的问题。实验结果表明，H-DPO在多个任务中优于DPO，尤其在数学任务中表现突出，显示出良好的应用潜力。

可控熵直接偏好优化

BriefGPT - AI 论文速递 ·

通过生成数字分布控制的锚点，提出了一种语义化编码数字的策略，提供数字标记的数学基础表示。通过评估涉及从1到10亿的数字的数学任务，证明了该技术的优越性，并展示了数学基础的显著改进。

铺设锚点：语言建模中数字的语义启发

BriefGPT - AI 论文速递 ·