小红花·文摘

极道 ·

Long Luo's Life Notes ·

本文分享了作者作为ICML 2025区域主席的经验，指出ICML的审稿过程比NeurIPS更复杂，沟通不畅。审稿人未按时提交评论，导致紧急邀请审稿人。许多论文的数学推导不严谨，影响阅读体验，部分审稿人未能发现问题，审稿分数对论文接受至关重要。

Lei Mao's Log Book ·

中国电信人工智能研究院发布的“复杂推理大模型”TeleAI-t1-preview在数学推导和逻辑推理方面表现优异，超越了OpenAI等标杆模型。该模型通过强化学习和创新训练策略，提高了推理准确性，并能清晰展示思考过程，帮助学生理解问题逻辑。

量子位 ·

机器之心 ·

本文讨论了CuTe布局代数中形状元组的左可分性问题。通过修改定义，确保形状模式的左可分性，从而增强组合的可接受性假设。文章还在特定条件下证明了组合的可接受性，并探讨了相关的数学推导和符号使用。

学习让我快乐 ·

本文介绍了LLM-SR，一种利用大型语言模型（LLMs）发现科学方程的新方法。该方法结合科学先验和进化搜索，优化方程框架以提高数据拟合度。研究表明，LLM-SR在多个科学领域表现优越，发现的方程优于现有基准。同时，研究探讨了LLMs在数学推导中的能力及其局限性，强调模型训练对数学能力的提升作用。

BriefGPT - AI 论文速递 ·

本文研究了利用大型语言模型进行特定领域数学推导的能力，发现fine-tuned FLAN-T5-large (MathT5)在绝对性能方面超过了GPT模型，但对于涉及未知符号的扰动更为敏感。同时，分析了常见的推理错误和现有指标的适用性，总体来说，合成数据训练模型可以提高其数学能力。

BriefGPT - AI 论文速递 ·