小红花·文摘 - 小红花技术领袖俱乐部

智谱推出了新模型GLM-4.1V-9B-Thinking，参数仅9B，却在28项评测中获得23个SOTA，超越8倍参数模型。该模型采用思维链推理和课程采样强化学习，具备超长视频解析和智能读图问答能力，表现优异。

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

量子位 ·

大语言模型高考数学拿高分靠强化学习，那文科考高分得靠什么？

大语言模型高考数学拿高分靠强化学习，那文科考高分得靠什么？

宝玉的分享 ·

本研究提出了推理边界框架++（RBF++），旨在解决思维链推理（CoT）在实际应用中的两个主要问题：缺乏可量化指标和评估不可测能力的方法。实验结果表明，该框架在跨模态场景中有效，促进了对推理边界和优化策略的理解。

RBF++: Quantifying and Optimizing Reasoning Boundaries for Measurable and Unmeasurable Capabilities to Achieve Chain-of-Thought Reasoning

BriefGPT - AI 论文速递 ·

本研究提出COT Fine-tuned框架，通过双任务方法提升AI生成文本的检测准确性，并利用思维链推理增强模型的透明度与可解释性。实验结果表明，该框架在文本分类和LLM识别方面表现优异。

Tracing Thought: Identifying the Language Models Behind AI-Generated Text Using Chain of Thought Reasoning

BriefGPT - AI 论文速递 ·

本研究提出了一种生成思维链推理的方法，解决了文本到SQL模型的合理性缺失问题。通过逐步拆解SQL查询并提供解释，显著提高了复杂查询的执行准确性和模型的可解释性。

文本到SQL的合理化模型

BriefGPT - AI 论文速递 ·

人工智能突破：新学习方法使语言模型像人类一样思考和行动

人工智能突破：新学习方法使语言模型像人类一样思考和行动

DEV Community ·

本研究探讨了大型语言模型中思维链推理在情感分析中的作用，结果表明思维链对情感分析的影响微弱，模型表现主要依赖示范信息，支持语言与思维独立的观点。

Reassessing the Role of Chain-of-Thought in Sentiment Analysis: Insights and Limitations

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的相关性-多样性增强选择（RDES）方法，以提升模型的泛化能力。实验结果表明，RDES在文本分类任务中显著优于十种基准方法，且结合思维链推理可进一步提高预测性能。

Demonstration Selection for Context Learning through Reinforcement Learning

BriefGPT - AI 论文速递 ·

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界？

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界？

机器之心 ·

Meta AI推出思维偏好优化，助力AI模型在回应前进行思考

Meta AI推出思维偏好优化，助力AI模型在回应前进行思考

InfoQ ·

本文研究了量化对语言模型的影响，发现4位量化模型仍具备新兴能力，而2位模型性能显著下降。实验揭示了量化对上下文学习和思维链推理的影响，并探讨了模型规模扩展与新技能的关系，为AI产品发展提供了重要见解。

大型语言模型中的出现量化

BriefGPT - AI 论文速递 ·

谷歌的研究团队发现了一种名为“思维链提示”的技术，利用计算复杂性理论的方法，探索了思维链推理的力量。研究人员发现，思维链提示可以帮助Transformer解决更困难的问题，但需要大量的计算工作。

大模型原理与思维链推理

极道 ·