小红花·文摘 - 小红花技术领袖俱乐部

本研究针对开源大型语言模型在数学推理方面的不足，提出了课程学习和分解策略。实验结果显示，WizardMath 7B在英语数据集上超越Gemini，在印地语上表现相当，表明双语方法有效提升数学推理能力。

多语言数学推理：推动开源LLM在印地语和英语中的发展

BriefGPT - AI 论文速递 ·

本研究探讨了大语言模型生成内容的事实验证中，去语境化与分解策略的相互作用。引入DnDScore方法后，发现不同策略选择对事实性得分有显著影响，为改进长文本生成的验证过程提供了新思路。

DnDScore: Decontextualization and Decomposition for Factuality Verification in Long-Form Text Generation

BriefGPT - AI 论文速递 ·