小红花·文摘

本研究探讨了思维链（CoT）长度对大语言模型推理准确性的影响，发现推理步骤增加初期性能提升，但在达到一定长度后性能下降，原因在于长推理过程易受噪声干扰。提出了最优CoT长度理论，以优化多步骤推理。

BriefGPT - AI 论文速递 ·

本文研究了机器学习中噪声干扰的幂方法，提出了稳健收敛性分析和基于Wasserstein距离的泛化误差界限。同时探讨了高斯机制的变体及其在隐私保护中的应用，提出了高效的差分隐私算法DP-RGrad，并验证了其在低秩矩阵估计中的优越性。

BriefGPT - AI 论文速递 ·