小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了TATA框架，以解决大型语言模型在数学推理中调整策略的不足。该框架使模型能够根据自身能力自适应调整推理策略，并优化训练数据选择。实验结果表明，TATA在数学推理基准测试中表现优异，显著提升了推理效率。

Teaching Large Language Models According to Their Aptitude: Adaptive Reasoning for Mathematical Problem Solving

BriefGPT - AI 论文速递 ·

本研究提出BIDS算法，解决大型语言模型在指令微调中训练数据选择不平衡的问题。该算法通过规范化影响分数，迭代选择最具影响力的训练实例，从而提升不同任务间的性能平衡。实验结果表明，BIDS在多个基准测试中优于现有方法，增强了多样化能力的学习。

Improving Influence-based Instruction Tuning Data Selection for Balanced Learning of Diverse Capabilities

BriefGPT - AI 论文速递 ·