小红花·文摘

本研究提出了ConCISE框架，通过增强大型推理模型在复杂任务中的信心，减少冗长输出，输出长度减少近50%，同时保持高准确率。

BriefGPT - AI 论文速递 ·

大语言模型输出长度短的原因包括成本、用户体验和技术限制。长输出增加算力消耗和费用，短响应时间提升用户体验，且模型训练通常不针对长输出。解决方案包括分段处理输入和多次输出。

王福强 ·

本研究提出了Hansel框架，有效控制大型语言模型（LLMs）的输出长度。该框架通过定期输出特殊标记来跟踪目标长度，确保文本的连贯性和流畅性。实验结果表明，Hansel显著降低了输出序列的误差，并具备良好的长度控制能力。

BriefGPT - AI 论文速递 ·

清华唐杰团队通过AgentWrite方法成功将GLM-4和Llama-3.1的输出长度增加到7800字，翻了4倍。他们还生成了6000个长输出SFT数据，并将其添加到训练过程中。研究团队表示将进一步扩展模型的输出长度和质量，并提高效率。

量子位 ·

山维空间 ·