小红花·文摘

Vercel News ·

Apple Machine Learning Research ·

香港大学、字节跳动Seed和复旦大学联合推出的Polaris方法，通过700步强化学习训练，使4B模型在数学推理能力上超越多款商业大模型，特别是在长文本生成方面表现突出。该方法强调动态调整训练数据和超参数，提升了模型的多样性和准确性。

量子位 ·

本研究提出了一种新方法，通过分析频域中的键值缓存能量分布，利用低频部分进行有效压缩，解决大型语言模型在长文本生成中的上下文窗口扩展问题。实验结果表明，该技术在长上下文任务中显著提高了效率和有效性。

BriefGPT - AI 论文速递 ·

本研究提出MAMM-Refine方法，通过多智能体和多模型协作，提升长文本生成的可信度，尤其在总结和问答领域。研究表明，该方法有效消除事实不一致性，显著提高生成内容的准确性和整体性能。

BriefGPT - AI 论文速递 ·

本研究针对长文本生成中的“失落中间”问题，提出了长输入输出基准（LongInOutBench）和合成数据集，开发了检索增强长文本生成器（RAL-Writer），显著提升了长输入和长输出任务的生成效果。

BriefGPT - AI 论文速递 ·

本研究强调在小说创作和复杂推理中对连贯逻辑长文本的需求，建议将长文本生成的重点从长输入处理转向长输出生成，并呼吁开发高质量长文本输出的基础性大型语言模型。

BriefGPT - AI 论文速递 ·

本研究提出Qwen2.5系列模型，以解决大型语言模型在多样化需求上的不足。通过扩大预训练数据集和多阶段强化学习，显著提升了长文本生成、结构数据分析和指令遵循的能力。

BriefGPT - AI 论文速递 ·

本研究提出段级扩散（SLD）框架，旨在解决扩散模型在生成长文本时的连贯性和上下文准确性问题。通过文本分段和对抗学习，SLD显著提升了生成效果，实验结果显示其在流畅性和连贯性方面优于其他方法。

BriefGPT - AI 论文速递 ·

本研究提出了DAHL，一个用于评估生物医学长文本生成中幻觉现象的基准数据集和自动评估系统。通过分析8573个问题，发现较大模型通常幻觉较少，并提出DAHL分数作为更高效的评估替代方案。

BriefGPT - AI 论文速递 ·

本研究提出了一种图形不确定性方法，旨在解决大型语言模型在长文本生成中的虚构和不确定性问题。通过二分图表示生成与声明的关系，结果显示该方法在多个任务上提高了6.8%的AUPRC，并在事实性方面改善了2-4%。

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型在长文本生成中的偏见问题，提出了长文本公平性测试（LTF-TEST）。研究发现模型对某些群体存在偏袒，并对弱势群体过度敏感。通过FT-REGARD微调方法，显著降低了性别偏见并提升了模型性能。

BriefGPT - AI 论文速递 ·

该研究提出了一种新方法，解决大型语言模型生成文本时的高计算成本和输出分布扭曲问题。该方法提高了计算效率，保持输出分布平衡，并能在困难约束下生成长文本，性能与不扭曲分布的方法相当。

BriefGPT - AI 论文速递 ·

Blog on Qwen ·

本研究提出了一种基于事件图和神经顾问的事件规划框架，以提升长文本生成性能。通过多种数据集和模型，探讨事件预测和知识图谱的应用，展示了新模型在事件序列预测中的优势，并提出了开放事件过程规划任务，验证知识转移能力。研究结果为事件预测方法提供了重要启示。

BriefGPT - AI 论文速递 ·