小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了ConCISE框架,通过增强大型推理模型在复杂任务中的信心,减少冗长输出,输出长度减少近50%,同时保持高准确率。

ConCISE: Confidence-Guided Stepwise Efficient Reasoning Compression

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

大语言模型输出长度短的原因包括成本、用户体验和技术限制。长输出增加算力消耗和费用,短响应时间提升用户体验,且模型训练通常不针对长输出。解决方案包括分段处理输入和多次输出。

大语言模型的输出长度为啥都不长?

王福强
王福强 · 2025-02-15T16:00:00Z

本研究提出了Hansel框架,有效控制大型语言模型(LLMs)的输出长度。该框架通过定期输出特殊标记来跟踪目标长度,确保文本的连贯性和流畅性。实验结果表明,Hansel显著降低了输出序列的误差,并具备良好的长度控制能力。

Hansel: Output Length Control Framework for Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

清华唐杰团队通过AgentWrite方法成功将GLM-4和Llama-3.1的输出长度增加到7800字,翻了4倍。他们还生成了6000个长输出SFT数据,并将其添加到训练过程中。研究团队表示将进一步扩展模型的输出长度和质量,并提高效率。

清华唐杰团队新作:一口气生成2万字,大模型开卷长输出

量子位
量子位 · 2024-08-15T05:23:08Z
Prompt Engineering 经验分享

本文介绍使用ChatGPT API的技巧,包括编写有效的Prompt、控制输出长度、减少歧义等。作者建议将ChatGPT视为一位态度超好的实习生,需要开发者的努力才能发挥全部战力。中文Embedding效果不如英文,需要预设搜索场景来提高匹配度。

Prompt Engineering 经验分享

山维空间
山维空间 · 2023-10-01T14:32:31Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码