小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种代理混合解码策略,以提高大规模语言模型在多样化任务中的适应性。该方法通过动态选择最合适的模型,显著提升了性能,平均奖励提高1.56倍,胜平负比率提升71.89%。

Collab: Controlled Decoding for Large-Scale Language Model Alignment Using Mixed Agents

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本研究探讨了大型语言模型(LLM)中文本生成解码策略对GPU能耗的影响,强调了解码技术和超参数选择对文本质量和资源利用的影响,以及优化资源效率与文本质量之间的平衡。

节能意识的LLM解码:文本生成策略对GPU能耗的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本文探讨了神经文本生成中的“幻觉”现象,并提出了多种减少虚假信息生成的方法,包括扩展beam搜索算法和实时检验策略。研究表明,模型的不确定性与虚假内容相关,所提解码策略能有效降低幻觉概率。此外,开发了无约束幻觉生成评估基准,以评估语言模型的表现。

预训练语言模型对不真实幻觉文本返回可区分的概率分布

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

DISCO是一种动态调整推断长度的方法,能够提高推理速度和质量。研究提出了自适应推测解码策略和Speculative Streaming方法,显著提升了大型语言模型的解码效率。SpecDec++通过自适应候选长度实现了更快的推理,实验结果显示加速效果显著。

利用 Goodput 优化为大型语言模型提供服务的概念解码

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

本文探讨了视觉对话任务中的解码策略,分析了不同策略的优缺点。研究表明,核采样在质量优先时表现最佳,并提出了“选择性抽样”算法以提高多样性和连贯性。此外,动态词汇序列模型(DVS2S)显著提升了聊天机器人回答的质量和解码效率。

开放领域对话生成的动态随机解码策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-12T00:00:00Z

本文探讨了大型语言模型的幻觉现象,提出了一种基于标记的方法来识别幻觉类型,并改进了对话摘要的可解释性和忠实度。研究表明,模型的不确定性高会导致更多幻觉,并提出了优化解码策略以减少幻觉。通过微调Longformer模型和数据过滤技术,提升了摘要质量和事实一致性。此外,介绍了无参考的幻觉检测方法和未来研究方向。

德国也出现幻觉!与阿森特数据集中的新闻摘要不一致检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-06T00:00:00Z

该研究提出了一种高效稳定的人造文本检测方法,能够辨别多种模型和解码策略生成的人造文本,并具有抗检测的能力。同时,该研究还揭示了使用大规模语言模型技术时存在的社会和伦理问题,并提出了相应的解决方案。

基于 LLM 的文本检测调查:必要性、方法和未来方向

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z

本文介绍了一种基于BERT的非自回归文本生成模型,通过引入新的解码策略和机制解决了NAG模型中的问题,并在三个任务上进行了评估,证明该模型在速度和性能上优于现有的非自回归基线模型,也在强自回归模型上取得了有竞争力的性能。

非自回归句子排序

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-19T00:00:00Z

本文提出了一种解码策略,通过优化源和目标单词的点间互信息来减少模型不确定性高时的幻觉出现。在 XSum 数据集上进行实验证明,该方法降低了幻觉的概率,同时保持了黄色和 BertS 得分。

用合成任务教授语言模型减少产生幻觉

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z

通过分析代码标记的丢失分布,发现代码标记可分为难以预测的具有挑战性的标记和容易推测的自信标记。提出了一种简单而有效的方法:自适应温度采样(AdapT sampling),通过在解码不同的标记时动态调整温度系数。在不同规模的LLMs上应用AdapT采样,并在两个常用数据集上进行评估,结果表明AdapT采样优于最先进的解码策略。

通过动态温度采样来改善代码生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-06T00:00:00Z
图说文本生成解码策略

本文介绍了文本生成任务中的不同解码策略,包括贪心搜索、集束搜索、Top-K采样、核采样和温度采样。这些策略都有不同的优缺点,需要根据具体场景选择合适的策略。

图说文本生成解码策略

Finisky Garden
Finisky Garden · 2023-07-19T01:46:22Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码