小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了提升大型语言模型(LLMs)推理效率的方法,包括自适应计算、动态资源分配和新解码算法。研究表明,通过优化计算预算和引入新策略,可以显著提高模型性能和计算效率,尤其在资源有限的环境中。

学习如何决策思考强度:输入自适应分配语言模型计算资源

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文介绍了多种加速大型语言模型(LLM)推理的算法,包括递归推测解码、分阶段投机性解码和SpecInfer等。这些方法通过优化树结构、动态规划和并行处理,提高了解码速度和效率,同时保持模型的准确性。研究表明,这些技术在不同模型上实现了显著的加速效果。

SEED: 通过计划的推测解码加速推理树构建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-26T00:00:00Z

本文介绍了一种名为DOMINO的解码算法,能够高效生成符合预期格式的文本,速度优化接近2倍。同时,研究提出了一种新的公差预测方法,结合概率约束编程模型和贝叶斯学习,提升了大型语言模型的生成质量和结构化输出能力。实验验证了该方法在多个文本生成任务中的有效性。

通过 PDFA 学习分析受限 LLM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-12T00:00:00Z

本文介绍了多种优化解码算法,包括使用CUDA提升RNN-T模型速度、并行重构贪心解码和引入Token-and-Duration Transducer框架。这些技术显著提高了解码速度和准确性,部分方法在GPU上实现了高达7倍的加速,推动了机器翻译和序列任务的效率提升。

标签循环:转录器的高效解码

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z

该研究提出了一种解码算法,用于生成开放性文本。该算法采用遗忘机制和长度惩罚,以解决过度惩罚导致的过短句子问题。实验结果表明,该方法有效地提高了生成高质量句子的能力。

惩罚解码:有效抑制开放式文本生成中的自我强化效应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z

LogicalBeam是一种新的解码算法,可以解决自然语言查询中的SQL歧义性问题。相比于现有模型,LogicalBeam在生成SQL方面表现效果提升了最多2.5倍,并且在SPIDER和Kaggle DBQA上的Top-5精确度和执行匹配精确度也有所改善。

在歧义下进行文本到 SQL 生成的基准测试和改进

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-20T00:00:00Z

该文介绍了对Whisper语音识别模型的改进,通过在额外数据上微调和使用改进的解码算法,提高了在低资源语言方面的性能。使用Filter-Ends和Min Lookahead解码算法,WER相对于标准beam search平均减少了2.26。

利用微调和最小前瞻波束搜索改善 Whisper

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码