小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文讨论了后训练中的强化学习,重点介绍马尔可夫决策过程(MDP)、轨迹、回报、策略、价值函数和优势函数。强调了在语言模型生成中,奖励通常在序列末尾出现,导致信用分配和稀疏奖励问题。通过定义和贝尔曼期望方程,探讨了将语言生成视为MDP及其策略优化的挑战。

【强化学习与大模型后训练】02|MDP、回报与贝尔曼方程

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-29T00:00:00Z
LiveKit 介绍了增强 AI 语音代理真实感的技术

LiveKit 正在优化 AI 语音代理的自然度,重点提升语言生成能力,而不仅仅是降低延迟。通过改进语音转文本和文本转语音的流程,结合提示设计和非语言线索,旨在提升用户体验。这将吸引更多企业用户,增强平台使用率,并在竞争激烈的市场中实现质量差异化。

LiveKit 介绍了增强 AI 语音代理真实感的技术

实时互动网
实时互动网 · 2026-02-28T03:15:27Z
LLM与NLP的比较

LLM(大型语言模型)与NLP(自然语言处理)在功能和应用上有明显区别。NLP侧重于语言的理解与生成,采用多种技术;而LLM则通过深度学习生成类人文本。NLP适合结构化任务,LLM在开放式语言生成中表现突出。未来,两者可能会发展出混合模型和个性化AI。

LLM与NLP的比较

DEV Community
DEV Community · 2025-03-14T08:04:20Z

本文讨论了视觉语言模型中的视觉幻觉问题,提出了一种新方法——感知放大器(PM),通过迭代隔离相关视觉标记并放大区域,增强模型的视觉分析能力,从而提高语言生成的准确性和合理性。

Through the Magnifying Glass: Adaptive Perception Magnification for Hallucination-Free VLM Decoding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-13T00:00:00Z

蚂蚁医疗大模型在MedBench评测中获得双料冠军,得分分别为97.5和98.2。该模型在医学问答和语言生成等领域表现出色,具备多模态交互能力。自2023年进入医疗AI领域以来,已服务近3000万人次,推动了多个智能医疗应用的研发。

蚂蚁医疗大模型拿下MedBench测评“双料”冠军,原生多模态+千亿数据

量子位
量子位 · 2025-03-12T08:47:56Z

本研究提出熵-UID方法,以解决语言生成模型中的信息流不平衡和效率低下问题。该方法通过自适应调整标记选择,提升文本生成的自然性和流畅性。实验结果表明,该方法在多个数据集上表现优异。

熵-统一信息密度(Entropy-UID):优化信息密度的方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究提出了一种新的上下文感知语义重组机制(CASRM),旨在提升大型语言生成模型的连贯性和上下文适应性。实验结果表明,该机制显著改善了生成文本的质量,并减轻了错误传播的影响。

面向上下文的语义重组机制在大型语言模型中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z

该研究探讨了语言生成中的一致性与广度之间的权衡,分析了现有算法的局限性,并提出了一种新方法,通过引入更弱的Angluin条件,严谨表征近似广度与完全生成的等价性,揭示了稳定与不稳定生成的显著差异,推动了理论发展。

Study on the Characteristics of Breadth in Language Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

国内初创公司阶跃星辰的Step-2大模型在LeCun推出的LiveBench榜单中获得全球第一和国产第一,展现出其在指令跟随和语言生成方面的强大能力。该模型采用自主研发的MoE架构,参数量达到万亿级,体现了卓越的技术实力和创新潜力。

国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单

量子位
量子位 · 2024-11-21T04:13:18Z

本研究提出了多种基于扩散模型的语言生成方法,如Diffusion-LM、DiffusionBERT和EDLM,显著提升了文本生成的质量和速度。实验结果显示,这些模型在细粒度控制任务和基准测试中表现优异,尤其在减少采样步骤时性能提升明显。

基于PLM的离散扩散语言模型与熵自适应Gibbs采样

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-10T00:00:00Z

论文介绍了一种“Talker-Reasoner”架构,模拟人类快慢思维。该架构由“Talker”模块快速生成语言和“Reasoner”模块进行深入推理组成。实验显示,这种方法在语言生成、问答和常识推理任务中优于传统模型,但未详细讨论实际挑战和伦理问题。总体而言,该架构为AI模拟人类认知提供了新思路,值得进一步研究。

AI 说话者-推理者:模拟人类的快思与慢思

DEV Community
DEV Community · 2024-10-15T07:13:02Z

本文探讨了大型语言模型(LLMs)在记忆和推理方面的表现及其对语言生成的影响。研究表明,LLMs通过优化方法提高情境理解,并在记忆容量和认知表现上取得显著进展。实验发现,记忆效应与上下文推理的明确区分有助于分析模型的推理模式。此外,研究揭示了LLMs与人类决策之间的对齐问题,为LLMs应用的设计和开发提供了重要启示。

利用序列顺序回忆任务评估大型语言模型的情节记忆

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

MuRAG是一种多模态检索增强变压器,通过外部存储器提升语言生成能力,在WebQA和MultimodalQA数据集上超越现有模型10-20%。该研究综述了检索增强生成技术在大型语言模型中的应用,提出了评估方法和未来研究方向,强调了检索与生成模型结合的重要性。

iRAG:一种用于视频的增量检索增强生成系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-18T00:00:00Z

该研究探讨了扩散模型在语言生成中的应用,提出了多种生成方法,如对话生成、图像编辑和文本转语音等。实验结果显示,这些方法在生成多样性、相关性和自然度方面优于传统模型,且效率和精度较高。

DiffusionDialog:擴散模型用於具有潛在空間的多樣對話生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-10T00:00:00Z
RAG技术革新语音识别系统的三种方式

RAG技术通过结合信息检索和语言生成,显著提升了语音识别系统的准确性和效率,改善了转录文本的处理,减少了错误,并优化了响应速度。同时,RAG在个性化用户体验方面表现出色,增强了用户满意度。未来,语音识别将更加精准和人性化。

RAG技术革新语音识别系统的三种方式

MyScale Blog
MyScale Blog · 2024-03-15T06:33:54Z

该调研总结了高效大型语言模型的研究成果,整理了相关文献并创建了GitHub存储库,为研究人员和从业者提供有价值的资源,促进该领域的发展。

大型语言模型的数据集:综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-28T00:00:00Z

该调研总结了高效大型语言模型的研究成果,并创建了GitHub存储库,收集相关论文,为研究人员和从业者提供有价值的资源,推动该领域的发展。

构建最优的语言模型学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z

大型语言模型在自然语言理解、语言生成和复杂推理等任务中展示出卓越能力,但资源需求较高。该调研概述了高效大型语言模型的研究成果,并提供了相关论文的GitHub存储库,为研究人员和从业者提供有价值的资源。

科学文本处理的预训练语言模型综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-31T00:00:00Z

该调研总结了高效大型语言模型的研究成果,整理了相关文献并创建了GitHub存储库,为研究人员和从业者提供有价值的资源,促进该领域的研究进展。

ReSLLM:大型语言模型是联邦搜索的强大资源选择器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-31T00:00:00Z

该调研总结了高效大型语言模型的研究成果,整理了相关文献并创建了GitHub存储库,为研究人员和从业者提供有价值的资源,推动该领域的研究进展。

使用马尔可夫链蒙特卡洛从大型语言模型中恢复心智表征

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-30T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码