小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
语言模型的蜂巢思维

论文探讨了语言模型的“蜂巢思维”现象,指出不同模型在开放式问题上的回答高度相似,导致输出同质化。研究构建了Infinity-Chat数据集,分析了模型间的语义重合度,发现模型训练和奖励模型的校准问题是同质化的主要原因。长期使用同质化工具可能缩小用户思维框架,因此需在训练层面保障输出多样性。

语言模型的蜂巢思维

Finisky Garden
Finisky Garden · 2026-04-17T00:32:21Z

本研究提出了一种好奇心驱动的强化学习框架(CD-RLHF),旨在解决人类反馈强化学习中输出多样性降低的问题。实验结果表明,CD-RLHF在多个任务上显著提升了输出多样性,同时与人类偏好的对齐效果相当。

Curiosity-Driven Reinforcement Learning Based on Human Feedback

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z

本研究通过增加随机性、促进多样化视角的回答和整合多个模型输出,显著提升了大型语言模型的输出多样性,达到了人类水平,对AI政策具有重要意义。

生成多样性:提升大型语言模型的输出多样性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

本文提出了一种名为 FECS 的新解码方法,用于解决自然语言生成任务中的幻觉问题。该方法通过上下文感知的正则化项来增强语义上与来源相似的标记,同时惩罚生成文本的重复性。在抽象化摘要和对话生成两个任务中,FECS 显示出了有效性。结果表明,FECS 能够持续提升忠实度,同时保持输出多样性。

丰富保真度的对比搜索:在文本生成中协调忠实度与多样性的权衡

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码