小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

腾讯的7B模型通过RLVER框架解决了AI情商的三大困境,得分从13.3提升至79.2,表现与顶级模型相当。RLVER利用用户模拟器优化多轮对话,增强模型的情感理解和共情能力,避免了灾难性遗忘。

7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍

量子位
量子位 · 2025-07-18T08:32:19Z

阿里通义实验室推出MaskSearch框架,提升大模型推理与搜索能力。小模型表现接近大模型,兼容监督微调和强化学习,显著提升开放域问答性能。通过检索增强型掩码预测任务,模型有效学习信息处理与搜索引擎使用,适应多领域任务。

阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升

量子位
量子位 · 2025-05-31T04:07:36Z

本研究针对现有的开放域问答系统在提示指令依赖性、计算开销大及检索覆盖不足等问题,提出了EmbQA嵌入框架。该框架通过改进查询表示和引入多样化候选生成机制,显著提高了系统的准确性和效率,展示了在多个基准测试中的优越表现。

超越提示:一种高效的开放域问答嵌入框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-03T00:00:00Z
TOMG-Bench:大语言模型开放域分子生成新基准

科学家提出了新的基准测试TOMG-Bench,用于评估大型语言模型(LLM)在分子领域的生成能力。该基准涵盖分子编辑、优化和定制生成三个主要任务,旨在克服传统分子发现方法的局限性,推动LLM在该领域的应用。实验结果表明,开源模型在分子生成任务中表现优异,TOMG-Bench为评估LLM提供了新的视角。

TOMG-Bench:大语言模型开放域分子生成新基准

机器之心
机器之心 · 2025-02-18T08:25:10Z

本研究提出了一种ARM方法,解决了传统大语言模型在开放域问题检索中的低效,通过探索数据对象关系显著提升了检索效果,证明了其在复合问题中的重要性。

Can We Retrieve All Information at Once? ARM: An Alignment-Based Retrieval Method Using Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-30T00:00:00Z

本研究解决了房地产领域缺乏专用表格问答数据集的问题,推出了RETQA,这是首个大规模的开放域中文表格问答数据集。通过提出SLUTQA框架,结合大型语言模型与口语理解任务,显著提升了在该领域的问答准确性,推动了表格问答研究的发展。

RETQA:房地产领域的大规模开放域表格问答数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-13T00:00:00Z

图像识别是计算机视觉的基础任务,广泛应用于人脸和商品识别。PP-ShiTuV2是一个通用图像识别系统,包含主体检测、特征学习和向量检索模块,显著提升了细粒度识别效果,特别适合快速更新的零售商品识别。

基于PP-ShiTuv2新增PaddleX图像识别模型产线,显著提升商品识别等细粒度开放域产业场景检索性能...

百度大脑
百度大脑 · 2024-11-20T11:40:28Z

本研究探讨开放域对话系统如何利用无结构文本作为外部知识源,指出现有系统在生成丰富回复和控制对话主题方面的不足。定义了无结构文本增强对话系统(UTEDS),总结相关数据集和模型,强调其对未来研究的重要性。

无结构文本增强开放域对话系统:系统性调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究针对单目开放域图像的3D几何恢复问题,提出了一种新颖的模型MoGe。该模型通过采用不受全局尺度和偏移影响的仿射不变表示,从单幅图像直接预测3D点图,使训练监督更加明确,从而提升几何学习的效果。实验证明,MoGe在各种未见数据集上显著超越了现有最先进的方法,展现出较强的泛化能力和高精确度。

MoGe:通过最优训练监督解锁开放域图像的准确单目几何估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

该研究探讨了在线持续学习中的图像分类问题,比较了MIR、iCARL和GDumb等多种方法,发现MIR表现优异。同时评估了CLIP模型在不同设置下的持续学习能力,提出了新算法CTP和CDCL,以解决忘却和分布漂移问题,展示了良好的性能。

通过利用领域内类别感知原型增强开放域持续学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z

本研究针对开放域问答中大语言模型无法仅依赖内部知识生成正确答案的问题,提出了W-RAG方法。该方法利用大语言模型的排名能力生成弱标签数据,优化密集检索器的训练。实验结果表明,该方法显著提升了检索和问答的性能。

W-RAG:用于开放域问答的弱监督密集检索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

本研究提出了一种新颖的句子选择方法(FastFiD),用于解决开放域问答中推理效率低的问题。实验证明,该方法在保持模型性能的情况下,推理速度提升了2.3至5.7倍。

FastFiD:通过句子选择提高开放域问答的推理效率

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

本文介绍了MVDream,一个多视图扩散模型,能够根据文本提示生成几何一致的多视图图像。该模型结合了大规模Web数据集的预训练图像扩散模型和3D资源,解决了现有2D-lifting方法中的3D一致性问题,提升了生成的稳定性,并可在少量样本下微调,实现个性化3D生成。

DreamStory: 基于 LLM 引导的多主题一致扩散的开放域故事可视化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z

本文介绍了一种结合语言模型与知识的问答方法,旨在提高开放域问题回答的性能。通过整合结构化和非结构化知识,提出了统一的知识模型,显著提升了问答系统的准确性和效率。研究开发的KGQAn系统能够灵活处理不同知识图谱,表现优于现有系统,实验结果在多个基准测试中取得了优异成绩。

信任 UQA:统一结构化数据问答的可信框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

本文探讨了大型语言模型(LLMs)在推理和分类任务中的表现,指出不同提示策略对模型准确性有显著影响。研究显示,LLMs在教育和人机交互领域具有潜力,但在解决现实问题时存在局限。通过强化学习和视觉语言模型微调,提升了对话系统的性能。此外,生成式LLMs在机器翻译中表现优异,能够优化翻译的细微差别。

基于大型语言模型的零射击提示在开放域人机对话中的角色扮演

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-26T00:00:00Z

提出了一种称为问题和路径增强的简单而有效的方法,通过对原始问题进行多步子问题的扩充和规划,从而提升检索性能,以及通过语言模型生成的自我生成路径来指导答案抽取,实验证明该方案优于现有技术且在现有的检索 - 生成模型中实现了显著的性能提升。

基于 LLMs 的增强查询和段落的开放域问答检索增强生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

本研究提出了一种基于自我对话模型的评估方法,旨在提高不同注释人员之间的鲁棒性。实验表明,学习指标PONE显著提高了与人类判断的相关性。此外,研究评估了多种自动评估度量,提出了无参考评估器和BERT微调方法,以改进对话响应生成系统的评估性能,结果显示与人类判断的相关性较强。

PairEval:使用配对比较进行开放域对话评价

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-01T00:00:00Z

本文探讨了抽象意义表示(AMR)在神经对话建模中的应用,提出了一种基于语义的预训练框架,以提升对话理解和响应生成的效果。研究表明,结合多模态信息和情感知识的对话型大型语言模型在情感识别方面表现优异。此外,构建的方言生成数据集用于评估基于大型语言模型的评估器的可靠性。

结构化信息的重要性:将抽象意义表示引入到 LLMs 中以提高开放域对话评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-01T00:00:00Z

本文提出了“视觉实体匹配”学习问题,旨在克服现有图像分类和检索算法的局限性。研究建立了人脸识别基准任务,识别100万张面部图像并链接实体,同时介绍了Flickr30k和EuroCity Persons等数据集,以推动自动图像描述和对象检测的发展。

Entity6K:用于真实世界实体识别的大型开放域评估数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-19T00:00:00Z

强化学习从人类反馈(RLHF)和来自AI反馈的强化学习(RLAIF)在大型语言模型优化中表现相似。研究表明,RLAIF在摘要任务中效果与RLHF相当,并能解决RLHF的可扩展性问题。通过不断更新偏好模型和强化学习策略,RLAIF有效提升了模型性能,强调了人类反馈在AI对齐中的重要性。

HRLAIF:通过 AI 反馈在开放域强化学习中的有用性和无害性改进

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码