小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种基于框架语义的自动事实检查新方法,旨在应对虚假信息问题。通过使用真实世界声明的数据集,验证了框架语义在提升证据检索效率方面的有效性。

基于框架语义的自动事实检查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究探讨了大型语言模型在答案可信度归因中的不足,提出了一种新方法,通过优化答案段落和证据检索,提升了答案归因性能,具有重要的应用潜力。

增强大语言模型的文本生成中的答案归因可信度

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-22T00:00:00Z

本研究介绍了HerO系统,用于AVeriTeC任务的自动化事实核查。HerO利用公开的大语言模型,提高了证据检索和真实性预测的效率,并在排行榜中获得第二名,展示了其在验证现实世界声明方面的潜力。

HerO在AVeriTeC:开放大语言模型的群体验证现实世界声明

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本文介绍了一个自动化事实核查平台,能够检索证据并预测其支持或反驳声明的能力。用户研究显示,该平台的预测正确率为58%,相关证据占59%。研究探讨了AI工具在事实核查中的应用,提出了多种设计理念以提高效率,并展示了大型语言模型在主张匹配中的有效性。

洛基:一个开源的事实验证工具

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面存在挑战。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

将人置于大型语言模型的视角:通过问题重写器生成更好的答案

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-20T00:00:00Z

本研究通过简化证据检索和利用结构化知识图谱,解决了自然语言处理中事实验证困难的问题,提高了效率和效果。

事实还是虚构?通过简化子图检索提高事实验证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-14T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面落后于10个以上的点。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

我有了 “答案”!问答中 LLMs 隐藏状态的解释

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-04T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面存在挑战。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

xFinder:大型语言模型的稳健精确定位答案提取

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-20T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面落后。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

评价信息抽取中的生成式语言模型作为主观问题纠正

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-04T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面存在挑战。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

让 LLMs 应对最新挑战!一个中文动态问答基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-29T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面落后。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

WSDM Cup 2024 的第一名解决方案:利用大型语言模型进行对话式多文档问答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-28T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面落后。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

LLM 中能否生成与文化相关的常识问答数据?印尼文和巽他语案例研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面落后于10个以上的点。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

SPARQL 生成:对于在生命科学知识图谱上进行问答的 OpenLLaMA 微调分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-07T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下表现优于现有技术,但在抽取性问答方面落后于10个以上的点。研究还强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

用于语义缓存测试输入生成的 LLM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-16T00:00:00Z

该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面落后于10个以上的点。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。

通过问答探究语言模型对结构化语义理解和生成的能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-11T00:00:00Z

介绍了DialFact测试基准数据集,用于对话中的事实核查。数据集包含对话声明和维基百科证据片段,并提出了三个子任务。文章提出了一种简单高效的解决方案,以提高对话中的事实核查性能。

通过行为微调提高信息查找对话的事实准确性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-16T00:00:00Z

该研究使用NLP技术开发了临床试验数据的证据检索和自然语言推理系统。系统包括Pipeline和Joint两个部分,并采用集成学习方法进行结果分析。

Nonet 参加 SemEval-2023 任务六:法律评估方法学

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-17T00:00:00Z

CB-ANLI是一种自然语言推理模型,可以进行多次跳跃推理和证据检索,对下游推理任务的稳健性和准确性具有直接影响。实证评估结果表明,CB-ANLI在常识和科学问答任务上表现良好,并提高了最具挑战性的解释的质量。

关于归纳性自然语言推理的自洽叙述提示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码