小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ODKE+: 基于本体的开放领域知识提取与大型语言模型

ODKE+是一个高精度的开放领域知识提取系统,能够自动从网络中提取知识。它通过模块化组件检测缺失事实、收集证据,并应用混合知识提取方法,使用大型语言模型验证提取的事实。ODKE+支持批处理和流处理,处理超过900万维基百科页面,摄取1900万个高置信度事实,精度达到98.8%。该系统显著提高了知识图谱的覆盖率,并减少了更新延迟。

ODKE+: 基于本体的开放领域知识提取与大型语言模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-27T00:00:00Z

本研究提出了一种逐步事实验证系统,旨在改善传统医疗声明验证方法的不足。通过在三个医疗数据集上的评估,该系统在验证医疗声明时显著提升了性能,显示出其在特定领域的高潜力。

Step-by-Step Fact Verification System for Medical Claims with Explainable Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究探讨了大语言模型生成内容的事实验证中,去语境化与分解策略的相互作用。引入DnDScore方法后,发现不同策略选择对事实性得分有显著影响,为改进长文本生成的验证过程提供了新思路。

DnDScore: Decontextualization and Decomposition for Factuality Verification in Long-Form Text Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z
CommunityKG-RAG:利用知识图谱中的社区结构提升事实验证中的高级RAG

本文介绍了CommunityKG-RAG模型,该模型结合了知识图谱(KG)与图基RAG,旨在提升事实验证的准确性。通过社区结构和多跳信息探索,该模型改善了信息提取和上下文理解,实验结果表明其在事实验证任务中显著优于传统方法。

CommunityKG-RAG:利用知识图谱中的社区结构提升事实验证中的高级RAG

DEV Community
DEV Community · 2024-11-08T13:38:23Z

研究发现,合成数据可以替代90%的人类标注数据而不影响性能,但替换最后10%会显著降低性能。仅需125个人类数据点即可提升模型性能,说明少量人类数据仍然重要。

少量人类数据能发挥巨大作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本研究引入HalEval-Wild基准测试,评估大型语言模型(LLMs)在现实环境中产生幻觉的能力。通过分析用户查询和使用GPT-4模型,发现LLMs的事实性输出存在严重问题,GPT-3.5的准确率甚至不到25%。研究提出了一种新方法来检测幻觉,强调事实验证器的重要性,并探讨幻觉的来源及缓解策略,以提高LLMs的可靠性。

WildHallucinations: 用真实世界的实体查询评估 LLM 中的长篇事实准确性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-24T00:00:00Z

本文介绍了一种新的零射击方法,通过将声称和证据转化为语义三元组,利用大型语言模型进行自然语言推理,提升了多个数据集上的表现。同时,提出了新的数据集FactKG和多种生成方法,以提高事实验证的可靠性和有效性。研究表明,基于生成式语言模型的知识图谱构建方法在事实核查中表现优异。

FactGenius:结合零 - shot 提示和模糊关系挖掘提高知识图谱事实验证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z

本研究探讨了大型语言模型(LLM)的不确定性,发现较大模型可能表现出更高的不确定性,且指令微调会增加这种不确定性。提出了一种新的无参考幻觉检测方法,强调不确定性在评估中的重要性。研究表明,LLM在事实验证方面表现良好,能够执行多任务语言检查,为开发可信生成模型提供了见解。

通过令牌级别不确定性量化对大型语言模型的事实核查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-07T00:00:00Z

本研究提出了Iter-RetGen方法,通过检索和生成的迭代协同作用,全面处理检索到的知识,实现灵活生成,可在多跳问答、事实验证和常识推理等任务中达到优于现有基准的效果,同时减少开销,提高性能。

探索检索器和大型语言模型的整合策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码