小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种自动生成基于上下文的问答对的方法,旨在提升大型语言模型在复杂推理和实时知识整合方面的能力。实验结果显示,该方法在逻辑一致性和事实准确性上优于传统的人类标注问答对。

Automatic Dataset Generation for Knowledge-Intensive Question Answering Tasks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了EnronQA基准,包含103,638封电子邮件和528,304个问答对,旨在改善私人文档的个性化检索,探讨记忆与检索的权衡,以提升企业对客户隐私文件的理解与使用效率。

EnronQA: Towards Personalized Retrieval-Augmented Generation for Private Documents

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究提出NativQA框架,旨在解决大型语言模型在多语言和文化背景下的公平性问题。该框架结合用户查询与搜索引擎,生成了30万个问答对,为模型基准测试提供了资源。

NativQA Framework: Empowering Large Language Models with Local and Everyday Knowledge

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z
通过微调重排序器提升信息检索

RAG(检索增强生成)结合向量数据库与大语言模型,虽然易用但难以掌握。通过优化重排序器提升检索结果质量,确保信息在上下文窗口内,从而改善响应准确性。BAAI的预训练Cross-Encoder模型可用于重排序任务,帮助区分相关与不相关的问答对,成功依赖于持续的实验与迭代。

通过微调重排序器提升信息检索

Redis Blog
Redis Blog · 2025-03-31T00:00:00Z

本研究提出了一种新的分子理解基准,解决了现有方法偏重描述性的问题。通过自然语言处理技术,展示了模型的指称能力,并提供了79,000个问答对的基准,显著优于现有模型。

Molecular Foundation: A Benchmark Based on Molecular Understanding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了PeerQA数据集,包含579个科学文档的问答对,旨在解决评审过程中的问题与回答不足。实验结果表明,去上下文化的方法提升了文档检索性能,为长上下文建模提供了具有挑战性的基准。

PeerQA:来自同行评审的科学问题回答数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z

本文介绍了LongViTU,一个包含121,000个问答对和900小时视频的大规模自动生成数据集,旨在提升长视频理解能力。通过层次树结构和自我修正机制,确保数据集的高质量。研究表明,基于LongViTU的微调显著提升了视频理解模型的性能,展示了其实际应用潜力。

LongViTU:用于长视频理解的指令调优

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出了LongDocURL基准,旨在解决长文档理解和布局元素定位的不足。该基准涵盖长文档理解、数值推理和跨元素定位,收集了超过33,000页文档的高质量问答对,显著提升了文档理解性能。

LongDocURL: A Comprehensive Multimodal Benchmark Framework for Long Document Understanding, Reasoning, and Localization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本文探讨了如何利用大型语言模型(LLMs)增强制造任务指导系统的数据,以填补复杂任务理解的空白。研究建立了20万个问答对的数据集,评估了多种开源LLMs的表现,发现其在理解程序规范和时间序列操作方面具有潜力。

QA Toolbox: Conversational Q&A for Manufacturing Process Task Guidance

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

本研究探讨了大型语言模型(LLM)的评估方法,提出通过预测未来事件和生成问答对进行连续评估。研究表明,LLM的性能随时间下降,强调了持续更新模型的重要性。

Are Large Language Models Prescient? A Continuous Evaluation Based on Daily News

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z

本文介绍了TAT-DQA数据集,包含来自财务报告的半结构化表格和非结构化文本,以及16558个问答对。作者提出的MHST模型能够有效处理多模态信息,回答不同问题。尽管该模型优于基线方法,但仍未达到专家水平,旨在推动视觉与语言融合的研究。

M3DocRAG:多模态检索是您进行多页多文档理解所需的

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

提出了一种用于稠密检索的文本增强框架 QAEA-DR,通过生成问答对和元素驱动事件的两种文本表示,解决了长文本导致的信息丢失和低质量文本与相关查询的匹配问题。该框架通过评分和重生成机制提高生成文本的质量,在稠密检索中具有积极影响,并得到了理论分析和实证实验的支持。

QAEA-DR:稠密检索统一文本增强框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z

TAT-DQA是一个包含16558个财务报告问答对的新数据集。作者提出了一种名为MHST的文档VQA模型,可以智能地处理多模态信息,并使用离散推理进行训练。结果显示,该模型优于基线方法,但仍落后于专家人类。作者希望通过提供新的数据集促进对融合视觉和语言的文档理解的研究。

JDocQA: 用于生成语言模型的日语文档问答数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码