小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

近年来,医学领域面临大语言模型应用的挑战。牛津、卡内基梅隆和爱丁堡大学联合提出的MedGraphRAG方法,通过生成循证回答和医学术语解释,显著提升了模型在医学问答中的表现,确保了回答的可信度和准确性。该研究已入选ACL 2025。

ACL 2025丨牛津大学等提出医学GraphRAG,刷新问答准确性记录,在11个数据集评测上达SOTA

HyperAI超神经
HyperAI超神经 · 2025-08-18T03:04:12Z
Qdrant在研究中的应用:ETH与斯坦福大学MIRIAD数据集的背后故事

ETH苏黎世和斯坦福大学的研究人员发布了MIRIAD,一个包含580万医学问答对的开源数据集,旨在解决医学领域数据不足的问题。该数据集基于900,000篇同行评审文献,经过多阶段过滤以确保数据质量,能显著减少医学AI中的幻觉现象,提升其可靠性和应用。研究者计划每年更新MIRIAD,以促进医学AI系统的发展。

Qdrant在研究中的应用:ETH与斯坦福大学MIRIAD数据集的背后故事

Qdrant - Vector Database
Qdrant - Vector Database · 2025-07-22T22:00:00Z

本研究探讨了在隐私限制下,日本医学问答中基于知识图谱的检索增强生成框架(KG-based RAG)的有效性。结果表明,KG-based RAG对小规模开源LLMs的影响有限,效果依赖于外部检索内容的质量和相关性。

Exploring the Role of Knowledge Graph-based RAG in Japanese Medical Q&A

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

本研究评估了检索增强生成(RAG)模型在医学问答系统中的偏见,特别关注种族、性别和健康社会决定因素。通过分析MMLU和MedMCQA数据集,发现RAG管道存在显著的人口统计差异,强调了公平性在临床决策中的重要性。

Evaluating Bias in Retrieval-Augmented Medical Question-Answering Systems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

蚂蚁医疗大模型在MedBench评测中获得双料冠军,得分分别为97.5和98.2。该模型在医学问答和语言生成等领域表现出色,具备多模态交互能力。自2023年进入医疗AI领域以来,已服务近3000万人次,推动了多个智能医疗应用的研发。

蚂蚁医疗大模型拿下MedBench测评“双料”冠军,原生多模态+千亿数据

量子位
量子位 · 2025-03-12T08:47:56Z

本研究提出了MedAgentsBench基准,旨在评估复杂医学推理的不足,尤其是在多步骤临床推理和诊断形成方面。实验结果表明,最新的思维模型在这些任务中表现优异,而高级搜索代理方法具有较高的性价比,推动了医学问答领域的发展。

MedAgentsBench: Benchmarking Thinking Models and Agent Frameworks for Complex Medical Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究提出了MedBioLM模型,通过微调和检索增强生成技术,提高医学与生物学问答的准确性和可靠性,显示出大型语言模型在生物医学研究和临床决策支持中的重要潜力。

MedBioLM: Optimizing Medical and Biological Question Answering through Fine-Tuning Large Language Models and Retrieval-Augmented Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-05T00:00:00Z

本研究提出K-COMP方法,旨在解决医学领域问答中的理解困难。通过自动生成先验知识并与压缩文献结合,显著提高了问答模型的准确性和信任度。

K-COMP: Retrieval-Augmented Medical Domain Question Answering with Knowledge-Injected Compressor

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究探讨了大语言模型和视觉语言模型在医学问答中的适应性,结果显示其表现不及基础模型,尤其在零样本和少样本条件下。未来研究需加强相关方法。

大型语言和视觉语言模型的医学适应性:我们取得进展了吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z

本研究介绍了MedLogic-AQA,一种创新的医学问答系统,旨在解决复杂医疗查询中逻辑理解不足的问题。通过提取一阶逻辑规则,系统生成更准确的答案。实验结果表明,该方法显著提高了问答质量。

MedLogic-AQA:基于逻辑结构增强医学问答的抽象模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-20T00:00:00Z

该研究评估了GPT-4V在医学图像任务中的能力,发现其在为胸部X射线图像生成描述性报告方面有潜力,但在某些评估指标上仍需改进。在医学问答方面,GPT-4V在问题类型上表现熟练,但准确性不如现有基准。在视觉基础领域,GPT-4V在识别边界框方面显示了潜力,但精度不够。评估强调了GPT-4V在医学图像领域的潜力,但需要改进来充分发挥其能力。

HuatuoGPT-Vision,面向大规模注入医学视觉知识的多模态语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

该研究评估了GPT-4V在医学图像任务中的能力,发现其在生成胸部X射线图像描述性报告方面有潜力,但仍需改进。在医学问答方面,GPT-4V在问题类型上表现熟练,但准确性不及现有基准。在视觉基础领域,GPT-4V在识别边界框方面显示潜力,但精度不够。评估强调了GPT-4V在医学图像领域的潜力,但需要改进来充分发挥其能力。

利用 GPT-4V (ision) 进行保险业的初步探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-15T00:00:00Z

介绍了Dr. LLaMA,一种通过使用大型语言模型进行生成式数据增强的方法,改善小型语言模型在医学问答任务和PubMedQA数据集上的性能。研究表明,LLMs可以有效改善和多样化问题-答案对,提高规模更小的模型在领域特定QA数据集上的性能。研究强调了在领域特定问答任务中使用LLMs所面临的挑战,并提出了解决这些限制的潜在研究方向,以创建更高效、更有能力的专门应用模型。

使用 LLMs 的数据增强:数据视角、学习范式和挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

该研究评估了GPT-4V在医学图像任务中的能力,发现其在为胸部X射线图像生成描述性报告方面有潜力,但在某些评估指标上仍需改进。在医学问答方面,GPT-4V在问题类型上表现熟练,但准确性不如现有基准。在视觉基础领域,GPT-4V在识别边界框方面显示了潜力,但精度不够。评估强调了GPT-4V在医学图像领域的潜力,但需要改进来充分发挥其能力。

GigaPevt: 多模式医疗助理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-26T00:00:00Z

该论文评估了GPT-4V在医学图像任务中的能力,发现其在生成胸部X射线图像描述性报告方面有潜力,但仍需改进。在医学问答方面,GPT-4V在问题类型上表现熟练,但准确性不及现有基准。在视觉基础领域,GPT-4V在识别边界框方面显示潜力,但精度不够。评估强调了GPT-4V在医学图像领域的潜力,但需要改进来充分发挥其能力。

GPT-4 视觉在医学中的专家级准确性背后的隐藏缺陷

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-16T00:00:00Z

该论文评估了GPT-4V在医学图像任务中的能力,发现其在生成胸部X射线图像描述性报告方面有潜力,但在某些评估指标上仍需改进。在医学问答方面,GPT-4V在问题类型上表现熟练,但准确性不如现有基准。在视觉基础领域,GPT-4V在识别边界框方面显示潜力,但精度不够。评估强调了GPT-4V在医学图像领域的潜力,但需要改进来充分发挥其能力。

GPT-4V (ision) 是文本生成三维图像的人类对齐评估器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-08T00:00:00Z

本论文评估了GPT-4V在医学图像任务中的能力,发现其在生成胸部X射线图像描述性报告方面有潜力,但仍需改进。在医学问答方面,GPT-4V在问题类型上表现熟练,但准确性不及现有基准。在视觉基础领域,GPT-4V在识别边界框方面显示潜力,但精度不够。评估强调了GPT-4V在医学图像领域的潜力,但需要改进来充分发挥其能力。

GPT-4V 带情感属性:多模态情感理解的零样本基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-07T00:00:00Z

研究人员在医学问答中使用多代理辩论策略取得了重要进展,并提供了全面基准和开源实现。他们探索了不同策略之间的权衡,并提出了一种新的辩论刺激策略,取得了更好的结果。

我们疯了吗?医学问答中语言模型的多智体辩论基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-29T00:00:00Z

本论文评估了GPT-4V在医学图像任务中的能力,发现其在生成胸部X射线图像描述性报告方面有潜力,但仍需改进。在医学问答方面,GPT-4V在问题类型上表现熟练,但准确性不如现有基准。在视觉基础领域,GPT-4V在识别边界框方面显示潜力,但精度不够。评估强调了GPT-4V在医学图像领域的潜力,但需要改进来充分发挥其能力。

GPT4Vis:GPT-4 能为零样本视觉识别做什么?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-27T00:00:00Z

该论文评估了GPT-4V在医学图像任务中的能力,发现其在生成胸部X射线图像描述方面有潜力,但仍需改进。在医学问答方面,GPT-4V在问题类型上表现熟练,但准确性不如现有基准。在视觉基础领域,GPT-4V在识别边界框方面显示潜力,但精度不够。评估强调了GPT-4V在医学图像领域的潜力,但需要改进来充分发挥其能力。

利用 GPT-4 增强医学文本评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码