利用大型语言模型加速临床证据综合
原文中文,约500字,阅读约需2分钟。发表于: 。利用 TrialMind 等基于 LLMs 的人工智能模型,我们介绍了一种为进行医学系统评价而设计的生成型 AI 流水线。通过结合人类专家的监督,我们证明了 TrialMind 显著提高了文献综述的过程,并在从超过 2000 万篇 PubMed 文章中搜索研究、筛选研究和提取结果的过程中取得了优异的性能。结果还显示,与 GPT-4 基准相比,八位人类评估者更喜欢...
本研究使用精细调整的大型语言模型(LLMs)自动化系统性文献综述(SLRs),展示了一种实用高效的自动化SLR过程的方法。研究结果验证了LLM的准确性,并提出了解决虚幻感和追踪信息来源的机制。该研究呼吁更新PRISMA报告指南以整合AI驱动的过程,拓宽了AI在学术和研究领域的应用。