阿里健康推出AI助手“氢离子”,专注于低幻觉率和高循证能力,已完成内测并开放下载,主要服务于临床和科研医生,支持权威出处溯源,提升医疗决策准确性。
本研究通过QLoRA微调的LLM与检索增强生成技术,提高医疗决策支持系统的准确性和资源效率,同时关注患者隐私与数据安全。
本研究开发了KidneyTalk-open系统,旨在解决肾病医疗决策支持中大型语言模型的安全性和技术要求问题。该系统实现了无代码的开源部署,提高了医疗问答的准确性,降低了技术门槛,方便更多医疗人员和患者使用。
本研究提出了一种基于神经常微分方程(NODEs)的可解释深度学习方法,旨在解决医疗领域的“黑箱”决策问题,提高模型透明度和预测能力,为未来研究提供新方向。
本研究提出了一种新的医学语言模型Citrus,旨在解决医疗行业在疾病推理中专业知识获取的难题。Citrus模拟医疗专家的认知过程,通过训练合成的专家数据,提高医疗决策支持系统的准确性和效率,并开放医疗诊断对话数据集以促进后续研究。
OpenAI于2024年12月6日推出了一种新的强化微调方法,旨在通过少量数据构建专家模型,应用于医疗和科学决策等领域。该方法结合了人类反馈的强化学习,有效学习决策过程。尽管技术潜力巨大,但数据集中在非开源公司可能带来安全隐患。
麻省理工学院、谷歌研究院和首尔国立大学医院提出了医疗决策智能体(MDAgents)框架,通过动态分配大型语言模型(LLM)协作,提升医学任务的效率和准确性。MDAgents在七项基准测试中表现最佳,准确率提高4.2%,小组评审提升11.8%。该框架有效应对复杂医疗决策,展示了LLM在医学领域的应用潜力。
本文综述了可解释人工智能(XAI)在医学研究中的应用,强调其在提高医生信任和医疗决策中的重要性。研究分析了XAI的设计指南、透明度和可解释性对医疗模型的影响,并探讨了深度学习在医疗中的应用及其挑战。尽管已有进展,但仍需加强用户信任和数据合规性,以推动XAI在医学领域的有效实施。
本研究提出KARE框架,通过结合知识图谱的检索与推理,解决大型语言模型在医疗决策中的幻觉问题,并提升医学知识的细粒度。KARE利用多源知识图谱,提高信息检索的准确性和可解释性,实验结果显示其在死亡率和再入院预测方面优于现有模型。
本文介绍了多种医学数据集和工具的开发,旨在提高医疗数据的可解释性和交互性。研究内容包括心力衰竭和白内障患者的电子病历分析、医学图像的上下文数据集、会话式医疗视觉-语言模型XrayGPT,以及多模态医疗问题摘要数据集,强调了图像与文本结合在医疗决策中的重要性。
这篇论文综述了可解释人工智能(XAI)在医学研究中的应用,强调其在提高医生信任和改善医疗决策中的重要性。文章探讨了XAI方法的设计、评估及其在临床中的有效性,指出现有技术需改进,并呼吁加强医疗与人工智能专家的合作,以推动XAI的发展。
本研究探讨了现代神经模型在自动生成生物医学证据摘要中的效果。结果表明,生成的摘要流畅但准确性不一。通过优化输入片段和强调高质量试验,摘要的准确性有所提升。此外,研究提出了一个多模态医疗问题摘要数据集,结合图像辅助生成更详细的医疗摘要,以改善医疗决策和患者理解。
本文探讨了大型语言模型(LLM)在信息检索、医疗决策和用户隐私等领域的应用与挑战。研究表明,LLM能提高检索相关性和回答准确性,但在高风险环境中不应过度依赖。通过整合LLM与搜索引擎,提出了新的生成检索框架,验证了其在可靠性和可信性上的优势,并分析了LLM在Web界面信息检索中的表现,指出其潜力与改进空间。
研究表明,人工智能在医疗决策中的应用取得了一定进展,但仍需解决性能和公平性问题。大型语言模型在医学领域的应用能辅助决策、提高诊断准确性,但过度依赖可能导致临床医师技能下降,因此需加强伦理监管和优化整合策略,以确保安全有效使用。
数字孪生是将计算模型与物理模型相耦合的系统,通过双向数据流动态更新,具有预测能力。它在医疗决策、天气预测和工程流程等方面广泛应用。然而,实现数字孪生的全部潜力仍面临数学、统计和计算研究的差距,以及系统和转化挑战。数字孪生的未来应用包括医学研究、飞机发动机优化和气候预测。加强核查、验证和不确定性量化是数字孪生发展的关键。联邦机构应提供计算资源,并促进领域间的协作和数据模型的共享。
本研究评估了大型语言模型在安全生物医学自然语言推理中的鲁棒性,特别是在临床试验和医疗决策中的应用。结果显示,GPT-4的表现优于其他模型。研究还提出了新的评估框架和提示策略,以提升模型在医疗任务中的表现,并探讨了其在实际应用中的优势与挑战。
本文探讨了大型语言模型(LLMs)在医疗决策中的应用潜力,评估了BioMistral和MEDITRON等模型,发现它们能有效辅助医生,提高诊断准确性。研究强调提示设计的重要性,并指出多语言评估的必要性。通过开发医学对话模型,旨在改善医生与患者的沟通,推动医学领域发展。
本文介绍了一种基于13B Llama2的医学对话大型语言模型(LLM),其在PubMedQA中的准确度达到76.6%。该模型在生成SOAP笔记方面优于GPT-4,并能更好地捕捉医学概念。研究探讨了LLMs在医疗决策中的应用,强调提示设计对准确性的影响,并提出结合人类专家的方法以提高医疗文本注释的效率和准确性。
本研究评估了HIV患者病例的临床文本摘要可信度,提出了忠诚度和臆断率等新度量方式。结果表明,支持可追溯性的文本摘要结构在忠实性和质量上表现优越,且深度学习模型生成的摘要能有效提高医疗决策效率,减少错误。
研究表明,自2015年以来,人工智能在科研中的应用迅速增长,尤其在医疗决策中。AI论文的影响因子较高,但面临人才供需不平衡及种族、性别不公等问题。通过人类专业知识训练的AI模型能够提高预测能力,促进科学进步。研究还探讨了用户与AI的互动,发现不同水平用户对AI建议的依赖程度不同,强调了开发以人为本的AI算法的重要性。
完成下面两步后,将自动完成登录并继续当前操作。