患者隐私至关重要,医学领域需保持保密性。MIT研究表明,人工智能模型可能会记忆患者信息,存在泄露风险。研究团队开发了评估隐私风险的测试,强调保护患者数据的重要性,尤其是针对独特病症的患者。
本研究提出MEG方法,旨在解决大型语言模型在医学领域的知识相关性不足和高训练成本问题。通过轻量级映射网络整合图嵌入,MEG在四个医学数据集上提高了10.2%的准确率。
本文探讨了如何通过因子论证为贝叶斯网络推理提供自然语言解释,提出的算法优化了论证展示,增强了用户对推理的理解,尤其在医学领域优于传统方法。
本文介绍了MID-M框架,利用大规模语言模型的上下文学习能力,通过图像描述处理多模态数据。其性能与任务特定精调模型相当或更优,无需大量训练或预训练,参数更少,展示了通用模型在特定任务中的潜力。MID-M在数据质量问题上的稳健性证明了其在医学领域的实用性。
本研究提出了SurgicaL-CD方法,通过一致性蒸馏扩散生成高质量的手术图像,解决了医学领域标注数据集稀缺问题。在多个数据集上展现了优于GAN和传统扩散方法的表现,为计算机辅助手术系统的训练提供了新的思路和可能性。
大视觉语言模型(LVLMs)在医学领域的幻觉测试中表现出较差的稳健性,引发了对这些特定领域模型可靠性的担忧。这项研究提供了评估这些模型的途径。
本文介绍了使用SAM生成内窥镜帧的过度分割预测,并结合多个掩码获得准确的预测掩码。实验结果显示,组合的SAM预测结果在一定程度的破坏下具有改进的结果和鲁棒性。然而,在医学领域实施这些模型需要恰当的提示策略。
本文评估了检索增强型大型语言模型在生物医学任务中的影响,并在医学领域建立了四个测试组,测试了三个大型语言模型与三个检索器的性能。
本论文介绍了一种基于预训练掩码语言模型的条件联合建模框架,用于提高医学领域 ASR 系统的识别准确率。实验结果显示,该模型相对于基线模型在字典和会话样式语料库上有5%的绝对改进和10%的ASR输出优化。
最近的研究发现,利用在线数据来源中的图像对基础模型进行微调可以提高图像-文本建模的性能,特别在数字病理学的检索任务中表现更好。
该研究评估了医学领域的开源和闭源大型语言模型在临床试验报告数据集上的自然语言推理能力。Gemini模型在具有医学缩写和数量 - 定量推理要求的挑战性实例上表现良好,获得了0.748的F1分数,并在任务排行榜上位列第九。这是第一项全面检验大型语言模型在医学领域推理能力的研究。
调查了大型语言模型(LLMs)在医学领域的应用和挑战,介绍了LLMs的构建和下游性能,以及在临床实践中的利用和面临的挑战。调查为构建实际和有效的医学LLMs提供了有价值的资源。
研究比较了多模式表示学习在医学领域的效果,发现通用领域表示在医学领域具有可转移性,多模式对比训练不足够,学习细粒度特征有益处。研究结果表明多模式医学表示学习的有效性,并公开了代码。
医学领域中人工智能(AI)的道德整合需要解决公平性这个高度依赖上下文的概念。本文通过详细的证据缺口分析,系统地指出了医疗数据和 AI 公平解决方案中存在的一些缺陷。我们强调了在许多医学领域中 AI 公平研究的稀缺性。此外,我们分析还凸显了对群体公平的重要依赖,旨在从宏观医疗系统的角度确保人口统计群体之间的平等;相比之下,对于更精细化程度上的个人公平性常常被忽视了。为了填补这些间隙,我们的综述为医疗和 AI 研究社区提出了可操作的策略。除了在医疗中应用现有的 AI 公平方法,我们进一步强调了将医疗专业人员纳入其中,以完善 AI 公平概念和方法,以确保 AI 在医疗领域中具有上下文相关性和道德健全性。
本文评估了医学领域的开源和闭源大型语言模型在临床试验报告数据集上的自然语言推理能力,并分析了它们在具有医学缩写和数量 - 定量推理要求的挑战性实例上的表现。Gemini模型在测试集上获得了0.748的F1分数,排名第九。这是第一项全面检验大型语言模型在医学领域推理能力的研究。
通过自然语言处理和多模态范式,ChatGPT 加快了医学领域问题回答的进展。它处理了医学环境下大规模、多样化、不平衡或无标签数据分析的场景,并在不同任务和数据集中应用。当前的挑战和未来医学领域研究提供了机遇和创新。
本研究提出并评估了一种综合人工智能在医学领域的框架(HAIM),以促进利用多模态输入实现人工智能系统的生成和测试。该框架可在医疗保健环境中进行研究和部署,并通过使用Shapley值量化每个模态和数据源的贡献,展示了多模态输入在不同医疗任务中的必要性。
该研究提出了一种基于自监督遮掩采样蒸馏方法的视觉Transformer,在医学领域的各种任务中表现出较好的性能和隐私保护能力。
该论文综述了198篇医疗决策支持的可解释人工智能解决方案,大多数采用了模型无关的可解释人工智能技术,深度学习模型被广泛应用。需要加强医疗和人工智能专家之间的合作,以指导可解释人工智能解决方案在医学领域的设计、实施和评估。
该研究评估了联邦学习在医学领域的应用,结果显示联邦学习模型总体表现优于单个客户数据训练的模型,但使用更多客户训练的模型表现较差。联邦学习训练的模型在客户数据独立同分布的情况下表现接近,但在非独立同分布数据下有明显差距。
完成下面两步后,将自动完成登录并继续当前操作。