本研究提出了一种新的端对端变压器方法GIT-CXR,用于生成胸部X射线报告,旨在解决报告生成的耗时和专业化问题。实验结果表明,该方法在临床准确性指标上表现优异,可能提升患者护理的标准化水平。
本研究解决了医疗环境中多模态数据整合和标签稀缺的挑战。我们深入评估了新提出的多模态变分混合专家(MMVM)变分自编码器(VAE),结果表明其在MIMIC-CXR数据集上的表现优于其他多模态VAE和完全监督的方法,展示了其在实际医疗应用中的强大潜力。
该研究提出了一种基于深度卷积神经网络的多标签分类框架,能够预测14种胸部疾病的风险,并引入标签平滑技术处理不确定样本。模型在超过20万的数据集上训练,平均AUC分数达到0.940,优于多位医学专家。此外,研究还探索了多实例学习和广义零样学习等方法,提升了胸部X射线图像的分类和定位能力。
MedXChat是一个用于医学助理和用户之间互动的模型,包括CXR到报告生成、基于CXR的问答和文本到CXR合成三个功能。该模型在医学多模态应用中表现出优异的适应性,并在MIMIC数据集上超越了基准模型。研究还介绍了一种创新的文本到CXR合成方法,能够生成高保真度的医学图像。研究中的数据和模型将开源。
BarlowTwins-CXR 通过自监督学习策略显著提高了胸部 X 射线图像异常定位的效率和准确性,超越了传统的迁移学习方法,并有效地解决了跨域场景中的领域不一致问题。我们的实验结果表明,利用自监督学习可以提高在医学环境中具有有限异构数据的模型的泛化能力。
本研究提出了一种策略来克服大规模自然-医学分布偏移,并使用预先训练的潜在扩散模型在公开可用的胸部X射线(CXR)及其对应的放射学(文本)报告语料库上进行调整,评估了生成的高保真CXR的图像质量和文本-图像对齐的能力,并观察到使用数据增强的方式训练动态成像分类器的证据。
COVID-Net CXR-2是一种新型的深度卷积神经网络,用于检测COVID-19。该网络在19203幅CXR图像的基准数据集上进行了研究,具有95.5%的灵敏度和97.0%的阳性预测值。
本文研究了利用大规模图像-文本配对数据集进行视觉语言预训练模型的发展,解决医疗领域中缺乏数据的问题,并通过扩展图像-标签对为图像-文本对,利用多个图像和多个部分的放射学报告来提高模型性能。同时设计了两个对比损失,ICL和TCL,来学习医学图像和报告的研究级特征。该模型在相同条件下优于现有的最先进模型。
完成下面两步后,将自动完成登录并继续当前操作。