本研究探讨了在资源有限的俄语中实现临床编码自动化的可行性。我们提供了一个新的ICD编码数据集,包括从电子健康记录中注释的诊断字段,具有超过10,000个实体和1,500多个独特的ICD代码,实验表明在经过训练的自动化预测代码下,准确性显著提高,展示了在资源有限语言中实现临床编码自动化的潜力。
大规模视觉-语言模型在生成文本时常出现幻觉问题。为解决此问题,本文提出了指令对比解码(ICD)方法,通过对比标准和干扰指令的分布,减少幻觉现象。实验表明,ICD有效降低了物体和属性级别的幻觉,并提升了模型的识别能力。
本研究解决了ICD编码中因人口统计因素和专家偏见造成的标签不平衡和虚假相关问题。提出了一种名为DECI的新方法,通过因果推断模型以三条不同路径进行预测,从而减少这些偏见。实验结果表明,DECI在准确无偏的ICD编码方面优于现有先进模型,具有显著进步。
该论文介绍了一种新的自动ICD编码方法,使用了基于Transformer的文本编码模型,并探索了将基本编码模型调整为Longformer或将文本分成块处理的方法。实验结果显示,该方法在ICD编码方面优于当前最先进的模型,并且标签嵌入有助于提高性能。该方法还导致适当校准的分类结果,可用于下游任务如数量化。
本文提出了一种通用多任务框架,用于预测疾病发病率,结合了结构化信息和文本医疗笔记。该方法不需要特定于疾病的特征工程,能够处理文本中的否定和数值。在100万名患者的队列中,使用文本的模型优于仅使用结构化数据的模型,并能够使用文本中的数值和否定,提高预测性能。同时比较了医疗专业人员用于解释模型预测的不同可视化方法。
该论文介绍了一种新的自动ICD编码方法,使用了基于Transformer的文本编码模型,并探索了将模型调整为Longformer或将文本分块处理的方法。实验结果表明,该方法在ICD编码方面优于当前最先进的模型,并且标签嵌入有助于提高性能。该方法还导致适当校准的分类结果,可用于下游任务。
完成下面两步后,将自动完成登录并继续当前操作。