本研究指出现有编辑方法在提升大型语言模型对长尾生物医学知识理解方面的局限,尽管有所改善,但仍需针对性策略以缩小表现差距。
本研究探讨了大型语言模型生成的生物医学知识的真实性,并提出了一种评估生成内容准确性的计算方法。结果表明,疾病术语、药物名称和遗传信息的识别准确性较高,而症状术语的识别准确性较低,为生物医学知识生成的可靠性提供了新视角。
大语言模型Y-Mol在药物研发中展现出强大能力,解决了领域知识不足和数据获取难题,提升了药物-靶标及药物-药物相互作用的预测性能,为药物研发提供了新工具。
本研究提出了一种基于BERT模型和条件随机场的端到端方法,从临床记录中提取生物医学知识,准确率分别为90.7%和88%。研究比较了多种关系提取方法,发现基于transformers的模型表现优越。同时,构建了知识图谱,探讨阿尔茨海默病与化学物质的关系,并提出了自动构建知识图谱的方法,展示了其应用和未来挑战。
完成下面两步后,将自动完成登录并继续当前操作。