CoRTEx:通过解释的对比学习来表示术语及其在构建生物医学知识图谱中的应用
原文约500字/词,阅读约需2分钟。发表于: 。通过利用大型语言模型的世界知识,我们提出了一种通过解释来增强术语表示并显著改进术语聚类的对比学习方法(CoRTEx),并通过修改的 BIRCH 算法将 Biomedical Informatics Ontology System (BIOS) 中的 35580932 个术语分成 22104559 个聚类,证明了 CoRTEx 在处理大规模生物医学本体术语聚类方面的优越性。
本研究探讨了大型语言模型在补充生物医学知识图谱中的潜力,并通过改进的对比学习、自蒸馏和权重平均化阶段获得高保真度的生物医学概念和句子表示。与以往技术相比,在多个任务上性能显著提升。发布了与多种语言兼容的多语言模型,为临床流程和生物信息学研究人员提供了宝贵工具。希望BioLORD-2023成为未来生物医学应用的宝贵工具。