d[IA]gnosis:使用嵌入式Python和大型语言模型进行诊断向量化
💡
原文英文,约800词,阅读约需3分钟。
📝
内容提要
本文介绍了使用InterSystems IRIS for Health生成ICD-10代码列表向量的工具,并使用预训练的语言模型进行存储和相似性搜索。文章还提到了使用Python库SentenceTransformers进行向量生成,下载了BioLORD-2023-M预训练模型,并将ICD-10代码向量化并更新到数据库中。最后,将Python代码包装成一个类,并与IRIS for Health集成。下一篇文章将介绍如何将Angular 17开发的前端应用与IRIS for Health集成,并进行文本分析和ICD-10代码相似性搜索。
🎯
关键要点
- 本文介绍了使用InterSystems IRIS for Health生成ICD-10代码列表向量的工具。
- 使用预训练的语言模型进行存储和相似性搜索。
- 采用Python库SentenceTransformers进行向量生成。
- 下载BioLORD-2023-M预训练模型以生成786维向量。
- BioLORD模型通过定义和多关系知识图谱提高了医学概念的语义表示。
- 使用SQL命令TO_VECTOR在IRIS中更新ICD-10代码的向量化描述。
- 将Python代码封装成类并与IRIS for Health集成。
- 下一篇文章将介绍如何将Angular 17开发的前端应用与IRIS for Health集成。
➡️