d[IA]gnosis:使用嵌入式Python和大型语言模型进行诊断向量化

💡 原文英文,约800词,阅读约需3分钟。
📝

内容提要

本文介绍了使用InterSystems IRIS for Health生成ICD-10代码列表向量的工具,并使用预训练的语言模型进行存储和相似性搜索。文章还提到了使用Python库SentenceTransformers进行向量生成,下载了BioLORD-2023-M预训练模型,并将ICD-10代码向量化并更新到数据库中。最后,将Python代码包装成一个类,并与IRIS for Health集成。下一篇文章将介绍如何将Angular 17开发的前端应用与IRIS for Health集成,并进行文本分析和ICD-10代码相似性搜索。

🎯

关键要点

  • 本文介绍了使用InterSystems IRIS for Health生成ICD-10代码列表向量的工具。
  • 使用预训练的语言模型进行存储和相似性搜索。
  • 采用Python库SentenceTransformers进行向量生成。
  • 下载BioLORD-2023-M预训练模型以生成786维向量。
  • BioLORD模型通过定义和多关系知识图谱提高了医学概念的语义表示。
  • 使用SQL命令TO_VECTOR在IRIS中更新ICD-10代码的向量化描述。
  • 将Python代码封装成类并与IRIS for Health集成。
  • 下一篇文章将介绍如何将Angular 17开发的前端应用与IRIS for Health集成。
➡️

继续阅读