HoneyBee: 用基础嵌入模型创建可扩展的多模态肿瘤学数据集的模块化框架
原文中文,约500字,阅读约需2分钟。发表于: 。为了解决医学数据的复杂性和异质性所带来的挑战,我们引入了 HoneyBee,一个可扩展的模块化框架,用于构建多模态肿瘤学数据集,通过使用基础模型生成代表性嵌入。该框架整合了包括临床记录、影像数据和患者结果在内的各种数据模态,利用数据预处理技术和基于 Transformer 的架构生成能够捕捉原始医学数据中的重要特征和关系的嵌入。生成的嵌入使用 Hugging Face datasets 和...
为了解决医学数据的复杂性和异质性挑战,研究人员引入了HoneyBee框架,用于构建多模态肿瘤学数据集。该框架整合了临床记录、影像数据和患者结果等多种数据模态,并生成能够捕捉重要特征和关系的嵌入。通过评估嵌入的质量和代表性,证明了HoneyBee的有效性。该框架旨在加速肿瘤学研究,并可扩展到其他医学领域。