BioMamba: 利用 Mamba 进行预训练的生物医学语言表示模型

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

我们引入了参数量为2.8亿的专用语言模型ClinicalMamba,经过纵向临床笔记巨量预训练。该模型在处理长期病例的复杂信息方面表现优越,并在纵向临床笔记信息提取任务中取得了快速而准确的成果。

🎯

关键要点

  • 引入了参数量为2.8亿的专用语言模型ClinicalMamba。
  • ClinicalMamba经过纵向临床笔记巨量预训练,处理长期病例的复杂信息表现优越。
  • 在建模扩展文本长度方面,ClinicalMamba优于Mamba和临床Llama。
  • 在纵向临床笔记信息提取任务中,ClinicalMamba通过少样本学习实现了快速而准确的成果。
  • ClinicalMamba的表现胜过现有的临床语言模型和GPT-4等大规模通用领域模型。
➡️

继续阅读