BioMamba: 利用 Mamba 进行预训练的生物医学语言表示模型
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
我们引入了参数量为2.8亿的专用语言模型ClinicalMamba,经过纵向临床笔记巨量预训练。该模型在处理长期病例的复杂信息方面表现优越,并在纵向临床笔记信息提取任务中取得了快速而准确的成果。
🎯
关键要点
- 引入了参数量为2.8亿的专用语言模型ClinicalMamba。
- ClinicalMamba经过纵向临床笔记巨量预训练,处理长期病例的复杂信息表现优越。
- 在建模扩展文本长度方面,ClinicalMamba优于Mamba和临床Llama。
- 在纵向临床笔记信息提取任务中,ClinicalMamba通过少样本学习实现了快速而准确的成果。
- ClinicalMamba的表现胜过现有的临床语言模型和GPT-4等大规模通用领域模型。
➡️