研究发现,大型语言模型在生物医学文献生成方面取得了显著进展,但在其他方面进展不大。使用存在风险和挑战,如可疑信息生成和涉及敏感病人数据的法律和隐私问题。
本研究开发了两种基于Transformer结构的大型语言模型PhenoBCBERT和PhenoGPT,可以自动检测临床表型术语,从生物医学文献中提取新的表型信息。PhenoBCBERT和PhenoGPT可以促进自动的下游任务,以获得关于人类疾病的新的生物学见解。
完成下面两步后,将自动完成登录并继续当前操作。