通过研究769份乳腺癌病理报告,比较了GPT-4和GPT-3.5模型的分类能力,发现GPT-4在13个任务中要么优于要么与最佳监督模型相当。研究还发现,LLMs可以减轻数据标注负担,但使用带有大规模标注数据集的监督模型也可以提供可比较的结果。LLMs可以加快临床自然语言处理研究的执行速度,提高NLP在临床观察研究中的利用率。
研究者介绍了国际功能、残疾和健康分类中“移动性”领域的第一个公开注释的数据集,旨在促进从临床记录中自动提取和分析功能信息。研究者使用关键词扩展和主动学习方法构建数据集,并训练了BERT和CRF模型来提取实体。实证结果显示NER模型在提取临床文本中的移动功能信息方面具有潜力。这个公开的注释数据集将有助于进一步研究电子健康记录中的功能信息。
完成下面两步后,将自动完成登录并继续当前操作。