小红花·文摘

本文探讨了多领域神经机器翻译模型在医学领域的应用，发现领域内模型在自动度量和术语错误方面优于领域外模型。研究表明，较小的专业语言模型在解析电子健康记录时表现更佳。评估大型语言模型在临床任务中的表现，发现它们在零样本和少样本场景中接近最先进水平，但在分类和关系抽取任务上不如专门训练的模型。最后，提出了优化医学模型的方法，强调了对领域特定微调的评估需求。