本研究提出了一种评估大型语言模型生成生物医学知识准确性的方法。通过验证疾病相关联想,发现疾病术语、药物名称和遗传信息的识别准确性较高,而症状术语的准确性较低,为生物医学知识生成的可靠性提供了新视角。
完成下面两步后,将自动完成登录并继续当前操作。