本研究提出OphthBench基准,评估大型语言模型在中国眼科的应用。通过分析教育、分诊、诊断、治疗和预后五个关键场景,揭示了大型语言模型在临床应用中的不足,并为未来改进提供指导。
完成下面两步后,将自动完成登录并继续当前操作。