小红花·文摘

本研究提出OphthBench基准，评估大型语言模型在中国眼科的应用。通过分析教育、分诊、诊断、治疗和预后五个关键场景，揭示了大型语言模型在临床应用中的不足，并为未来改进提供指导。