本研究提出了CCSBench基准,解决科学文献摘要中属性控制不足的问题。结果显示,大型语言模型在控制显性和隐性属性时有明显局限,尤其是在隐性属性的深层理解和抽象推理方面。
完成下面两步后,将自动完成登录并继续当前操作。