本研究提出了CCSBench基准,以解决科学文献摘要中多属性组合控制不足的问题。实验结果表明,现有大型语言模型在平衡控制属性方面存在显著局限,尤其是在隐性属性的深层理解和抽象推理上。
完成下面两步后,将自动完成登录并继续当前操作。