本研究提出了基于家庭知识图谱的FamilyTool基准,旨在解决个性化动态环境中的多跳推理问题。研究表明,现有语言模型在复杂场景中的表现不佳,推理复杂度增加时准确性下降,需改进个性化工具的使用。
完成下面两步后,将自动完成登录并继续当前操作。