清史修编进展缓慢,主要由于价值体系断裂、史料不控及缺乏政治功能。清朝与民国间的根本变化使得修史难以统一标准,新资料可能影响定论,增加政治风险。修史与政治环境密切相关,需谨慎处理。
使用逆强化学习作为方法,使得人工智能代理人能够基于人类观察和互动隐式地获得文化敏感的价值观体系。通过在线虚拟世界中观察不同文化群体的行为,我们的实验结果显示出代理人能够通过学习特定文化群体的行为获得反映该群体行为的利他特征,且这一学习到的价值体系可以推广到需要进行利他判断的新场景。这是首次演示出人工智能代理人具备持续从观察和与人类互动中学习价值观和规范的能力,从而与其所操作的文化环境相适应。
完成下面两步后,将自动完成登录并继续当前操作。