该研究使用认知模型作为人类模拟器,与人工智能交互并收集反馈,提高训练效率。实践中,该方法在道德决策制定方面取得了成功,对人工智能的发展具有重要贡献。其中,强化学习代理与认知模型交互学习公平性,并能理性调整行为。
完成下面两步后,将自动完成登录并继续当前操作。