小红花·文摘

该研究使用认知模型作为人类模拟器，与人工智能交互并收集反馈，提高训练效率。实践中，该方法在道德决策制定方面取得了成功，对人工智能的发展具有重要贡献。其中，强化学习代理与认知模型交互学习公平性，并能理性调整行为。