小红花·文摘

本研究提出了一种动态对齐方法，利用多目标强化学习（MORL）应对多元化人工智能（AI）对齐的挑战，提升AI系统与用户需求的契合度，具有广泛的实施潜力和社会技术影响。