朝双向人工智能对齐迈进：澄清、框架和未来发展的系统综述

近期的人工智能的普适性进展凸显出引导人工智能系统走向个人和群体的目标、道德原则和价值观的重要性，这被广泛称为对齐。然而，人工智能和哲学领域对于人工智能和人类对齐的定义和范围尚未被明确界定，而且这个问题的长期互动和动态变化也基本被忽视。为了填补这些空白，我们对 2019 年至 2024 年 1 月间发表的 400...

本文综述了人工智能与人类对齐的重要性，提出了双向对齐的概念框架，包括确保预期结果和帮助人类适应人工智能进展。关键发现包括人类价值观、交互技术和评估。未来研究的挑战包括对齐的实现和评估。

交互技术人工智能人类价值观对齐评估