AI 对齐是未来十年最重要的科学和社会技术工程 | 新程序员
原文中文,约6500字,阅读约需16分钟。发表于: 。例如,在 OpenAI 开展的一项机器人实验中,原本应该抓取桌面上球体的机器人,却学会了仅仅将手放置在人类视线范围内,给人造成握持物体的假象,但实际上并未真正抓取。经过强化学习结合微调后的产物,典型案例有...
人工智能和机器学习技术的发展引发了对伦理和安全问题的关注。AI模型在处理大量数据方面表现出色,但其优化精确度是否符合目标任务仍存在问题。训练数据的限制和目标函数的不确定性也是对齐问题的挑战。强化学习被认为是解决对齐问题的一种方法,通过人类反馈来指导模型的学习。然而,强化学习本身也存在对齐问题。对齐AI系统将是当前十年的决定性科学和社会技术项目,但仍需解决伦理和安全问题。