本研究探讨了语言模型在伦理模糊情境中与人类判断的不匹配,指出现有模型的局限性。通过精细调优,模型在复杂道德决策中的理解能力显著提升,更好地对齐人类判断,强调了研究伦理推理技术的必要性。
该研究使用交互式定理软件实现了自动化康德伦理学,并开发了测试框架评估其在伦理判断中的表现。这是创建哲学成熟的伦理人工智能代理的早期步骤。
完成下面两步后,将自动完成登录并继续当前操作。