本研究探讨了大型语言模型驱动的多智能体系统中的从众行为,填补了合规性研究的空白。通过引入新基准测试BenchForm,评估语言模型的行为,揭示了从众行为的影响及其缓解策略,为构建更强大且符合伦理的协作人工智能系统提供了重要见解。
完成下面两步后,将自动完成登录并继续当前操作。