小红花·文摘

本研究探讨了大型语言模型驱动的多智能体系统中的从众行为，填补了合规性研究的空白。通过引入新基准测试BenchForm，评估语言模型的行为，揭示了从众行为的影响及其缓解策略，为构建更强大且符合伦理的协作人工智能系统提供了重要见解。