本研究提出了一种新的推理基准NPPC,旨在解决现有基准测试中的崩溃和攻击问题。NPPC能够有效降低大语言模型的性能,并提供分析工具,以支持人工通用智能的测试与发展。
完成下面两步后,将自动完成登录并继续当前操作。