非确定性多项式时间问题挑战:为大语言模型提供不断扩展的推理基准
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
本研究提出了一种新的推理基准NPPC,旨在解决现有基准测试中的崩溃和攻击问题。NPPC能够有效降低大语言模型的性能,并提供分析工具,以支持人工通用智能的测试与发展。
🎯
关键要点
- 本研究提出了一种新的推理基准NPPC,旨在解决现有基准测试中的崩溃和攻击问题。
- NPPC能够有效降低大语言模型的性能至10%以下。
- 该基准提供深入的分析工具,以支持人工通用智能的测试与发展。
- 研究表明,NPPC是不可崩溃、不可攻击且自动验证的通用基准。
➡️