本文探讨了通过外部记忆增强变压器型大语言模型(LLMs)的方法,特别是在P与NP问题上的应用。研究表明,GPT-4能够推理出“P≠NP”的结论,展示了LLMs的潜力。同时,强调了对LLMs评估标准化的重要性,呼吁人工智能社区共同应对评估挑战,以确保模型的可靠性和社会利益。
完成下面两步后,将自动完成登录并继续当前操作。