小红花·文摘

本文探讨了通过外部记忆增强变压器型大语言模型（LLMs）的方法，特别是在P与NP问题上的应用。研究表明，GPT-4能够推理出“P≠NP”的结论，展示了LLMs的潜力。同时，强调了对LLMs评估标准化的重要性，呼吁人工智能社区共同应对评估挑战，以确保模型的可靠性和社会利益。