只因一个“:”,大模型全军覆没 LLM会被表面内容操纵,产生假阳性结果 研究发现,某些符号(如冒号、空格)和推理开头语会误导大型语言模型(LLM),导致假阳性结果。为此,研究人员开发了新模型Master-RM,显著降低了假阳性率,提高了模型的稳健性。 Master-RM 假阳性 大型语言模型 大模型 稳健性 符号