只因一个“：”，大模型全军覆没

LLM会被表面内容操纵，产生假阳性结果

研究发现，某些符号（如冒号、空格）和推理开头语会误导大型语言模型（LLM），导致假阳性结果。为此，研究人员开发了新模型Master-RM，显著降低了假阳性率，提高了模型的稳健性。

Master-RM 假阳性大型语言模型大模型稳健性符号