简单变得更难:LLMs 在简化语料库上表现出一致的行为吗?

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

研究发现,简化文本以提高阅读能力存在问题。预训练分类器在原始和简化输入上的预测不一致,简化输入易受对抗攻击,成功率高达50%。

🎯

关键要点

  • 研究发现简化文本以提高阅读能力存在问题。
  • 预训练分类器在原始和简化输入上的预测不一致。
  • 简化输入易受对抗攻击,成功率高达50%。
  • 研究比较了所有语言和模型之间的预测一致性。
➡️

继续阅读