小红花·文摘

研究发现，使用175B参数的语言模型和人类反馈数据训练可以在模糊分类任务上接近或超过人类准确度。通过微调少量模糊上下文示例，可以显著提高没有大规模人类反馈训练的语言模型的准确性。这为教授模型有效处理模糊性问题提供了有希望的方向。