小红花·文摘 - 小红花技术领袖俱乐部

Andrej Karpathy：神奇大模型不存在的，只是对人类标注的拙劣模仿

Andrej Karpathy：神奇大模型不存在的，只是对人类标注的拙劣模仿

机器之心 ·

RLHF不够用了，OpenAI设计出了新的奖励机制

RLHF不够用了，OpenAI设计出了新的奖励机制

机器之心 ·

通过基于规则的奖励提升模型安全行为

通过基于规则的奖励提升模型安全行为

OpenAI ·