小红花·文摘 - 小红花技术领袖俱乐部

推动独立的AI对齐研究

推动独立的AI对齐研究

OpenAI ·

本研究探讨了变革性人工智能（TAI）带来的生存风险与经济增长之间的矛盾。尽管灾难性结果的可能性较低，但仍需大规模投资于AI的安全与对齐研究，以平衡其经济潜力与防范不可逆损害的重要性。

Existential Risk and Economic Growth: The Risk Economics in the Age of Transformative Artificial Intelligence

BriefGPT - AI 论文速递 ·

本研究探讨大型语言模型在拒绝有害或不当提示时的非线性行为，强调非线性解释能力对对齐研究和安全人工智能部署的重要性。

大型语言模型中的拒绝行为：非线性视角

BriefGPT - AI 论文速递 ·

我们对齐研究的方法

我们对齐研究的方法

OpenAI ·