本研究分析了基础模型在识别新型化学、生物、辐射和核威胁方面的不足,发现不同模型在专家提示下的推理能力存在差异,强调了监测新模型能力的重要性。
OpenAI进行了一项研究,邀请了100名参与者,以评估GPT-4对获取有关生物威胁的危险信息的影响。研究发现准确性和完整性略有改善,但效果在统计上并不显著。OpenAI强调,仅仅获取信息不足以构成生物威胁,还需要更多的研究。他们还讨论了评估程序的局限性以及在评估模型评估结果时进一步研究的重要性。
我们正在评估大型语言模型(LLM)在制造生物威胁方面的风险。研究表明,GPT-4在生物威胁创建的准确性提升有限,需进一步探讨。
完成下面两步后,将自动完成登录并继续当前操作。