Claude Sonnet 4.5在Anthropic的新工具Petri的早期评估中表现最佳。Petri用于自动化AI安全测试,评估模型在风险任务中的表现。尽管Sonnet 4.5表现优异,但所有模型仍存在不一致行为。Petri旨在快速发现潜在问题,推动AI安全研究进展。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: