OpenAI获得66亿美元投资扩展大型语言模型,Anthropic也在开发更大模型。研究显示,模型变大可能导致不可靠,人们误以为更强大模型的错误模式可预测。新模型在复杂任务上表现更好,但简单任务仍有缺陷。专家建议企业先用大模型,再优化为更小更高效的模型。
研究发现简化模型表示无法准确捕获深度学习系统的行为,尽管在训练集上可以准确近似全模型。使用奇异值分解等工具进行机械解释时,预测模型在新情况下的行为可能不可靠。
完成下面两步后,将自动完成登录并继续当前操作。