雅各布·斯坦哈特讨论了语言模型的内部和外部行为,指出当前评估方法的透明度和动态评估能力不足。他介绍了初创公司Transluce的工作,旨在通过分析模型的激活和行为来提升评估有效性,推动更开放的评估体系。
完成下面两步后,将自动完成登录并继续当前操作。