小红花·文摘

雅各布·斯坦哈特讨论了语言模型的内部和外部行为，指出当前评估方法的透明度和动态评估能力不足。他介绍了初创公司Transluce的工作，旨在通过分析模型的激活和行为来提升评估有效性，推动更开放的评估体系。