作者分享了参加字节跳动测开实习的三次面试经历,面试内容涵盖了计算机基础知识、数据库、排序算法、Java、操作系统等多个方面的问题。面试官认为作者的深度不够,建议继续提升。整体面试表现令人满意,但仍有提升空间。
该研究使用SafetyBench设计了一个综合评估大型语言模型安全性的基准测试工具,测试结果显示GPT-4表现突出,但当前大型语言模型的安全性仍有提升空间。
完成下面两步后,将自动完成登录并继续当前操作。