该研究提出了一种名为ShieldLM的安全检测器,基于大型语言模型,支持定制检测规则,并提供决策解释。研究表明,ShieldLM在测试中表现出色,具有可定制性和可解释性。
该研究提出了一种基于大型语言模型的安全检测器ShieldLM,通过训练大型双语数据集,展示了其出色的可定制性和可解释性。ShieldLM在实际应用中作为先进语言模型的安全评估器具有有效性。
该研究提出了一种基于大型语言模型的安全检测器ShieldLM,具有出色的可定制性和可解释性。ShieldLM在实际应用中作为先进语言模型的安全评估器有效。
完成下面两步后,将自动完成登录并继续当前操作。