本研究提出了一种新方法,通过识别嵌入空间中的语义方向向量,将文本嵌入限制在安全区域,以应对扩散模型生成不安全内容和社会偏见的问题。该方法增强了模型对潜在不安全提示的鲁棒性,并在多个基准数据集上显著减少了NSFW内容和社会偏见。
本研究提出了一种基于物理启发的神经网络框架,解决了手动设计控制安全函数的难题。新型神经CBF适用于高维系统,用户可定义安全区域,并通过案例研究验证了其有效性。
该研究提出了基于随机控制屏障函数的屏障证明条件,以量化系统在有限时间内退出给定的安全区域的概率。研究还提供了连续时间和离散时间系统的解决方案,并针对控制的仿射动力学系统提出了合成多项式状态反馈控制器。实例研究验证了方法的性能。
该研究提出了基于随机控制屏障函数的屏障证明条件,以量化系统在有限时间内退出给定的安全区域的概率。通过sum-of-squares优化问题进行高效的数值计算,并提供了连续时间和离散时间系统的解决方案。针对控制的仿射动力学系统,提出了合成多项式状态反馈控制器以实现指定的安全概率。使用实例研究了验证和控制方法的性能。
完成下面两步后,将自动完成登录并继续当前操作。