本研究提出了一种新的视觉指令重写方法,旨在解决多模态交互中的隐私数据传输问题。该方法将多模态指令转化为纯文本命令,从而增强视觉数据的隐私性,推动隐私保护的多模态人工智能应用发展。
完成下面两步后,将自动完成登录并继续当前操作。