小红花·文摘

本研究提出了一种新的视觉指令重写方法，旨在解决多模态交互中的隐私数据传输问题。该方法将多模态指令转化为纯文本命令，从而增强视觉数据的隐私性，推动隐私保护的多模态人工智能应用发展。